Law的大模型路线已遇瓶颈依赖Scaling 传神语联何恩培

作者： 2024年11月19日金融浏览

11月19日消息，近日，传神语联推出“任度数推分离大模型 ”，模型采用双网络架构实现数推分离，把推理网络与数据学习网络分开。

据介绍，可将其理解为两个协同联动的大脑：一个是客户数据学习网络大脑，专注于数据的动态管理与迭代训练，为模型持续注入知识；一个是推理网络大脑，作为经大量数据预训练的基础网络，有良好的推理和泛化能力。

随着AI技术进入规模化应用阶段，传统大模型的开发逐渐暴露出成本高昂、效率低下的难题。尤其在参数规模不断扩大的背景下，Law（规模定律）的局限性愈发显著。

传神语联创始人何恩培认为，仅依赖Scaling Law的大模型路线已遇瓶颈，要真正突破需依靠算法与架构。

双网络通过共享嵌入层和中间表示层协同工作，形成类似“主脑”与“辅脑”的高效配合模式，既支持独立训练，也支持联合推理。

这一双网络架构通过共享嵌入层和中间表示层，实现灵活独立训练与高效联合推理，提升模型性能的同时显著降低成本。

据悉，相比传统大模型，“任度双脑大模型”架构在多个关键领域实现突破：一是实时学习：数据学习网络支持上下文无限制输入，可动态处理海量数据，缩短训练时间至分钟级；二是数据隐私保护：客户数据本地完成训练，无需上传至云端；三是成本优化：减少模型参数规模，大幅降低算力需求与硬件投入成本。

何恩培坚信，“算法制胜”是具有中国特色的技术路径之一，在以大模型为代表的AI时代尤为重要。相信中国有很多像传神这样的团队在默默耕耘，正在以独特理念引领智能创新。（袁宁）