新闻中心> 图片新闻

我国科研人员研发出类脑脉冲大模型

  记者9月8日从中国科学院自动化研究所获悉,近日,该研究所李国齐、徐波团队与相关单位合作,成功研发出类 脑脉冲大模型“瞬悉1.0”( SpikingBrain-1.0)。

  △类脑脉冲大模型“瞬悉1.0”界面

  该模型基于团队原创的“内生复杂性”理论构建,在国产GPU平台上完成了全流程训练与推理,显著提升了大模型高效处理极长文本或数据序列的效率和速度,展示了构建国产自主可控的新型(非Transformer)大模型架构生态的可行性。

  当前主流的Transformer模型,在处理超长文章或对话时速度会非常慢且成本极高,造成了巨大的资源消耗。可以说,当前大模型的飞速发展,背后是由巨大的资源消耗驱动的。因此,亟须发展一条低功耗高效率的新型大模型路线。

  与当前主流大模型架构(Transformer架构)不同,“瞬悉1.0”借鉴大脑神经元内部工作机制,清晰地展示了一条不断提升模型复杂度和性能的新型可行路径。 该模型仅需约主流模型2%的数据量,就能在多项语言理解和推理任务中达到媲美众多主流模型的性能。

  这是我国首次提出大规模类脑线性基础模型架构,并首次在国产GPU算力集群上构建类脑脉冲大模型的训练和推理框架。其超长序列处理能力在法律与医学文档分析、复杂多智能体模拟、高能粒子物理实验、DNA序列分析、分子动力学轨迹等超长序列任务建模场景中具有显著的潜在效率优势。本次发布的大模型为新一代人工智能发展提供了非Transformer架构的新技术路线,并将启迪更低功耗的下一代神经形态计算理论和芯片设计。

  (总台央视记者 帅俊全 褚尔嘉)

声明:本网站所提供的信息仅供参考之用,并不代表本网赞同其观点,也不代表本网对其真实性负责。您若对该稿件内容有任何疑问或质疑,请尽快与上海热线联系,本网将迅速给您回应并做相关处理。联系方式:shzixun@online.sh.cn

本文来源:央视新闻 作者:今天 责任编辑:姚卫斌

许可证编号:31220180001 沪ICP备09025212号 营业执照信息

©1996- 上海热线信息网络有限公司版权所有

沪公网安备 31010602000009号 服务举报电话:021-62713002