欢迎访问淄博新闻时报官网
设为首页 | 收藏本站
国际新闻 民生新闻
时政新闻 经济新闻
军事新闻 体育新闻
部委信息 政坛人物
时事观察 政策解读
法治生活 法律法规
安全生产 食品安全 生态环保
健康卫生 房产商情 财经在线
娱乐资讯 旅游天下 科技之窗
文化名人 文化产业
中华情缘 书画收藏
报料投稿 查询系统
今天:
您所在的位置: > 经济新闻 >

自回归“统一”多模态 中国大模型登上《自然》

时间: 2026-01-30 10:01 作者:网络 来源:人民网 点击:

人民网北京1月30日电 (记者赵竹青)1月28日,智源多模态大模型成果“通过预测下一个词元进行多模态学习的多模态大模型”上线国际顶级学术期刊《自然》。这是我国科研机构主导的大模型成果首次在《自然》正刊发表。

2018年以来,GPT采用“预测下一个词元(Next-token prediction,NTP)”的自回归路线,实现了语言大模型重大突破,开启了生成式人工智能浪潮。“预测下一个词元”彻底改变了语言模型,促成了如ChatGPT等突破性成果,并引发了关于通用人工智能(AGI)早期迹象的讨论。然而,其在多模态学习中的潜力一直不甚明朗。多模态模型主要依赖对比学习、扩散模型等专门路线,自回归路线是否可以作为通用路线统一多模态?一直是未解之谜。

智源此次提出的Emu3模型,基于“预测下一个词元”的全新多模态模型,将图像、文本和视频统一离散化到同一个表示空间中,并从零开始,在多模态序列混合数据上联合训练一个单一的Transformer架构?。这项成果表明,只采用自回归路线,就可以统一多模态学习,训练出优秀的原生多模态大模型。

《自然》编辑点评,Emu3仅基于“预测下一个词元”,实现了大规模文本、图像和视频的统一学习,其在生成与感知任务上的性能可与使用专门路线相当,这一成果对构建可扩展、统一的多模态智能系统具有重要意义。

(责任编辑:admin)

国际新闻

更多>>

民生新闻

更多>>

最新文章

推荐文章

关于我们 | 机构介绍 | 报社动态 | 联系我们 | 版权声明 | 招聘信息 | 查询系统
主办:淄博新闻时报 联系电话:0533-2885688 13305690216 邮箱:562513588@qq.com
地址:淄博市纬六路中关村科技城 邮编:255000
Copyright©2013 Www.Zbrx.Com Inc. All Rights Reserved.淄博新闻时报
鲁ICP备12017224号 鲁公网安备110102006107号