北京时间今天凌晨,美国Open-AI公司在备受关注中发布了GPT-5。公司联合创始人兼首席执行官山姆·奥特曼,直播中也同时在个人社交账号“吆喝”,连发了十几条消息。
GPT-5有哪些技术亮点?是否实现了革命性突破和范式变革?在通用大模型领域,国内外的技术差距如何?解放日报记者专访了上海交通大学人工智能学院助理教授张林峰。
【恐怕没有什么特点让人印象深刻】
GPT-5的第一个技术亮点是快慢思考结合。对于GPT系列而言,GPT-4 o1之前的模型不具备深度思考能力,优点是速度非常快。今年年初,以中国DeepSeek-R1为代表的慢思考模型“横空出世”,提升了思考质量,缺点是速度慢一些。奥特曼称,GPT-5会自己决定何时需要深入思考。当用户提出一个它认为相对简单的问题时,可跳过思考过程直接给出答案,这样就不需要反复思考一个简单的问题,不仅响应速度变快了,服务成本也降低了。
“实际上,快慢思考结合并不是一个新的概念。今年上半年,这在学术界是一个广泛讨论的话题。据我所知,阿里千问3已有版本实现了快慢思考结合。我认为,GPT-5在快慢思考结合上应该会有不俗的表现。”张林峰说。
GPT-5的第二个技术亮点是减少“一本正经胡说八道”,也就是减少幻觉。
幻觉从何而来?“大模型回答问题只关注过去的经验和数据,特别是在强化学习时,相较于它回答‘不知道’,不如说一个错误答案,用户无法立即验证,反而提高了用户对它的评价。另一方面,大模型本身没有归因系统,它不具备将回答与事实关联的能力,因此他所表达的内容很可能就充满幻觉。”张林峰介绍,一直以来,在幻觉问题上,许多闭源模型比开源模型表现得更好。
GPT-5的第三个技术亮点是代码能力的提升。“AI的一个长期应用场景就是开发代码,至少可以减少程序员一半的工作量,而代码能力的提升与产业化具体应用直接相关。”张林峰说,另一方面,代码能力越强,在某种程度上更能参与到智能体的工作中。
“不过,GPT-5的代码能力还没有给人难以超越的碾压感。之前,代码能力最强的大模型是Anthropic公司开发的Claude,而Claude正是早期研发GPT的一批人离开OpenAI后研发的。随着GPT-5的发布,我相信Claude马上会反击。”张林峰说。
GPT-5是否实现了革命性突破和范式变革?
在张林峰看来,GPT-5除了扎实地提升了基础智能能力,并没有什么革命性突破,更未看到它在范式上的变化,恐怕没有什么特点让人印象深刻。
相较之下,几年前的GPT-3.5和GPT-4确实实现了一个非常大的跨越,前者像是一个概念性产品,后者在此基础上虽然没有新增什么功能,但能级大大提升。
【国内外大模型技术差距如何】
张林峰经常被问到一个问题,国内外通用大模型的技术差距如何?
“对此我一直比较乐观,也从未给出超过一年半以上的答案。即使是GPT-5也并非遥遥领先,不会给国内研发人员带来很大压力。”张林峰认为,这也许是中国人工智能公司的机会,究竟是引领AI新范式,还是继续跟随式研究,关键就在这几年。
有人看了GPT-5发布会后表示,完全没有GPT-4带来的震撼,有点失望。大模型的进化是否进入了瓶颈期?
对此,张林峰认为,任何技术的发展总是阶段式提升,然后进入平台期。可能大家习惯了AI在过去几年的快速发展,因此产生这种感觉。以智能体为例,这个概念出现的时间并不长,还有很大的成长空间。
奥特曼在GPT-5发布会上称,这是一个“博士”级智能大模型。就在上个月,马斯克旗下xAI团队发布Grok-4大模型,宣称其为“全球最强AI”,在处理跨学科学术问题时达到甚至超越人类博士水平。
“其实,目前处于国际上第一方阵的大模型均已达到甚至超越博士水平。”张林峰说。
由于通用大模型一旦“出圈”可以赢者通吃,吸引了国际上诸多人工智能头部企业。如今,这一赛道竞争非常激烈,除了Claude主攻代码是其比较明显的标签,第一方阵尚未形成差异化竞争。
“实际上,针对单一领域研发垂域大模型,相比优化通用大模型要简单得多,产业落地的路线也更加清晰,比如设计垂域的智能体,非常适合创业公司弯道超车。”张林峰说。
未来,大模型的发展将会带来哪些重大突破?
“人类一直想要跨学科研究科学问题,但并非每个人都是牛顿。而大模型在科研领域尤其是跨学科复杂问题方面的能力非常强,只是我们尚未完全挖掘这种能力。”张林峰认为,正如马克思所言,生产力的发展会推动社会范式的变化深圳知名的配资公司,科研工具的发展也会推动科研生产力和科研范式的变化,“未来,科学家可能只负责提出科学问题或给予关键的洞见和指导,而具体操作层面将全部由大模型实现”。
东南配资提示:文章来自网络,不代表本站观点。