首页 > 公众号研报 > HUATECH洞见丨任福继:跳出GPT框架,AGI需要理解和数据双驱的新范式

HUATECH洞见丨任福继:跳出GPT框架,AGI需要理解和数据双驱的新范式

作者:微信公众号【华泰证券频道】/ 发布时间:2023-07-14 / 悟空智库整理
(以下内容从华泰证券《HUATECH洞见丨任福继:跳出GPT框架,AGI需要理解和数据双驱的新范式》研报附件原文摘录)
  文章开始 编者按:GPT-4给人类社会带来太多震撼,半年来我们一直在思考如何追赶、如何超越,又或者如何落地产业。所有这些思考,似乎都局限于大模型框架之内,而忽视了大模型只是生成式AI的子集,而生成式AI也只是AGI终局的可能路径之一而已。今天,我们不妨把眼光看得更远,跳出大模型的框架,再看通用人工智能。 7月8日,华泰证券于2023世界人工智能大会举办“AI大模型的金融数智化机遇”科技金融创新论坛。日本工程院院士、欧盟科学院院士任福继从理论创新性角度重新审视大模型,展望并反思未来AGI发展方向。 任福继 日本工程院院士、欧盟科学院院士 日本工学会院士、电子科技大学讲席教授 AI大模型在理论上并无多大创新 人工智能并非全新的概念,其诞生于1956年的达特茅斯会议,之后经历了70年代专家系统的遍地开花、2010年后深度学习与大数据的蓬勃发展,两度迎来热潮也经历了其间的寒冬。实际上,如今大火的AI大模型,与其说是一个全新的篇章,更像是大数据时代的高潮。其本质仍延续了数据驱动人工智能的基因,回避了智能本质问题。 从理论基础上看,早在20年前的世纪之交,学术界就已经对生成式AI有了初步的构想,比如基于自然语言描述自动生成代码、多语言多功能多媒体智能系统等等。语言模型的概念甚至上个世纪70年代就已提出,都可以窥见如今大模型的影子。 而GPT家族之所以能在2022年及之后“翻江倒海”,更多源于应用技术的巨大进步终于满足了理论需求。2010年代深度学习问世以来,相关算力需求每6个月翻一倍,2015年末大规模机器学习的出现,进一步将相关算力需求提高了10到100倍。算力需求飞速增长的同时,优质数据集和语料库、不断迭代的算法模型架构和训练方法也都日新月异,这才让大模型在2022年照进现实。 可以说,大模型只是展演了大数据驱动人工智能范式的辉煌历程,是此前二三十年人工智能技术的“集大成”之作,但绝非通用人工智能的珠峰。我们仍然需要召唤基于理解和数据双驱动的人工智能研究新范式。万里长征才走出第一步,仍然需要期待着更好的模型。 智能的本质:AGI不能只有“数据” 作为大数据和深度分析的产物,GPT的智能模式明显不像人类。如果说“计算智能——认知智能——感知智能”是人工智能进步的三级阶梯,那么当前的大数据驱动,本质上是通过数据、概率和随机迂回了人工智能的本质问题。而未来的AI发展,需要直面认知智能,达到真正意义上的“理解”。实际上,包括人类在内的自然智能非常重要,我们进化上亿年所沉淀下的智能,到目前应用于AI的还很有限,另外情感计算也应当被考虑,形成人工智能、自然智能、情感计算相结合的新范式。 当然,GPT同样在某些方面指引着未来,比如智能“涌现”就堪称GPT-4为人类提供的最重要的内容。所谓“涌现”(Emergency)是指系统中的个体遵循简单的规则,通过局部的相互作用构成一个整体的时候,一些新的属性或者规律就会突然一下子在系统的层面诞生。如同单个蚂蚁没有办法跨越地缝,但蚁群却能搭建蚁桥通过一样,是一种从低层次到高层次的过渡,是在微观主体进化的基础上,宏观系统在性能和机构上的突变,在这一过程中从旧质中可以产生新质。 具体到大模型而言,语言模型的模型规模达到一定程度、突破复杂性的某个阈值后,大模型会“涌现”出一些小模型所不具有的能力,这些能力包括但不限于:少样本提示、多步推理能力、指令执行、程序执行、模型矫正等等。其中许多能力在小模型中并不存在,但大模型却实现了,这正是量变后发生质变的“涌现”现象。当然,并非只要模型足够复杂,就会有“涌现”现象,数据质量、询问(query)措辞同样也会影响模型回复的准确性。 涌现之外,GPT-4的重要发展潜能之一,是为人工智能提供了符合人类习惯的交互方式。人类之前通过鼠标、键盘等与AI交互,实际上都是“反直觉”的。而如果人类能够使用包括方言的自然语言与AI交互,这毫无疑问是重大的进展。但同时,这或许也意味着AI在逐渐学会“察言观色”,并拥有反向影响人类的潜能。在今天,我们不去定性这种能力的“好or坏”,但要重视这种能力。 重新审视大模型:期待理解和数据双驱动的新范式 虽然在理论上创新有限,但AI大模型在应用层面却对人类社会产生了深刻的震撼。作为一款超强的、不断进化的智能工具,GPT-4正在带来一场智能系统的革命。总体来看,GPT-4在自然语言处理、文本生成、丰富人类知识库、创造性和适应性能力、多模态预训练及跨语言多模态交互能力、自我学习自我进化能力等方面,都展现出了很强的能力。比如丰富人类知识库方面,GPT作为极其强大的工具现在已经能够很容易理解人类的思维方式,并帮助人类个体理解、识别他们此前不了解的领域和知识;创造性方面,GPT-4凭借其习作、文生图等功能,用事实改变了此前普遍认为“深度学习和大数据在创造性上有限”的认知。 但同时,GPT-4以及整个GPT家族仍然有其局限性,比如知识的时效性,其训练数据集停留在2021年9月以前,这就意味着它对之后产生的新事物缺乏理解;再比如应答的真实性,也就是众所周知的“幻觉”问题,会一本正经瞎说;再比如应用的合法性,会生成有害信息,安全性限制仍然不够完善,可能产生大量的认知偏差、产生社会偏见,甚至侵犯个人隐私。虽然相比ChatGPT,GPT-4已经大有改观,但问题依然客观存在。 尤其值得注意的是,GPT家族的任何一员,虽然可以产生智能涌现,但都没有自主意识、主观情感或主观体验。一款与人打交道的应用,没有独立思考的能力、没有情感交互的功能,就容易出现先天不足。 站在当下这个时点,以GPT-4为代表的人工智能技术革命势必变革人类的生产生活方式,在关注大模型实际落地应用的同时,也应该多抬头望天,看到数据驱动的大模型之外的更多可能。我们期待着基于理解和数据双驱动的人工智能研究范式早日出现,实现真正的“智能”。 |免责声明| 特别提示:文中观点仅代表个人意见,不代表华泰证券(以下简称“本公司”)立场,也不构成对读者的投资建议。本公司或本公司相关机构、雇员不对任何人使用此全部或部分内容的行为或由此而引致的任何损失承担任何责任。未经本公司事先书面许可,任何人不得将本文或其任何部分以任何形式进行派发、复制、转载或发布,或对本文内容进行任何有悖原意的删节或修改。市场有风险,投资需谨慎。 你可能会感兴趣 华泰证券携手世界人工智能大会,洞察AI大模型的投资机遇 HUATECH洞见丨范承工:突破互联极限,CXL叩开大内存时代 HUATECH洞见丨陈齐彦:从局部创新到大模型崛起的开源故事 HUATECH洞见丨大模型推动网络技术革新:迈向统一开放,突破算力瓶颈 文章结束

大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)

郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。