微软公司创始人比尔·盖茨公开表示,自1980年首次看到图形用户界面以来,以GPT为代表的大模型是他所见过的最具革命性的技术进步。对于大模型未来的产业发展趋势和面临的挑战究竟如何,我们可以从三个方面进行探讨。
其一,人类种群知识库从外化、索引化到智能化的三部曲。
我们在《崛起的超级智能》一书中提出,生物的竞争本质上是种群知识库的竞争。在过去的几亿年里,恐龙因为灭绝导致种群知识库消失为0,鲨鱼一直保持在海洋中游荡,种群知识库没有发生大的变化,熊猫因为趋于灭绝从而种群知识库不断萎缩。
互联网知识库被索引之后,如何智能化也就成为了一个重要议题。在过去的近30年里,以谷歌、百度为代表的搜索引擎公司加大了智能化的步伐,人工智能的兴起也与此有密切的关系。
2022年OpenAI的ChatGPT成功引发了大模型的兴起,标志着互联网这个外化的人类种群知识库完成了从索引化到智能化的转变。但不能忘记的是,OpenAI ChatGPT的成功离不开谷歌提出的Transformer注意力机制模型,也离不开微软通过Bing搜索引擎提供的海量数据和巨大资金支持。
应该指出,当前人类社会对大模型充满了热情,特别在中国,很多人希望大模型能够与金融、法律、工业、农业、电力、建筑等等行业领域结合,从而实现快速发展。
其实大模型的成功并不仅仅是参数量大,而是用大规模预训练+微调的方式,对海量的跨领域知识进行学习时涌现出来新的能力,而且这些新的能力往往与创新有关,如翻译、创作文章、创作图像等,然而这种创新能力并不稳定,会出现“幻觉”和胡编乱造的情况。同时由于神经网络本身的特点,其可解释性问题也一直没有解决,因此对于需要精密控制或精确结果的产业领域,大模型并不是可靠的工具和技术。
还有一个误区是,认为用大模型的训练方法加上行业产业的大数据就可以形成高质量的行业大模型。这个观点并不符合大模型涌现出创新能力的规律,过于单一领域的知识反而会降低大模型涌现出新能力的水平。因此应继续提高ChatGPT、文心一言、LLama等等通用大模型的智能水平,通过通用大模型平台与其他可靠性高的人工智能技术协同工作,并与各个行业结合,这种路径要比建设专门的行业大模型更为稳健和有效。
其三,值得期待的大模型未来。
虽然大模型有着令人惊叹的智能表现,但我们还需要耐心等待大模型的持续发育和成长,如果从以ChatGPT3.5为代表的大模型大规模向人类提供服务算起,毕竟它还是一个从出生来到全人类面前还不到1年的婴儿。
/ 福利大放送,答题领红包 /
通知通知!新一轮红包活动开始啦!
每天12:00-24:00!
点击文章最下方左下角「阅读原文」,直达答题界面!
作者:刘锋,中国科学院虚拟经济与数据科学研究中心研究组成员、中国指挥与控制学会城市大脑专委会副主任兼秘书长、计算机博士、《崛起的超级智能》作者
原标题:《时评 | 大模型的未来趋势与挑战》