新疆师范大学学报(哲学社会科学版第44卷第4期2023年7月
JournalVol.44.No.4Jul.2023
ofXinjiangNormalUniversity(PhilosophyandSocialSciences)
ChatGPT的运行模式、关键技术及未来图景
朱光辉王喜文2
(1.北京理工大学人文与社会科学学院,北京100081;2.北京华夏工联网智能技术研究院,北京100085)
摘要:美国人工智能实验室OpenAI开发的人工智能聊天机器人应用ChatGPT引发广泛热议,被认为是继
互联网、智能手机之后,带给人类的第三次革命性产品。互联网开辟了“空间革命”,智能手机的出现带来“时
间革命”,ChatGPT的横空出世有望形成“思维革命”,通过替代人类进行创作、创意、解答、咨询、翻译和客服
等改变人类思考和处理问题的方式方法,由此重塑各行业生态乃至整个世界。
关键词:ChatGPT;运行模式;关键技术;未来图景
中图分类号:TP18文献标识码:A文章编号:1005-9245(2023)04-0113-10
埃隆·马斯克称ChatGPT将颠覆世界;微软公务无关的超大型LLM,可以从海量的数据中学习
司以数百亿美元投资ChatGPT,并计划将其整合到各种知识,LLM以生成一切的方式解决各类实际
微软的Ofice办公软件和Bing搜索引擎之中;部问题。除此之外,AGI能够听懂人类的命令,便于
分高校和学术机构开展了关于使用ChatGPT写论人类使用。
文是否合规的大讨论;还有部分咨询公司担忧是否(一)幕后:大型语言模型
会被其替代。2023年,ChatGPT的应用热情被点ChatGPT“无比强大”的能力主要得益于其依
燃,应用场景不断快速拓展。托的大型语言模型。尽管ChatGPT加人了人工标
注数据,但量级只有数万,这一规模的数据量和
一、ChatGPT的运行模式训练与GPT-3.5模型使用的几千亿级别的数据量相
比,几乎可以忽略不计,基本不会对提升GPT-3.5
2022年11月上线的ChatGPT是由美国人工的基础能力发挥作用。因此,ChatGPT的强大功能
智能实验室OpenAI开发的人工智能聊天机器人应主要源自隐藏其背后的“巨无霸”模型一LLM。
用,上线不到一周用户突破100万,两个月时间吸对于LLM的发展理念,可以将其理解为“构
引活跃用户超亿人,打破抖音9个月吸引用户过建一个与任务无关的超大型LLM,让它从海量数
亿的记录,成为历史上用户增长速度最快的应用据中学习各种知识”。图1展示了大型语言模型
程序。LLM。第一,这一LLM模型的规模必然是巨大
回顾ChatGPT的发展历程可知,OpenAI自的,有能力开发出该模型或改动该模型参数的机构
GPT1.0开始,就将大型语言模型(LargeLanguage较少。对于任务需求方而言,无论是无数的中小机
Model,LLM)视为通往通用人工智能(Artificial构还是个人,即使有能力开源出大型语言模型,也
GeneralIntelligence,AGI)的必由之路。具体而无力部署这一模型,更湟论用微调(Fine-tuning)
言,在OpenAI看来,未来的AGI应拥有一个与任技术模式修改模型参数。因此,追求不修正模型参