7月13日,伊隆·马斯克正式宣布成立人工智能公司xAI,并将亲自领导11人的核心团队。
其中最显眼的骨干,是三个多月前就在挖角的伊戈尔·巴布什金(Igor Babuschkin),此人在DeepMind供职时,是星际争霸AI模型击败人类世界冠军的AlphaStar项目骨干之一;在受雇于OpenAI时,是ChatGPT项目成员之一。
除了DeepMind与OpenAI双料前员工巴布什金外,xAI的现团队中有三人来自DeepMind、三人来自谷歌研究团队、一人来自OpenAI。
这可能是命运最恰当的安排:要不是马斯克的特殊做派,AI界头两号重量级玩家DeepMind和OpenAI都有机会姓了马,世界首富也不必另开小号来问鼎AGI(通用人工智能)了。
跟谷歌创始人翻脸
2022年11月底ChatGPT面世以来,马斯克在公开场合只说过一句好话:“如今AI真是越来越好。”
从此之后,他以周为单位,频频抛出“AI是人类最大危险”观点与“OpenAI太不对”的责难。
坊间戏称:马斯克命里与AI相克,跟哪家AI企业打交道就会得罪谁,每每结交最早,却次次无缘。
DeepMind被谷歌收购,机缘也发生在马斯克的私人飞机上,但却埋下了他和谷歌创始人拉里·佩奇友谊破裂的根子。
DeepMind的起家与立基之本,是从较易实现的强化学习方向入手,来改善AI玩电子游戏的效率。
DeepMind早年开发出的AI产品,在玩《弹球打砖块》(Breakout)和《小蜜蜂射击》(Space Invasion)都能胜过人类玩家。
2013年中,DeepMind把AI玩《弹球打砖块》的演示视频发给所有天使轮投资人——给金主爸爸们交业绩兼追加筹钱。收到视频的人,包括PayPal的联合创始人卢克·诺赛克(Luke Nosek)与马斯克。
诺赛克在马斯克的私人飞机上和机主聊DeepMind的小视频时,刚好在场的佩奇也听见了,产生了收购DeepMind的想法。
佩奇并不是擦耳朵听八卦就要买公司的人,在他还主政谷歌时,大举进军AI行业的方针已经定下。
2012年底,谷歌买下了AI界泰斗辛顿(Geoffrey Hinton)的公司DNNresearch。2013年,佩奇在南太平洋的一个小岛上与当时的谷歌高管团队开会,现场表示“咱们要大搞AI”(Let’s really go big)。按与会人的说法,当时大家都惊得“倒退了一步”。
在此时点,让佩奇得知DeepMind的成就,收购如水之就下、势所必致。佩奇带当时的谷歌技术部门首脑阿兰·尤斯塔斯(Alan Eustace)等人飞赴伦敦与DeepMind团队见面之后,DeepMind的创始人之一登尼斯·哈萨比斯(Demis Hassabis)也带同事飞到谷歌的加州总部面商。
在不断互动中,收购的前景越发明朗了。
谷歌的AI开发者们认可了DeepMind的成就货真价实,而且强化学习正好补上了当时谷歌AI研发版图的缺口。
而哈萨比斯也发现谷歌的技术实力和财力都难以抗拒:谷歌自研的Torch软件能大幅改善写AI代码效率,并且这种千亿资产量级的公司一旦把注意力投向只有几个博士的小公司,小公司就面临要么雇员全被高薪挖走、要么公司全盘被买走的现实。未来的路径选项既已锁定,自然要选更优厚的那条。
2014年初,谷歌以4亿英镑(约合当时6.6亿美元)的价格,压倒Facebook出价,买到DeepMind。这笔交易金额排进了2014年全球初创公司收购金额前十。
但在此前,马斯克搅合进来了。
2013年底,马斯克在最后时刻发出收购DeepMind的提议,但输给了谷歌。据知情者称,马斯克想要引导该实验室的研究,并向同事们和DeepMind的人表示,佩奇不是监督打造先进AI的可靠人选。
考虑到当时景况,马斯克此举真是太奇葩。
2013年初,特斯拉Model S因系统故障频发、传感器设计落后而销量低迷,特斯拉因此处于破产边缘。4月的第一周,马斯克已经要找佩奇救急,恳请老友拿60亿美元出来收购特斯拉,其中50亿美元要马上给到工厂,自己只求能继续领导公司8年或者到第三代车出厂。若无2013年一季度特斯拉有1100万美元盈利,缓解了破产危机,马斯克已然自顾不暇。
上半年还在求老友搭救自家的产业,下半年就背刺老友、说老友水准不可靠。世界首富的作风实在令人瞠目。
2015年7月18日晚,马斯克夫妇在加州开办的宴会上招待佩奇。酒足饭饱深夜中,席上的人们又聊起了AI可怕与否,马斯克坚持AI很可能变“终结者”,佩奇则认为对AI报有偏执怀疑会阻碍技术进步、或反而让各国军方成为AI研究领先者。
马斯克当时使劲跟佩奇抬杠,要老友展开讲讲为啥放心AI不会变“终结者”毁灭人类。佩奇被杠得冒火,撂下一句“你这物种主义者(specieist)”走人。
马斯克做人这么厉害,果然没了朋友。今年4月在上福克斯电视台专访时,马老板承认“佩奇已经和我不再是亲密的朋友了。”
回想当年,马斯克去湾区总会发电邮找佩奇蹭房住,佩奇也在TED Talk上公开说:“我要是被公交车撞死,家产不捐给慈善组织,全捐给伊隆。”唉。
从OpenAI卷铺盖
因为DeepMind与老友反目后,马斯克再因为OpenAI创业跟拍档反目。
作为知名创业家,马斯克以性格百折不挠、坚毅不拔举世闻名,然而这种性格也是刚愎跋扈、目中无人的另一种表述。
若是创业从未成功过,那这种脾气还不见得会有滋长。但马斯克创业大落后屡有大起,难免会坚定“天下唯余一人”、“我所在行业怎么能不听我指挥”的信念。“联合创始人”在这等人眼里只是雇员、不是搭档,只是下属、不是同侪。
2015年,马斯克与山姆·阿尔特曼(Sam Altman)共同创立OpenAI,旨在与谷歌和DeepMind打对台。2018年,马斯克离开OpenAI。
在ChatGPT爆火后,OpenAI的现员工与前员工不再沉默,纷纷给商业媒体放料。马斯克其实是摊牌夺权不成,被从创业搭档到普通员工的整个OpenAI团队一致摒弃的。
有媒体从涉及马斯克的法律诉讼公开证据文件中扒出,至迟到2017年,马斯克仍视OpenAI为值得出力的里程碑式成就。
他在手机短信里跟弟弟金博·马斯克(Kimball Musk)说:“OpenAI和Neuralink(注:马斯克创立的神经科技和脑机接口公司)对人类的美好未来都至关重要。直觉告诉我,花在它们上面的时间比例应大幅提高。”当时这两家连办公室都是马斯克在旧金山租的同一间。
OpenAI除了名字是马斯克取、启动资金由马斯克筹以外,现在的“GPT之父”、首席科学家伊利亚·萨茨克维尔(Ilya Suskever)也是马斯克用力从DeepMind挖来。
按世界首富的说法,萨茨克维尔曾为是否跳槽到OpenAI犹豫多次,当时DeepMind的CEO哈萨比斯与马斯克两边较劲说服,最后是马斯克画饼功夫技高一筹,才有了之后萨茨克维尔担纲GPT系列与DALL-E系列大模型的故事。
然而有OpenAI的前员工爆料,表示当时的马斯克既不懂行又躁急,为OpenAI设定了不切实际的研发时间表,要求在此之前一定要做出通往AGI的重大突破来,否则单位的信誉挂不住。马斯克当时还在OpenAI内部天天做调查,想知道员工认为何时可以做出AGI来。
创始人里有这么一位,单位内部已经很糟心了。要是这位还对其他创业搭档发动逼宫、要求大权独揽的话,此君最终结局便不难想见了。
|马斯克与巨富同侪不约架、只牵手拥抱的场景,只会发生在AI虚构的图片里
2018年初,马斯克就做了这事:向其他联合创始人要求完全控制、亲自运营OpenAI,理由是OpenAI的研发进度已落后于谷歌。
在马斯克逼宫前,OpenAI作为非营利组织,没有首席执行官,也没有正式的管理架构,2017-2018年员工50人左右。虽然是小公司,但山姆·阿尔特曼与格雷格·布洛克曼等创业拍档一致拒绝马斯克的表态。
逼宫结果人尽皆知,2018年马斯克以“回避利益冲突”为公开理由退出OpenAI,之后就是漫长的对OpenAI各种抨击。
利益冲突不能说没有,毕竟马斯克离开时顺手把技术人才安德烈·卡帕斯(Andrej Karpathy)挖去特斯拉负责AI和自动驾驶部门。但OpenAI前员工爆料说当时单位内部没人相信这个是主因,马斯克在OpenAI的临别致辞也因重复此借口,在当时的OpenAI员工中反响很糟:公司里连老板们一起算也就52号人,你糊弄谁呢?
讽刺的是,马斯克从OpenAI下野反而成了GPT面世的远因。
马老板一开始是OpenAI的财务支柱,许诺会让OpenAI完全获得早期支持者承诺的10亿美元注资。此承诺即使在马斯克离开后仍未取消,但实际到账金额一直有争议,2023年马斯克在本人推特上称到位了1亿美元,但有信源说实到不足5千万。
钱不够永远是刺激降本提效的动力。OpenAI的研究者转用2017年谷歌开发的Transformer模型作为发力方向,就是因为Transformer模型的适用性更宽、并行计算效率更高、衍生模型的GPU加速效果更好,简而言之,成本效益比更高。
即使马老板离开了OpenAI,他和山姆·阿尔特曼的过节还是难消。按知情者说法,2023年初,马斯克私下告诉阿尔特曼,自己将开办与其竞争的AI项目。阿尔特曼先是斯文有礼地祝马斯克一切顺利,然后皮里阳秋地戳一句:不理解加增一个项目怎么能消除马斯克对AI发展过快的担忧。
2023年来,OpenAI的单位行为,和阿尔特曼的个人言辞,都表示出老同事们被马斯克深重地得罪了。
3月下旬,OpenAI董事会成员希冯·齐莉丝(Shivon Zilis)离任,原因就是作为跟马斯克生过一对孩子的前女友、现兼Neuralink公司高管,齐莉丝继续在OpenAI董事会,会产生利益冲突。
与此几乎同时,阿尔特曼在接受播客采访和出席各种场合时,直说马斯克是个“混球”(jerk),“他在研发运营上是我的导师……但他的做派我一点都不想仿效”。
|世界首富近期做派的抽样:“扎克伯格是个龟男,我建议咱俩比比谁鸟大。”
能把公开形象一向斯文安静的阿尔特曼气到爆粗,马斯克可谓举世一人。能得此成就,也不只是过去的宿怨,世界首富在加增嫌隙上努力很大。除了日常的言语责难OpenAI外,马斯克本人在OpenAI总部的亮相也有作用。
2022年11月底,马斯克旁观ChatGPT成就的私下反应,据说是“暴怒”(furious)。12月初,马斯克宣布撕毁在他收购前推特与OpenAI就有的数据访问权限协议。
2023年初,阿尔特曼请马斯克到OpenAI的旧金山总部面商,试图解决分歧。马斯克人是到了,不过不止他和他的保镖队伍,还带了尚在学步的幼子和他的保姆。
当会议室中OpenAI员工演示推特如何能兼容ChatGPT时,马斯克和保姆在轮流把孩子放在腿上颠动抚慰。在跟更多OpenAI员工谈话时,马斯克复述了一遍他的“世界为数码模拟”观念,然后离开。
尽管在场者称马斯克态度温和,但世界首富的做派更近于暴发户还乡而非合作洽谈。这要是能消除积怨,那就见鬼了。
“顶配”新欢,难圆旧梦
管不了DeepMind和OpenAI,马斯克现在总算能管到自己的独有企业xAI了。那他会率先造出AGI来吗?按现有资料看,有希望,但并不很大。
马斯克旗下企业做AI的经验的确是业内顶流,但优势都是分解的、单方面的。“道场”超级计算机、D1训练芯片、FSD算法、“擎天柱”人形机器人,单论性能参数,虽非世界第一,但都与顶级竞品比肩。
不过AGI的特殊点,是在“通用”,也就是通行处理各种模态的输入数据、各种质性的独特难题,这才是“通用人工智能”能够比肩人智的特点。然而马斯克现有的优势恰恰不在此。
比如D1芯片的架构是为特斯拉自动驾驶量身定做,用在通用多模态大模型上就会显得内存带宽受限。大模型与自动驾驶算法的片上通信、片上存储器和片外存储器需求组合有很大差异。
特斯拉的算法处理视觉图像的输入数据表现够好,但效果也就限于将图像数据转译为空间矢量数据、再以此做出自动驾驶系统的动作决定。基于Transformer的大语言模型和多模态模型需要与此极不同的代码架构。
“擎天柱”人形机器人可以在2023年的视频展现直接沿用FSD算法的动作,那是因为机器人动作与自动驾驶系统的数据量与模型着重点都在周边物理环境的感知与导航上。
然而由于技术天花板,要以低能耗、高精度与高速度低延迟完成这些动作,特斯拉算法只能适用在物理尺寸极受限的车型与人形机器人上。简而言之,特斯拉算法开不了卡车,也开不动多臂大型机器人。
即使xAI标榜的理念,也并不是独家的。xAI的老板和骨干们都表示,现有的大语言模型只是高端差分统计学应用与相关性模仿引擎,xAI要让人工智能模型能够发现新知新见、挖掘人所不止的事实,而非仅重复仿效训练数据中的内容。
然而meta的人工智能研究部门灵魂人物“杨立昆”(Yann Lecun)的“世界模型”构想在三年前就表示几乎一样的见解。6月14日在论文中公布的I-JEPA模型已经开始试用有关世界的背景知识、而非周边像素数据,来补齐图像的缺失部分。
所以xAI虽然能借用特斯拉的资源、获取推特的数据,有确切的优势。但在完成愿景上,既有竞争对手的进度已经有可见的领先。摘取AGI桂冠的竞技场上,群雄逐鹿的态势短期内不会改变。