文章      动态     相关文章     最新文章     手机版动态     相关动态     |   首页|会员中心|保存桌面|手机浏览

ymnqbd

http://keair.bhha.com.cn/comymnqbd/

相关列表
文章列表
  • 暂无文章
推荐文章
联系方式
  • 联系人:汪女士
  • 电话:15033066985
AI新战场:英伟达与谷歌争夺“世界模型”主导权
发布时间:2025-01-11        浏览次数:0        返回列表

在2025年拉斯维加斯消费电子展(CES)上,英伟达的创始人黄仁勋首次亮相,宣布他们最新进军AI领域的重要一步——推出Cosmos世界模型(Cosmos World Foundation Models,简称CosmosWFMs)。这一专为理解物理世界而设计的模型,能够预测和生成充满物理感知的视频,引发了业界的广泛关注。

CosmosWFMs被细分为三类:Nano、Super和Ultra,参数规模从40亿到140亿不等,各具适用性——从低延迟实时应用到高性能任务。英伟达不仅推出了上采样模型和增强现实优化的视频解码器,还确保其模型在使用过程中的负责任性,真是引领技术潮流的先锋。

这并不仅仅是英伟达独自的舞台,谷歌旗下的DeepMind也在积极布局“世界模型”领域。DeepMind新组建的研究团队由前OpenAI研究员Tim Brooks领导,正在全力开发其自己的世界模型解决方案。最近发布的Genie模型,能够创建虚拟世界,模拟逼真的动画和物理效果,让用户能通过文本、图像等多种方式与之互动。

除了这些科技巨头,还有许多初创公司如李飞飞的WorldLabs、Decart和Odyssey等也在这个领域中积极探索,显示出“世界模型”正成为AI行业的重要焦点。

那么,世界模型究竟是什么?简单来说,它是一种通过对大量数据(如图像、音频、视频和文本)的训练,构建出对世界运作方式的内部表征。根据这些表征,模型不仅可以理解现实世界的规律,还能模拟人类的潜意识推理,如同我们的大脑形成的心智模型。比如,棒球击打手能快速判断如何挥棒,正是因为他们能够直观预测球的飞行轨迹。

世界模型的重要性在于它能够实现复杂的推理和规划,并在生成式视频技术中展现出独特的优势。它能够理解物理规律,准确模拟物体运动,从而在影视、游戏、自动驾驶及机器人等领域创造无限可能。未来,这些模型甚至能够按需生成用于各种创意工作的3D世界,极大地降低开发时间和成本。

然而,面对巨大的前景,世界模型的发展同样存在重大挑战,例如对计算能力的高要求、幻觉和偏见问题,以及训练数据的限制等。这些技术瓶颈的突破,将是实现成熟世界模型的关键。

虽然当前世界模型离全面成熟依然存在不小的距离,但已然展现出了无与伦比的潜力。若能克服主要挑战,未来将可能在虚拟世界构建、机器人技术和AI决策中的各个领域带来革命性的变革,开创人工智能与现实世界深度融合的新篇章。