推广 热搜： 公司快速中国上海金未来企业政策系统教师

阿里除夕发布Qwen2.5-Max反超DeepSeek V3，一句话开发小游戏

日期：2025-02-28 作者：n7igm1 caijiyuan 评论：0 移动：http://keair.bhha.com.cn/mobile/news/9230.html

核心提示：昨晚，杭州大模型又双叒不睡，给大伙儿拜年啦～就在春晚直播进行时，阿里通义Qwen发布新春节礼第三弹：Qwen2.5-Max来袭，多个

昨晚，杭州大模型又双叒不睡，给大伙儿拜年啦～

就在春晚直播进行时，阿里通义Qwen发布新春节礼第三弹：

Qwen2.5-Max来袭，多个基准测试中超越当红炸子鸡DeepSeek V3。

Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准统统拿下，Qwen2.5-Max整体表现优于DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o，和Claude-3.5-Sonnet也能比一比。

基座模型对比中，Qwen2.5-Max同样超越DeepSeek V3、Llama-3.1-405B，在针对模型知识理解和推理能力的MMLU-Pro等基准上均表现不凡。

更令AI社区关注的是，Qwen2.5-Max同DeepSeek V3一样是超大规模的MoE模型，经超20万亿token的预训练数据及精心设计SFT+RLHF后训练方案训练而成。

Qwen2.5-Max这份春节礼包被网友们齐刷刷收入囊中。前有DeepSeek，还有阿里通义Qwen，网友们不忘艾特奥特曼：

祝大家新年快乐，特别祝Sam。

阿里研究员在模型发布后也都还不睡，纷纷当起了自个儿的自来水。

阿里高级算法专家林俊旸开麦：

Qwen2.5-Max在基准测试中表现良好，希望大家可以试试看，新年快乐！

之前曾自曝阿里大模型员工996作息表的Binyuan Hui也再次现身：

外面的烟花照亮了天空，我却坐在电脑跟前。

下面是Qwen2.5-Max在四个使用场景上的演示。

首先是联网搜索功能，输出的每句话来源出处都有标注，整体运行也很丝滑。

代码能力上，Qwen2.5-Max能够帮助用户完成各种可视化创作，一句话就能做出下面这样旋转的球体：

有网友改造了一下，让球体内部有三个弹跳的黄色小球。

结果只尝试了一次就成功了，而且三个小球始终在大球内部运动，能正确处理碰撞：

Qwen2.5-Max也有Artifacts功能，同样一句话，能开发各种小应用、小游戏。

比如制作一个扫雷小游戏，秒秒钟“啪”一下直接就能玩：

另外Qwen2.5-Max数单词中的特定字母数量也不在话下。

现在，Qwen2.5-Max已在Qwen Chat中上线。

此外也有Hugging Face的Demo可玩，还上线了Any Chat，并且可通过阿里云服务使用API。

感兴趣的童鞋赶紧试试吧～

参考链接：
[1]https://qwenlm.github.io/blog/qwen2.5-max/
[2]https://x.com/JustinLin610/status/1884263803451498794
[3]https://x.com/_akhaliq/status/1884278071093502253
[4]https://x.com/huybery/status/1884263539675934860

本文地址：http://keair.bhha.com.cn/news/9230.html 康宝晨 http://keair.bhha.com.cn/ , 查看更多

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

更多>同类最新资讯

0 条相关评论

文章列表

相关文章

6000万预约，突然定档，腾讯游戏让年轻人炸开了锅

最新动态

推荐图文

最新资讯

点击排行

• 厦门三区小学一年级已经实现随迁子女公办学位自	• 大动作！全球资管巨头抄底中国房地产
• 韩国技术改造美国船厂，韩华称十年内实现年产10	• 假山假景假脸，短剧《窃心》爆火，让多少内娱流
• 军事晚报AI速递：今日军事热点一览丨2025年8月	• 原包PA66 GVS-5H 瑞士EMS 耐化学性
• 征信逾期五年超十次？别慌！2025最新解密与攻略	• SAB47减速机
• 九类危险品进口流程？	• 乡村学校少年宫丨池淮镇中心小学：快乐不“打烊

征信逾期五年超十次？	东渚街道：支部领航，
全新360安全云重磅发	新刊推介丨挺膺担当，
南开大学：非211秒拒	德信服务时隔两年折价
DNF手游：8月首套联动	固安：暑期多元影片热
防城港亮证姐事件通报	四大行协商还款会减免
群像叙事的成功，《樱