lol投注app
- 英雄联盟投注 原本她们竟是恋东说念主,因戏生情相伴41年,演完《生万象》终于成名
- lol投注 姜洪涛事件升级:遭堂哥打压、被老大针对,前妻好意思貌引关注
- 英雄联盟比赛投注 康辉也没思到,“淹没”多年的海霞,如今照旧走上了另一条正途
- lol投注 9分钟!刘炜亲手撕下新疆队长临了一块遮羞布,功勋为何不值钱?
- 英雄联盟投注 广西感统康复设备器材
- 英雄联盟比赛投注 43岁港姐自曝被离婚, 已与俩女儿移居上海, 离婚两个月寻获新恋情
- lol投注app 杜兰特316打败掘金!约基奇257,申京被冷藏,双探花合砍50分
- lol投注app 孟子义星光大赏跌倒现场:红毯玩笑、舞台不测,背后藏着明星圈的真确温度
- lol投注 古斯塔夫一世,开创现代军队制度,被后人称为现代战争之父
- 英雄联盟投注app 孙俪冬至仅吃了六颗饺子,饿出来的好意思,究竟影响了几许东谈主?
- 发布日期:2026-01-29 04:34 点击次数:161

界面新闻记者|宋佳楠
界面新闻获悉,1月26日晚,阿里正式推出千问系列旗舰推理模型Qwen3-Max-Thinking。根据阿里公布的数据,该模型在19项权威基准测试中的表现媲美OpenAI的GPT-5.2-Thinking、谷歌的Gemini3Pro等国际顶尖模型,标志着国产大模型在高阶推理领域实现重要突破。
该模型总参数量超万亿,预训练数据量达36TTokens,经大规模强化学习打磨而成。相较于前代模型,其核心改进集中在两方面。
一是自适应工具调用能力,可按需调用搜索引擎和代码解释器,现已上线QwenChat。与早期需要用户手动选择工具的方法不同,Qwen3-Max-Thinking能在对话中自主选择并调用其内置的搜索、记忆和代码解释器功能。这种能力让模型能像专业人士一样自主判断是否调用搜索、记忆或代码解释器,比如解答实时政策问题时自动检索最新信息,处理工程计算时启动代码工具验证结果,无需用户额外指令即可降低“幻觉”风险。

Qwen3-Max-Thinking相关测试数据 图片来源:千问
另一个是测试时扩展技术(Test-TimeScaling),指在推理阶段分配额外计算资源以提升模型性能的技术。据称显著提升推理性能,在关键推理基准上超越Gemini3Pro。
一般AI遇到难题,会同时想很多思路,很多是重复的,白白耗算力。该技术则通过“经验提取”式反思,避免传统模型并行推理的冗余计算,在相同算力下聚焦未解决难点,使GPQA科学知识测试得分从90.3提升至92.8,LiveCodeBench编程测试从88.0升至91.4。

针对Qwen3-Max-Thinking的更多性能评估 图片来源:千问
在性能比拼中,该模型在被称为“人类最后的测试”的HLE工具调用基准中,以58.3分远超GPT-5.2-Thinking的45.5分和Gemini3Pro的45.8分;IMO级数学推理测试获91.5分登顶,预览版更曾拿下AIME25与HMMT25双满分。
{jz:field.toptypename/}目前,普通用户可通过千问PC端、网页端免费体验,企业则能通过阿里云百炼获取API服务。
阿里CEO吴泳铭去年曾表示,公司正在积极推进三年3800亿的AI基础设施建设计划,并将会持续追加更大的投入。这一投入规模与谷歌、Meta和亚马逊等美股科技巨头的AI资本开支处于同一量级。
- lol外围投注 王鹤润 红唇烈焰2026-02-05
- 英雄联盟比赛投注 43岁港姐自曝被离婚, 已与俩女儿移居上海, 离婚两个月寻获新恋情2026-02-05
- lol外围投注 VCTCN:happywei开局即ACE震慑全场,XLG22026-02-04
- 英雄联盟比赛投注 和平精英租号指南:安全考量与平台挑选要点2026-02-04
- lol外围投注 央媒发文, 高调官宣62岁甄子丹喜讯, 他让李连杰和所有人刮目相看2026-02-03
- 英雄联盟投注 00后集体炸场! 央视主播、影帝、短剧顶流…年轻人的清醒与实力2026-02-03
