3月21昼夜深,腾讯混元晓喻,厚爱推出自研深度想考模子混元T1郑再版。
在体现推理模子基础才气的常见benchmark上,如谎话语模子评估增强数据集MMLU-PRO中,混元T1得回87.2分,仅次于o1。在CEval、AIME、Zebra Logic等中英文学问及竞赛级数学、逻辑推理的公开基准测试中,混元T1的收获也达到业界进步推理模子的水平。
此前,腾讯晓喻,混元大模子初度登上 Chatbot Arena 榜单,踏进人人 Top 15。用户在该平台上以匿名面孔与多个模子互动,投票决定何种模子更佳,从而字据分数生成名次榜。这种测评也被行为是大模子平直 PK 的竞技场,毛糙平直。
前年 9 月 5 日,腾讯发布了新一代大模子混元 Turbo,聘任 MoE 架构,比上一代产物推理效果进步 100%,推理资本镌汰 50%。
在本月 1 日发布的腾讯元宝电脑版 App 中则是内置了混元和 DeepSeek 两种模子人体艺术照,援救双模切换。