📱 微博 AI 发布 VibeThinker-1.5B 模型,仅用 7800 美元训练成本达到大模型推理性能

微博 AI 在 Hugging Face 平台发布了 VibeThinker-1.5B 语言模型,这是一个拥有 15 亿参数的密集型语言模型。该模型总训练成本仅为 7800 美元,却实现了与参数量更大的 GPT OSS-20B Medium 等模型相当的推理性能。

在数学推理方面,VibeThinker-1.5B 在 AIME24、AIME25 和 HMMT25 三大数学基准测试中分别获得 80.3、74.4 和 50.4 的分数,全面超越了参数量超过其 400 倍的 DeepSeek R1 初始模型(分数分别为 79.8、70.0 和 41.7)。在代码生成方面,该模型在 LiveCodeBench v5 和 v6 上分别取得 55.9 和 51.1 的成绩。模型采用了创新的"频谱到信号原理"(SSP)训练框架,通过系统整合监督微调和强化学习两个阶段来实现卓越性能。

Hugging Face

🍀在花频道 🍵茶馆 📮投稿新鲜事
 
 
Back to Top