找回密码
 立即注册

QQ登录

只需一步,快速开始

广告载入中...
查看: 253|回复: 3

李飞飞团队训练出媲美DeepSeek R1的推理模型 云计算费用不到50美元

[复制链接]
发表于 2025-2-6 18:14 | 显示全部楼层 |阅读模式

马上注册,享用更多功能,让你轻松玩转本论坛。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
《科创板日报》6日讯,李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。
研究人员表示,s1对Qwen2.5-32B-Instruct模型,使用通过蒸馏法由Gemini Thinking Experimental模型提炼出来的1000个样本小型数据集,进行了监督微调。使用16个英伟达H100 GPU进行了26分钟的训练。
小K注:“不到50美元”仅为云计算服务费用,不包括服务器、显卡等硬件投入费用,因这部分已经由云厂商承担。

发表于 2025-2-6 21:06 | 显示全部楼层
好好学习天天向上
回复

使用道具 举报

发表于 2025-2-7 08:10 | 显示全部楼层
感谢提供信息分享。
回复

使用道具 举报

发表于 2025-2-7 16:47 | 显示全部楼层
假的不能再假了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表