AI教母50美元成功练习AI模型应战DeepSeek蒸馏别人模型底子不花钱
时间: 2025-02-12 04:53:41 | 作者: 照明非球面
- 产品介绍
教授的团队仅用不到50美元(约港币HK$390)成功练习出一个名为“s1”的推理模型。这个模型在数学和编程才能测验中的体现,与OpenAI的o1和DeepSeek的R1等先进推理模型适当。这一成就让美国科技界惊叹,也显示出人工智能技能的竞赛越来越剧烈。
李飞飞团队的s1模型,采用了来自Google的推理模型Gemini 2.0 Flash Thinking Experimental的常识,并使用“蒸馏技能”改进其AI模型。蒸馏技能是一种模型紧缩办法,研究人员从一个大型、杂乱的模型(称为“教师模型”)中提取常识,再辅导一个较小、较简略的模型(即“学生模型”)进行学习。这样,学生模型能坚持较高功能,一起显着下降核算资源耗费。
从前DeepSeek团队曾发布其将OpenAI的练习本钱紧缩至本来的三十分之一,让许多人以为AI范畴的竞赛越发剧烈。然后李飞飞教授的团队在短短一个月内,便用不到50美元的本钱练习出了比美DeepSeek R1的AI推理模型,这无疑再次改写了本钱与功能之间的平衡。
李飞飞团队的成功标明,蒸馏技能的使用能改进与紧缩大型AI模型,还能在资源有限的环境下,坚持杰出的功能。这为未来在资源受限的环境中布置和运转大型AI模型供给了有用的解决方案。
李飞飞,这位被誉为“AI教母”的华裔科学家,在AI范畴的奉献不容忽视。她创建了全球最大的图画识别数据库——ImageNet,该数据库包括21,800个类别和超越1,400万张图画,对核算机视觉范畴的开展起到了及其重要的效果。现在,李飞飞是斯坦福大学的终身教授,也曾担任Google Cloud的首席科学家。
上一篇:支撑 AI 的机器视觉的鼓起 下一篇:赛摩智能:AI与机器视觉的深层次地融合在多个行业大显身手