DeepSeek被称为AI界拼多多,训练2个月仅花费了557.6万美元!
- 发布于:2025-01-28 14:19:27
- 来源:nba直播
1月28日讯 据钱江晚报报道,此次DeepSeek-V3在AI行业引发关注,关键的原因在于——超低的预训练成本。
“预训练”是AI大模型学习中的一种方法,指的是通过海量的数据,训练一个大模型。训练时需要大量的数据和算力支持,每次迭代可能耗资数百万至数亿美元。
官方技术论文披露,DeepSeek-V3在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。这个费用是什么概念?
据报道,GPT-4o的模型训练成本约为1亿美元。简单粗暴地说,这相当于DeepSeek-V3比同等性能的AI大模型,降了十几倍的成本。
早在2024年5月,深度求索发布DeepSeek-V2时,就曾因给模型的定价太过于便宜,开启了中国大模型的价格战,被称之为“AI界的拼多多”。
“相比于说它是‘拼多多’,它更像小米,贴近成本定价,并且自产自销。”马千里认为,训练成本比较低的原因,离不开深度求索团队自研的架构和算力,他们自身的算力储备可以与大厂比肩,并且更注重底层的模型。
“ChatGPT走的是大参数、大算力、大投入的路子,DeepSeek-V3的路径用了更多的巧思,依托数据与算法层面的优化创新,从而高效利用算力,实现较好的模型效果。”马千里说道。

- 体育战报 | Ning:昨天和Cat聊一下没事了主要被他一句"你说啥就是啥"干破防
- 体育战报 | 有点过分了吧!朱开锐评Meiko近期表现:打得感觉像大姨妈来了一样
- 体育战报 | Uzi将与RNG关联公司对簿公堂!此前直播公开控诉RNG拖欠款项
- 体育战报 | 太敬业了!Baolan与队友聊天:Uniboy为了打比赛在上海租房子
- 体育战报 | 小罗伯特唐尼60岁生日晒新发型:为参演《复联5》大反派做准备
- 体育战报 | 《我的世界》大电影内地票房破亿全球首周末票房高达3.01亿美元
- 体育战报 | 俱乐部02不敌BLG,iG股东张皓瀚更新微博:虹桥三连败,再也不来了
- 体育战报 | 外媒:前FNC名宿选手YellOwStaR将在法国次次级联赛复出,担任辅助
- 体育战报 | iPhone17Air为苹果史上最薄手机:电池容量不到4000毫安
- 体育战报 | Chovy:换线机制移除后更容易在比赛中形成配合,整体难度降低了

- NBA | 开挂!东契奇和芬尼相继再中三分湖人轰15记三分领先雷霆29分
- NBA | 外线火力全开!湖人半场轰出78分三分22投15中!
- NBA | 半场战报东契奇22+5詹姆斯9+4湖人轰进15记三分领先雷霆22分
- NBA | 状态回来了!东契奇半场14中8&三分9中5轰22分5助首节14分!
- NBA | 苦苦支撑!亚历山大半场11中7拿到15分7助正负值16
- NBA | Skip:78分创下雷霆本赛季半场最高失分纪录湖人真是他们的克星
- NBA | 没事,我有射程!德鲁蒂米三分踩线被扣掉后再来三分弥补上!
- NBA | 佩林卡:里夫斯是个为胜利而战的人希望他能帮助湖人夺冠!
- NBA | 你敢信湖人大比分领先联盟第一雷霆全场高呼“我们要布朗尼”
- NBA | 打得是啥玩意儿!巴雷特16投仅4中&罚球11中5拿到13分6板