原来deepseek的训练成本只有其他公司的二十分之一

版主: Nimitz

回复
内容
作者
resso
栋梁
帖子: 10968
注册时间: 2023-12-24
Has thanked: 95 time
Been thanked: 198 time

原来deepseek的训练成本只有其他公司的二十分之一

#1

#1 帖子 resso »

嗯,这一下英伟达少买95%的芯片。孙正义只要投资两百五十亿就够了

shanghaibaba
精英
帖子: 8133
注册时间: 2023-12-21
Has thanked: 36 time
Been thanked: 224 time

Re: 原来deepseek的训练成本只有其他公司的二十分之一

#2

#2 帖子 shanghaibaba »

resso 写了: 27 1月 2025, 19:37

嗯,这一下英伟达少买95%的芯片。孙正义只要投资两百五十亿就够了

好事情。帮美国节约成本了

shepherd17
精英
帖子: 2526
注册时间: 2023-12-24
Has thanked: 471 time
Been thanked: 459 time

Re: 原来deepseek的训练成本只有其他公司的二十分之一

#3

#3 帖子 shepherd17 »

resso 写了: 27 1月 2025, 19:37

嗯,这一下英伟达少买95%的芯片。孙正义只要投资两百五十亿就够了

咱们中国人擅长“花小钱办大事”。

resso
栋梁
帖子: 10968
注册时间: 2023-12-24
Has thanked: 95 time
Been thanked: 198 time

Re: 原来deepseek的训练成本只有其他公司的二十分之一

#4

#4 帖子 resso »

我一直觉得现在的ai不make sense,为啥要花几亿刀,去训练模型。正常ai的发展方向铁定是低能耗,而不是大基建啊

shanghaibaba
精英
帖子: 8133
注册时间: 2023-12-21
Has thanked: 36 time
Been thanked: 224 time

Re: 原来deepseek的训练成本只有其他公司的二十分之一

#5

#5 帖子 shanghaibaba »

resso 写了: 27 1月 2025, 19:43

我一直觉得现在的ai不make sense,为啥要花几亿刀,去训练模型。正常ai的发展方向铁定是低能耗,而不是大基建啊

大数据本身方向就不对。你我活到现在,受了多少数据训练啊?这应该不是真的智能方向

shepherd17
精英
帖子: 2526
注册时间: 2023-12-24
Has thanked: 471 time
Been thanked: 459 time

Re: 原来deepseek的训练成本只有其他公司的二十分之一

#6

#6 帖子 shepherd17 »

shanghaibaba 写了: 27 1月 2025, 19:50

大数据本身方向就不对。你我活到现在,受了多少数据训练啊?这应该不是真的智能方向

更重要的可能是方法问题。

举个不恰当的例子。我们都学过编程。实现同样一个功能,有些人的程序思路复杂、代码也复杂低效。但有些人的程序思路就简洁巧妙。前者运行时明显比后者更占用资源。

Test3
新手
帖子: 42
注册时间: 2025-01-28
Been thanked: 1 time

Re: 原来deepseek的训练成本只有其他公司的二十分之一

#7

#7 帖子 Test3 »

resso 写了: 27 1月 2025, 19:43

我一直觉得现在的ai不make sense,为啥要花几亿刀,去训练模型。正常ai的发展方向铁定是低能耗,而不是大基建啊

以后成本会降低。
有人说用deep seek学数论,很快学出来了。
让open Ai学,学不会一直画圈圈

好像还是有点技术含量的

Test3
新手
帖子: 42
注册时间: 2025-01-28
Been thanked: 1 time

Re: 原来deepseek的训练成本只有其他公司的二十分之一

#8

#8 帖子 Test3 »

shepherd17 写了: 27 1月 2025, 19:40
resso 写了: 27 1月 2025, 19:37

嗯,这一下英伟达少买95%的芯片。孙正义只要投资两百五十亿就够了

咱们中国人擅长“花小钱办大事”。

都是站在前人的肩旁上,一步步发展起来的。
中国赢在内卷的教育制度。

Test3
新手
帖子: 42
注册时间: 2025-01-28
Been thanked: 1 time

Re: 原来deepseek的训练成本只有其他公司的二十分之一

#9

#9 帖子 Test3 »

Deepseek 模仿的是OpenAi 的模型。
不是从0到1的突破,也是从1到100的进步。
特别是逻辑推理上。

回复