今天下跌是因为DeepSeek砸盘?

版主: Nimitz

回复
内容
作者
牛大春
栋梁
帖子: 13083
注册时间: 2023-12-21
Has thanked: 947 time
Been thanked: 392 time

今天下跌是因为DeepSeek砸盘?

#1

#1 帖子 牛大春 »

DeepSeek周一低调发布了6850亿参数的AI开源模型DeepSeek-V3的更新版本V3-0324,加强了模型的编程能力,在Hugging Face上线并取得MIT许可证,可免费用于商业用途。该模型可以在消费级硬件上运行,例如配备M3 Ultra芯片的苹果Mac Studio,打破了大模型必须依赖数据中心的传统思路;同时采用“专家”模块,仅在特定任务中激活部分参数,显著降低算力需求;并引入多头潜在注意力(MLA)和多标记预测(MTP)技术,输出速度提升80%。有AI研究者在社交平台X上发布评测指出,V3-0324模型在所有基准测试中都取得巨大进步,可能已超越Claude 3.5 Sonnet,成为最强大的非推理模型。

百升飞上天,明月照长安。

Hof
精英
帖子: 2208
注册时间: 2023-12-21
Has thanked: 477 time
Been thanked: 301 time

Re: 今天下跌是因为DeepSeek砸盘?

#2

#2 帖子 Hof »

H20 tailor-made chip for China market, avoiding US tariff, is being challenged by the newly approved Chinese energy-use regulation esp. AI data-centers.(China focus on efficiency not power usage)
China accounts for 13% of NVDA's annual sales.

PS: H20's conterparts for US/EU market are H100/H200/B100/B200.

回复