老鐵又開始捲了
先把各家愛秀的 "我比你還猛" 圖放一邊(反正一定自己都是最猛),以實測體驗講心得
- 和主流免費/限次數模型比起來堪用,不同種類問題各有千秋
- 和我訂閱的 O1 Pro 比起來還是有差距,但 deepseek 現在免錢
"DeepSeek V3開發方正式發布了技術報告,最引人注目的是它的高效和對算力資源依賴之小,同時效果又異常的好。 “DeepSeek-V3的完整訓練成本僅為2.788M GPU小時。假設H800 GPU的租金為每GPU小時2美元,我們的總訓練成本僅為557萬美元。”
只用了閹割的 hopper,還更省錢,也就是說巨頭現在的壓力很大,有追兵一再會試著去證明他用更少錢就能做到你做的事情,這樣跟股東交代的難度會變得很高
https://mp.weixin.qq.com/s/iFZOQsUNkpkXPDvOkE99wQ