【FOCUS】螺絲殼裏做道場,DeepSeek致勝啟示

28/01/2025

  「算力出奇跡」VS「螺絲殼裏做道場」,到底哪個技高一籌?AI股王英偉達輝周一(27日)市值蒸發5890億美元,如對前者的當頭棒喝,盛行多年的AI核心假設--資金多即是強、算力高即是好,遭奉行後者的DeepSeek徹底打破。

 

AI多年核心假設一朝打破

 

  Meta的朱克伯格上周拋出「2025年資本支出高達650億美元」、「年底擁有130萬顆GPU」的震撼彈,短短三天後,AI界的「大躍進」敘事即畫風驟變,皆因跟OpenAI O1大模型分庭抗禮的DeepSeek-R1大模型,被揭訓練成本低至560萬美元,使用的英偉達GPU數量僅2048顆,且型號是上一代H800。

 

【FOCUS】螺絲殼裏做道場,DeepSeek致勝啟示

DeepSeek異軍突起,拖累英偉達輝周一(27日)市值蒸發5890億美元。

 

  OpenAI首席執行官Sam Altman周二最新表示,DeepSeek-R1大模型令人印象深刻,但堅稱「現在比以往任何時刻,都需要更強的算力來完成使命。」

 

強化學習+混合專家架構

 

  面對有「AI界拼多多」之稱的中國「黑馬」公司,何解Sam Altman仍執著算力?答案指向其大模型訓練路徑。據OpenAI創始成員Andrej Karpathy解釋,訓練分為4個階段:一,預訓練(「投喂」大量文字並設定權重),建立基礎LLM模型;二,監督微調(以少量高品質的資料提示完成特定任務),建立SFT模型;三,獎勵模型(對回應進行打分並相應調整權重);四,強化學習(在獎勵模型下不斷調整以獲得更高分數),最終獲得RLHF(人類反饋強化學習)模型。

 

【FOCUS】螺絲殼裏做道場,DeepSeek致勝啟示

DeepSeek依賴大規模強化學習(RL)訓練大模型,並將論文公開發表。

 

  DeepSeek則選擇跳過監督微調,而依賴大規模強化學習(RL),而這種方法允許模型自行探索思維鏈(CoT) ,以直接獲得更好表現。此外,DeepSeek採用MoE(混合專家)架構,即每個任務只激活相應的「專家(參數)」,意味顯著減少計算時間和算力需求。

 

借分享突破邊界吸引人才

 

  令人尤為驚訝的是,這兩大「殺手鐧」,DeepSeek都將相關研究論文--19頁《通過強化學習激勵大模型的推理能力》、33頁《在MoE語言模型中邁向終極專家專業化》經Arxiv學術平台公開分享。

 

  如此「慷慨」的原因何在?據DeepSeek自己的回答:「在快速發展的AI領域,合作和開放式的思想交流對於快速創新至關重要」,「是否擔心他人『趕上』並非主要考量,相反,重點在於突破可能的邊界,並分享這些進步,讓所有人受惠」,「通過分享研究成果,DeepSeek也能建立自己的思想領袖地位,並吸引人才和合作夥伴,以進一步實現其目標。」

 

【FOCUS】螺絲殼裏做道場,DeepSeek致勝啟示

鄭州連鎖餐廳靠免費派發低成本的氣球,做出了月租數萬元廣告牌沒有的效果。

 

  相比之下,名為「開放」的OpenAI拒絕如DeepSeek一樣開源,格局無疑小得多。聯想河南鄭州的一家連鎖餐廳,面對每月僅700元的廣告預算,靠免費派發每個成本僅幾毫子的氣球,做出了月租數萬元廣告牌沒有的效果,所謂「螺螄殼裏做道場」,即是不信邪、不拘泥地靈活變通,終能出奇制勝。

 

  那麼,Nvidia的神話有無結束?看看黃仁勳月初在「國際消費電子展CES 2025」上的展示,RTX 50 GPU、低價AI超級電腦Project Digits、人形機器人Cosmos……答案同樣是否。

 

撰文:金子安

撐運動.護關節 | 維柏健健骨鐵三角【關節健骨至尊(升級版)】買1送1 (原價$388)!同時修復、抗蝕、強骨,7天見效。立即把握健骨良機!(優惠期至27/3/2025)► 了解詳情

備註:報價延遲最少15分鐘,資料更新時間為 28/03/2025 17:59

延伸閱讀

More
  • 道瓊斯工業平均指數
    跌 41,583.90
    -715.80 (-1.692%)
  • 標準普爾500指數
    跌 5,580.94
    -112.37 (-1.974%)
  • 納斯達克綜合指數
    跌 17,322.99
    -481.04 (-2.702%)
精選預託證券 More
02318 中國平安
按盤價(HKD)︰跌46.781
變動率︰-2.356%
較港股︰-0.36%
00388 香港交易所
按盤價(HKD)︰跌350.198
變動率︰-3.010%
較港股︰-0.96%
00001 長和
按盤價(HKD)︰跌43.434
變動率︰-4.940%
較港股︰-3.80%
00003 香港中華煤氣
按盤價(HKD)︰跌5.846
變動率︰-9.030%
較港股︰-12.62%
精選中資美股 More
GDS 萬國數據
按盤價(USD)︰跌25.230
變動率︰-3.592%
BILI 嗶哩嗶哩
按盤價(USD)︰跌19.220
變動率︰-4.663%
IQ 愛奇藝
按盤價(USD)︰跌2.250
變動率︰-5.063%
BIDU 百度
按盤價(USD)︰跌93.370
變動率︰-5.131%
精選美股 More
GOOG
谷歌
按盤價(USD)︰跌156.060
變動率︰-4.888%
PYPL
貝寶
按盤價(USD)︰跌65.150
變動率︰-5.388%
SHOP
Shopify
按盤價(USD)︰跌96.680
變動率︰-5.696%
COIN
Coinbase Global
按盤價(USD)︰跌173.930
變動率︰-7.769%
美國指數之報價延遲最少15分鐘。
美股之報價延遲最少15分鐘。
美國時間為 : 29/03/2025 06:28 EDT
港股之報價延遲最少15分鐘,更新時間為:28/03/2025 17:59
美國指數之報價延遲最少15分鐘。
美國時間為 : 29/03/2025 06:28 EDT
顯示更多
緊貼市況
  • 06667 美因基因
  • 7.250
  • 00139 中達集團控股
  • 0.036
  • 08247 中生北控生物科技
  • 0.850
  • 00392 北京控股
  • 29.200
  • 06127 昭衍新藥
  • 14.500
  • 01397 碧瑤綠色集團
  • 0.640
  • 目標︰$0.80
  • 06862 海底撈
  • 18.020
  • 目標︰$20.00
  • 00778 置富產業信託
  • 4.110
  • 目標︰$4.45
  • 00856 偉仕佳杰
  • 6.540
  • 目標︰--
  • 01415 高偉電子
  • 29.400
  • 目標︰$40.00
  • 09988 阿里巴巴-W
  • 131.000
  • 00001 長和
  • 45.150
  • 00700 騰訊控股
  • 509.500
  • 00981 中芯國際
  • 48.000
  • 01810 小米集團-W
  • 51.050
  • 02359 藥明康德
  • 69.500
  • 目標︰--
  • 00020 商湯-W
  • 1.500
  • 目標︰--
  • 02319 蒙牛乳業
  • 19.420
  • 目標︰$21.00
品味生活
備註: 本地指數之報價為即時更新,資料更新時間為 28/03/2025 17:59
中國指數之報價為即時更新,資料更新時間為 28/03/2025 16:29
期指之報價為即時更新,資料更新時間為 29/03/2025 03:00
緊貼市況之報價延遲最少15分鐘,資料更新時間為 28/03/2025 16:40
港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站
人氣文章
  • 生活
  • DIVA
  • 健康好人生
專業版
HV2
精裝版
SV2
串流版
IQ 登入
強化版
TQ
強化版
MQ

etnet榮膺「第九屆傳媒轉型大獎」四大獎項

【限時優惠$68/月】申請etnet強化版MQ手機串流報價服務 捕捉板塊輪動,提高獲利勝算

【讚好有禮】送你有溫度的禮物!賞:銀杏館百合金桔菊花羅漢果清潤茶!

貨幣攻略

大國博弈

說說心理話

Watch Trends 2024

北上食買玩

Art Month 2024

理財秘笈

流感高峰期

山今養生智慧

輕鬆護老