27/01/2026 14:57

【AI】DeepSeek發布OCR 2模型,AI能以人類邏輯順序「看」圖像

  據《華爾街見聞》報道,DeepSeek今日發布新一代光學字符識別模型DeepSeek-OCR 2。DeepSeek-OCR 2採用名為DeepEncoder V2的新方法,使AI能夠像人類一樣按照邏輯順序「看」圖像。這一進展可能重塑文檔處理、圖表分析等依賴複雜視覺理解的應用場景。

  據介紹,這項技術的核心創新在於改變了傳統AI處理圖像的方式。DeepEncoder V2讓AI基於圖像含義動態重新排列圖像片段,而非傳統的從左到右剛性掃描。這種方法模仿了人類追隨場景邏輯流的方式。

*性能較前代提升3.73%*

  根據DeepSeek公布的技術報告,DeepSeek-OCR 2在多項關鍵指標上展現出顯著優勢。在OmniDocBench v1.5基準測試中,該模型取得了91.09%的成績,相較於去年10月發布的前代--DeepSeek-OCR提升了3.73%。

  值得注意的是,該模型在保持極高精度的同時,嚴格控制了計算成本,其視覺Token數量被限制在256至1120之間,這一上限與Google的Gemini-3 Pro保持一致。在實際生產環境中,該模型在處理在線用戶日誌和PDF預訓練數據時的重複率分別下降了2.08%和0.81%,顯示出極高的實用成熟度。
《經濟通通訊社27日專訊》

【你點睇?】巴士安全帶新例正式實施,乘客須配戴安全帶,違者可被檢控。你認為新例對提升乘車安全有多大幫助?你最擔心新例會帶來哪方面問題?► 立即投票

專業版
HV2
精裝版
SV2
串流版
IQ 登入
強化版
TQ
強化版
MQ

etnet初心不變 風雨無阻 與你並肩投資路,立即加入成為etnet YouTube頻道會員!

獨家優惠【etnet x 環球海產】 用戶專享全場95折,特價貨品更可折上折,立即選購五星級酒店御用海鮮!

樂本健 x etnet健康網購 | 購物滿額即送免費禮品

大國博弈

貨幣攻略

關稅戰

說說心理話

Watch Trends 2025

北上食買玩

Wonder in Art

理財秘笈

山今養生智慧

輕鬆護老

照顧者 情緒健康