—
加入為 Google 偏好來源
將 Yahoo 設為首選來源,在 Google 上查看更多我們的精彩報導
大陸AI新創公司深度求索(DeepSeek
[https://tw.news.yahoo.com/tag/DeepSeek])全新系列模型V4的預覽版本,昨(24)日上線並同步開源。這是DeepSeek首度採用華為AI晶片,分為Pro和Flash兩個版本,陸媒認為,其定價仍是一貫的「價格屠夫」風格。
華爾街見聞報導,就在前一天,OpenAI剛剛上線GPT-5.5,每百萬輸出token定價30美元(新台幣952元)。DeepSeek
V4-Flash的輸出定價是人民幣2元,折合不到0.3美元,也就是百分之一的價格。
路透報導,DeepSeek過去主要依賴輝達晶片訓練模型,但這次V4版本轉向與華為合作。不過DeepSeek並未公開說明訓練V4所使用的具體處理器晶片型號。這距離DeepSeek去年1月的大版本更新已時隔15個月。
值得一提的是,業界一直在關注DeepSeek-V4是否會用國產算力,從推文來看確實是與華為昇騰合作。V4
Pro版本主打高性能,DeepSeek表示,受限於高階算力,目前Pro服務吞吐十分有限,預計下半年華為昇騰950超節點批量上市後,Pro的價格還會大幅下調。
DeepSeek表示,V4開創了一種全新的注意力機制,在token維度進行壓縮,結合DeepSeek Sparse
Attention,深度求索稀疏注意力機制,實現全球領先的長上下文能力,並相比於傳統方法大幅降低對計算和顯存(顯卡記憶體VRAM)的需求。
DeepSeek還宣布, V4 擁有百萬字超長上下文,在AI代理(Agent)能力、世界知識和推理性能上均實現境內與開源領域的領先。
第一財經日報報導,V4模型按大小分為Pro和Flash兩個版本,其中,Pro版參數為1.6兆,啟動參數490億,預訓練資料量33兆;Flash版參數為2,840億,啟動參數130億,預訓練資料量32兆。均支持100萬token上下文,MIT協定完全開源。
從價格看,DeepSeek指出,V4-Pro每百萬tokens輸入是人民幣1元,輸出是人民幣12元,V4-Flash每百萬tokens輸入是人民幣0.2元,輸出是人民幣2元。
【看原文連結】
[https://udn.com/news/story/7333/9463158?utm_source=yahoonews&utm_medium=yahoo]
更多udn報導
玩股慘賠4千萬 張克帆近況曝光「瘦到認不出」
[https://stars.udn.com/star/story/10092/9462265?utm_source=yahoonews&utm_medium=referral&utm_campaign=yahoo]
夜市內衣攤誰會買?他賣6年還清負債再買2棟別墅
[https://udn.com/news/story/120911/9462201?utm_source=yahoonews&utm_medium=referral&utm_campaign=yahoo]
她產雙胞胎一驗父親不同人 專家驚:從未遇過
[https://udn.com/news/story/6810/9461589?utm_source=yahoonews&utm_medium=referral&utm_campaign=yahoo]
摸1下生殖器噴18萬 她拚「婚前挑戰」遭警帶走
[https://udn.com/news/story/6810/9462146?utm_source=yahoonews&utm_medium=referral&utm_campaign=yahoo]