穩定、高效！DeepSeek-V3 滿血版上線基石智算

pr 18426 2025-02-10 10:10:12

基石智算CoresHub 正式上線 DeepSeek-V3 滿血模型，為用戶帶來全新的 AI 體驗。DeepSeek-V3 模型以卓越的性能，助力各行業實現智能化升級。基石智算提供更靈活的調用方式，助力開發者快速構建高效智能應用。

DeepSeek-V3 模型亮點

DeepSeek-V3 模型在自然語言處理領域取得重大突破。它擁有龐大的預訓練數據，對各種復雜語境理解精準，無論是日常對話、專業文檔分析，還是創意寫作，V3 模型都能快速生成高質量、邏輯清晰的回復。通過優化算法架構，它的運算速度大幅提升，響應時間更短，為實時交互場景提供有力支持。

DeepSeek-V3 在知識類任務（MMLU, MMLU-Pro, GPQA, SimpleQA）上的水平，接近當前表現最好的模型 Claude-3.5-Sonnet-1022。

● 長文本：在長文本測評中，DROP、FRAMES 和 LongBench v2 上，DeepSeek-V3 平均表現超越其他模型。

● 代碼：DeepSeek-V3 在算法類代碼場景（Codeforces），遠遠領先于市面上已有的全部非 o1類模型，并在工程類代碼場景（SWE-Bench Verified）逼近 Claude-3.5-Sonnet-1022。

● 中文能力：DeepSeek-V3 與 Qwen 2.5-72B 在教育類測評 C-Eval 和代詞消歧等評測集上表現相近，但在事實知識 C-SimpleQA 上更為領先。

DeepSeek-V3 與 R1 對比

DeepSeek-V3 作為一個通用 NLP 模型，適用于廣泛的應用場景，能夠高效處理各種文本生成、摘要和對話任務。DeepSeek-R1 則專注于邏輯推理和問題求解，借助強化學習優化推理能力，適用于推理密集型任務。

特性	DeepSeek-V3	DeepSeek-R1
架構	混合專家 (MoE)	基于 V3，優化推理能力
參數規模	6710 億	6710 億
計算優化	每個Token激活的參數量為 370 億參數	采用動態門控機制，適應推理任務
訓練方法	結合負載均衡策略，優化專家分配	進一步增強專家調度，提高邏輯推理能力
推理能力	主要用于基于訓練數據中編碼的答案進行下一個詞的預測	擅長復雜問題解決、邏輯和分步推理任務
內存和上下文處理	可處理多達 64,000 個輸入標記，但在長時間交互中維護邏輯和上下文的能力相對較弱	特別擅長在長時間交互中維護邏輯和上下文
速度和效率	由于 MoE 架構，響應速度更快，更適合實時交互	生成響應時間較長，但提供更深入、更結構化的答案
應用場景	多功能 NLP 任務	復雜邏輯推理，多模態推理
價格	輸入價格：0.002元 / 千 tokens輸出價格：0.008 元/ 千 tokens	輸入價格：0.004 元/ 千 tokens輸出價格：0.016 元/ 千 tokens

DeepSeek-V3 調用方式

基石智算提供了兼容 OpenAI 接口規范的使用方式。支持多種調用方式，用戶僅需創建 API 密鑰，即可通過 AI 應用或第三方客戶端完成對特定模型的調用訪問。
具體使用方式參考：https://docs.coreshub.cn/console/big_model_server/call_scenario/

截至目前，基石智算已上線 DeepSeek 全系列模型，包括 V3、R1、Janus-Pro 等模型的滿血、量化及蒸餾版本，并支持直接調用 API、云端一鍵部署、私有化部署等多種模型使用方式，滿足不同用戶對于數據安全、應用場景的個性化需求。

熱門文章
最新文章
推薦文章

回收建議倡導

中金×青云榮膺 IDC 報告！共樹金融云原生轉型標桿

北京民營企業科技創新 100 強！青云再次入選

青云加入中國電信“AI+ 生態出海聯盟”

新品速遞｜計算型 e4 云服務器正式上線

青云科技品牌煥新：錨定 AI Infra 新定位，以全棧自研引領智能時代

青云云易捷與云尖 AI 服務器完成兼容互認證

讓 AI 真“干活”！青云與產業伙伴共話新型工業化新路徑

青云科技與朝陽園管委會共話 AI Agent 發展新機遇

青云科技亮相第四屆北京人工智能產業創新發展大會

熱門標簽

Ubuntu

邊緣計算

飛騰

教育

超融合

云易捷

數據

存儲

U10000

云服務器

RadonDB

數據庫

復制成功