DeepSeek-V2.5 中國最成功的聊天AI,號稱真正的開源 AI 模型領導者,卻無法輸入特定字眼。

開源生成式AI的發展速度之快,連身處該領域的專家或記者也難以追趕上這股潮流。由於開源AI模型的廣泛可獲取性及其許可條款的開放性,其他開發者比起使用專有模型更能迅速加以改進。這種特性讓新的開源AI領導者層出不窮,甚至僅在數日之內便可能出現替代者。

就在2024年9月6日,來自中國量化對沖基金「高飛資本管理公司」的AI子公司DeepSeek推出了其最新的AI模型DeepSeek-V2.5。這款新版本結合了之前兩個模型——DeepSeek-V2-0628與DeepSeek-Coder-V2-0724的功能,成為一個集語言處理與編程功能於一體的強大模型。

功能增強與表現提升

DeepSeek-V2.5對多項任務進行了優化,包括寫作、指令跟隨和進階編程等,並更符合人類偏好需求。經過多次調整,這款模型在幾乎所有基準測試中都超越了前任版本。

一個引人注目的新功能是其函數調用能力,這使得DeepSeek-V2.5能夠更有效地與外部工具互動。例如,該功能可用於實時天氣報告、翻譯服務,甚至在編寫算法或代碼片段等計算任務上也表現出色。

法國國家科研中心(CNRS)的AI/ML數據工程師Maziyar Panahi在社交平台X(原推特)上稱讚這款模型,稱它是「全球最佳的開源LLM」。他對於這款突破性產品尚未引起更廣泛的關注感到驚訝,並強調其出色的表現。

實測等級


DeepSeek-V2.5的整體表現大約與GPT-3.5相當。在中文的語言處理上,模型的用詞相當精確,但同樣存在一些偏見。核心問題在於,該模型雖然標榜為開源,但在內容上仍有限制。特別是在政治敏感話題上,使用者無法輸入或查詢任何對中國共產黨不利的訊息。此外,當試圖詢問有關中國領導人習近平的家庭成員時,例如他的父親,模型同樣無法給出相關回應。這些限制顯示出儘管該模型在技術上開放,但在資訊的自由度方面仍受到約束,特別是在涉及中國政治的領域。

明明很封閉卻很嘴硬

相關連結:DeepSeek | 深度求索