Meta揭曉Llama 3:這款開放式AI模型是否真的無人能敵?

Meta近日推出了其Llama系列開放式生成AI模型的最新作品:Llama 3。更確切地說,該公司首次亮相了Llama 3系列的兩款模型,其餘模型將在未來某個不確定的時間推出。

Meta形容新模型——擁有80億參數的Llama 3 8B和擁有700億參數的Llama 3 70B——與前代Llama 2系列相比,在性能上是“重大飛躍”。事實上,Meta聲稱,就各自的參數數量而言,經過兩個定制的24,000 GPU集群訓練的Llama 3 8B和Llama 3 70B是當今表現最佳的生成AI模型之一。

這是一個相當大的宣稱。那Meta是如何支持這一點的呢?公司指出,Llama 3模型在眾多流行的AI基準測試中得分高,如MMLU(測量知識)、ARC(測量技能獲得)和DROP(測試模型對文字塊的推理能力)。雖然這些基準的實用性和有效性仍有爭議,但它們仍是AI界評估模型的少數標準方式之一。

Llama 3 8B在至少九個基準測試中超越了其他開放模型,如Mistral的Mistral 7B和Google的Gemma 7B,這兩款模型都包含70億參數。而更大參數數的Llama 3 70B模型,則與Google Gemini系列的最新作Gemini 1.5 Pro競爭。

Meta還開發了自己的測試套件,涵蓋從編碼和創意寫作到推理和摘要的多種用例,並自豪地表示Llama 3 70B在對抗Mistral的Mistral Medium模型、OpenAI的GPT-3.5以及Claude Sonnet等時表現居首。

從質量上講,Meta表示新Llama模型的用戶可以期待更多的“操控性”,拒絕回答問題的可能性更低,以及在有關歷史和STEM領域(如工程和科學)以及一般編碼建議的問答題目上的更高準確性。這部分得益於更大的數據集:收集了15萬億個代幣,或約7500億個單詞——是Llama 2訓練集大小的七倍。

官方網址:Meta Llama

目前Llama 3有開放下載核心,以及Meta AI(只開放特定國家,台灣不再列)

目前不支援繁體中文

預設選項

參考資料:Meta Llama

deom:https://www.meta.ai/