Meta揭曉Llama 3：這款開放式AI模型是否真的無人能敵？

Meta近日推出了其Llama系列開放式生成AI模型的最新作品：Llama 3。更確切地說，該公司首次亮相了Llama 3系列的兩款模型，其餘模型將在未來某個不確定的時間推出。

Meta形容新模型——擁有80億參數的Llama 3 8B和擁有700億參數的Llama 3 70B——與前代Llama 2系列相比，在性能上是“重大飛躍”。事實上，Meta聲稱，就各自的參數數量而言，經過兩個定制的24,000 GPU集群訓練的Llama 3 8B和Llama 3 70B是當今表現最佳的生成AI模型之一。

這是一個相當大的宣稱。那Meta是如何支持這一點的呢？公司指出，Llama 3模型在眾多流行的AI基準測試中得分高，如MMLU（測量知識）、ARC（測量技能獲得）和DROP（測試模型對文字塊的推理能力）。雖然這些基準的實用性和有效性仍有爭議，但它們仍是AI界評估模型的少數標準方式之一。

Llama 3 8B在至少九個基準測試中超越了其他開放模型，如Mistral的Mistral 7B和Google的Gemma 7B，這兩款模型都包含70億參數。而更大參數數的Llama 3 70B模型，則與Google Gemini系列的最新作Gemini 1.5 Pro競爭。

Meta還開發了自己的測試套件，涵蓋從編碼和創意寫作到推理和摘要的多種用例，並自豪地表示Llama 3 70B在對抗Mistral的Mistral Medium模型、OpenAI的GPT-3.5以及Claude Sonnet等時表現居首。

從質量上講，Meta表示新Llama模型的用戶可以期待更多的“操控性”，拒絕回答問題的可能性更低，以及在有關歷史和STEM領域（如工程和科學）以及一般編碼建議的問答題目上的更高準確性。這部分得益於更大的數據集：收集了15萬億個代幣，或約7500億個單詞——是Llama 2訓練集大小的七倍。

官方網址:Meta Llama

目前Llama 3有開放下載核心，以及Meta AI(只開放特定國家，台灣不再列)

目前不支援繁體中文

預設選項

參考資料：Meta Llama

deom：https://www.meta.ai/