Meta近日推出了其Llama系列開放式生成AI模型的最新作品:Llama 3。更確切地說,該公司首次亮相了Llama 3系列的兩款模型,其餘模型將在未來某個不確定的時間推出。
Meta形容新模型——擁有80億參數的Llama 3 8B和擁有700億參數的Llama 3 70B——與前代Llama 2系列相比,在性能上是“重大飛躍”。事實上,Meta聲稱,就各自的參數數量而言,經過兩個定制的24,000 GPU集群訓練的Llama 3 8B和Llama 3 70B是當今表現最佳的生成AI模型之一。
這是一個相當大的宣稱。那Meta是如何支持這一點的呢?公司指出,Llama 3模型在眾多流行的AI基準測試中得分高,如MMLU(測量知識)、ARC(測量技能獲得)和DROP(測試模型對文字塊的推理能力)。雖然這些基準的實用性和有效性仍有爭議,但它們仍是AI界評估模型的少數標準方式之一。
Llama 3 8B在至少九個基準測試中超越了其他開放模型,如Mistral的Mistral 7B和Google的Gemma 7B,這兩款模型都包含70億參數。而更大參數數的Llama 3 70B模型,則與Google Gemini系列的最新作Gemini 1.5 Pro競爭。
Meta還開發了自己的測試套件,涵蓋從編碼和創意寫作到推理和摘要的多種用例,並自豪地表示Llama 3 70B在對抗Mistral的Mistral Medium模型、OpenAI的GPT-3.5以及Claude Sonnet等時表現居首。
從質量上講,Meta表示新Llama模型的用戶可以期待更多的“操控性”,拒絕回答問題的可能性更低,以及在有關歷史和STEM領域(如工程和科學)以及一般編碼建議的問答題目上的更高準確性。這部分得益於更大的數據集:收集了15萬億個代幣,或約7500億個單詞——是Llama 2訓練集大小的七倍。
官方網址:Meta Llama
目前Llama 3有開放下載核心,以及Meta AI(只開放特定國家,台灣不再列)
目前不支援繁體中文
預設選項
參考資料:Meta Llama
deom:https://www.meta.ai/