OpenELM大型語言模型,還能在你的設備上直接運行呢!
就在Google、Samsung和Microsoft不斷在他們的PC和移動設備上推進生成性AI技術時,蘋果也不甘示弱,加入了這場AI革命。他們新推出的OpenELM是一套開源的大型語言模型(簡稱LLM),最大的賣點是這些模型可以完全在個人設備上運行,完全不需要連接雲端服務器。
這些模型是在幾小時前在AI社區Hugging Face上發布的。OpenELM包括了一些小巧的模型,專門設計來高效地處理文本生成任務。
OpenELM一共有八個模型,四個是預訓練的,另外四個則是經過指令調整的。它們的參數範圍從2.7億到30億不等,參數越多一般意味著模型的性能更強大,功能也更多。
說到預訓練,這是讓語言模型能夠產生連貫且實用的文本的方法。而指令調整則更進一步,它讓模型能對用戶的具體要求做出更加精確的回應。比如,當你問“教我如何烘焙麵包”,預訓練可能只會回答“在家用烤箱”,而指令調整後的模型則能給你一個完整的烘焙步驟。
蘋果將這些模型的權重以“範例代碼許可”的形式提供,還附有訓練的不同階段檢查點、模型性能的統計數據,以及有關預訓練、評估、指令調整和參數效率調整的指導。
這個許可證不禁止商業使用或修改,只是要求如果你要重新分發蘋果的軟件,你得保留原來的通知和一些文本免責聲明。
蘋果還提醒說,這些模型沒有任何安全保證。這意味著有可能會在回應用戶的指令時產生不準確或令人不快的結果。
繼去年10月悄悄推出具有多模態功能的開源語言模型Ferret之後,這是蘋果又一次讓人意外的開源AI模型發布。作為一家以保密著稱且喜歡“閉門造車”的科技公司,蘋果這次又在沒有太多宣傳的情況下,在線上推出了這些模型和相關論文。
相關資訊:OpenELM Instruct Models - a apple Collection (huggingface.co)