Google 開源 AI 模型 Gemma:大模型普及化時代來臨

Google 近期動作頻頻,繼上周公布大型語言模型 Gemini 1.5 版本後,本周再宣布開源 AI 模型 Gemma 的兩個版本 (2B 和 7B),讓開發者和研究人員可在雲端、資料中心甚至個人筆電上建立和執行 AI 模型。此舉被視為大模型普及化的重要里程碑,未來所有設備都可能具備與人類對話的能力,而依靠租賃或販售大模型獲利的商業模式也將面臨挑戰。

Gemma:輕量級開源模型家族

Gemma 是由 Google DeepMind 和 Google 其他團隊共同開發的輕量級開源模型家族,其名稱源自拉丁語,意為「寶石」。Gemma 建立在與 Gemini 相同的技術和研究基礎之上,並提供兩種版本:Gemma 2B 和 Gemma 7B。Google 同時也釋出其他工具,協助開發、協同和負責任地使用 Gemma 模型。

效能超越同級模型

Google 強調,Gemma 和 Gemini 採用相同的技術和基礎架構元件,這使得 Gemma 2B 和 7B 的效能超越其他同等規模的開源模型。在多項基準測試中,Gemma 甚至超越了更大的模型。例如,在推論、數學和程式撰寫方面,Gemma 7B 的表現都優於 Llama 2 7B 和 Mistral 7B。

多平台支援與易於部署

Gemma 預訓練模型和經過指令微調後的模型,可以直接在開發人員的筆電、工作站、桌上型電腦或 Google Cloud 的 Vertex AI 和 Google Kubernetes Engine (GKE) 上執行。Vertex AI 提供廣泛的 MLOps 工具,內建多種微調選項和一鍵部署功能。不論是代管的 Vertex AI 工具還是自行管理的 GKE,都支援客製化,包括部署到各種 GPU、TPU 和 CPU 等基礎架構平台。

大模型普及化時代的影響

Google 開源 Gemma 模型的舉動,被視為大模型普及化的重要一步。未來,所有設備都可能具備與人類對話的能力,而依靠租賃或販售大模型獲利的商業模式也將面臨挑戰。OpenAI 的 GPT 系列大模型可能首當其衝,因為企業現在有了新的選擇:繼續付費使用 GPT API 或是自行建立 Gemma 模型。