Google 開源 AI 模型 Gemma：大模型普及化時代來臨

Google 近期動作頻頻，繼上周公布大型語言模型 Gemini 1.5 版本後，本周再宣布開源 AI 模型 Gemma 的兩個版本 (2B 和 7B)，讓開發者和研究人員可在雲端、資料中心甚至個人筆電上建立和執行 AI 模型。此舉被視為大模型普及化的重要里程碑，未來所有設備都可能具備與人類對話的能力，而依靠租賃或販售大模型獲利的商業模式也將面臨挑戰。

Gemma：輕量級開源模型家族

Gemma 是由 Google DeepMind 和 Google 其他團隊共同開發的輕量級開源模型家族，其名稱源自拉丁語，意為「寶石」。Gemma 建立在與 Gemini 相同的技術和研究基礎之上，並提供兩種版本：Gemma 2B 和 Gemma 7B。Google 同時也釋出其他工具，協助開發、協同和負責任地使用 Gemma 模型。

效能超越同級模型

Google 強調，Gemma 和 Gemini 採用相同的技術和基礎架構元件，這使得 Gemma 2B 和 7B 的效能超越其他同等規模的開源模型。在多項基準測試中，Gemma 甚至超越了更大的模型。例如，在推論、數學和程式撰寫方面，Gemma 7B 的表現都優於 Llama 2 7B 和 Mistral 7B。

多平台支援與易於部署

Gemma 預訓練模型和經過指令微調後的模型，可以直接在開發人員的筆電、工作站、桌上型電腦或 Google Cloud 的 Vertex AI 和 Google Kubernetes Engine (GKE) 上執行。Vertex AI 提供廣泛的 MLOps 工具，內建多種微調選項和一鍵部署功能。不論是代管的 Vertex AI 工具還是自行管理的 GKE，都支援客製化，包括部署到各種 GPU、TPU 和 CPU 等基礎架構平台。

大模型普及化時代的影響

Google 開源 Gemma 模型的舉動，被視為大模型普及化的重要一步。未來，所有設備都可能具備與人類對話的能力，而依靠租賃或販售大模型獲利的商業模式也將面臨挑戰。OpenAI 的 GPT 系列大模型可能首當其衝，因為企業現在有了新的選擇：繼續付費使用 GPT API 或是自行建立 Gemma 模型。