BlockBeats 消息,12 月 12 日在前一天剛宣布量子晶片突破性進展後,Google 再次引發熱議,正式發布其最新一代人工智慧模型 Gemini 2.0 系列。該模型被稱為 Google 迄今最強大的 AI 模型,專為「代理型智能體時代」而設計,同時伴隨推出多項智能體應用(AI Agent)。
Gemini 2.0 的重大突破與應用
Google 表示,Gemini 2.0 的核心基於第六代 TPU Trillium 架構,該硬體為模型的訓練和推理提供 100% 的算力支持。目前,這款模型已開放給開發者和受信任的測試人員,並計劃迅速整合到 Google 旗下的產品中,包括 Gemini 和搜尋服務。
Google 執行長 Sundar Pichai 在週三的聲明中表示:「今天,我們非常興奮地推出下一代 AI 模型 Gemini 2.0,這是我們邁向通用助理願景的重要一步。憑藉多模態技術的突破,例如圖像與音訊輸出能力,搭配工具使用的新進展,Gemini 2.0 將能構建更強大的 AI 代理,改變我們與人工智慧互動的方式。」
模型亮點與應用場景
- 多模態能力提升
Gemini 2.0 在處理文字、圖像、音訊等多模態資料時更為自然流暢,能提供更精準的理解與回應。 - 工具使用與任務執行
這款模型可主動調用工具,例如搜尋引擎、翻譯系統,甚至 API 呼叫,具備自主執行複雜任務的能力。 - 深度研究功能
新增的「深度研究」功能,結合推理與長上下文處理能力,適合用於探索複雜主題,並能生成專業報告。 - AI 代理化
Gemini 2.0 標誌著 Google 邁向 AI 代理時代的開始。模型能夠主動協助用戶完成任務,從行程安排到專業建議,無所不包。
市場反應熱烈
受 Gemini 2.0 發布消息的提振,Google 股價週三上漲 5.52%,創歷史新高。今年以來,Alphabet A 股已累計上漲近 40%,成為推動納斯達克突破 20,000 點的重要力量之一。
Gemini 2.0 與 1.5 的差異
與先前的 Gemini 1.5 相比,Gemini 2.0 不僅是效能升級,更代表 AI 能力的質變:
- 多模態處理能力的飛躍:能更有效地整合文字、圖像、音訊等多種資訊,回應更精確且自然。
- 推理與理解能力增強:在處理複雜問題和多步驟推理時表現更佳,特別是在程式碼生成與除錯中展現出色表現。
- 自主工具使用能力:可主動使用外部工具執行任務,如 API 呼叫與任務規劃,擴展應用場景。
- 上下文處理更強:Gemini 2.0 擁有更長的上下文窗口,能處理大量資訊,生成更一致且準確的結果。
- 代理型 AI 的基礎:相比於被動回應的 Gemini 1.5,2.0 已邁向主動執行任務的 AI 代理型態。
Gemini 2.0 的推出象徵著人工智慧進入全新階段,從單純的指令回應,進化為能自主執行任務的「代理型 AI」。這不僅是 Google 在 AI 領域的又一里程碑,也預示著未來 AI 技術應用將帶來更多可能性,讓我們的生活與工作方式產生深刻變革。