聯發科突破:推出450億參數繁中語言模型BreeXe,性能超越GPT-3.5!

Breexe-8x7B 是一個建立在 Mixtral-8x7B 之上的語言模型系列,專門用於繁體中文。


Breexe-8x7B-Base 是 Breexe-8x7B 系列的基礎機型。 Breexe-8x7B-Base 透過額外的 30,000 個繁體中文標記擴展了原始詞彙。隨著詞彙量的擴展,Breexe-8x7B 的繁體中文推理速度是 Mixtral-8x7B 的兩倍。

聯發科跨足生成式AI,推出DaVinci平台與BreeXe語言模型

在人工智能的浪潮中,聯發科技不甘落後,正式推出了生成式AI服務平台MediaTek DaVinci和繁中大型語言模型MediaTek Research BreeXe,標誌著聯發科在AI領域的重要一步。

DaVinci平台:客製化智能助理的新選擇

MediaTek DaVinci是聯發科為提高企業生產力而設計的一站式AI服務平台。它提供了豐富的API庫、擴充外掛庫和AI模型庫,使使用者能夠打造專屬的智能助理。更令人興奮的是,DaVinci平台今年新增了智慧助理架構和4大商店,這意味著即使沒有編程技能的職員也能輕鬆定制自己的智慧秘書。

此外,DaVinci平台還整合了多種大型語言模型,如Google Gemini、GPT-3.5/4V等,以及聯發科自己開發的BreeXe模型。這些功能的結合使DaVinci成為一個功能強大、靈活多變的AI工具箱,能夠滿足企業在不同場景下的需求。

BreeXe語言模型:繁中處理的新高峰

聯發科的BreeXe語言模型是基於Mistral 8x7B模型開發的,擁有450億個參數,專門針對繁體中文進行了大量訓練。在繁中基準測試中,BreeXe的表現甚至超越了GPT-3.5,顯示出其在中文處理方面的卓越能力。

不僅如此,BreeXe還能處理長達4萬字的文本,遠超Mistral 8x7B模型的4,000字限制,這使得它能夠應對更加複雜和深入的語言處理任務。聯發科技還計劃開源臺灣-RAG的訓練資料,進一步豐富BreeXe模型的應用範圍。

聯發科內部的成功應用

聯發科技已經在內部深度運用DaVinci平台和BreeXe模型,實現了96%的集團滲透率和4.4分的滿意度。這些工具在軟體開發、人資篩選、財務報銷等多個領域發揮了巨大作用,顯著提升了聯發科的工作效率。

未來展望

展望未來,聯發科不僅計劃將DaVinci平台和BreeXe模型推廣到外部企業,還將繼續開發更多創新的AI技術,如致力於打造繁中版的GPT-4模型。聯發科的這些舉措無疑將為AI領域帶來更多的可能性,也為企業提供了更多高效、智能的解決方案。

BreeXe 測試連結 : Gradio (hf.space)