Stability AI,一家位於科技前沿的創新公司,今天推出了其革命性的下一代生成AI模型——Stable Diffusion 3。在數月的精心預覽後,這款引人注目的新技術終於全面上市,同時公司還提供了名為「Stable Assistant」的新型聊天機器人技術的初步預覽。
早在2月,Stable Diffusion 3就作為測試版首次亮相,引起了廣泛的關注。從今日起,這一創新的AI模型將通過Stability AI的開發者平台API全面開放,使開發者能夠將這一強大的文字到圖像生成功能整合到各種應用程式中。此外,Stability AI還推出了一個更加強大的版本——Stable Diffusion 3 Turbo模型,提供更快的處理速度和更高的效率。
Stability AI在這一版本中加入了一系列創新的機器學習和人工智慧技術,旨在提升圖像生成的品質與精確度。Christian Laforte,Stability AI的首席技術官兼臨時聯合執行長,在接受VentureBeat的獨家採訪時表示,公司已經實施了多項措施以防止技術濫用,並將根據用戶反饋持續改進這些措施。
儘管Stable Diffusion 3現已可透過API獲得,一個完全開放的版本仍在開發中。Laforte強調,公司正在不斷改進這一模型,目標是在不久的將來,讓這些模型權重能夠通過Stability AI的會員資格自託管。
在支援和實現Stable Diffusion 3 API的過程中,Stability AI與Fireworks AI建立了重要的合作夥伴關係。Fireworks AI,作為業界領先的機器學習(ML)編譯器專家,將為Stable Diffusion 3提供必要的技術支持,確保API平台的推理性能在市場上保持領先。
值得一提的是,Stable Diffusion 3中的一大創新是引入了多模態擴散變壓器(MMDiT)架構,首次將變壓器技術應用於擴散模型中,這不僅提高了對文字的理解,還大幅提升了圖像排版的品質。
此外,Stable Diffusion 3 Turbo,即SD3-Turbo,被設計為一個速度更快的模型,根據相關研究論文,其運行速度是普通版的十倍,同時在保持近似於原始Stable Diffusion 3水平的圖像質量的同時,顯著提高了效率。
隨著這些突破性技術的推出,Stability AI不僅再次確立了其在AI領域的領導地位,也為未來的技術創新奠定了堅實的基礎。隨著技術的不斷演進和完善,我們期待看到更多創新應用的誕生,進一步推動人工智能技術的發展和應用。
參考資料:
[2403.12015] Fast High-Resolution Image Synthesis with Latent Adversarial Diffusion Distillation (arxiv.org)
Stability AI - Developer Platform