次世代 AI 殺到 Google Gemini 1.5 版發表

Billy | Android
相比起 OpenAI 的 ChatGPT 在去年年初已經相當流行,Google 在生成式人工智慧方面給人落後的感覺,不過在大型語言模型 Gemini 去年 12 月初推出後,Google 上星期就公佈了加強版 Gemini 1.0 Ultra,剛剛跟發佈了首個 Gemini 1.5 模型 Gemini 1.5 Pro。同時 Google 也宣佈將 Gemini 1.0 Ultra 首次開放給開發者使用。

google-next-gen-gemini-15-ai-model-can-handle-vast-amounts-o_3jkq.1920.jpg

 

效能提升運算需求下降

Google CEO Sundar Pichai 在公告中表示,Gemini 1.5 在多方面都有顯著的進步,1.5 Pro 達到了相當於 1.0 Ultra 的品質,同時還降低了運算需求。新一代的人工智慧實現了長篇內容理解上的突破。模型可處理的信息量獲得顯著提升,能夠一致地運行高達 100 萬個 Token 代幣,創下了所有大型基礎模型中最長的內容窗口。較長的內容窗口開啟了全新的能力,幫助開發者構建更有用的模型和應用程式。

 

有望挑戰 OpenAI 和 Microsoft

Google 今天只釋出了 Gemini 1.5 Pro 模型,但相信很快就會有 Ultra 和 Nano 版本。Google Deepmind CEO Demis Hassabis 將 Gemini 1.5 Pro 形容為一種中型多模態模型,能夠應付不同種類的任務。預計它與體積更大的 Gemini 1.0 Ultra 擁有相似的表現,足以令 Google 成為 OpenAI 和 Microsoft 的競爭對手。

 

已開放小規模測試

目前,Gemini 1.5 Pro 配備了 128,000 token 的內容窗口,但 Google 透過 AI Studio 和 Vertex AI 向一小部分開發者和企業客戶開放了 100 萬內容窗口的私人預覽。在獲得反饋並進一步改良以改善延遲、降低計算需求和增強用戶體驗後,就會向更多客戶推出。

 

內容窗口為 AI 基本元素

Google 特別為模型的「內容窗口」作出解釋,內容窗口由 token 組成,即是完整或部分的單詞、代碼、圖像、音訊或影片,這些是人工智慧模型用於處理資訊的基本元素。Gemini 1.0 支援 32,000 token,而 Gemini 1.5 在生產環境中可運行高達 100 萬 token,足以處理超過 70 萬單詞、超過 30,000 行代碼的代碼庫、11 小時的音頻或 1 小時的影片。該公司聲稱已成功測試達到 1000 萬 token。於有興趣測試 Gemini 1.5 Pro 的開發者,現在可以通過 AI Studio 中報名,企業客戶則可以聯繫 Vertex AI 帳戶團隊。

Google Gemini 1.5



資料來源:thurrott