Google 一口氣推出諸多人工智慧模型應用,與年底將推出多款功能的 OpenAI 進一步對抗

管理員 | Android
【此文章來自:Mashdigi】

或許是為了與 OpenAI 等新興人工智慧技術抗衡,Google 稍早將其圖像生成模型 Imagen 3 向所有 Vertex AI 平台用戶開放使用,而可藉由文字生成影片內容的 Veo 也開始 以個人預覽形式開放使用,甚至 Google DeepMind 也進一步推出可生成能透過滑鼠、鍵盤互動的 3D 場景,並且僅以單張圖像即可生成的人工智慧模型 Genie 2,更以名為 GenCast 的人工智慧模型標榜能產生更精準的未來 15 天內氣候變化。

veo04-1.jpg



Imagen 3 及 Veo 明顯是為了與 OpenAI 等人工智慧新創團隊競爭,並且以單一文字描述、圖像內容,即可生成靜態圖像或時間長度為 1 分鐘、1080p 解析度規格的動態影片,同時也能納入電影拍攝運鏡,以及相關視覺呈現效果,讓生成影片可以更貼近專業內容。

7_blog-imagen-customization.max-1400x1400-1.jpg

在此之前,Veo 主要先透過 VideoFX App 向部分創作者提供測試,未來也會將此功能整合進 YouTube Shorts,而 Imagen 3 則會先透過 Google 實驗室提供使用。此次更新,則是讓 Veo 可透過 Vertex AI 平台以個人預覽形式提供使用,而 Imagen 3 則從下週開始向所有 Vertex AI 用戶提供。

其中,旅遊服務業者 Agoda 已經開始透過 Veo、Gemini 人工智慧與 Imagen 等人工智慧工具簡化宣傳影片廣告製作流程,而包含 Veo、Imagen 3 都會透過 SynthID 數位浮水印技術保護內容。

1_blog-veo-i2v-1.jpg

除了搶先 OpenAI 日前推出同樣可透過文字、靜態圖像生成長達 1 分鐘擬真影片的自動生成式 人工智慧技術「Sora」一步,讓更多人可透過 Veo 創造生動影片,Google DeepMind 團隊也進一步推出人工智慧模型 Genie 2,標榜以以單張圖像即可生成 3D 場景,並且能透過滑鼠、鍵盤操作互動。

unnamed-2.jpg

另外,此次推出的 GenCast 可預測未來 15 天內的氣候變化,並且標榜比市場上的模型分析預測更準確,同時本身是以 DeepMind 團隊去年提出的氣候預測模型 GraphCast 為架構基礎,透過自動生成方式讓準確度擴大,更強調此模型將對外開源提供使用。

1unnamed-1.jpg

至於在 OpenAI 方面,執行長 Sam Altman 確認將從 12 月 5 日起為算,維持 12 天連續公布新功能,其中預期也包含新版「Sora」 人工智慧模型。
 

Mashdigi

Mashdigi

出生自台灣高雄的楊又肇,以前聯合新聞網 (udn.com)數位頻道主編,以及在各網站頻道以本名或Mash Yang名稱維持提供撰寫、授權內容等身分,持續在網路、科技相關活動、展覽出沒。撰寫內容涵蓋個人感興趣內容,包含手機、網路、軟體、零組件,以及科技市場動態,另外也包含各類惡趣味內容,並且持續關注蘋果、微軟、Google、Intel、AMD、Nvidia等經常在你我生活中出現的科技廠商動態。