Google 公布新版影片生成工具 Veo 2、新版圖像生成工具 Imagen 3,提供更多影像創作可能性

管理員 | 科技新知
【此文章來自:Mashdigi】

繼今年 5 月公布影片生成工具 Veo 之後,Google DeepMind 稍早公布新版影片生成工具 Veo 2,並且推出新版圖像生成工具 Imagen 3,另外也推出 新一波實驗計畫

12-16-24_GenMedia_Hero-1_FEraqiS.width-1600.format-webp.jpg



Veo 2 主要提高生成結果更符合真實世界的物理作動,以及人類運動時的肢體表現,以及表情細微呈現,藉此增加生成影像的真實性。

此外,Veo 2 也加入電影攝影特殊用語,例如可要求生成以低角度平移追蹤鏡位產生影片,或是依照使用者輸入 18mm 焦段鏡頭產生相應拍攝影像,甚至也能依照淺景深效果產生背景模糊、讓視覺焦點聚焦在人物的畫面。

目前 Veo 2 最高可生成 4K 解析度影片,長度最長可達 2 分鐘,幾乎是 OpenAI 提出 Sora 對應最高解析度的四倍,時間長度更超過 6 倍,另外也能確實遵循使用者所輸入指示,並且依照真實物理表現產生影片,更標榜能減少幻覺產生比例。

而此次同步推出的新版 Imagen 3,則可生成更具構圖感、生成更明亮的影像,更可依照指示產生寫實、印象、抽象或動漫風格等的藝術風格,同時在細節與質感表現更為突出。

watermarked_photo_train_station.max-768x768.format-webp.jpg

Google 將從即日起透過 Google Labs 開放加入等候 Veo 2 存取權限,預計明年開始應用在 YouTube Shorts 短影片等服務,而新版 Imagen 3 則已經在超過 100 個國家地區佈署,並且透過 Google Labs 提供圖片生成工具 ImageFX 使用。

Google Labs 也同步推出名為 Whisk 的新實驗工具,標榜能產生更具表達張力的圖片,其中整合 Imagen 3 與新版 Gemini 模型,可透過 電腦視覺分析理解方式產生指令描述,並且由 Imagen 3 產生全新圖像,目前已經在美國境內提供使用。
 




 

Mashdigi

Mashdigi

出生自台灣高雄的楊又肇,以前聯合新聞網 (udn.com)數位頻道主編,以及在各網站頻道以本名或Mash Yang名稱維持提供撰寫、授權內容等身分,持續在網路、科技相關活動、展覽出沒。撰寫內容涵蓋個人感興趣內容,包含手機、網路、軟體、零組件,以及科技市場動態,另外也包含各類惡趣味內容,並且持續關注蘋果、微軟、Google、Intel、AMD、Nvidia等經常在你我生活中出現的科技廠商動態。