Google 公布新版影片生成工具 Veo 2、新版圖像生成工具 Imagen 3，提供更多影像創作可能性

管理員 2024-12-18 18:32 | 科技新知

【此文章來自：Mashdigi】

繼今年 5 月公布影片生成工具 Veo 之後，Google DeepMind 稍早公布新版影片生成工具 Veo 2，並且推出新版圖像生成工具 Imagen 3，另外也推出新一波實驗計畫。

12-16-24_GenMedia_Hero-1_FEraqiS.width-1600.format-webp.jpg

12-16-24_GenMedia_Hero-1_FEraqiS.width-1600.format-webp.jpg

Veo 2 主要提高生成結果更符合真實世界的物理作動，以及人類運動時的肢體表現，以及表情細微呈現，藉此增加生成影像的真實性。

此外，Veo 2 也加入電影攝影特殊用語，例如可要求生成以低角度平移追蹤鏡位產生影片，或是依照使用者輸入 18mm 焦段鏡頭產生相應拍攝影像，甚至也能依照淺景深效果產生背景模糊、讓視覺焦點聚焦在人物的畫面。

目前 Veo 2 最高可生成 4K 解析度影片，長度最長可達 2 分鐘，幾乎是 OpenAI 提出 Sora 對應最高解析度的四倍，時間長度更超過 6 倍，另外也能確實遵循使用者所輸入指示，並且依照真實物理表現產生影片，更標榜能減少幻覺產生比例。

而此次同步推出的新版 Imagen 3，則可生成更具構圖感、生成更明亮的影像，更可依照指示產生寫實、印象、抽象或動漫風格等的藝術風格，同時在細節與質感表現更為突出。

watermarked_photo_train_station.max-768x768.format-webp.jpg

watermarked_photo_train_station.max-768x768.format-webp.jpg

Google 將從即日起透過 Google Labs 開放加入等候 Veo 2 存取權限，預計明年開始應用在 YouTube Shorts 短影片等服務，而新版 Imagen 3 則已經在超過 100 個國家地區佈署，並且透過 Google Labs 提供圖片生成工具 ImageFX 使用。

Google Labs 也同步推出名為 Whisk 的新實驗工具，標榜能產生更具表達張力的圖片，其中整合 Imagen 3 與新版 Gemini 模型，可透過電腦視覺分析理解方式產生指令描述，並且由 Imagen 3 產生全新圖像，目前已經在美國境內提供使用。

Mashdigi

出生自台灣高雄的楊又肇，以前聯合新聞網 (udn.com)數位頻道主編，以及在各網站頻道以本名或Mash Yang名稱維持提供撰寫、授權內容等身分，持續在網路、科技相關活動、展覽出沒。撰寫內容涵蓋個人感興趣內容，包含手機、網路、軟體、零組件，以及科技市場動態，另外也包含各類惡趣味內容，並且持續關注蘋果、微軟、Google、Intel、AMD、Nvidia等經常在你我生活中出現的科技廠商動態。

AI 學習 Galaxy Tab 多可能｜購機享雙重好禮

Google 公布新版影片生成工具 Veo 2、新版圖像生成工具 Imagen 3，提供更多影像創作可能性

Mashdigi

網友評論 0 回覆本文

最新新聞