精準識別圖像內容 Apple 發表大型自然語言模型「雪貂」

管理員 | 科技新知
【此文章來自:Mashdigi】

除了日前傳出悄悄公布針對其晶片產品打造的高效能機器學習框架 MLX,蘋果在今年 10 月其實也與美國哥倫比亞大學研究人員公布一款開源多模大型自然語言模型「Ferret」 (雪貂)。

170355798692242_P28578940.jpg



「Ferret」能精準識別圖像內容,並且能清楚描述圖像細節、構成元素,本身區分 70 億組及 130 億組參數版本,主要透過累積超過 110 萬筆參考樣本、對應各類層次空間知識的數據集「GRIT」構成其推論能力。

而「Ferret」僅作為研究使用,並未開放用於商業使用,但不確定未來蘋果是否會以此模型,或是以此為基礎打造可用於 iPhone 等產品使用的人工智慧技術應用服務。

除了「Ferret」,蘋果日前也公布針對其晶片產品量身打造的高效能機器學習框架 MLX,讓 iPhone 或 Mac 機種都能使用,並且強化運算效能。

消息指稱,蘋果目前正透過大型自然語言模型訓練 Siri 數位助理服務,使其能有更自然的人工智慧互動體驗,最快會在明年 WWDC 2024 期間公布。
 

Mashdigi

Mashdigi

出生自台灣高雄的楊又肇,以前聯合新聞網 (udn.com)數位頻道主編,以及在各網站頻道以本名或Mash Yang名稱維持提供撰寫、授權內容等身分,持續在網路、科技相關活動、展覽出沒。撰寫內容涵蓋個人感興趣內容,包含手機、網路、軟體、零組件,以及科技市場動態,另外也包含各類惡趣味內容,並且持續關注蘋果、微軟、Google、Intel、AMD、Nvidia等經常在你我生活中出現的科技廠商動態。