精準識別圖像內容 Apple 發表大型自然語言模型「雪貂」

管理員 | 科技新知
【此文章來自:Mashdigi】

除了日前傳出悄悄公布針對其晶片產品打造的高效能機器學習框架 MLX,蘋果在今年 10 月其實也與美國哥倫比亞大學研究人員公布一款開源多模大型自然語言模型「Ferret」 (雪貂)。

170355798692242_P28578940.jpg



「Ferret」能精準識別圖像內容,並且能清楚描述圖像細節、構成元素,本身區分 70 億組及 130 億組參數版本,主要透過累積超過 110 萬筆參考樣本、對應各類層次空間知識的數據集「GRIT」構成其推論能力。

而「Ferret」僅作為研究使用,並未開放用於商業使用,但不確定未來蘋果是否會以此模型,或是以此為基礎打造可用於 iPhone 等產品使用的人工智慧技術應用服務。

除了「Ferret」,蘋果日前也公布針對其晶片產品量身打造的高效能機器學習框架 MLX,讓 iPhone 或 Mac 機種都能使用,並且強化運算效能。

消息指稱,蘋果目前正透過大型自然語言模型訓練 Siri 數位助理服務,使其能有更自然的人工智慧互動體驗,最快會在明年 WWDC 2024 期間公布。