蘋果釋出開源自然語言模型 OpenELM,將能用於 IPhone 等終端裝置

管理員 | Apple
【此文章來自:Mashdigi】

在 Google、微軟、Meta 等業者接連推出多款對應人工智慧應用的大型自然語言模型,同時也推出可在終端裝置離線運作的自然語言模型之後,蘋果稍早也宣布推出名為 OpenELM 的開源自然語言模型,同樣標榜能在終端裝置上運作。

lApple-EU-Digital-Markets-Act-updates-hero_big.jpg.large_2x.jpg



OpenELM 已經透過 Hugging Face 託管平台對外提供下載使用,並且包含 4 款已經預先完成訓練,以及 4 款針對指令最佳化調整版本,分別對應 2.7 億組、4.5 億組、11 億組與 30 億組參數規模,相較市面多數以 70 億組參數在終端裝置運作的自然語言模型都還要小,因此能有更流暢執行效率表現。

而蘋果目前以提供模型權重檔、範例程式碼形式授權,並且提供多個訓練檢查點、模型效能數據,以及相關操作指引,授權範圍並未限制商用或進行修改。另外,蘋果更說明 OpenELM 訓練數據來源包含在 Reddit、維基百科、arXiv.org 等公開資料,並且透過約 1.8 兆個代幣數據進行預先訓練,但強調此模型並未加上任何安全保證,因此可能會有做出回應不準確、有害、帶有偏見,或是令人反感內容。

蘋果在去年公布針對其晶片產品打造的高效能機器學習框架 MLX,後續也與美國哥倫比亞大學研究人員公布開源多模大型自然語言模型「Ferret」 (雪貂),而此次公布的 OpenELM 則是以開源形式對外提供使用,同時也可能應用在自有產品,例如 iPhone、Mac 等。
 

Mashdigi

Mashdigi

出生自台灣高雄的楊又肇,以前聯合新聞網 (udn.com)數位頻道主編,以及在各網站頻道以本名或Mash Yang名稱維持提供撰寫、授權內容等身分,持續在網路、科技相關活動、展覽出沒。撰寫內容涵蓋個人感興趣內容,包含手機、網路、軟體、零組件,以及科技市場動態,另外也包含各類惡趣味內容,並且持續關注蘋果、微軟、Google、Intel、AMD、Nvidia等經常在你我生活中出現的科技廠商動態。