阿布扎比先進技術(shù)研究協(xié)會(ARTC)下屬的科技創(chuàng)新研究所(TII)今天發(fā)布了兩項重大人工智能進展:Falcon Arabic是Falcon系列首款阿拉伯語模型,現(xiàn)已成為該地區(qū)表現(xiàn)最佳的阿拉伯語人工智能模型,而Falcon-H1則是一款通過全新架構(gòu)設計重新定義了性能和可移植性的新模型。在中小型人工智能模型(300億至700億個參數(shù))中,F(xiàn)alcon-H1的性能超越了Meta的LlaMA和阿里巴巴的Qwen等競品,可在日常設備和資源有限的環(huán)境中實現(xiàn)真實世界的人工智能。阿聯(lián)酋總統(tǒng)顧問兼ATRC秘書長Faisal Al Bannai閣下在“Make it in the Emirates”活動上發(fā)表主題演講時宣布了這一消息。
Falcon Arabic建立在Falcon 3-7B(70億參數(shù))之上,是迄今為止已開發(fā)的最先進的阿拉伯語人工智能模型之一。該模型在涵蓋現(xiàn)代標準阿拉伯語和地區(qū)方言的高質(zhì)量母語(非翻譯)阿拉伯語數(shù)據(jù)集上進行訓練,全面捕捉了阿拉伯世界的語言多樣性。根據(jù)開放式阿拉伯語LLM排行榜基準,F(xiàn)alcon Arabic優(yōu)于所有其他地區(qū)可用的阿拉伯語模型,鞏固了其在主權(quán)多語言人工智能領(lǐng)域的領(lǐng)先地位。作為同類產(chǎn)品中表現(xiàn)最佳的阿拉伯語模型,其性能可媲美10倍于其規(guī)模的模型,從而證明了智能架構(gòu)可以超越單純的規(guī)模。
另外,新推出的Falcon-H1模型旨在通過降低運行高級系統(tǒng)通常所需的計算能力和專業(yè)技術(shù)知識,大幅擴大高性能人工智能的使用范圍。作為新模型的基礎,TII的Falcon 3系列在單個圖形處理器(GPU)上運行的人工智能模型在全球名列前茅,這項重大突破使不具備高端基礎設施的開發(fā)人員、初創(chuàng)企業(yè)和機構(gòu)能夠以可承受的價格部署尖端人工智能。
“我們?yōu)榻K于將阿拉伯語帶入Falcon感到自豪,更讓人驕傲的是,阿拉伯世界性能最強的大語言模型在阿聯(lián)酋打造!盕aisal Al Bannai閣下在阿布扎比Make it in the Emirates活動中表示。在談到Falcon-H1時,他說:“今天,人工智能的領(lǐng)導地位不是為了規(guī)模而規(guī)模,而是要讓強大的工具變得有用、可用和通用。Falcon-H1體現(xiàn)了我們致力于開發(fā)對每個人都有用的人工智能,而不僅僅是為了少數(shù)人!
Falcon-H1仍將支持歐洲語言,并首次配備了支持100多種語言的可擴展能力,這有賴于在不同數(shù)據(jù)集上訓練的多語言分詞器。
更智能、更簡單、更包容
Falcon-H1的開發(fā)旨在滿足全球?qū)Ω咝、靈活、易用的人工智能系統(tǒng)與日俱增的需求。Falcon-H1的“H”因其混合架構(gòu)而得名,該架構(gòu)結(jié)合了Transformers和Mamba的優(yōu)勢,能夠顯著提高推理速度并降低內(nèi)存消耗,同時在一系列基準測試中保持高性能。
“Falcon-H1不僅是我們的一個研究里程碑,我們還將其視為一項工程挑戰(zhàn):如何在不做出任何妥協(xié)的情況下提供卓越的效率。”TII首席執(zhí)行官Najwa Aaraj博士表示,“該模型反映了我們致力于打造技術(shù)嚴謹、具有實際用途的系統(tǒng)。Falcon不僅僅是一個模型,它還是為研究人員、開發(fā)人員和創(chuàng)新人員賦能的基礎,尤其是在資源有限但雄心不減的環(huán)境中。”
Falcon-H1系列包括多種尺寸型號:34B、7B、3B、1.5B、1.5B-deep和500M。這些型號為用戶提供了廣泛的性能效率比,使開發(fā)人員能夠根據(jù)自己的部署方案做出最合適的選擇。較小的型號可以部署在受限的邊緣設備上,而旗艦型號34B在復雜任務上的表現(xiàn)則優(yōu)于Meta的LlaMA和阿里巴巴的Qwen等同類競品。
“Falcon-H1系列展示了新架構(gòu)如何為人工智能訓練解鎖新機遇,同時也展現(xiàn)了超小型模型的潛力。”TII人工智能與數(shù)字科學研究中心首席研究員Hakim Hacid博士表示,“這從根本上改變了最小規(guī)模的可能性,使得在隱私、效率和低延遲至關(guān)重要的邊緣設備上啟用強大的人工智能成為可能。我們的重點在于在不影響能力的前提下降低復雜性!
Falcon-H1系列的每個型號都超越了兩倍于其尺寸的其他模型,為性能效率比樹立了新標準。此外,這些模型還在數(shù)學、推理、編碼、長語境理解和多語言任務方面表現(xiàn)出色。
國際影響
Falcon模型已經(jīng)開始助力現(xiàn)實世界應用。Falcon與蓋茨基金會合作,為AgriLLM的開發(fā)提供支持,該解決方案可幫助農(nóng)民在極端氣候條件下做出更明智決策。TII的Falcon生態(tài)系統(tǒng)在全球的下載量已超過5,500萬次,被公認為是中東地區(qū)功能最強大、性能最穩(wěn)定的開放式人工智能模型系列。
許多人工智能模型都專注于狹隘的消費者用例,而TII則優(yōu)先考慮建立基礎模型,以滿足工業(yè)、研究和公益的苛刻需求,與此同時不影響可訪問性。這些模型旨在應用于現(xiàn)實世界的各種場景,同時保持可訪問性、資源效率和對不同環(huán)境的適應性。
Falcon所有模型皆為開源,可在Hugging Face和FalconLLM.TII.ae上憑TII Falcon License獲取,后者是基于Apache 2.0的許可證,旨在促進負責任和合乎道德的人工智能開發(fā)。
來源: AETOSWire