開(kāi)源世界再起巨浪,Llama3正式發(fā)布,能挑戰(zhàn)閉源大模型嗎?

當(dāng)?shù)貢r(shí)間4月18日晚間,Meta終于正式發(fā)布全新一代開(kāi)源模型Llama3。

作為一款備受矚目的大型模型,Llama3的發(fā)布立刻在全球范圍內(nèi)引起了廣泛的關(guān)注和討論。Llama3目前已經(jīng)登陸其官方網(wǎng)站和知名平臺(tái)Hugging Face,成為了人工智能領(lǐng)域的一大焦點(diǎn)。值得一提的是,盡管商業(yè)使用受到一定條件的限制(月活躍用戶不得超過(guò)7億),但基本上仍然可以算作是免費(fèi)商用。

大模型了解到,這次發(fā)布的Llama3涵蓋了兩個(gè)版本,即8B和70B,為各種廣泛應(yīng)用提供了強(qiáng)大的支持。按照Meta的說(shuō)法,Llama 3 8B和Llama 3 70B是目前同體量下,性能最好的開(kāi)源模型。Llama 3 8B在某些測(cè)試集上性能比llama 2 70B還要強(qiáng)。這些版本提供了預(yù)訓(xùn)練和指令調(diào)優(yōu)版本,可直接在Meta AI中體驗(yàn)。Meta AI是一個(gè)智能助手,改變了人們與人工智能交互的方式,擴(kuò)展了任務(wù)完成、創(chuàng)造和連接的可能性。開(kāi)發(fā)代理和其他人工智能應(yīng)用程序的開(kāi)發(fā)者將受益于Llama 3的8B和70B版本,這些版本為他們提供了所需的靈活性和性能。

開(kāi)源世界再起巨浪,Llama3正式發(fā)布,能挑戰(zhàn)閉源大模型嗎?

Llama 3的性能令人印象深刻,特別是在語(yǔ)言理解、上下文理解以及諸如翻譯和對(duì)話生成等復(fù)雜任務(wù)方面。其具有強(qiáng)大的可擴(kuò)展性和性能,可以輕松處理多步任務(wù)。通過(guò)精心優(yōu)化的后訓(xùn)練過(guò)程,大大降低了虛假拒絕率,提高了響應(yīng)對(duì)齊度,并增加了模型答案的多樣性。此外,Llama 3還顯著提高了推理、代碼生成和指令跟蹤等能力。

同時(shí),Llama3的性能也經(jīng)受起了時(shí)間的考驗(yàn),得到了廣泛的認(rèn)可。在一系列評(píng)測(cè)中,無(wú)論是在學(xué)科知識(shí)理解、一般問(wèn)題、代碼能力、數(shù)學(xué)能力還是其他領(lǐng)域,Llama3都表現(xiàn)出色。甚至在與其他領(lǐng)先模型的比較中,Llama3也取得了巨大成功,凸顯了其在開(kāi)源模型中的卓越地位。

Meta官方宣稱,Llama 3模型的發(fā)布將數(shù)據(jù)擴(kuò)展到了新的高度。它是在最近宣布的兩個(gè)定制的24K GPU集群上進(jìn)行訓(xùn)練的,使用了超過(guò)15T令牌的數(shù)據(jù),這個(gè)訓(xùn)練數(shù)據(jù)集比Llama 2使用的大7倍,其中包括4倍的代碼。

開(kāi)源世界再起巨浪,Llama3正式發(fā)布,能挑戰(zhàn)閉源大模型嗎?

隨著Llama 3的發(fā)布,相應(yīng)的《負(fù)責(zé)任使用指南》也得到了更新,提供了與LLM負(fù)責(zé)任開(kāi)發(fā)相關(guān)的最全面信息。更新的系統(tǒng)方法包括更新的信任和安全工具,其中包括優(yōu)化后的Llama Guard 2,以支持MLCommons發(fā)布的新公布的分類法,將其覆蓋范圍擴(kuò)展到更全面的安全類別,包括代碼防護(hù)和網(wǎng)絡(luò)安全評(píng)估。

開(kāi)源世界再起巨浪,Llama3正式發(fā)布,能挑戰(zhàn)閉源大模型嗎?

此外,Llama3發(fā)布團(tuán)隊(duì)還進(jìn)行了一項(xiàng)有趣的測(cè)試,評(píng)估了模型在一系列關(guān)鍵用例中的表現(xiàn)。為了防止過(guò)擬合,測(cè)試團(tuán)隊(duì)在建模過(guò)程中對(duì)類別和提示進(jìn)行了人工評(píng)估,其結(jié)果證明了Llama3的強(qiáng)大性能和多樣化應(yīng)用的潛力。

然而,盡管Llama3在各方面都表現(xiàn)出色,但也存在一些挑戰(zhàn)。例如,知識(shí)庫(kù)時(shí)間和上下文長(zhǎng)度等方面仍有待提高,雖然使其容量加倍,但其上下文長(zhǎng)度僅支持到8K,同時(shí)在面對(duì)一些特定的難題時(shí),Llama3仍然有進(jìn)一步優(yōu)化的空間。

眾所周知,國(guó)內(nèi)外有大量的大模型都源自開(kāi)源大模型,尤其是建立在Llama上而來(lái),因此Llama3的發(fā)布,對(duì)于大模型創(chuàng)企而言同樣意義重大。這一開(kāi)源之舉不僅為開(kāi)發(fā)者和研究人員提供了更多的技術(shù)選擇和資源支持,而且為人工智能技術(shù)的全球推廣和普及貢獻(xiàn)了巨大的力量。

Llama3的開(kāi)源意味著創(chuàng)新的可能性被無(wú)限放大,不再受限于少數(shù)專業(yè)機(jī)構(gòu)或大企業(yè)的封閉研發(fā),而是讓更多的人能夠參與到人工智能技術(shù)的創(chuàng)造和應(yīng)用中來(lái)。這對(duì)于促進(jìn)人工智能技術(shù)的全球共享和發(fā)展,推動(dòng)行業(yè)技術(shù)進(jìn)步和創(chuàng)新都具有重要的意義。

部分云計(jì)算企業(yè)也宣布將在第一時(shí)間為客戶提供該模型,例如,亞馬遜云科技表示將為客戶提供了該模型,客戶可以通過(guò)Amazon SageMaker Jumpstart來(lái)發(fā)現(xiàn)和部署Llama 3模型,并運(yùn)行推理。

在大模型之家看來(lái),Llama3的發(fā)布標(biāo)志著開(kāi)源模型邁向新的里程碑,為人工智能領(lǐng)域帶來(lái)了巨大的推動(dòng)力。其強(qiáng)大的性能和全面的應(yīng)用支持使其成為開(kāi)發(fā)者和研究人員的首選,為人工智能的未來(lái)奠定了堅(jiān)實(shí)的基礎(chǔ)。

(0)
上一篇 2024年4月19日 13:26
下一篇 2024年4月19日 13:55