Bye Siri ! 大模型能做的可不止是聊天機(jī)器人

在眾多人工智能大模型發(fā)布會(huì)上,自然語(yǔ)言處理(NLP)能力一直是各大科技廠商著重展示的要點(diǎn)之一,事實(shí)上,早在四年前行業(yè)內(nèi)的就已經(jīng)圍繞這顆人工智能“皇冠上的明珠”展開(kāi)過(guò)激烈的討論……


彼時(shí)的人工智能還沒(méi)有今日的火熱,很多人對(duì)自然語(yǔ)言處理(NLP)的理解還停留在“Hi,Siri”和“小度小度”等智能對(duì)話機(jī)器人。能否實(shí)現(xiàn)與人流利對(duì)話也成為了人們判斷人工智能能力的一大重要手段。隨著ChatGPT、文心一言、360智腦等眾多大模型紛紛問(wèn)世,讓大語(yǔ)言模型成為了人們關(guān)注的焦點(diǎn),也讓人工智能的認(rèn)識(shí)更加深入和全面。

大語(yǔ)言模型是聊天機(jī)器人嗎?

在大模型未出現(xiàn)時(shí),聊天機(jī)器人的自然語(yǔ)言處理僅停留在對(duì)固定問(wèn)題的固定回答上,甚至換一種問(wèn)法都很難得到答案,甚至一些“智能語(yǔ)音客服”至今也只能聽(tīng)懂一些預(yù)設(shè)問(wèn)題,哪怕面對(duì)稍有變化的指令或問(wèn)題,都很難為用戶(hù)提供被需要的解救辦法。

圖源:網(wǎng)絡(luò)


而具有大模型加持的聊天機(jī)器人在面對(duì)多樣化的問(wèn)題已經(jīng)可以通過(guò)總結(jié)自身數(shù)據(jù)庫(kù)中的數(shù)據(jù)為使用者生成答案。有業(yè)內(nèi)人士對(duì)大模型之家表示,LLM當(dāng)然不等價(jià)于Chatbot,不過(guò)現(xiàn)在的LLM很多都是用Chat數(shù)據(jù)指令調(diào)諧過(guò)的,Chat版本的LLM更適合用來(lái)構(gòu)建Chatbot,技術(shù)上不能劃等號(hào)。


聊天機(jī)器人是一種能夠與人進(jìn)行自然對(duì)話的系統(tǒng),通常需要利用大語(yǔ)言模型來(lái)生成回復(fù)。為了讓大語(yǔ)言模型更適合用于聊天機(jī)器人,可以在聊天數(shù)據(jù)上進(jìn)行額外的訓(xùn)練,使其學(xué)習(xí)到更多的對(duì)話技巧和知識(shí)。因此,雖然大語(yǔ)言模型和聊天機(jī)器人有一定的關(guān)聯(lián),但它們?cè)诩夹g(shù)上是不同的概念。


無(wú)界AI聯(lián)合創(chuàng)始人馬千里對(duì)大模型之家表示,聊天機(jī)器人是語(yǔ)言大模型的眾多功能或應(yīng)用之一。
語(yǔ)言大模型不應(yīng)局限于聊天這一狹隘的場(chǎng)景。大模型不僅能夠?qū)崿F(xiàn)自然語(yǔ)言處理,還能通過(guò)各種插件功能,為使用者提供計(jì)算、文檔總結(jié)、工作相關(guān)問(wèn)題解答等服務(wù)。

大模型之家認(rèn)為,大語(yǔ)言模型和聊天機(jī)器人的不同概念源自于不同的目標(biāo)、評(píng)價(jià)指標(biāo)、數(shù)據(jù)類(lèi)型、數(shù)據(jù)規(guī)模、用戶(hù)和場(chǎng)景。聊天機(jī)器人只是大語(yǔ)言模型的一個(gè)功能或應(yīng)用,而不是它的本質(zhì)。大模型的存在除了應(yīng)用在自然語(yǔ)言處理方面,更重要的是體現(xiàn)在生產(chǎn)中的意義,大語(yǔ)言模型還有很多其他的功能或應(yīng)用,比如音視頻生成、金融、法律咨詢(xún)等,這些都體現(xiàn)了大語(yǔ)言模型的能力和潛力。也是大語(yǔ)言模型商業(yè)化的重要方向。

大語(yǔ)言模型表現(xiàn)良莠不齊,根源在哪兒?

在大多數(shù)大模型發(fā)布會(huì)上,自然語(yǔ)言處理能力仍是被著重展示的部分,而對(duì)于使用者來(lái)說(shuō),聊天能力確實(shí)是判斷大模型強(qiáng)大與否的重要指標(biāo)之一。事實(shí)上大語(yǔ)言模型的表現(xiàn)并未像市場(chǎng)中吹捧的那般天花亂墜。360集團(tuán)創(chuàng)始人周鴻祎也于近期表示,誰(shuí)能解決大模型“幻覺(jué)”問(wèn)題,就相當(dāng)于摘下了“皇冠上的明珠”。

很多人認(rèn)為市場(chǎng)上大模型對(duì)話能力的參差不齊與大模型研發(fā)的技術(shù)水平有著直接關(guān)系,在繁多的技術(shù)當(dāng)中,數(shù)據(jù)的質(zhì)量是影響大模型表現(xiàn)的關(guān)鍵技術(shù)因素,它決定了模型能否有效地學(xué)習(xí)和生成文本。數(shù)據(jù)質(zhì)量需要從數(shù)據(jù)的正確性、有效性、豐富性和代表性等方面來(lái)提高。這需要經(jīng)過(guò)數(shù)據(jù)清洗、標(biāo)注、過(guò)濾和多樣化等方法,保證數(shù)據(jù)沒(méi)有錯(cuò)誤或者矛盾,去除低質(zhì)量和垃圾數(shù)據(jù),涵蓋不同的主題、領(lǐng)域、風(fēng)格和觀點(diǎn)。提高數(shù)據(jù)質(zhì)量是影響大模型表現(xiàn)的關(guān)鍵技術(shù)因素,也是未來(lái)文本生成領(lǐng)域的重要研究方向。

圖源:網(wǎng)絡(luò)

行業(yè)領(lǐng)先人工智能企業(yè)「行者AI」對(duì)大模型之家表示:雖然如今大語(yǔ)言模型參數(shù)規(guī)模越來(lái)越大,涌現(xiàn)出的能力也越來(lái)越強(qiáng),但它歸根結(jié)底仍然是一種概率統(tǒng)計(jì)模型,因此理論上來(lái)說(shuō),即使是目前最好的模型,仍然有一定概率輸出不佳的結(jié)果,只是這種概率較小而已。

而具體從技術(shù)上來(lái)說(shuō),大語(yǔ)言模型表現(xiàn)好壞受眾多因素影響,其一是訓(xùn)練數(shù)據(jù)的質(zhì)量和數(shù)量,模型本質(zhì)上是以訓(xùn)練數(shù)據(jù)為老師進(jìn)行學(xué)習(xí),數(shù)據(jù)的質(zhì)量和數(shù)量直接決定模型的上限,數(shù)據(jù)質(zhì)量在某些方面的參差不齊可能會(huì)導(dǎo)致模型回答時(shí)有好有壞;其二是模型的架構(gòu)和訓(xùn)練策略,訓(xùn)練模型時(shí)選擇的不同模型架構(gòu)和訓(xùn)練策略會(huì)導(dǎo)致最終得到的模型性能有所差異。

當(dāng)然,除技術(shù)之外,無(wú)界AI聯(lián)合創(chuàng)始人馬千里認(rèn)為,大模型表現(xiàn)的好壞,人的“問(wèn)題”也占很大一部分。他指出,大語(yǔ)言模型的效果同樣受到提問(wèn)者輸入的影響。使用者需要輸入一個(gè)恰當(dāng)?shù)奶崾菊Z(yǔ)后再提出問(wèn)題。而問(wèn)題的形式和方式會(huì)決定模型的回答質(zhì)量,因此不同的使用者可能獲得不同的體驗(yàn)。其次,模型本身也在持續(xù)更新和優(yōu)化。由于部署在云端,為了保證安全性,它增加了對(duì)敏感內(nèi)容的審核機(jī)制,如果使用者詢(xún)問(wèn)一些涉及危險(xiǎn)信息的問(wèn)題,大模型可能不會(huì)給出回答。

同時(shí),大模型的本質(zhì)神經(jīng)網(wǎng)絡(luò)生成內(nèi)容的過(guò)程,數(shù)據(jù)、參數(shù)以及算法都具有一定的隨機(jī)性,能提高大模型的泛化能力和創(chuàng)造力,但也會(huì)導(dǎo)致大模型的不穩(wěn)定和不可預(yù)測(cè)。因此,使用者需要根據(jù)不同的數(shù)據(jù)和任務(wù),選擇合適的隨機(jī)操作和超參數(shù),以及監(jiān)控和評(píng)估大模型的表現(xiàn)。

圖源:《人工智能大模型產(chǎn)業(yè)創(chuàng)新價(jià)值研究報(bào)告》

《人工智能大模型產(chǎn)業(yè)創(chuàng)新價(jià)值研究報(bào)告》中,大模型之家認(rèn)為,大模型將引發(fā)數(shù)據(jù)的革命。數(shù)據(jù)的質(zhì)量以及數(shù)據(jù)清洗的工程化能力會(huì)顯著拉開(kāi)大模型預(yù)訓(xùn)練階段的效果差距將成為決勝關(guān)鍵因素。同時(shí)大模型的發(fā)展將為數(shù)據(jù)相關(guān)產(chǎn)業(yè)和行業(yè)帶來(lái)多重機(jī)遇,包括數(shù)據(jù)分析和洞察力,數(shù)據(jù)清洗和預(yù)處理,數(shù)據(jù)驅(qū)動(dòng)的創(chuàng)新,數(shù)據(jù)安全和隱私保護(hù)以及數(shù)據(jù)驅(qū)動(dòng)的行業(yè)轉(zhuǎn)型等。

大模型是一種技術(shù),也是一種趨勢(shì)。決定大模型表現(xiàn)的也不止需要對(duì)數(shù)據(jù)質(zhì)量進(jìn)行把控,模型可解釋性、安全性、創(chuàng)新性甚至使用者的操作都是必要考慮關(guān)鍵因素。除了聊天機(jī)器人,大模型能夠在不同的領(lǐng)域和任務(wù)中表現(xiàn)出優(yōu)秀的通用性和創(chuàng)造性,例如自然語(yǔ)言生成、圖像識(shí)別、語(yǔ)音合成等。此外,大模型的訓(xùn)練和應(yīng)用也依賴(lài)于高效的硬件和軟件支持,例如GPU、TPU等處理器,以及分布式并行的平臺(tái)和方法。

(0)
上一篇 2023年8月7日 18:05
下一篇 2023年8月8日 10:54