當(dāng)前位置:首頁 > 芯聞號 > 極客網(wǎng)
[導(dǎo)讀]現(xiàn)在的生成式AI工具還不完美,經(jīng)常會“撒謊”,這就是所謂的幻覺。為了克制幻覺,開發(fā)者開發(fā)出一系列工具,最近在硅谷比較流行的工具是檢索增強生成(Retrieval-augmented Generation,簡稱RAG)。

現(xiàn)在的生成式AI工具還不完美,經(jīng)常會“撒謊”,這就是所謂的幻覺。為了克制幻覺,開發(fā)者開發(fā)出一系列工具,最近在硅谷比較流行的工具是檢索增強生成(Retrieval-augmented Generation,簡稱RAG)。

RAG是一種結(jié)合檢索和生成技術(shù)的模型,它為大模型提供外部知識源,使得大模型具備從指定的知識庫中進行檢索,并結(jié)合上下文信息,生成相對高質(zhì)量的回復(fù)內(nèi)容,減少模型幻覺問題。例如,企業(yè)可以將所有的HR政策和福利信息上傳到RAG數(shù)據(jù)庫,AI聊天機器人聚焦于可以從這些文件中找到的答案。

聽起來RAG似乎和ChatGPT技術(shù)沒有什么太大差異,實際上差異蠻大的。Thomson Reuters用RAG技術(shù)開發(fā)出一套面向法務(wù)工作者的AI工具,其公司高管Pablo Arredondo說:“RAG不會單純依靠初始訓(xùn)練生成的記憶來回答問題,它會利用搜索引擎收集真實文檔,比如判例法、論文等,然后根據(jù)這些文檔錨定模型的響應(yīng)?!?

例如,我們可以將某本雜志的所有內(nèi)容上傳到數(shù)據(jù)庫,根據(jù)數(shù)據(jù)庫內(nèi)容回答問題。因為AI工具關(guān)注的信息面比較窄,信息質(zhì)量更高,基于RAG開發(fā)的聊天機器人在回答問題時會比通用機器人更有深度。

RAG機器人會不會犯錯呢?當(dāng)然會,但它捏造內(nèi)容的概率會降低。

研究人員認(rèn)為,RAG方法有很大優(yōu)勢,在訓(xùn)練模型時,它所接受的信息都是事實,而且是可以追溯來源的事實。如果你能教模型對提供的數(shù)據(jù)進行分類,并在每個輸出結(jié)果中使用、引用,那么人工智能工具就不太可能犯嚴(yán)重的錯誤。

用了RAG技術(shù),幻覺能降低多少呢?一些研究者認(rèn)為,幻覺可以達到很低的程度,但無法完全消除。換言之,RAG不是萬能藥??傮w看,幻覺減少程度取決于兩個核心要素:一是整體RAG的部署質(zhì)量,二是對AI幻覺的定義。

并非所有的RAG都是一樣的。在自定義數(shù)據(jù)庫中,內(nèi)容的精度影響著結(jié)果質(zhì)量,但它并不是唯一影響因素。除了要關(guān)注內(nèi)容的質(zhì)量,還要關(guān)注搜索質(zhì)量及基于問題的正確內(nèi)容的檢索。掌握過程中的每一步都至關(guān)重要,因為一個失誤就可能使模型完全偏離。

斯坦福教授Daniel Ho說:“凡是在某個搜索引擎中使用自然語言搜索的律師都會發(fā)現(xiàn),許多時候語義相似度影響巨大,它會導(dǎo)出完全不相關(guān)的資料?!?

如何定義RAG應(yīng)用中出現(xiàn)的幻覺也很重要。一些專家認(rèn)為,判斷RAG系統(tǒng)是否出現(xiàn)幻覺主要是看輸出結(jié)果是否與數(shù)據(jù)檢索時模型找到的答案一致。斯坦福大學(xué)則認(rèn)為,要檢查結(jié)果,看它是否基于提供的數(shù)據(jù),是否符合事實。

在回答法律問題時,RAG系統(tǒng)明顯比ChatGPT、Gemini更好,但它仍然有可能忽視細(xì)節(jié),隨機給出錯誤答案。幾乎所有專家都認(rèn)為,即使有了RAG系統(tǒng),也需要人類參與,對引用信息進行雙重檢查,判定結(jié)果的準(zhǔn)確率。

在法律領(lǐng)域RAG系統(tǒng)可以找到用武之地,在其它領(lǐng)域也一樣。凡是需要專業(yè)知識的專業(yè)領(lǐng)域,AI系統(tǒng)給出的答案都應(yīng)該錨定真實文件,所以RAG適合專業(yè)領(lǐng)域。

Daniel Ho說:“幻覺一直存在,我們還沒有找到好辦法真正消除幻覺?!彪m然RAG可以降低錯誤率,但還是需要人類來判斷結(jié)果如何。(小刀)

聲明:該篇文章為本站原創(chuàng),未經(jīng)授權(quán)不予轉(zhuǎn)載,侵權(quán)必究。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉