構建大模型幻覺及其價值風險的預防治理體系
大模型幻覺的生成原因
在人工智能領域,幻覺特指大模型生成的內(nèi)容看似語法正確、邏輯嚴謹,但實際上存在著事實錯誤或無法驗證事實的現(xiàn)象,具有“一本正經(jīng)胡說八道”、無法確認現(xiàn)實依據(jù)等特征。大模型的幻覺包括事實性幻覺與忠實性幻覺兩種類型,前者指的是與事實不一致或存在事實捏造,后者指的是生成內(nèi)容與用戶指令不一致、上下文不一致或邏輯不一致。
在本質(zhì)上,大模型的幻覺問題是其技術架構、訓練和生成模式共同作用的產(chǎn)物,具有一般性、偶然性、隨機性、難以避免或克服等特征。在生成機制上,大模型幻覺的核心成因來自概率驅動的技術架構、訓練數(shù)據(jù)局限性以及人機互動生成邏輯的多重耦合。
首先是技術架構的能力短板。目前大模型主要采取基于轉換器結構的GPT范式,這種技術架構確能大幅度提高自然語言處理的精度與效率,但在預訓練、監(jiān)督微調(diào)、推理等環(huán)節(jié)都可能存在能力短板,產(chǎn)生與事實、指令或上下文不一致的幻覺問題。例如在預訓練階段,大模型通過自回歸生成方式,基于歷史標記的概率分布逐詞預測輸出。這種機制天然缺乏對上下文語義一致性的把控能力,容易優(yōu)先選擇概率更高但與事實、邏輯不一致的詞匯組合,輸出形成“語法正確但內(nèi)容失真”的幻覺。
其次是訓練數(shù)據(jù)的天然缺陷。大模型基于互聯(lián)網(wǎng)海量數(shù)據(jù)進行深度學習,但由于互聯(lián)網(wǎng)語料并未經(jīng)過嚴格檢驗處理,或者由于錯誤標注,不可避免存在事實錯誤或邏輯矛盾,大模型缺乏對數(shù)據(jù)真實性的鑒別能力,容易抓取或根據(jù)錯誤數(shù)據(jù)生成回答。例如,當要求GPT4大模型講述“林黛玉倒拔垂楊柳”的故事時,大模型并不能辨析其中的陷阱,而是未經(jīng)事實驗證直接從海量文本數(shù)據(jù)中進行內(nèi)容拼接,編造出一段荒謬情節(jié)。
最后是人機互動的刻板誤傷。大模型采取的人類反饋強化學習,容易導致大模型在刻意逢迎人類需求過程中出現(xiàn)信口開河、事實偽造等問題。如加拿大航空聊天機器人在錯誤理解“特殊退款”概念后,連續(xù)生成虛構的退款條件與時限,最終釀成法律糾紛。大模型特有的技術架構和生成邏輯,導致幻覺具有自我強化的危險性。
大模型幻覺的價值風險
大模型幻覺的隨機出現(xiàn)和難以避免,還存在著削弱人機信任、導向信息極化、沖擊社會秩序甚至引發(fā)意識形態(tài)安全危機等價值風險,亟待加強預防與治理。
大模型幻覺最直接的危害就是對用戶決策的誤導,特別是在醫(yī)療、健康、金融等領域。大模型的權威性表達風格與流暢的敘事邏輯,使得錯誤信息具有極強的迷惑性。如果用戶過于依賴大模型生成信息輔助決策,很有可能被誤導進而產(chǎn)生嚴重后果。例如,相信大模型提供的錯誤治療方案,可能導致疾病無法控制甚至進一步惡化。長此以往,恐將削弱人機信任關系。
更令人擔憂的是,大模型幻覺引發(fā)的價值風險呈現(xiàn)出從個人決策誤導向群體認知偏差、社會秩序沖擊的擴散路徑。在公共決策領域,幻覺可能扭曲政策認知,如果不加強對大模型輸出信息的甄別與把關,很有可能出現(xiàn)誤讀政策、發(fā)表歧視言論等幻覺問題,不僅會削弱政府公信力,甚至會危及社會公共安全。
在意識形態(tài)安全領域,相關威脅更加隱蔽。例如,相關研究監(jiān)測到,某些境外大模型帶著意識形態(tài)的有色眼鏡看待中國特色社會主義發(fā)展成就與制度優(yōu)勢,刻意混入虛假事實或錯誤評價,形成與主流話語不同的輸出。這種經(jīng)過意識形態(tài)包裝的幻覺內(nèi)容,通過知識問答形式進行價值滲透,其誤導性遠超傳統(tǒng)虛假信息。
大模型幻覺的治理對策
預防與治理大模型幻覺,應構建技術糾偏、法律規(guī)制與倫理調(diào)適的三維治理體系,通過技術優(yōu)化消除幻覺問題,借助法律規(guī)制明確責任邊界,依托倫理調(diào)適培育價值理性,使大模型成為人類更可靠的合作伙伴。
構建多層次防治體系。“以技治技”是解決大模型幻覺問題的首選路徑。人工智能倫理的“價值敏感設計”或價值對齊策略,也有賴于技術層面創(chuàng)新與突破。這不僅需要人工智能企業(yè)與專家通過提高訓練數(shù)據(jù)質(zhì)量、加強外部驗證與事實檢查、改進模型推理能力、增強透明度與可解釋性等途徑提升大模型性能,而且鼓勵哲學社會科學專家與人工智能專家攜手合作,通過知識庫優(yōu)化、訓練語料糾錯、價值對齊監(jiān)測等途徑,幫助大模型提高問答正確率,消除潛在的幻覺問題與價值風險。
建立適應性治理框架。面對大模型的普及化應用,敏捷、柔性、規(guī)范的立法治理勢在必行。國家網(wǎng)信辦等七部門頒布實施《生成式人工智能服務管理暫行辦法》,對訓練數(shù)據(jù)選擇、模型生成與優(yōu)化、服務提供等提出明確的法律規(guī)制與風險防范要求,有利于推動“智能向善”,促進大模型的合規(guī)應用。歐盟《人工智能法案》要求大模型履行告知義務、確保技術方案的穩(wěn)健性和可靠性等規(guī)范要求,對大模型的應用形成有效的制度約束和問責框架,值得參考借鑒。
提高技術開發(fā)應用的價值基準。對大模型幻覺更有意義的治理創(chuàng)新在于建立技術價值觀,將負責任創(chuàng)新、可控創(chuàng)造性等倫理價值融入工程師的頭腦、植入大模型的代碼。例如,倡導存在爭議結論不生成、無法溯源的信息不生成、超出模型認知邊界的內(nèi)容不生成等原則,推動大模型從追求生成流暢度向確保內(nèi)容可靠性轉型;又如,建立大模型回答事實性問題分級置信提示制度,按照高可信、需核實、推測性結論等進行分類標注,加強輸出內(nèi)容的透明度與可解釋性。
對用戶而言,應進一步提高科學正確應用大模型的信息素養(yǎng),進而成為引導內(nèi)容生成的指揮官、幻覺問題的甄別者。研究表明,經(jīng)過人工智能交叉驗證等使用習慣培訓,能夠顯著降低用戶被幻覺誤導的概率。人們需要與時俱進地提升自身辨析幻覺、掌握常識、批判思考的綜合能力,在利用大模型檢索信息、生成內(nèi)容的過程中遵守履行事實核查、邏輯驗證、專業(yè)甄別、最小必要、場景控制等價值原則,最大限度消除幻覺問題和價值風險。
人工智能的可靠性建設往往滯后于其能力擴展。治理大模型幻覺的終極目標不是完全消滅技術的不確定性,而是要建立風險可控的人機協(xié)同機制。在這場人機協(xié)同的賽博進化中,始終保持技術的謙遜與倫理的清醒,是破除大模型幻覺迷霧的應有之義。
標簽:
搶先讀
- 構建大模型幻覺及其價值風險的預防治理體系
- 多品牌戰(zhàn)略再升級 安踏集團宣布收購德國狼爪
- 今年全國快遞業(yè)務量已突破500億件
- 新華財經(jīng)|AI機器人 廣東打算怎么做?
- 高校團隊在介電儲能領域取得突破性成果
- 高校團隊在介電儲能領域取得突破性成果
- 今年全國快遞業(yè)務量已突破500億件
- 海南洋浦區(qū)域國際集裝箱樞紐港首個20萬噸級泊位投用
- 金價為何坐上“過山車”
- 消博會“黑科技”提前看:海南“車路云一體化”應用成果首次展示
- 第五屆消博會開幕在即 中外展商緊抓“消博”機遇
- 福建漳州成立低空技術校企合作聯(lián)盟
- 上海多舉措促進專精特新中小企業(yè)發(fā)展壯大 大模型等加速其成長
- 上海多舉措促進專精特新中小企業(yè)發(fā)展壯大 大模型等加速其成長
- 中馬國際高科技生態(tài)產(chǎn)業(yè)園協(xié)議在深圳簽署
- 上海專精特新中小企業(yè)數(shù)量超1.2萬家
- 上海專精特新中小企業(yè)數(shù)量超1.2萬家
- 上海專精特新中小企業(yè)數(shù)量超1.2萬家
- 財政部:加強產(chǎn)權交易機構開展金融機構國有產(chǎn)權交易業(yè)務管理
- 港股三大指數(shù)止跌回升
- 浙江首個智慧零碳供能高速服務區(qū)投運
- (鄉(xiāng)村行·看振興)枳殼花開白如雪 江西南城藥材變“藥財”
- 中國多家電商和零售企業(yè)宣布支持“出口轉內(nèi)銷”
- 雪峰山深處春茶飄香 湖南新化高山茶園成“綠色銀行”
- 第九屆全國石油石化裝備產(chǎn)業(yè)基地建設與發(fā)展大會在四川廣漢舉行
- 浙江首個智慧零碳供能高速服務區(qū)投運
- 中國手機經(jīng)歷過大風大浪,“OPhone的含金量還在上升”
- 浙江首個智慧零碳供能高速服務區(qū)投運
- 中國手機經(jīng)歷過大風大浪,“OPhone的含金量還在上升”
- 李熠:數(shù)字孿生技術正為人工智能發(fā)展提供數(shù)據(jù)支撐
- 關稅淪為游戲,美國已成笑話
- 廣州海關發(fā)布支持第137屆廣交會12項便利措施
- 李熠:數(shù)字孿生技術正為人工智能發(fā)展提供數(shù)據(jù)支撐
- 廣東發(fā)明專利有效量突破80萬件
- 廣州海關發(fā)布支持第137屆廣交會12項便利措施
- “堯七味” 亮相 山西臨汾中藥材產(chǎn)業(yè)從“賣資源”向“賣品牌”轉型
- 海南自貿(mào)港首個“人民幣海漂鐵礦石掉期”產(chǎn)品上線
- 海南自貿(mào)港首個“人民幣海漂鐵礦石掉期”產(chǎn)品上線
- 廣東發(fā)明專利有效量突破80萬件
- 中基協(xié)發(fā)布修訂后的《基金經(jīng)營機構及其工作人員廉潔從業(yè)實施細則》
- 中基協(xié)發(fā)布修訂后的《基金經(jīng)營機構及其工作人員廉潔從業(yè)實施細則》
- 寧夏跨省物流大通道建設邁入新階段
- 國家郵政局:3月中國快遞發(fā)展指數(shù)同比增長5%
- 成都發(fā)力首發(fā)經(jīng)濟 鼓勵國際化品牌來蓉開店
- 云南昌寧:林下經(jīng)濟點“綠”成“金”
- 從走出去到扎下根,無錫小電驢勇闖世界
- 各地一批重大工程有序推進
- 泰國籍大型液化氣船在福建寧德完成維修交付
- 高速開車睡覺,誰制造了“全民智駕”幻覺?
- 碳路中國 | 中國新增可再生能源發(fā)電量占全球六成
- 國家金融監(jiān)督管理總局發(fā)布《保險集團并表監(jiān)督管理辦法》
- 加碼布局中國市場 多家外資金融機構積極創(chuàng)新 加速拓展在華業(yè)務
- 4月7日以來,已有48家中央企業(yè)宣布增持回購
- 碳路中國 | 中國新增可再生能源發(fā)電量占全球六成
- 一季度中國鐵路完成固定資產(chǎn)投資同比增5.2%
- 4月7日以來,已有48家中央企業(yè)宣布增持回購
- 泰國籍大型液化氣船在福建寧德完成維修交付
- 加碼布局中國市場 多家外資金融機構積極創(chuàng)新 加速拓展在華業(yè)務
- 碳路中國 | 中國新增可再生能源發(fā)電量占全球六成
- 百年青?。撼帧百|(zhì)”以恒 煥消費新光 青島啤酒舉辦第47屆“提高質(zhì)量紀念日”活動
- 深交所:圍繞關鍵領域助力打通中長期資金入市的卡點堵點
- 國家綜合貨運樞紐補鏈強鏈第一批典型經(jīng)驗發(fā)布
- 第137屆廣交會每期將設1萬平方米進口展區(qū)
- 今年首季上??诎哆M口冰鮮水產(chǎn)品同比增長6.6%
- 迎峰度夏不限電,蘇州有何秘訣?
- 南京推行政檢查碼 以數(shù)字賦能規(guī)范執(zhí)法新路徑
- 海南出臺2025版優(yōu)化營商環(huán)境重點舉措 推出166條具體任務
- 全球塑料有多少產(chǎn)自回收材料?中國團隊最新研究發(fā)現(xiàn)不足10%
- 全球塑料有多少產(chǎn)自回收材料?中國團隊最新研究發(fā)現(xiàn)不足10%
- 海南出臺2025版優(yōu)化營商環(huán)境重點舉措 推出166條具體任務
- 海南出臺2025版優(yōu)化營商環(huán)境重點舉措 推出166條具體任務
- 海南出臺2025版優(yōu)化營商環(huán)境重點舉措 推出166條具體任務
- 迎峰度夏不限電,蘇州有何秘訣?
- 海南出臺優(yōu)化營商環(huán)境新舉措 外資企業(yè)登記服務再升級
- 上合組織可持續(xù)發(fā)展投資促進活動天津舉辦 簽約金額47.95億元
- 海南出臺優(yōu)化營商環(huán)境新舉措 外資企業(yè)登記服務再升級
- 搶抓市場機遇 中小企業(yè)加速向智能化、數(shù)字化、綠色化轉型
- 凝心聚力 實干篤行丨打開世界地圖做生意 中國企業(yè)走通“出?!敝?/a>
- 2025全球6G技術與產(chǎn)業(yè)生態(tài)大會在南京召開
- 深圳寶安打造全國首個“場景全域開放標桿城區(qū)”
- 一季度全國鐵路固定資產(chǎn)投資完成1312億元 同比增長5.2%
- 開創(chuàng)鄉(xiāng)村全面振興新局面
- 2025全球6G技術與產(chǎn)業(yè)生態(tài)大會在南京召開
- 第五屆消博會將于4月13日開幕 提前解鎖各大展館亮點
- 2025全球6G技術與產(chǎn)業(yè)生態(tài)大會在南京召開
- 電商平臺AI造假頻現(xiàn) 警惕批量生成的“買家秀”
- 開創(chuàng)鄉(xiāng)村全面振興新局面
- 現(xiàn)貨黃金首次突破3200美元大關
- 旅游觀察:這屆銀發(fā)族重新定義旅游消費新潮流
- 新開發(fā)銀行發(fā)行70億元人民幣3年期熊貓債
- 現(xiàn)貨黃金首次突破3200美元大關
- 現(xiàn)貨黃金首次突破3200美元大關
- 京東外賣推出百億補貼,一年內(nèi)投入超100億
- 山東鄄城:科學采伐除隱患 道路升級保暢通
- 140臺前沿農(nóng)機密山市“炫技” 助推農(nóng)業(yè)發(fā)展
- 廣州海事部門多措并舉護航廣州港一季度實現(xiàn)“開門紅”
- 福州航標處更新平潭海峽公鐵兩用大橋水域部分航標 護航“海上通道”安全暢通?
- “天津之眼”摩天輪景區(qū)將于4月13日起暫停運營
- 廣州海事部門多措并舉護航廣州港一季度實現(xiàn)“開門紅”
- 第三屆中國(西安)國際礦業(yè)裝備與技術展覽會舉辦