繼將馬斯克畫成黑人后,谷歌再次翻了車。(虎嗅注:今年2月份,谷歌的Gemini在推出文生圖功能幾周的時(shí)間內(nèi),被用戶發(fā)現(xiàn)該平臺刻意拒絕生成白人形象。對此谷歌方面表示加快改進(jìn),暫停人物圖片的生成功能。)
此次谷歌又犯了前科。在5月15日推出這一AI搜索引擎功能后,有不少用戶在使用過程中發(fā)現(xiàn)谷歌的AI Overviews會“胡言亂語”,對搜索的問題給出有違常識的、荒謬的解決方案。比如,兔子曾經(jīng)作為密爾沃基鷹隊(duì)的后衛(wèi)在NBA打過球、金毛犬可以生下奶牛、建議人們每天至少吃一塊小石頭……
此外,谷歌的人工智能搜索系統(tǒng)有時(shí)會難以解決基本的數(shù)學(xué)問題和方程式。例如,詢問2000年美元的相對價(jià)值,會返回一個(gè)荒謬的答案,即“2000 年至 2023 年期間價(jià)格累計(jì)上漲 -43.49%”(根據(jù)谷歌自己引用的通脹計(jì)算器,當(dāng)時(shí)價(jià)格實(shí)際上漲了77% );又或是認(rèn)為2024年10月至2025年1月之間有 738,523 天。
AI Overviews是谷歌在5月15日的I/O大會上高調(diào)推出的新型AI搜索引擎,由Gemini大模型驅(qū)動,展示在谷歌搜索的頁面頂部,可總結(jié)提煉用戶查詢內(nèi)容的概要。在I/O大會上,谷歌稱該功能將“重新定義搜索體驗(yàn)”。由于這一功能的推出,一些專家甚至將這一天稱為 Google 搜索的“零日”。 2023年5月推出的Search Generative Experience是AI Overviews的測試版。CEO 桑達(dá)爾?皮查伊曾表示,在測試版推出后谷歌已經(jīng)處理了超過 10 億次查詢。
之所以會犯這樣的錯(cuò)誤,最直接原因是Reddit網(wǎng)站網(wǎng)友評論的錯(cuò)誤數(shù)據(jù)。谷歌的大模型以Reddit上的帖子作為學(xué)習(xí)資料,在數(shù)據(jù)清洗與訓(xùn)練環(huán)節(jié)出現(xiàn)紕漏,因而出現(xiàn)了“大模型致幻”。
事實(shí)上,谷歌這樣“滿紙荒唐言”并非個(gè)例。
谷歌之外,OpenAI、Perplexity、You.com等無一幸免,均出現(xiàn)過不同程度的失誤。為了增強(qiáng)對話的擬真性和數(shù)據(jù)的全面性,這些AI搜索功能都將Reddit等社交平臺作為模型訓(xùn)練的數(shù)據(jù)庫,甚至奧特曼本身便是Reddit的投資人。
但Reddit等社區(qū)上的發(fā)言良莠不齊,顯然AI在內(nèi)容真實(shí)性和可靠度方面的判斷力還未成熟。在常規(guī)的搜索中,這些來自隨機(jī)互聯(lián)網(wǎng)用戶的惡作劇帖子可能不會成為人們點(diǎn)擊網(wǎng)絡(luò)鏈接列表時(shí)看到的首個(gè)答案。但有了AI Overviews后,這些惡作劇帖子就被整合到結(jié)果頁面頂部顯示的權(quán)威數(shù)據(jù)摘要中。
本質(zhì)上,AI Overviews此次出現(xiàn)的問題是人工智能幻覺的一種新變體,當(dāng)生成式人工智能模型提供虛假或誤導(dǎo)性信息并將其呈現(xiàn)為事實(shí)時(shí),就會出現(xiàn)幻覺。幻覺是由有缺陷的訓(xùn)練數(shù)據(jù)、算法錯(cuò)誤或?qū)ι舷挛牡恼`解造成的。
HITCon安全會議上的相關(guān)研究成果顯示,僅僅需要“污染”不到0.7%的數(shù)據(jù)集,就能有效規(guī)避防御機(jī)制,導(dǎo)致大模型輸出的內(nèi)容準(zhǔn)確性大幅下降。當(dāng)大模型被投喂的數(shù)據(jù)集含有誤導(dǎo)性信息時(shí),其給出的結(jié)果必然同樣失真。
對此,紐約大學(xué)的AI專家和神經(jīng)科學(xué)榮譽(yù)教授加里?馬庫斯(Gary Marcus)曾表示,AI模型天生無法對自己的工作進(jìn)行理性檢查,而這正是這個(gè)行業(yè)的致命傷。
而谷歌發(fā)言人梅根?法恩斯沃斯則表示,“用戶展示的事例都是不常見的查詢,并不代表大多數(shù)人的經(jīng)歷,我們也看到了一些被篡改或我們無法復(fù)現(xiàn)的例子”“絕大多數(shù) AI 概覽查詢都產(chǎn)生了高質(zhì)量信息,并提供了深入挖掘網(wǎng)絡(luò)的鏈接”。谷歌將使用有問題答案的“孤立例子”來完善其系統(tǒng)。