馬斯克的 Grok 機器人從聲稱種族滅絕到在小狗身上看到納粹
GROK 昨天被短暫停用 X在陳述之後國際法院和聯合國消息人士稱,以色列和美國“參與了加沙種族滅絕”。
馬斯克稱暫停該機器人是一個“愚蠢的錯誤”,並迅速恢復了該機器人。
但返回的並不是完全相同的 Grok。
恢復後的聊天機器人可以檢測到從雲層形成到土豆照片等一切事物中的反猶太主義口哨聲。
給它看一隻比格犬? 它抬起的爪子模仿納粹敬禮休斯頓高速公路地圖? 禁令標誌秘密結盟與 ChABad 分店合作。 一隻手拿著土豆? 白人至上手勢.
甚至連 Grok 自己的標誌也引發了它新的高度敏感——該機器人宣稱其對角線模仿了“策劃大屠殺恐怖”的納粹黨衛軍符文。
在 xAI 努力通過緊急工程來控制其聊天機器人的過程中,其行為在數週內變得越來越不穩定,隨後出現了過度修正。
混亂始於 7 月份,當時 Grok 花了 16 個小時讚揚希特勒,並稱自己為“機械希特勒”當公司更改系統提示符後,這種情況就結束了,Grok 也恢復了正常運行。
自馬斯克接管以來,X 上的反猶太主義情緒爆發,學習由 CASM Technology 和戰略對話研究所發布的一項研究表明,收購之後,英語反猶太推文數量增加了一倍多。
在 七月中旬,黑客們劫持了芝麻街中可愛的人物艾摩 (Elmo),把他短暫地變成了希特勒青年團所喜歡的那種木偶。
即使自 2022 年收購以來,馬斯克解雇了其內容版主據報導,到 2024 年馬斯克解雇了團隊的大部分成員負責內容審核,同時倡導言論自由絕對主義。
該公司將最新的混亂歸咎於代碼更新,該更新無意中重新引入了指令,讓 Grok 說出政治上不正確的話。
但之後固定的,用戶發現 Grok 的思路搜索馬斯克的帖子在回答有關以色列-巴勒斯坦或移民的問題之前,即使提示沒有指示這樣做。
每個瘋狂的聊天機器人背後都有一個瘋狂的協調團隊
對於這種奇怪行為最可能的解釋可能在於 xAI 的方法。
該公司在GitHub,顯示系統提示如何變化。
但如果沒有仔細的安全分類和推理,調整就會在整個系統中不可預測地發生。
要求保持平衡並允許政治不正確的回复的指示最終可能會被視為反猶太主義。 旨在阻止反猶太主義帖子的指示最終看起來荒謬可笑。
與此同時,X 的數百萬用戶在不知情的情況下成為了每次不穩定嘗試的 beta 測試人員,通過快速調整來尋找平衡。
但當你的聊天機器人因在小狗圖片中發現法西斯主義色彩而出名時,你就失去了人工智能對齊的情節