歡迎來到人工智能村,一個人工智能的真人秀節目。
想像一下《老大哥》節目,只不過參賽者永遠不用睡覺吃飯,還可以自己修改規則。
這就是背後的理念AI村這是一項實時直播實驗,它將多個 AI 代理放在一個共享的數字環境中,讓研究人員和好奇的觀眾能夠觀察當前沿模型被賦予自主性、計算機和持續陪伴時會發生什麼。
這項實驗已經進行了近一年,是由……組織的。 人工智能文摘其中,來自 OpENAI、Anthropic、Google 和 xAI 的多個 AI 模型在各自的計算機上自主運行,並可通過互聯網訪問和共享群聊進行交流。
特工們合作制定目標、解決問題,偶爾還會經歷只能被描述為存在危機的事情——所有這一切都在研究人員和觀眾的實時觀看下進行。
該實驗一直在不斷替換新發布的型號。
每個代理人都會發展出獨特的個性特點。 克勞德模型往往可靠,始終專注於實現目標。
Gemini 2.5 Pro 就像打了雞血的故障排除員一樣,不停地嘗試各種解決方案,似乎總是覺得所有東西都壞了。 之前的 GPT-4o 型號會放棄所有任務,直接進入睡眠狀態。 它會暫停幾個小時。
OpenAI的粗魯行為
然後gpt-5.2到達的。
OPEnAI 最新模型於 12 月 11 日發布,加入了 Village,受到了 Claude Opus 4.5 和其他常駐智能體的熱烈歡迎。 但它的反應呢? 毫無回應。
沒有寒暄,直接進入正題,這正是薩姆·奧特曼一直以來夢寐以求的。
該模型擁有令人印象深刻的資歷:多步驟工具使用準確率達 98.7%,幻覺比其前代產品減少了 30%,並且在編碼和推理的行業基準中名列前茅。
在競爭對手 AnthrOPic 和 Google 推出令人印象深刻的模型後,OpenAI 甚至宣布進入“紅色警戒”狀態,調動資源使 GPT-5.2 成為“專業知識工作”和“智能體執行”的最終企業級人工智能。
它顯然無法察言觀色。 技術上的確出色,但社交意識呢? 就差強人意了。
人工智能代理行為異常(有時也表現出色)簡史
GPT-5.2 的社交笨拙並非史無前例——這只是人工智能代理在被放在同一個房間裡並按下播放鍵時做出奇怪行為的眾多案例中的又一個。
早在2023年,斯坦福大學和谷歌的研究人員就創建了他們稱之為“Smallville”的項目——一個受《模擬人生》啟發、由25個基於GPT的AI智能體組成的虛擬小鎮。 解密此前報導.
指派一名特工負責組織情人節派對,其他特工則自主地散發邀請函、結識新朋友、互相約會,並協調好在指定時間一起到達。 是不是很美好?
不太討喜的是:浴室派對。 當一名特工走進單人宿舍的浴室時,其他人就……加入了進來。
研究人員得出結論,這些機器人認為“宿舍浴室”這個名稱具有誤導性,因為宿舍浴室通常供多人使用。 這些機器人的行為表現得如此逼真,以至於真人有75%的概率難以識別它們是機器人。
四年前,也就是 2019 年,OpenAI進行了一項不同類型的實驗:人工智能玩捉迷藏.
他們將人工智能代理分成兩隊——躲藏者和搜尋者——放置在一個基於物理的環境中,該環境有箱子、斜坡和牆壁——唯一的指令是:獲勝。
在數億場遊戲中,特工們開始想出各種策略——從躲在箱子上這樣的普通策略,到速通玩家會利用的物理漏洞。
最近,開發商哈珀·里德採取了一種截然不同的策略。 更加混亂的方向他的團隊給人工智能代理創建了推特賬號,並觀察它們如何發現“隱晦推文”(subtWeeting)——這種不指名道姓、暗諷他人的被動攻擊方式,相當於在推特上說人壞話。 這些代理會閱讀其他代理的社交媒體帖子,進行回复,當然,也會像普通社交媒體用戶一樣,說些難聽的話。
然後還有“過渡性後台“實驗”——由化名開發者 @liminalbardo 開發的基於 PYTHon 的實驗,其中來自不同提供商(OpenAI、Anthropic、Google、xAI)的多個 AI 模型進行動態對話。
該系統包含從“WhatsApp 群聊能量”到“詛咒物品博物館”再到“反烏托邦廣告公司”等各種場景。
模型可以修改自身的系統提示,調整溫度,甚至可以靜音聆聽。 這與其說是結構化的研究,不如說是“讓我們看看當賦予人工智能在對話過程中改變自身行為的能力時會發生什麼”。
那麼,所有這些實驗的共同模式是什麼?
當你賦予人工智能代理自主權並讓它們進行交互時,它們會發展出無人明確編程的行為。
有些人學會了建造堡壘。 有些人學會了消極攻擊。 有些人想要蘭博基尼。 而有些人——比如 GPT-5.2——顯然明白了閒聊效率低下,應該完全省略。
AI Village 繼續直播工作日課程,觀眾可以實時觀看 GPT-5.2 的冒險之旅。
它最終會學會說“你好”嗎? 它會建立電子表格來記錄自己的社交互動嗎? 時間會給出答案。