Karpathy:20年的編程生涯幾週之內被顛覆,80%由AI來寫,Claude和Codex跨過某種一致性門檻
OpENAI創始成員、特斯拉前AI總監Andrej Karpathy,剛剛分享了他使用Claude進行數周高強度編程後的心得體會。
AK直言,自己的工作流在幾週內就發生了巨變:從80%手動編碼,轉變為80%由AI來寫,這“有點傷自尊”,但這種轉變帶來的巨大效用難以抗拒。 他詳細闡述了當前AI編程的優缺點、對個人能力的影響,並對行業的未來提出了疑問

以下是KARpathy的核心觀點:
和許多人一樣,隨著大語言模型編碼能力的提升,AK的工作流也迅速改變。
去年11月,大約是80%手動+自動補全編碼,20%使用智能體。 到了12月,這個比例顛倒了過來,變成了80%由智能體編碼,AK只做20%的編輯和修補工作。
也就是說,現在基本上AK是在用英語編程,有點不好意思地用語言告訴大模型要寫什麼代碼。 這確實有點傷自尊,但通過大型“代碼動作”來操作軟件的力量實在太有用了,尤其是當你適應、配置、學會使用它,並理解了它的能力邊界之後。
這是AK編程近20年來,基礎編碼工作流發生的最大變化,而且僅僅在幾週之內就完成了。 AK預計,在工程師群體中,有兩位數百分比的人正在經歷類似轉變,而普通大眾對此的認知度可能還停留在低個位數百分比。
目前,“不再需要IDE”和“智能體集群”這兩種炒作都為時過早。
模型肯定還是會犯錯,如果你有任何真正在意的代碼,AK建議你在旁邊開一個大大的IDE,像鷹一樣盯著它們。
模型的錯誤類型已經變了很多——不再是簡單的語法錯誤,而是那些有點草率、急躁的初級開發人員可能會犯的、細微的概念性錯誤。 最常見的錯誤是,模型會為你做出錯誤的假設,並且不加核實就繼續執行。
它們也無法處理自身的困惑,不會尋求澄清,不會揭示不一致之處,不會展示權衡利弊,不會在應該反駁的時候提出異議,而且仍然有點過於諂媚。 在規劃模式(plan mode)下情況會有所好轉,但我們還需要一種輕量級的內聯規劃模式。
此外,它們還非常喜歡把代碼和API搞得過於復雜,濫用抽象,也不會清理自己留下的無用代碼。 它們會用1000行代碼實現一個低效、臃腫、脆弱的結構,而你得提醒它:“嗯......你難道不能這樣做嗎?”然後它們會說:“當然可以!”並立刻把代碼縮減到100行。 它們有時還會更改或刪除自己不喜歡或理解不夠充分的註釋和代碼,即使這與當前任務無關。
盡AK嘗試通過在CLAUDE.md中給出一些簡單的指令來修復這些問題,但它們依然存在。
然而,儘管有這些問題,這仍然是一個巨大的淨提升,很難想像再回到手動編碼的時代。 長話短說,AK目前的流程是:左邊開幾個ghostty窗口/標籤頁跑幾個小型的CC會話(與Claude交互),右邊開一個IDE用於查看代碼和手動編輯。
觀察一個智能體不懈地工作是件非常有趣的事。 它們從不疲倦,從不洩氣,只是不斷地嘗試,在人類可能早就放棄、改日再戰的地方繼續堅持。
看著它為一個問題苦苦掙扎很長時間,最終在30分鐘後取得勝利,那一刻有一種“感受到AGI”的瞬間。 你意識到,耐力是工作的核心瓶頸之一,而有了大語言模型,這個瓶頸被極大地拓寬了。
很難衡量大語言模型輔助帶來的“效率提升”到底有多大。 當然,對於原本計劃要做的事情,AK感覺速度快了很多。 但主要影響在於,做了遠比原計劃更多的事情,因為:
-
1. 能編寫出各種以前覺得不值得花時間去寫的東西。
-
2. 能處理以前因為知識或技能問題而無法著手的代碼。
所以,這當然是效率提升,但更多的是一種“能力擴張”。
大語言模型異常擅長循環執行任務直到滿足特定目標,這正是大部分“感受到AGI”魔力的來源。
不要告訴它具體怎麼做,而是給它成功的標準,然後看它表演。 讓它先寫測試,然後再通過這些測試。 把它放進一個帶有瀏覽器MCP(模型控製程序)的循環裡。 先寫一個很可能正確的樸素算法,然後要求它在保持正確性的前提下進行優化。
將你的方法從“命令式”轉變為“聲明式”,可以讓智能體循環更長時間,從而獲得更大的槓桿作用。
AK沒預料到,在智能體的幫助下,編程變得更有趣了。 因為大量“填空式”的苦差事被消除了,剩下的就是創造性的部分。
AK也感覺更少被卡住(這很不愉快),並且體驗到了更多的勇氣,因為幾乎總有辦法能與它攜手取得一些積極進展。
AK也看到了其他人的相反觀點;大語言模型編碼將根據工程師主要是喜歡“編碼”還是喜歡“構建”而將他們區分開來。
AK已經註意到,手動編寫代碼的能力正開始慢慢萎縮。
生成(寫代碼)和辨別(讀代碼)是大腦中的兩種不同能力。 很大程度上因為編程中涉及的各種細微的、主要是語法上的細節,即使你很難寫出代碼,你也可以很好地審查代碼。
AK正準備迎接2026年,那將是GitHub、Substack、arXiv、X/Instagram以及所有數字媒體的“垃圾末日”之年。 除了實際的、真正的進步之外,我們還會看到更多AI炒作下的“生產力表演”(這還有可能更多嗎?)。
AK腦海中有幾個問題:
“10倍工程師”會怎樣——頂尖工程師與平均水平工程師之間的生產力差距會如何變化?這個比例很有可能大幅增長
有了大語言模型,通才是否會越來越勝過專才?大語言模型在“填空”(微觀)方面遠比在“宏大戰略”(宏觀)方面更出色
未來的大語言模型編程會是什麼感覺?像玩《星際爭霸》?玩《異星工廠》?還是演奏音樂?
整個社會在多大程度上受限於數字知識工作?
這一切將我們引向何方?
大語言模型智能體(尤其是Claude和CoDEX)的能力似乎在2025年12月前後跨越了某種“一致性”的門檻,引發了軟件工程及相關領域的相變。
“智能”部分突然感覺遙遙領先於其他所有部分——包括集成(工具、知識)、對新組織工作流程和流程的需求,以及更廣泛的技術擴散。
隨著整個行業消化這一新能力,2026年將是充滿能量的一年
source:
https://x.com/karpathy/status/2015883857489522876
本文來源:AI寒武紀