a16z：三成財星 500 大企業已為 AI 付費，寫程式碼和客服先落地

BTCC / BTCC Square / TechFlowPost /

立即建立BTCC帳戶，輕鬆買賣加密貨幣！

Author:

TechFlowPost

Published:

2026-04-10 02:38:57

作者：a16z

編譯：深潮 TechFlow

MIT 聲稱 95%的企業生成式 AI 試點失敗轉化，a16z 用投資組合公司的一手數據直接打臉這個說法。 29%的 Fortune 500 和 19%的 Global 2000 已經是領先 AI 新創公司的付費客戶，程式設計工具讓最優秀工程師的效率提升 10-20 倍。這份 23928 字報告基於內部數據，揭示哪些 AI 場景真正產生價值、哪些仍是概念炒作。

關於 AI 在大型企業中取得多大進展的猜測很多，但大多數現有資訊僅由自我報告的 AI 使用或捕捉定性買家情緒而非硬數據的調查組成。此外，現有的少數研究斷言 AI 在企業中表現不佳，最引人注目的是 MIT 的一項研究，該研究聲稱 95%的生成式 AI 試點未能轉化。

基於我們的內部數據和與企業主管的對話，我們發現這個統計數據難以置信。我們一直在密切追蹤 AI 在哪裡看到最多採用以及 ROI 在哪裡明確，並編制了關於企業 AI 中實際有效的硬數據。

企業中的 AI 滲透率

根據我們的分析，Fortune 500 中的 29% 和 Global 2000 中的約 19% 是領先 AI 新創公司的活躍付費客戶。

為了符合這個統計，這些企業必須與 AI 新創公司簽署了自上而下的合同，成功轉化了試點，並在其組織中上線了產品。

在如此短的時間內達到這種滲透水平是顯著的，因為 Fortune 500 企業並不以技術早期採用者而聞名。從歷史上看，許多新創公司必須首先向其他新創公司銷售以獲得早期動力，幾年後新創公司才能簽下第一份企業合同，在能夠最終簽下 Fortune 500 規模的客戶之前需要更多收入和時間。

AI 顛覆了這個常態。 OpenAI 在 2022 年 11 月推出 ChatGPT，立即向消費者和企業展示了 AI 的潛力。這樣做釋放了對 AI 的興趣風暴，這是前幾代技術從未引發的，大型企業比以往任何時候都更願意更早對新產品下注。結果：僅僅 3 年多後，幾乎三分之一的 Fortune 500 和五分之一的 Global 2000 在其組織中有真正的企業 AI 部署。

企業 AI 中什麼有效

這種採用在哪裡發生得最快，它如何映射到模型本質上更擅長做的工作？

我們發現，最具指示性的評估方法是將各用例的收入動能疊加到 GDPval 定義的模型理論能力上，GDPval 是 OpenAI 的一個知名基準，評估模型在現實世界經濟上有價值的任務上的能力。對我們來說，這兩個因素既概括了模型可以有多好，也概括了它們今天證明提供了多少價值。這使它們非常能說明 AI 採用今天在哪裡、可能走向哪裡，以及儘管模型能力成熟但採用方面仍有 AI 懸置的地方。

企業 AI 今天在哪裡提供最多價值？

在收入動能上，企業對 AI 的採用由一組明確的用例和產業主導。程式設計、支援和搜尋到目前為止代表了大部分用例（程式設計甚至在這組中是一個數量級的異常值），而科技、法律和醫療保健部門是最渴望採用 AI 的行業。

程式設計：程式設計是 AI 的主導用例，幾乎達到一個數量級。這在 Cursor 等公司報告的爆炸性成長以及 Claude Code 和 Codex 等工具的超高速成長中顯而易見。這些成長率超過了幾乎所有人最樂觀的預測，到目前為止 Fortune 500/Global 2000 採用 AI 工具的絕大多數是在程式碼中。

在許多方面，程式設計代表了 AI 的理想用例，無論是在技術能力方面還是在企業市場接受程度方面。程式碼是資料密集的，這意味著在線有大量高品質程式碼可供模型訓練。它也是基於文字的，使模型易於解析。它是精確和明確的，具有嚴格的語法和可預測的結果。關鍵的是，它是可驗證的：任何人都可以運行它並知道它是否有效，為模型學習和改進創建緊密的回饋循環。

從商業角度來看，這也是一個很好的應用。我們一直聽到投資組合公司說，他們最優秀工程師的生產力水準隨著 AI 編碼工具提高了 10-20 倍。僱用工程師一直很困難且昂貴，因此任何提高他們生產力的東西都有明確的 ROI——AI 編碼工具提供的提升幅度為採用創造了巨大激勵。工程師也往往是要求最佳工具的早期採用者，因為程式設計與大多數企業工作相比是更單獨的任務，他們更容易簡單地找到最好的工具並採用它，而不會被困擾企業許多其他職能的協調和官僚主義所拖累。

此外，程式設計工具不需要 100%端對端完成任務才有附加價值，因為任何加速（例如，尋找 bug、產生樣板程式碼）仍然節省時間且有用。由於程式設計有緊密的人在環路工作流程，開發人員今天仍然監督開發過程，這些工具在加速輸出的同時仍為人類判斷審查、編輯和迭代留出空間。這既增加了企業信心，也使採取路徑更順暢。

程式設計能力正在以指數方式提高，每個實驗室都明確專注於贏得程式碼作為用例。這具有巨大影響。程式碼是所有其他應用的上游，因為它是任何軟體的核心構建塊，因此 AI 對程式碼的加速影響應該會加速每個其他領域。在這些領域建立的門檻降低，解鎖了用 AI 解決的新機會，但同樣的可及性使得為新創公司建立持久競爭優勢比以往任何時候都更為關鍵。

支援：支援在槓鈴的另一端，與程式碼相反。雖然軟體工程通常在組織中獲得最多投資和關注，但支援通常被忽視。支援組織中的工作是後台、入門級工作，通常外包給離岸公司或業務流程外包公司（BPO），因為公司認為自己管理太繁瑣和複雜。

AI 已被證明在管理這項工作方面表現出色，原因有幾個。首先，大多數支援交互的性質是有時限的，具有約束的意圖（例如，發出退款），為代理提供明確定義的問題來處理。支援也是角色中涉及的任務被清楚定義的唯一功能之一。支援團隊量大且流動性高，因此需要以快速和標準化的方式培訓新代表。為此，他們有清晰闡述的標準作業程序（SOP）來指導每個代表的工作。這些 SOP 創建了 AI 代理可以模仿的明確規則和指南。這使它與大多數其他企業工作區分開來，後者通常持續時間更長、定義更不清晰，並涉及客戶和服務代表之外的更多利益相關者。

支援也是展示 ROI 最清晰的企業職能之一。支援基於可量化的指標運行：回答的工單數量、客戶的 CSAT（滿意度）分數和解決率。現狀與 AI 代理的任何 A/B 測試都會為 AI 代理產生有利結果：它會回答更多工單，提高解決率，並提高消費者滿意度分數——所有這些成本更低。由於大多數支援已經外包給 BPO，採用 AI 解決方案需要有限的變更管理，使採用路徑更容易。

支援也不需要 100%準確才有用，因為它有向人類的自然出口（例如，"我正在將你升級給經理"）。這允許銷售週期更快移動，並使試點 AI 支援代理相對低風險；在最壞的情況下，100%的案例將簡單地升級並由人類解決。

最後，支援本質上是交易性的。客戶對實際在另一端的是誰漠不關心，這意味著支援不需要任何 AI 難以複製的人際關係。這些特徵解釋了為什麼 Decagon 和 Sierra 等公司成長如此之快，以及更多垂直特定支援參與者如 Salient、HappyRobot 等。

搜尋：最後一個具有明確企業市場拉動的水平類別是搜尋。 ChatGPT 的主要用例本身就是搜索，因此搜尋的影響可能嚴重地融入 ChatGPT 的收入和使用中，在這裡可能被大大低估了。

AI 搜尋作為一個類別如此廣泛，以至於它使許多獨立的大型新創公司得以出現。許多企業內部的主要痛點之一是使員工能夠簡單地在其係統的不同集合中定位和提取相關資訊。 Glean 作為這個用例的主要新創公司供應商而蓬勃發展。許多大型產業也基於非常具體的產業資訊（內部和外部）運作，像 Harvey（開始於法律搜尋）以及 OpenEvidence（開始於醫學搜尋）這樣的公司透過圍繞此建立核心產品而蓬勃發展。

產業

科技：目前最常見的採用 AI 的產業是科技業。 ChatGPT 本身報告說，27%的商業用戶來自科技，Cursor、Decagon 和 Glean 等公司的許多早期客戶都是科技公司。考慮到科技幾乎總是早期採用者，並且是催生 AI 浪潮的行業，這完全不令人驚訝。

更令人驚訝的是，歷史上不被認為是早期採用者的市場這次被證明是渴望的。

法律：法律令人驚訝地是 AI 中的先行產業之一。法律歷史上被認為是軟體的困難市場，時間表冗長且買家不太精通技術。

這是因為傳統企業軟體為律師提供的價值有限：靜態工作流程工具並沒有加速律師通常所做的非結構化、微妙的工作。但 AI 讓科技對律師的價值主張更加清晰。 AI 擅長解析密集文本、對大量文本進行推理以及總結和起草回應——所有這些都是律師經常做的工作。 AI 現在經常充當副駕駛員以提高個別律師的生產力，但已開始擴展到此之外：在某些情況下，它實際上可以通過允許律師事務所處理更多案件而產生收入（如 Eve 的情況，它專門從事原告法）。

結果很明顯。 Harvey 在成立 3 年內報告了約 2 億美元的年度經常性收入（ARR），像 Eve 這樣的公司擁有超過 450 個客戶，並在今年秋天達到 10 億美元估值。

醫療保健：醫療保健是另一個以傳統軟體從未有過的方式回應 AI 的市場。像 Abridge、Ambience Healthcare、OpenEvidence 和 Tennr 這樣的公司基於離散用例（如醫療記錄、醫療搜尋或管理醫療保健如何交付和支付的拜占庭規則的後台自動化）的收入增長非常迅速。

醫療保健歷史上是採用軟體較慢的市場，因為 1）高技能和複雜的工作與傳統工作流程軟體能解決的問題映射不佳，2）Epic 等系統記錄 EHR 的主導地位擠壓了全新軟體供應商。然而，有了 AI，公司能夠透過替換行政工作（例如醫療記錄員）或增強醫生正在做的更高價值工作，來承擔繞過系統記錄的離散人工勞動工作。這項工作足夠獨特，不需要撕毀和替換 EHR，允許這些公司快速擴展，同時不需要替換現有軟體供應商。

關於分析的幾點說明

這些估計值是最佳估計值。它可能低估了每個類別中產生的收入量，並誇大了模型的能力。

我們可能低估了收入，因為：

收入分析純粹基於哪些部門和用例成功到足以產生大型、獨立的企業 AI 業務，並排除了其他新創公司正在處理的用例長尾。

這些市場中的許多也有相當規模的非新創公司參與者產生顯著收入（例如，代碼中的 Codex/Claude Code，法律中的 Thomson Reuters 的 CoCounsel），但我們將分析集中在獨立新創公司參與者上。

我們分析中闡述的許多工作任務可能融入模型公司的核心產品（例如，ChatGPT 和 OpenAI 的搜尋），但沒有被分割並包含在此分析中。

此分析著重於企業業務而非消費者或專業消費者業務。有成功的業務（例如，應用程式生成和設計中的 Replit 和 Gamma）擁有相當數量的商業用戶，但今天主要專注於消費者或專業消費者。鑑於此分析著重於企業 AI 以及企業從何處獲得價值，我們排除了消費者主導的業務。

在能力方面，衡量 AI 對經濟不同部門的影響極為困難，儘管許多經濟學家正在嘗試。工作本質上定義不清且長尾，使其極難完全自動化。今天還不清楚企業能從部分自動化中獲得多少價值——如果 AI 只能做人類任務的 50%，不可自動化任務的重要性可能會上升，因為它們成為瓶頸，增加其相對價值。因此，我們可能高估了今天的能力狀態，因為每增量 1%的能力不會轉化為 1%的經濟價值，但注意相對能力以及它們如何隨著每個新模型發布而改進仍然很有說明性。

AI 正在進入所有市場

此分析衡量了通過 GDPval 基準測試，頂級評估模型對人類專家的勝率。基於此，很明顯，自 2025 年秋季以來，模型在經濟上有價值的工作上已經變得顯著更好。

那麼，為什麼我們沒有看到所有在此評估中排名高的行業具有與其他行業相同類型的收入勢頭？

迄今為止熱情採用 AI 的行業有幾個相似之處：它們是基於文本的，涉及機械性和重複性工作，有自然的人在環路參與以注入人類判斷，監管有限，並具有明確可驗證的最終輸出（例如，運行的代碼，已解決的支持工單）。許多行業沒有這些屬性。它們要麼處理物理世界，嚴重依賴人際關係，在許多利害關係人之間有明顯的協調成本，施加監管或合規障礙，或缺乏可驗證的結果。雖然收入動能和模型能力明顯相關，但在模型能力理論上相對人類處於 50%以下勝率的領域（如法律的情況），像 Harvey 這樣的公司仍然能夠透過副駕駛產品快速獲得市場份額以增強個人法律工作，然後隨著模型演進持續改進其核心產品。

這裡最值得注意的發現是模型能力正在快速提升。有幾個領域在過去 4 個月中顯示出巨大改進——會計和審計在 GDPval 上顯示近 20%的跳躍，甚至警察/偵探工作等領域也顯示近 30%的改善。我們期望這些跳躍在其相關領域產生引人注目的新產品和公司。此外，模型公司已經明確宣布他們打算改進經濟上有價值工作的核心能力，在電子表格和財務工作流程上進行核心工作，使用計算機來處理遺留系統和行業上的棘手工作，以及在長期任務上的有意義改進，這開闢了一整類無法輕易切割成短小、易消化片段的新工作。