BTCC / BTCC Square / TechFlowPost /
Manus 最新對話全文:嘗試 Agent 支付,公司 RRR 近 1 億美元

Manus 最新對話全文:嘗試 Agent 支付,公司 RRR 近 1 億美元

Published:
2025-08-22 13:31:43
11
1

作者|Li Yuan

編輯| 靖宇

搬到新加坡的 Manus,對通用 AI Agent 的思考沒有停止。

在今天在新加坡舉行的 StriPE Tour 上,Manus 聯合創始人兼首席科學家季逸超(Peak)與 Stripe 亞太地區及⽇本⾸席營收官 Paul Harapin 進行了對談。

席間, Manus AI 披露了近期的經營數據,Manus AI 收入運行率(RRR,Revenue Run Rate)已經達到 9000 萬美元,很快即將上億。

Manus AI 的肖弘還特意在即刻表示,Revenue Run Rate 指的是當月的 Revenue *12,並不等於 Cash IncOMe。 很多 AI 產品都會有年付選項,這部分只能算作預存款,而不能記為 Revenue。 「如果我們按照這種【錯誤方式】披露,可以算出一個一個比 1.2 億美金更大的數。」肖弘表示。

除了經營數據之外,季逸超還分享了 Manus 團隊是如何思考通用 Agent 的的下一步的,以及 AI Agent 和 AGI 未來到底有什麼區別。

「現在大家幾乎把一切都叫做 Agent。比如一個麥克風,有人會叫它是「有環境感知的收音 Agent。」季逸超開玩笑地講道。

他也給出了拓展通用 Agent 能力下一步的兩條主線: 其一,用多 Agent 協作把執行規模做寬 (如在大規模調研裡衍生出上百個並行的子 Agent); 其二,給 Agent 打開更大的「工具面」 ,不把能力綁死在少數預置 API,而是像程序員一樣調用開源生態、安裝庫、甚至在可視化後 看圖自檢並回改 。

季逸超還提到,今天的數字世界仍按「給人用」的範式建造——非 API 化網頁、CAPTCHA、流程「小遊戲化」帶來大量摩擦, 瓶頸更像生態與製度約束,而非模型智力 。

這也是 Manus 參與 StrIPe 活動的原因之一:雙方正推進 在 Agent 內完成支付 ,把「研究—決策—下單/結算」連成閉環,用基礎設施協作來消解世界的摩擦。

以下為對話精華,經極客公園編輯整理:

答: 謝謝 Paul。 很高興能來到。 Manus 在構建一個通用 AI Agent。

很多研究機構和公司,其實在嘗試打造一個大腦——打造一個大語言模型。 但我們認為,從消費者的角度來看,這其實並不好。 AI 應該能真正採取行動,完成事情,所以我們構建了 Manus。

我們的方式,是讓 AI 可以使用人類歷史上最偉大的發明之一——通用計算機。 給了 AI 計算機,它能做人類能做到的所有事。 Manus 能真正完成任務。 比如它可以幫你做演示文稿、幫你規劃一次旅行,甚至能幫你運營社交媒體——雖然我並不推薦你真的這樣做。

我們的用戶真的很喜歡 Manus。 我們在三月份發布了 Manus,現在已經實現了大約 9000 萬的收入運行率(RRR,Revenue Run Rate),很快就會突破 1 億。

我覺得這對我們這樣一個小型創業公司來說非常巨大。 但更重要的是,這表明 AI Agent 已經不再只是一個研究領域的流行詞,而是真正在被應用,落地生根。

我可以和大家分享一個我們構建 Manus 過程中的小故事。

我們其實從 Agent coding 的應用中得到了很多靈感。 比如像 Cursor 這樣的 AI 編程產品,之前已經吸引了很多關注。

作為工程師,我們自然會使用 Cursor。 但讓我們驚訝的是,公司裡很多非工程師同事也在用 Cursor。 當然,他們並不是在寫軟件,而是用它來做數據可視化,甚至寫一些文章。 他們會忽略左邊的代碼部分,只是跟 AI 對話來完成工作。

這讓我們意識到:我們應該把這種方式泛化,賦能非程序員。 這就是 AI 的一個用例。

答: 我們認為這是一個非常好的問題。

現在大家幾乎把一切都叫做「Agent」。 比如一個麥克風,有人會說它是「有環境感知的收音 Agent「。

但至少我們主張,Agent 應該是應用型 AI 的一個子集。 我們不妨退一步,看看常見的 AI 應用類別。

大多數人已經熟悉兩類:一類是聊天機器人,比如 ChatGPT;另一類是生成式工具,比如 MidJourney 或 sora。 在這些系統中,通常只有兩個角色:用戶和模型。 你和模型交互,得到輸出。 而 Agent 的不同在於,它除了用戶和模型,還引入了第三個關鍵元素——環境。

這個「環境」的概念會因智能體類型不同而變化,比如在設計型 Agent 裡,環境可能是一個畫布或一段代碼;而在 Manus 這裡,我們的目標是讓 Agent 出現在虛擬機甚至整個互聯網中。 這樣 Agent 就能觀察環境,決定下一步該做什麼,並通過行動來改變環境。 這讓它非常強大。

比如在 Manus,你可以表達需求,它會打開瀏覽器、發佈網頁、幫你訂一張機票。 我很喜歡這個例子,因為雖然訂機票聽起來很簡單,但這其實是 AI 在直接改變現實世界——結果不是模型的輸出,而是你手裡的機票。 AI 真正介入了你的世界。 這就是我們所說的 Agent。

簡單來說,Agent 就是能代表用戶與環境交互的 AI 系統。

至於 AGI,這個詞也經常被提到,很多人把它等同於超級智能。 我們認為,AGI 是一種能利用 AI 模型的通用能力,在不經過特別設計的情況下完成許多任務的系統。

我們認為「Agent coding」其實是通往 AGI 的一條路徑。 它不是一個垂直領域的能力,而是如果你把它賦予計算機,它幾乎能在計算機上做任何事。 所以對我們來說,AGI 的條件就是要構建足夠完善的環境,讓這種能力得以發揮。

答: 就 Agent 而言,如果單看模型能力的話,現在的旗艦模型已經非常驚人了,幾乎是「超人」級別的。 它們可以在數學競賽或邏輯推理上勝過我們大多數人。

但我認為,模型仍然像是「瓶子裡的大腦」,如果想真正發揮力量,就必須讓它們與真實世界交互、觸達現實。 但不幸的是,這正是問題開始的地方。

比如你讓一個 AI 去做一些事務性的任務,它在重複性任務上確實很擅長。 比如像 DEEP Research 這樣的產品,它只是聚合信息然後給出一個結果,它的輸出只是簡單地出現在那裡。

舉個例子,現在幾乎所有東西都是為人類設計的,不只是物理世界,甚至數字世界也是這樣。 比如網頁工具,它們就像小遊戲一樣,沒有提供 APi 或標準接口。 驗證碼 CAPTCHA 無處不在,處處在攔截 Agent。

所以我認為 AI 在封閉的自包含任務中表現很好,但一旦涉及真實世界,就會遇到障礙。

未來什麼時候能出現 iPhone 時刻? 我覺得這並不是技術問題,而是更像是一種制度性限制。 這不是像我們這樣的 Agent 創業公司能夠單獨解決的事情。

我認為這需要一個漸進的轉變,要求整個生態系統共同進化。 這也需要像 Stripe 這樣的公司在基礎設施層面發力。 比如我們正在集成新的 stripe 的 Agentic 支付 api。 大家共同努力。

答: 是的,我們雖然來自當前這一代 Agent,但已經看到很多很棒的用例。

比如說,我們剛剛搬到新加坡,需要雇傭房產中介來幫我們找住所。 是真人 Agent(笑)。

而現在這些中介已經在使用 Manus:他們會根據客戶的需求,用 Manus 來分析公司所在地、員工想住的區域,並生成相應的推薦。

我覺得這很有意思,因為這屬於一種「長尾需求」。 一般來說,並沒有專門的 AI 產品是為這種具體場景設計的,但由於 Manus 是一個通用型 Agent,它就能滿足這些需求。 我們認為長尾需求非常值得關注。

從宏觀角度看,它可能是長尾,但對具體用戶而言,這正是他們的日常工作。 這種場景特別有價值。

這就像今天的搜索引擎格局一樣。 如果你只是搜索一些常見的內容,不管用 Google 還是 Bing,結果質量差不多。 那為什麼人們會選擇其中一個? 可能是因為某個搜索引擎在特定時刻給了他們更合適的結果。 而如果你搜索的是非常個性化或專業化的內容,就更能體現差異。 所以我們認為通用型 Agent 的優勢就在這裡。

那如何讓它更好呢? 我們思考了很久,因為我們認為一切都繞不開編程。 如果你把計算機交給 AI,那麼它與環境交互的方式其實就是通過編程。

我們認為可以從兩方面改進。 第一是規模化。 但如果你能把 Agent 的能力放大一百倍會怎樣呢?

最近 Manus 剛剛發布了一個新功能,叫做 Wide ReseARch。 它的基本思路是允許一個 Agent 再衍生出上百個 Agent 一起去完成任務。 你知道的, 如果只是讓 AI 幫你做一些小事,很多時候你自己也能完成。 但如果任務非常龐大,你一個人根本不可能完成,比如需要做大規模的研究,這時候讓上百個 Agent 並行去做,就會變得非常強大。

其次,我們還需要讓 Agent 更靈活地使用計算機使。 比如,如果你只給一個 AI Agent 設置了預設工具,那麼它的行動空間就被限制在這些工具裡。 但想像一下,如果你是一個程序員,你有整個開源社區的資源可以調用。

比如你在 3D 打印的時候,直接修改模型的參數很困難,但是你如果能找到 GitHub 上的合適的庫,直接安裝就能解決你的問題了。 在 Manus,我們在優化通用性,並且提出了一個概念,叫做「工具的網絡效應」。

有一個很有意思的例子:很多用戶在用 Manus 做數據可視化。 你們知道,在亞洲有時候會遇到問題,比如在圖表中顯示中文時可能會出現字體錯誤。 或許有些專業用戶會寫一些硬編碼規則,比如在輸出韓文時應該用哪種字體。 但這種方式會讓系統越來越僵化。

我們採取的辦法是給系統增加了一個很簡單的能力:查看圖像。 結果很驚喜——因為今天的模型已經很聰明了,它們會在生成可視化圖像後自己檢查,並意識到錯誤,然後再自動修正。 我們發現, 增加工具的靈活性比硬編碼規則能解決更多的問題。

答: 很多人已經在用 Manus 做研究,不僅限於醫學研究。 我們覺得這很有意思,因為現在確實有很多所謂的「深度研究」產品,它們會幫你收集大量信息並做一些分析,但最後只給你一個 markdoWn 文件或文檔。 這遠遠不夠。

很多時候,研究人員真正需要的,是能夠直接交付給老闆或團隊的成果。 所以我們在 Manus 上加強了研究結果的輸出。 例如在醫學研究中,很多時候需要生成正式的報告,比如幻燈片報告之類的東西。 因此我們必須優化 AI 的輸出能力,以滿足研究人員的需求。 這是一種「工具化」的體驗。

比如現在很多用戶會先用 Manus 做研究,然後直接生成一個網站。 你會覺得這和傳統的網站搭建方式完全不同。

要知道,搭建一個網站本身其實不難,難的是如何確保數據的可靠性和準確性。 所以我們認為,最好能在一次會話、一個共享的上下文中完成整個流程。 這樣,你的研究、你的見解就能無縫轉化為最終成果。 這就是我們在 Manus 裡所做的事情。

答: 我們的朋友和投資人也經常問我們這個問題。 當我們推出 Manus 時,最初認為如果能構建這樣一個 Agent,它就能幫人們節省很多時間,讓大家輕鬆賺錢。

但實際上,我們發現這個願景並沒有完全實現。 通過大量用戶調研,我們發現用戶在使用之後,他們反而工作得更多了。 因為他們變得更高效了,他們實際上能做更多他們本來就很擅長的事情。 這是第一點。

其次,我們認為 Manus 還打開了一個全新的空間。 我們一直在討論虛擬機和雲計算。 我們覺得 Manus 正在扮演一種「個人云計算平台」的角色。 比如雲計算已經存在幾十年了,但它更多是工程師的特權,只有我們能通過編程來調用雲的力量。 普通知識工作者無法使用。

但現在有了像 Manus 這樣的 AI Agent,人們可以用自然語言下達指令,讓 AI 去執行。 這等於解鎖了一種全新的生產力。 這就是我們所帶來的。

而最後,關於「替代」,我認為其實很難。 比如房產中介,他們每天都在用 Manus 完成日常工作。 但你知道,AI 永遠無法替代中介面對客戶時的那種溝通方式。 我們是一家 AI 公司,甚至 Manus 的發布視頻都是由 Manus 寫的腳本,但視頻裡出現的還是我,因為這是關於信任的事情。 而信任,是不能完全交給 AI 的。

|Square

下載BTCC APP,您的加密之旅從這啟程

立即行動 掃描 加入我們的 100M+ 用戶行列