百家乐平台 (中国)有限公司官网

Manus的狂熱和爭議之后:這是智能體的勝利嗎?
2025-03-12 18:31

Manus的狂熱和爭議之后:這是智能體的勝利嗎?

本文來自微信公眾號:APPSO (ID:appsolution),作者:appso,原文標題:《Manus 的狂熱和爭議之后,我和 AI 開發者們聊了聊 :這是智能體的勝利嗎?》,題圖來自:AI生成

文章摘要
Manus展示了通用型智能體的潛力與爭議。

? ?? Manus被視為工程上的勝利,展示了通用型智能體的潛力。

? ?? Agent最重要的是“大腦”,需要動態規劃和工具調用。

? ?? Manus推動了agent生態的發展,引發開發者的廣泛討論與探索。

自從發布以來,Manus經過了一個堪比過山車的傳播歷程。


從一開始的驚艷,到被加速捧至高點,再到遭受套殼、營銷的批評,一切都發生在短短一周內。



在各種各樣的聲音當中,我們找到了和Manus最為相關的一群人:正在參與agent以及配套設施的開發者們,聊了聊他們眼中的Manus——不討論營銷和爭議,僅僅是技術層面。


結論并不復雜:Manus無疑是一款優秀的產品。以“套殼”為理由來否定Manus,是它的無妄之災。


同時,“縫合”一詞,也并不公允。一個通用型agent的能力和潛力,不僅體現在鏈接了多少工具,更在于對于agent本身的認知。


那些圍繞營銷和套殼展開的爭議,指向的是一個問題:Manus的價值到底是什么?


橫空出世的“全球首個”


快忘了上周盛況的朋友們,這里有一個快速回顧:3月5號深夜,Manus上線內測,在官方展示的視頻中,放出了好幾個原本只在PPT中才會出現的精彩使用案例,無一不展現出Manus獨特的任務理解和執行能力。


老實說Agent(智能體)并不新鮮,但Manus打出“全球首個通用型智能體”的說法,掀起了前所未有的討論浪潮,也讓“通用型agent”走到臺前。



由于內測使用需要申請邀請碼,且發放速度慢,一時間造成了哄搶的局面——用例有多驚艷,用不上的人就有多焦慮。


這種邀請碼的機制,陰差陽錯地把Manus推到一個近乎詭異的熱度,甚至被稱為“又一個DeepSeek時刻”。


DeepSeek是模型,Manus是智能體,是截然不同的兩種產品。然而某種程度上,二者的歷程,確實有相似之處。


DeepSeek做的是模型,但它并非是從零開始,而是在一系列已有的開源工作上,實現了工程上的勝利。



類似地,Manus實際上并非第一個做通用型agent產品,在2023年同類產品就涌現過一輪。Manus本身也從大量開源工作中獲得幫助,團隊此前曾經打造過monica,一款集成式AI助手,積累了豐富的agent工程經驗。因此,Manus也同樣被視為一種工程上的勝利。


工程上的勝利究竟是指什么?


這個問題必須回到“通用型agent”是什么這個根本源頭上。


人跟動物之間的區別在于制造和使用工具,這句話,放在agent身上也成立——普通agent和通用型agent的區別在于,后者能夠主動調用工具


“很多人覺得agent就是原來的對話機器人,接上數據庫,就叫做agent。實際上,一直以來agent的定義都是需要能使用工具,能真正的有所行動。”William Lee解釋道,他從去年開始和創業團隊一起開發針對agent的中臺系統ACI.DEV,就是在為agent類產品提供盡可能便捷的API調用服務。


在具體的產品使用上,工具調用能夠把agent的能力邊界,再推得遠一些。活躍在agent開發社區的堅白,見識過Manus在執行上的能力:剪視頻。


“剪的效果怎么樣另說,但是它可以去做到,可以完成,不會拒絕你。”


原理并不復雜:剪輯的動作,可以在一定程度上以代碼的方式來實現。又或者,一些在線工具可以被調用出來,完成剪輯的動作。


這樣完成的剪輯當然是粗放的,成品跟人工剪輯無法相提并論,但就像堅白所說,Manus不會拒絕這個要求,而是會主動尋找工具完成。“在過去的應用里,agent可能會推薦給你一個剪視頻的網站或者工具,但沒有這樣端到端的結果。”


他認為這反映了Manus團隊的認知,是在一種更有高度的位置上。“我認為他們把代碼,包括整個代碼的運行環境,更多作為工具,而不是目標。”



曾經一些類似的項目,給出一段代碼或者設置虛擬機,就已經是最終目的。而Manus的理解是,設計虛擬機跑代碼,只是實現方式,它們是為了完成某種目的而存在


“我覺得是他們在認知上有領先”,堅白說,“大家都在說要把agent當成人看,但他們真的是認真思考了agent如何作為一個主體。”


Agent最重要的是“大腦”


那么,虛擬機是那個讓Manus脫穎而出的設計嗎?


“虛擬機不是一個creative的設計,”同樣是在做通用型agent產品的鄭淺解釋。


鄭淺所在的公司Convergence.ai,在1月時推出了同樣屬于通用型agent的產品Proxy,并且在webvoyage基準測試中險勝OpenAI。



不久前Proxy登上Product Hunt榜單,鄭淺忙著帶領工程團隊應對突然涌來的流量。他們面對的是海外市場,可見通用型agent,在海內外都是被寄予厚望的agent形態。


“OpenAI Operator就是虛擬機,Manus是給browser use之后,加了一個coding execution,然后放到一個虛擬機里面去實現。”


Browser use,是一個在Github上獲得了4萬星的開源項目,它相當于把網頁瀏覽器放在了agent“眼”前,結合了大語言模型以及視覺識別。用戶只需要通過自然語言,就能讓智能體對網頁上的元素進行實際操作。



早期Proxy也嘗試過類似browser use的路線。“通過這種方式幫用戶做點擊、拖動等等的動作。整體是比較簡單直接的,只需要用戶給一個任務,它一步一步去執行。”


這個形態比較線性,無法勝任更復雜的任務。或者說,當任務的復雜程度上升,需要用戶給出更有細節的指令,反而成了對用戶的挑戰。


“我們公司算開始得比較早,跟OpenAI和H Company他們也比較多交流,后來OpenAI Operator出來,agent一下就變火了。大家很快就往一個新的東西上面去靠攏,就是agent orchestrator。”鄭淺非常明確,“可以說general agent真正的區別,不在于縫合了多少工具。


建設一個普通的agent,可以用“縫合”簡單粗暴地概括。但是要建設一個general agent,必須是一個系統工程。


“你可以把agent想象成一個人,最復雜的部分在于核心決策系統——就是大腦和神經傳輸。其次復雜的是執行構建,比如說相當于人類的四肢與末端。至于你剛才提到的生成報告、瀏覽器交互、代碼執行等功能模塊,本質上屬于工具鏈層面的能力。”


人并不是生下來就會走路的,嬰兒只會胡亂揮舞手腳,然后會爬、會站,磕磕絆絆地學會走路,最后學會精準地控制自己的四肢。


整個學習的過程,也是大腦逐漸成熟的過程。Proxy的絕大多數工作都在圍繞這個“大腦”展開,具體而言,是planner agent所負責的動態規劃。


“有一個調侃是,規劃不能預測未來:規劃可以做的很好,但你不知道未來會發生什么。放在agent上面也是一樣的,比如說它瀏覽某個網站,碰到無法打開的情況,比如改版啊或者域名過期,或者直接關停等等,那這時候agent該怎么做,這就需要動態規劃。”


Manus實測中,碰到網站登錄及驗證問題


一個典型場景是驗證碼,Proxy和Manus可以解決一些簡單的驗證碼,但太復雜的還是需要交回給用戶,也可能被直接跳過。


鄭淺解釋難度藏在細節里,“都是細節,而且情況非常多樣。如何在規劃上去實現復雜任務,同時又能回傳——用戶基數一大,做什么千奇百怪的事情都有,如何覆蓋各種各樣的場景是很大的難點。


現階段Manus并非盡善盡美,但它足以作為一個工程啟示錄。“它主要的成功之處,確實就是在工程上面”Wiilliam非常認同這一點,“它結合了市場上已有的模型,很好的跟工具做了對接,然后讓用戶第一次看到,真正可以調用工具的agent到底能做出什么樣的效果。這樣子我覺得百分之百是工程上的勝利。”


真正的勝利屬于生態


Manus正像是那個正在學走路的幼兒,它能夠造成巨大的討論,并不在于它已經能走多遠、跳多高,而在于展示出了足夠的潛力。


這或許才是它最大的貢獻:Manus的走紅,讓一系列與general agent類的應用,乃至基礎建設的工作,都漸漸浮出水面


最新的進展是OpenAI推出了Responses API,這是一個面向開發者,而且就是agent開發者的新發布。



在開發者社群里,Manus激發了更多想法。堅白正在做和agent記憶相關的項目,Manus的出現讓他開始重新思考記憶儲存相關的范式。


記憶儲存對于agent的實際工作至關重要,這不僅影響著agent能否從過往任務里學習到經驗并沿用,也影響著能否形成關于用戶使用習慣的記憶,真正做到個性化。


另外,通用型agent在理論上有著最大的自由度,可以鏈接和調用任何工具——在延遲、接口標準化等方面足夠好的前提下。這正是ACI這類中臺型產品,所想要提供的服務。



這可能是Manus最成功的一點:它作為現階段通用型agent最出圈的案例,為一系列配套設施打開了想象和探索的空間


“其實通過Manus可以看到,現在模型已經跑在工程的前面很多了。”William認為工程方面還有很多可以探索的空間,“我們還可以在工程上面繼續做點什么,來拉高這種AI agent產品的效能。我個人的看法是現在agent infrastructure這一端的話都還是挺不成熟的,包括像我們這種工具調用平臺,或者是說這種memory layer,這些在工程方面都還有很多方向是可以優化的。”


這也是我們跟開發者社群接觸下來最大的感受:他們感到興奮與躍躍欲試。“通用”兩個字所包含的可能性,前所未有的生動。


Proxy馬上要基于新的parallel agent思路,推出迭代的版本。鄭淺一直在觀察社群的反饋,他看到許多用戶把Proxy用出了自己根本沒過的方式,不斷被挖掘出新的可能。


“大多數產品最后的使用目的,都不太會是一開始開發的目的,可能后面是由用戶來發現我們沒有發現的用途,我們也在等待那一個moment的到來。”


本文來自微信公眾號:APPSO (ID:appsolution),作者:appso

本內容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯系hezuo@huxiu.com
如對本稿件有異議或投訴,請聯系tougao@huxiu.com
正在改變與想要改變世界的人,都在 虎嗅APP
贊賞
關閉贊賞 開啟贊賞

支持一下 ??修改

確定
玩百家乐怎么能赢呢| 大发888扑克下载| 五峰| 大发888 娱乐免费游戏| 网上百家乐有人赢过吗| 免费百家乐官网缩水软件| 百家乐官网怎么样投注| 申博娱乐城官网| 百家乐新送彩金| 百家乐是真的吗| 正品百家乐官网游戏| 易胜博百家乐官网下载| 易发百家乐| 百家乐发牌靴8| 赌王百家乐官网的玩法技巧和规则 | 百家乐讲坛汉献| 狮威百家乐官网赌场娱乐网规则| 大厂| 澳门百家乐官网出千| 真钱斗地主| 永利高足球投注网| 易胜国际| 大发888娱乐场17| 马牌百家乐的玩法技巧和规则| 澳门百家乐文章| 棋牌百家乐怎么玩| 环球百家乐官网娱乐城| 澳门百家乐官网小游戏| 网络百家乐投注| 百家乐官网是娱乐场| 百家乐官网如何捕捉长龙| 百家乐官网投注网中国体育 | 百家乐官网网络娱乐场开户注册| 于田县| 大发888下注| 成都百家乐的玩法技巧和规则| 百家乐平台在线| 真人百家乐澳门娱乐城| 百家乐单跳投注法| 百家乐官网博彩网址| 百家乐官网双人操作分析仪|