雷峰網強化學習之於 AI Agent,是靈魂、還是包袱?
17min2 w ago
詳細信息
自主決策能力是 Agent 受到重視,並被稱為 AI 時代“新基建”原因。從這個角度看,Workflow 似乎做不出真正的通用 Agent。
而要談真正具備決策能力和自我意識的 Agent,其實要從 AlphaGo 的問世說起。這是 AI 首次展示出非模板化、非規則驅動的智能行為。而 AlphaGo 也靠著深度神經網絡與 RL,進行自我對弈與自我優化,最終擊敗人類頂級棋手,敲響了 Agent 時代的第一聲鑼。
從某種程度上說,Devin 可以算是通用 Agent 的濫觴。它首次把 AI 的編碼能力、任務執行與反饋機制整合成一個完整的閉環,為后續產品提供了清晰的範例。
后來,Manus 延...