從「盲目抓取」到「結構化對話」

目前AI代理與網站互動的方式極為低效——它們需要截取螢幕截圖、解析DOM結構、模擬點擊操作,就像一個看不懂招牌的機器人在商場裡摸索。WebMCP(Web Model Context Protocol)徹底改變了這一局面:網站可以明確告訴AI代理「我能做什麼」以及「怎麼做」,將混亂的抓取替換為精確的函數調用。

WebMCP建立在Anthropic此前推出的Model Context Protocol(MCP)之上,但將其從伺服器端擴展到了瀏覽器環境。這一標準於2月10日作為W3C草案社區組報告發布,目前在Chrome 146 Canary中以實驗性功能旗標的形式提供。

WebMCP雙API架構

  • 聲明式API:直接處理現有HTML表單的標準操作,對已有良好表單結構的網站幾乎零改動成本
  • 命令式API:通過navigator.modelContext瀏覽器API處理複雜的JavaScript互動,支持豐富的工具模式定義
  • 效能提升:計算開銷降低約67%
  • 成本節省:大幅減少token消耗(無需截圖和多模態推理)
  • 可靠性:代理不再需要「猜測」頁面結構

人機協作的設計哲學

WebMCP的一個關鍵設計決策是明確圍繞「人在迴圈中」(human-in-the-loop)的協作模式,而非完全自主的代理範式。AI代理可以識別和調用網站提供的工具,但關鍵操作仍需要用戶確認。這種設計既提高了效率,又保持了用戶的控制權。

對於旅遊網站,代理可以使用結構化數據進行搜索、篩選結果並完成預訂;對於客服系統,代理可以通過自動填充技術細節來更快地創建詳細的工單;對於電商平台,用戶可以通過AI代理更高效地瀏覽和購物。

MCP生態的瀏覽器延伸

WebMCP的推出是MCP生態系統擴張的最新里程碑。自Anthropic在2024年底推出MCP以來,這一協議已獲得OpenAI、Microsoft和Google的支持。MCP此前已加入Linux基金會,成為AI代理連接外部工具的事實標準。WebMCP則將這一標準帶入了最重要的互動場景——瀏覽器。

Google和Microsoft作為全球兩大瀏覽器廠商(Chrome和Edge合計佔據超過80%的桌面市場份額)的聯合推動,幾乎保證了WebMCP將成為主流標準。雖然其他瀏覽器尚未宣布實施時間線,但Microsoft的積極參與暗示Edge的支持將緊隨其後。

對SEO和Web開發的深遠影響

SEO專家Dan Petrovic稱WebMCP為「自結構化數據以來技術SEO最大的變革」。當AI代理成為越來越多用戶與網站互動的媒介時,網站是否支持WebMCP將直接影響其在AI驅動搜索中的可見度和功能性。這對於Web開發者和SEO從業者而言,是一個需要立即關注的技術趨勢。

業界預計正式的瀏覽器公告將在2026年中後期發布,Google Cloud Next和Google I/O是最可能的發布場合。對於企業和開發者而言,現在開始了解WebMCP並規劃整合策略,將在AI代理時代佔得先機。