タグ

2025年3月28日のブックマーク (1件)

  • Microsoft 製の ブラウザ操作 MCP が実用レベルだった件

    はじめに 従来のブラウザ操作MCPの主な課題は、大量のコンテキスト消費でした。AI エージェントがブラウザを操作する際、ブラウザのスクリーンショットを base64 エンコードしてコンテキストに渡していたためです。このため、一度の操作でも膨大なトークン数を消費してしまい、処理効率が大幅に低下していました。 このため、数回の操作を必要とする程度の簡単な操作さえ、エージェント上で完了することはできませんでした。 つまり、従来のブラウザ操作系MCPは実用レベルに達していませんでした。 結論 以下の動画を見てください。 自然言語による指示によって、ローカル環境でログイン処理を行う様子 データの追加と結果の確認を行う様子 Microsoft 製の ブラウザ操作 MCP = Playwright MCP は実用レベルに達していました! おわり。 おまけ コンテキスト長問題の解決 Playwright

    Microsoft 製の ブラウザ操作 MCP が実用レベルだった件