ChatGPTエージェントに対抗!ブラウザ操作MCPを自作してClaudeDesktopからブラウザを操作してみました!
※ブラウザ画面とClaudeDesktop画面が重なっていて見づらい部分があり、申し訳ないです。
先ほどのはテスト的にブラウザの起動、入力、閉じるの3つの機能でしたが、下記8つに増やして再度操作してみました。
1. browser_launch – ブラウザを起動
2. browser_close – ブラウザを終了
3. navigate_to – URLへ移動
4. click_element – 要素をクリック
5. type_text – テキストを入力
6. take_screenshot – スクショ撮影
7. get_page_content – ページ内容取得
8. wait_for_element – 要素を待機
自作MCPのコーディングをしたのはClaudeDesktopのfilesystemMCPに全部やってもらっていますので私は一切、コーディングをしていません。
ChatGPTエージェントに対抗!ブラウザ操作MCPを自作してみたら想像以上に大変だった件
https://note.com/yaoyoroztech/n/n20dcdc83af06?sub_rt=share_pb
YaroTech note 生成AI関連の投稿しています!
https://note.com/yaoyoroztech
#claude #mcpserver #coding #python #windows #生成ai



コメント