毎朝、銀行・クレジットカード・証券口座の残高と取引履歴を自動集計して家族にメールで送る——そんな「夢の家計監視システム」が、AIエージェントのルーティン機能によって「プロンプトを書いて保存するだけ」で実現できるかもしれない。海外エンジニアの実験報告がHacker Newsで注目を集めている。

ブラウザ操作型の自動化から始まった試行錯誤

エンジニアのMatt May氏はまず、Chrome DevTools MCPを使ったブラウザ自動化でシステムを構築した。AIが銀行サイトに実際にログインし、残高・取引履歴を抽出してメール送信するという仕組みだ。

当初は驚くほどうまく動いた。しかし問題はすぐに現れた。ブラウザのレンダリング差異による誤動作、予期しない二段階認証(2FA)の割り込み、AIが突然メールフォーマットを変更してしまう現象——さらにパスキー専用ログインにしか対応していない口座が加わり、システムは安定稼働を保てなくなった。妻への「毎朝のメールが届かない」というクレーム対応が日課になったと同氏は振り返る。

この経験からの教訓は明確だ。スクレイピング+LLMによるブラウザ操作は本質的に脆い。サイト側のわずかな変更がシステム全体を止めてしまう。

MCP+Plaid連携で「データ取得の安定化」を実現

そこで同氏が約2カ月・7万5,000行のRustコードをかけて構築したのが「Driggsby」というMCPサーバーだ。Plaidという金融機関APIアグリゲーターを通じて口座データを取得し、残高・取引・投資情報・ローン情報などをMCPツールとして公開することで、AIエージェントが安定的にデータを参照できるようにした。

この基盤を整えた上で、Claude Code Routinesと組み合わせることで本格的な「全自動」が視野に入ってきた。

ルーティン機能が変えた「エージェントループのハードル」

従来、自律的なエージェントを定期実行するには、ループのコードを自分で書き、どこかにデプロイする必要があった。クラウドサーバーの立ち上げ、認証管理、スケジューリング設定——それなりの手間がかかる作業だ。

Claude Code Routinesが変えたのはここだ。プロンプトを書き、スケジュールを設定し、MCPコネクタを接続してセーブする——それだけで定期実行エージェントが動き始める。エージェントループのインフラを自分で管理する必要がない。同氏はDriggsby(財務データ)とGmailコネクタを組み合わせ、15分程度で設定を完了したという。

「メール送信できない」——残る実用上の壁

しかし現実はそう単純ではなかった。Gmailコネクタが実際の送信ができず、下書き保存しかできないという制約が判明。「美しくフォーマットされた情報密度の高いドラフトがメールボックスに座っているだけ」という状態になってしまった。

これはコネクタの成熟度の問題であり、権限設計のトレードオフでもある。「下書きまで」「送信まで」——この境界線をどこに引くかは、セキュリティと利便性の問題だが、自律エージェントにとっては致命的な制約になり得る。

実務への影響

個人・業務を問わず応用できる「定期集計→通知」パターン

今回の事例は個人の家計管理だが、定期的なデータ集計→レポート生成→通知というパターンは、ITの多くのシーンで応用できる。在庫監視、サーバーメトリクスのデイリーレポート、KPIのSlack通知——いずれも同じ構造だ。

ポイントは「データ取得の安定化」と「MCP経由の道具立て」の組み合わせだ。ブラウザスクレイピングではなく公式APIを経由してデータを取得する仕組みを整えることで、エージェントの信頼性は大幅に上がる。

MCPエコシステムの整備がカギ

MCPコネクタのエコシステムが充実するほど、「プロンプトを書けばエージェントが動く」という状況に近づく。IT管理者やエンジニアは、社内ツールやSaaSのMCPサーバー化を積極的に視野に入れる価値がある。今後この需要は急拡大していく。

2FA・パスキー問題は長期的な設計課題

金融機関や企業システムの認証強化(2FA・パスキー必須化)は、AIによる自動化の構造的な障壁だ。業務自動化を設計する際、認証フローをAPIに分離できるか否かが設計の分岐点になる。「APIを叩ける口」があるかどうかが、エージェント活用の成否を左右する。

筆者の見解

今回の事例が示しているのは技術的な面白さだけでなく、自律エージェント設計の本質的な問いかけだ。

ブラウザを操作してデータを取ってくる方法は「今すぐ動く」が「すぐ壊れる」。Plaid経由のAPI連携は初期コストが高いが堅牢だ。エージェントに自律的な仕事をさせたいなら、データ取得レイヤーを先にきちんと整備するという順序が正しい。インフラなき自律エージェントは砂上の楼閣だ。

Gmailコネクタが「送信」ではなく「下書き」止まりになっている点は象徴的だ。これはいわば「副操縦士モデル」——人間の最終確認を前提に設計されている。確認を挟まないと不安だという気持ちはわかる。だが、エージェントが「承認を求めて止まる」設計では、人間の認知負荷を本当の意味で削減することはできない。

真に自律的なエージェントには、目的を伝えたら最後まで自分でやりきる能力と、それを可能にする適切な権限設計の両方が必要だ。コネクタが送信まで担える仕組みに早急に進化すべきだし、プラットフォーム側もその方向で整備を急いでほしい。

「プロンプトを書いて保存するだけで定期エージェントが動く」という体験が、家計管理から業務自動化まで広がっていくのは時間の問題だと感じる。この分野の設計はいま急速に固まりつつある。MCPエコシステムの成熟と権限設計の高度化——この2点を軸に、今後の展開を追いかける価値は十分にある。


出典: この記事は Could a Claude Code routine watch my finances? の内容をもとに、筆者の見解を加えて独自に執筆したものです。