とほほのAI入門 (AIブラウザ)
目次
- AIブラウザとは
- Brave AI (Brave Software)
- Arc (The Browser Company)
- Fellou (Fellou)
- Gemini in Chrome (Google)
- Genspark AIブラウザ (MainFunc)
- Dia (The Browser Company)
- Comet (Perplexity)
- Copilot Mode in Edge (Microsoft)
- Opera Neon (Opera)
- ChatGPT Atlas (OpenAI)
AIブラウザとは
AI 機能が埋め込まれたブラウザの総称で、下記などの機能を持ちます。
- ページ要約・翻訳:開いているページの内容を要約・翻訳します。
- チャット:開いているページの内容についてチャットで質問できます。
- 複数サイト検索:「○○市内で今日泊まれる安いホテルを探して」と依頼すると、複数のサイトを検索して結果を表示してくれます。
- 動画要約:YouTube などの動画ページを開いて要約を依頼すると、動画の内容を探索して要約を表示してくれます。YouTube 動画に対して、タイムテーブルを表示してくれるものもあります。最終的な予約や購入の前には実行してよいか確認してくれます。
- タスク実行:「ホテルを予約してください」「Amazon で○○の商品を購入してください」などの指示を行うだけで AI がブラウザ画面を操作してタスクを実行してくれます。
- ドキュメント生成:要約した内容をベースにスライドを作成したりなどドキュメントを生成する機能を持ちます。
- 音声操作:マイクを使用して音声による操作ができます。音声指示+音声応答によって会話の様に作業を進められるものもあります。
- 外部連携:Gmail や Googleカレンダーなど外部のサービスとの連携機能を持つものがあります。「今日の予定は?」と聞くと Google カレンダーをみて今日の予定を教えてくれたり、「未読のメールは?」と聞いたり、「Google からのセキュリティ通知メールは削除して」などの指示ができます。開いている Google ワークシートに対して AI 処理を実行してくれるものもあります。
- タブ横断:開いている複数のタブを対象として要約や比較を依頼することができます。Amazon の商品をいつくか複数のタブで開いておき、「比較して」と依頼することができます。
- 履歴活用:過去に閲覧したページを AI が覚えておき、過去の閲覧ページに関する問い合わせを行うことができます。
- 広告ブロック:画面中の広告をブロックします。
ただし下記の注意が必要です。
- 情報漏洩:閲覧しているページの情報やプロンプト情報が AI 機能を通じて AI 学習などの目的で吸い上げられるリスクがあります。
- プロンプトインジェクション:閲覧しているページの中に埋め込まれた悪意を持った指示がプロンプトとして AI に機能してしまい、AI に情報漏洩などを指示するものです。PDF や画像ファイルの中に悪意のあるプロンプトが埋め込まれていた事例も報告されています。
競争が激しすぎて目まぐるしいリリースが相次いでいます。個人的には Comet の YouTube 要約ボタンが気に入っています。下記に、発表日・リリース日順に主だったものを列挙してみます。
Brave (Brave Software)
- Brave Software 社が 2019年11月13日にリリースしたブラウザです。
- JavaScript の開発者として知られるブレンダン・アイク氏が設立した会社です。
- 2023年11月2日には、Leo と呼ばれる AI 機能も搭載されました。
- 基本的に無料ですが AI 機能を優先的に使用できる Leo プレミアムという有償プランがあります。
- Chromium ベースで Chrome 拡張機能を利用可能です。
- ユーザー情報を収集しない、VPN機能、Torによる接続元隠蔽機能、ネイティブ仮想通貨ウォレット機能、サードパーティ Cookie ブロックなどプライバシー保護を強みとしています。
- 広告ブロッキング機能を備えていますが、Brave 独自の広告を表示するモードがあり、表示した広告料に応じて BAT というポイントを得ることができます。
- 最大4人までのビデオ通話機能を備えています。
- トップページにカスタマイズ可能なニュースを表示する機能があります。
- 好きな動画や楽曲をプレイリストとして作成・演奏することができます。
- 404 エラーで閲覧できないページは、Wayback Machine サービスで過去のページを閲覧することができます。
- ただし、広告ブロックや勝手なプレイリスト機能などにより、YouTube から Brave ブラウザ排除などの戦いもあるようです。
Arc (The Browser Company)
- The Browser Company 社(現在は Atlassian が買収)が2023年7月25日にリリースしたブラウザです。
- Chromium をベースとしており、無料で利用可能です。
- 2024年2月に Max と呼ばれる AI 機能が搭載されました。
- 機能がサイドバーに集約されており、ブラウザの縦幅を最大限に活用できるなど細かな UI の改善が人気でした。
- 開いているページに対して AI で質問したり、リンク先の概要をポップアップ表示したり、ChatGPT 問い合わせ機能などを備えています。
- インスタントリンク機能では、AIがユーザーの検索クエリを検索することで、検索エンジンを経由することなく、複数のリンクを瞬時に開くことができます。
- ライブフォルダ機能では、特定のイベントに基づくページをブラウザが自動で収集してタブとして生成してくれます。
- 現在は Arc の積極的な開発は停止し、後継ブラウザ Dia に移行しています。
Fellou (Fellou)
- 2025年5月11日にリリースされたブラウザです。
- ブラウザが勝手に「ホテルを予約する」「商品を購入する」などのタスクを実行する世界初の Agentic Browser として注目を集めました。
- 無償版、Plus($19.9/月)、Pro($39.9/月)、Ultra($199.9/月) のプランがあるようです。
Gemini in Chrome (Google)
- Google が 2025年5月20日の「Google I/O 2025」に発表した AI ブラウザです。
- 米国を皮切りに順次リリースされています。現時点(2025年10月26日)時点では日本への展開はまだのようです。
- Google AI Pro または Google AI Ultra いずれかのプランへの参加が必要とのこと。
- Chrome に Gemini 機能をドッキングさせて、
- ページ要約・翻訳、チャット、複数サイト検索、動画要約、外部連携、タブ横断、履歴活用などの機能を備えるようです。
Genspark AIブラウザ (MainFunc)
- GenSpark を運営する MainFunc 社が 2025年6月11日に発表した AI ブラウザです。
- 当初は macOS のみのサポートでしたが、現在は Windows 版もサポートされています。
- 「スーパーエージェント」と呼ばれる AI 機能を用いて下記などの機能を提供します。
- Find Best Deal:表示している商品に関して、他の小売業者から最安値のものを探します。
- Help Me Choose:指定したカテゴリーの中から人気ブランドを比較表形式で提案します。
- YouTube 対応:YouTube 動画のサマリをテキスト化します。
- Autopilot:ブラウザが自律的にタスクを実行します。
- Genspark AI Docs:要約した内容をテンプレートにしたがってドキュメント化してくれます。
- 横断検索:ChatGPT, Claude, Gemini などのデータを自動取得して整理します。
- 広告ブロック:広告表示をブロックします。
Dia (The Browser Company)
- 2025年6月12日にThe Browser Compary (現在は Atlassian が買収) がβ版をリリースしました。
- 同社が開発していた Arc の後継となるブラウザですが Arc の全機能が踏襲されている訳ではありません。
- 現時点(2025年10月26日)では macOS 版のみがリリースされています。
- 無料公開されていますが、将来有料になる可能性はあるようです。
- Arc が多少独創的で学習コストが高かった反省からシンプルで直感的なインタフェースに改善されています。
- ページ要約・翻訳、チャット、複数サイト検索、動画要約、タブ横断などの機能を備えています。
- パーソナライズ機能としてカスタムプロンプトを スキル として登録しておき呼び出すことができます。
- 文章作成支援やコーディング・デバッグ支援機能も備えます。
- Arc ブラウザで人気のあったスプリットビューにも対応しています。
Comet (Perplexity)
- Perplexity 社が 2025年7月9日に発表した AI ブラウザです。
- 当初は限定公開でしたが、一般ユーザーも無料でダウンロードできるようになりました。
- Perplexity Pro や Max ユーザーは Comet Plus を利用でき、CNN やワシントンポストなどの有料コンテンツも検索できるようになります。
- Chromium ベースで Chrome の拡張機能を使用することもできます。
- Google アカウント、Apple アカウント、またはメールアドレス登録アカウントで利用します。
- ページ要約・翻訳、チャット、複数サイト検索、動画要約、タスク実行、音声操作、外部連携、タブ横断、広告ブロックなどの機能を有します。
- 音声操作は指示だけではなく回答も音声で会話の様に進めることができます。
- 要約は [要約] ボタンがあり、一発で要約を見ることができます。
- ウィジェット機能を持ち、天気予報や株価情報などのウィジェットを表示することができます。
- Google スプレッドシートを開いた状態でアシスタント機能からシートの修正を依頼することもできます。
Copilot Mode in Edge (Microsoft)
- Microsoft 社が 2025年7月28日に発表した Edge の強化機能です。
- 同社のブラウザ Edge に Copilot 機能を組み合わせたものです。
- Edge のツールバー右側の [Copilot] アイコンをクリックすると右ペインに Copilot 画面が開きます。
- ページ要約・翻訳、チャット、複数サイト検索、動画要約、音声操作、タブ横断などの機能を有します。
- 音声モードでは、Copilot Vision 機能で画面を AI に共有しながら操作方法などの音声会話質問を行うことができます。
Opera Neon (Opera)
- Opera 社が2025年5月に発表し、2025年9月30日にリリースした AI ブラウザです。
- 2017年にも Neon の名称で発表がありましたが、その時点の内容とは異なっているようです。
- 現在はまだ開発を継続中で事前登録ユーザーに順次限定リリースされているようです。
- タスク実行機能などを備えます。
- 「ゲームを開発したい」などのクリエイティブを支援する機能を備えているそうです(詳細不明)。
ChatGPT Atlas (OpenAI)
- OpenAI 社が 2025年10月22日に発表した AI ブラウザです。
- 現時点(2025年10月26日)では macOS 版のみ利用可能です。
- ページ要約・翻訳、チャット、複数サイト検索、動画要約、タスク実行、音声操作、外部連携、タブ横断、履歴活用などの機能を持ちます。
- 画面操作の操作状況は Web 画面で表示され、いつでも中断や割り込みが可能です。購入ボタンを押す前には確認してくれます。
- プライバシーを考慮し、どの程度の情報をメモリに残すのかを制御することができます。
Copyright (C) 2025 杜甫々
https://www.tohoho-web.com/ai/ai-browsers.html