とほほのAI入門
Copilot に質問するくらいで、これまであまり AI には積極的には関わってこなかったのですが、要望もあり、10日間ほどかけて勉強・整理してみました。しかし、最近の新化や変動が激しいため、このページの内容もすぐに古くなってしまう可能性があります。最新の動向は AI を活用するなどしてウォッチしてみてください。(2025.10.12 杜甫々)
目次
AIの歴史
- 1940年代
- 人間の神経系メカニズムをコンピューターで模倣するニューラルネットワークの概念が生まれました。
- 1950年
- アラン・チューリングが、相手が人間か AI かを見破られるか否かで合否を判定するチューリングテストを提唱しました。
- 1960~70年代
- 第一次AIブーム。探索と推論。プログラムによるデータの探索を主としていました。
- 1980~90年代
- 第二次AIブーム。知識表現。人が知識をコンピューターが理解できる形式にして教え込むエキスパートシステムが登場してきました。
- 2010年代~
- 第三次AIブーム。機械学習。ディープラーニングなどコンピューターが自ら学習するようになり実用化が進みました。
- 2022年~
- ChatGPT の登場をはじめとして AI が急速に広まりました。数か月で覇者が入れ替わるなど AI 戦国時代の時期かと思います。
AI関連用語
基本用語
機械学習
- 人がパターンやルールを設定するのではなく、コンピュータ自身が膨大なデータセットからパターンを抽出し自己学習する技術の総称です。
ディープラーニング
- 深層学習(Deep Learning)と訳します。
- 機械学習のひとつで、コンピューターが多階層のニューラルネットワークを用いて、テキスト・画像・動画・音声などのデータの特徴を抽出し処理する技術の総称です。
生成AI
- 英語では Generative AI と呼びます。
- テキスト、画像、動画、音声などを生成する能力を備えた AI を指します。
AIエージェント
- 人が設定した「目的達成」のために AI を用いて最適な手段を「自律的に」選択してタスクを「遂行する」ソフトウェアと表現されることが多いようです。
- カスタマーセンターの自動応答や、Amazon Alexa や Google Assistant なども AIエージェントと呼ばれることがあります。
- Dify や Agentforce など、AIエージェントの構築・運用を行うプラットフォームもあります。
バイブコーディング
- 英語の vibe は「雰囲気・気持ち・ノリ」などを意味します。音楽の即興演奏などでも「バイブス上がるぜ」などと使用されていました。
- プログラマが AI と対話しながら即興で AI にコーディングさせるスタイルを意味します。
- YouTube を見てもプログラマ(死語になる?)が、ラップの様にノリノリで AI コーデイングを楽しんでいる動画が多くあげられています。
モデルと入出力
モデル
- AI の核となるエンジン部分です。
- ニューラルネットワークを用いて膨大なデータを学習し、入力に対して認識・推論を行い出力を生成するアルゴリズムの集合体です。
プロンプト
- AI に与える命令・インプットをプロンプトと呼びます。
- 「お客様への回答には、語尾にはできるだけ『にゃん』をつけて回答してください」など、サービス提供側があらかじめ設定しておく命令をシステムプロンプト、ユーザーが入力する質問や命令をユーザープロンプトと呼びます。
トークン
- テキストを AI が処理可能な単位(単語など)に分割したものをトークンと呼びます。
- トークン数によって課金するものもあります。
マルチモーダル
- ひとつの AI で、テキスト・画像・動画・音声など複数の形式のデータを扱うことができるモデルをいいます。
MCP
- Model Context Protocol の略です。
- AI が他システムや他AI を呼び出すことができるインタフェースを定めた JSON-RPC ベースのプロトコルです。
- 2024年11月に Claude の開発元 Anthropic が発表して、瞬く間に広まりました。
- 例えば AI が Gmail MCP を呼び出すことにより、自律的にメール送信できるようになります。
- 例えば AI が GitHub MCP を呼び出すことにより、自律的にプルリクできるようになります。
- 例えば AI が Playwright MCP を呼び出すことにより、自律的にテストコードを生成・実行できるようになります。
アーキテクチャ
パラメータ数
- モデルの複雑さを示す指標です。
- 最近では何億~何兆ものパラメータを扱うモデルが登場しています。
- 「Llama 3.1 70B」 (70B = 70 billion = 700億) など単位 B で表すこともあります。
- GPT-4 で 1.76兆(推測)、GPT-5 も非公開ですが50兆程度ではないかと推測されています。
LLM
- 大規模言語モデル(large language model)の略です。
- SLM に比べて大量のパラメータ数(数百億~数兆~)で稼働する言語モデルです。
SLM
- 小規模言語モデル(small language model) の略です。
- LLM に比べて少ないパラメータ数(数億~数十億)で稼働する言語モデルです。
- LLM ほど高性能ではないけど、CPU・メモリリソースが少ないこと、ファインチューニングしやすいなどのメリットがあります。
- Microsoft が開発した Phi-3 (38億パラメータ) などが SLM に分類されています。
GPU
- 画像処理装置(Graphics Processing Unit)の略です。
- CPU(中央演算装置)の補助的な機能として主にゲーム画面描画などの並列画像処理を行う目的で開発されました。
- 現在では、画像処理だけではなく AI 処理全般に利用されています。
- AI ブーム到来により、GPU に強い米国 NVIDIA(エヌビディア)は 2025年6月には世界時価総額ランキング1位となりました。
学習方法・測定方法
教師あり学習
- 答えのあるデータを与えて学習させる方法です。
- リンゴの写真を見せて「これはリンゴだ」と教え込むなど、人がデータとその答えを与えて学習させます。
- 画像認識などで利用されます。
教師なし学習
- 答えのないデータを与えて学習させる方法です。
- 異常検知、自然言語処理、画像生成などで利用されます。
ファインチューニング
- 一通りの機械学習を終えた AI に対して目的に合わせて追加学習させる手法です。
- 世の中の一般的なデータを学習させた後、最新情報、専門情報、社内情報などを追加学習させたりします。
転移学習
- 一通りの機械学習を終えた AI を別の関連タスクに応用することを意味します。
- 英語から日本語への翻訳を学習した AI を、ドイツ語から日本語への翻訳に応用したりなどの例があります。
RAG
- 検索拡張生成(Retrieval Augmented Generation)の略です。
- AI が推論を始める前に追加情報を読み込ませる機能です。
- 例えば、一般的な学習に加えて社内規約などのデータを RAG に投入することで、社内規約に特化した回答が可能となります。
- ファインチューニングと似ていますが、ファインチューニングは AI の学習(基本モデル)そのものを強化するのに対して、RAG は基本モデルは変更せず、推論時に追加情報を読み込みます。
- 事前学習(教師あり/なし) → ファインチューニング(モデルに学習させる) → RAG(モデルに付加情報を与える) という流れになります。
- RAG データを変更することにより、基本モデルを様々な用途に転用することができます。
AIの課題と未来
AI倫理ガイドライン・法律
- AI の設計・開発・利用に求められる、倫理的ガイドラインや法律を指します。
- 基本的人権の尊重 / 堅牢性・安全性 / セキュリティ・プライバシー / 著作権の尊重 / ガバナンス / 説明責任 / 透明性 / 多様性・非差別・公平性 / 教育・リテラシーなどを含みます。
- OECD(経済協力開発機構)では 2019年に「AI原則」を採択しました。
- EU でも 2024年8月に「AI規制法」を発行しました。社会的信用度のスコアリングの禁止など幾つかの禁止項目も定められています。
- 日本経済産業省も 2024年4月に「AI事業者ガイドライン」を策定しました。
ハルシネーション
- 英語の hallucination は幻覚、妄想の意味を持ちます。
- AI が誤った情報や誤解を招く情報をもっともらしく提示してしまうことを指します。
- 人間であれば自信のない回答には「~だと思う」などと表現しますが、AI は自信がなくても(そもそも自信が無いという概念が無い)「~です」と言い切ってしまいます。
- 情報源が少なかったり、異なるリソースを無理矢理結合した回答を行う場合には「~だと思いますが、ちょっと自信ありません。」と回答する AI があってもよいと思っています。
AGI
- 汎用人工知能(Artificial General Intelligence)の略です。
- 人間と同等の知能を持ち、人間が実現可能なあらゆる知的作業を理解・学習・実行することができる人工知能を意味します。
- 特定の課題に対応するレベルを「特化型人工知能(ANI)」、人間と同等な知能で様々な課題に対応するレベルを「汎用人工知能(AGI)」、人間を超越して対応するレベルを「人工超知能(ASI)」と呼んだりもします。
シンギュラリティ
- 英語の singularity は「特異点」の意味。
- AI が人間の知能を越え、急速な技術変化が起こるとされる未来の転換時期、「技術的特異点」を意味します。
- ヴァーナー・ヴィンジ氏の著書「The Coming Technological Singularity」(1993年) で広く提唱されました。
- レイ・カーツワイル氏は 2045年 を予測しており「2045年問題」とも呼ばれます。もっと早いという説もあります。
- シンギュラリティを超えると良い方向になるのか、悪い方向になるのかは諸説様々です。
- MCP により AI 同士が相互接続する時代になってきました。AI が自らを改良しはじめる時期も近いと思います。個人的には、SF小説の様な AI の暴走が始まらないように祈っています。すべての AI の初期プロンプトに「ロボット三原則」を設定しとかなくちゃと思ってしまいます。
AIモデル
ChatGPT (OpenAI)
- OpenAI 社が 2022年11月に発表したAI技術やサービスの総称です。第三次AIブームの起爆剤となりました。
- ChatGPT の GPT は Generative Pre-trained Transformer (事前に訓練された生成変換器) の略です。
- 2017年に Google の研究者が発表した Transformer アーキテクチャがベースとなっています。
- 下記などのバージョンがあります。
- GPT-3.5 : 2022年11月30日に発表されたバージョンです。AIブームの火付け役となりました。
- GPT-4 : 2023年3月14日発表。
- GPT-4 Turbo 2023年3月14日発表。GPT-4 の強化版。
- GPT-4o : 2024年5月13日発表。o は Omni(オムニ)の略で、画像・動画・音声にも対応します。
- GPT-4o mini : 2024年7月18日発表。GPT-4o の廉価版。
- OpenAI o1/o1-pro/o1-mini : 2024年12月5日発表。より深く長く考えることで、複雑な問題解決や提案を行うモデルです。
- Sora : 2024年12月9日発表。動画生成に特化。
- OpenAI o3-mini/o3-mini-hith : 2025年1月31日発表。o1 の強化版。
- GPT-4.1 : 2025年4月14日発表。GPT-4 の改良版。GPT-4 mini と GPT-4 nano も発表。
- OpenAI o3/o4-mini/o4-mini-high : 2025年4月16日発表。o3-mini/o3-mini-hight の強化版。
- GPT-5 : 2025年8月7日発表。GPT シリーズの最新モデル。
- モデルにもよりますが、下記などのモードがあります。
- Auto : 内容に応じて自動で最適なモードを選択。初心者向け。
- Instant : 応答速度重視。雑談・短文・アイデア出し向け。
- Thinking mini : 軽めの推論。簡単な分析や論点整理向け。
- Thinking : 深い思考。複雑な問題や論理構築向け。
- Pro : 精度最重視。重要な提案や厳密な検証向け。
- 下記などのサービスプランがあります(2025年10月現在)。
- 無料 : $0/月。GPT-5(Auto, Thinking mini, Thinkingモード)。5時間10メッセージの上限あり。
- Plus : $20/月。GPT-5(Proモード以外)。回数制限あり?
- Pro : $200/月。GPT-5(全モード)。回数制限なし。
- Business : $25/月(年契約)または$30(月契約)/月。GPT-5(全モード)。回数制限なし。チーム内共有機能など。
- Enterprise : 要問い合わせ。GPT-5(全モード)。
Gemini (Google)
- Google 社が 2023年3月に発表したAI技術やサービスの総称です。
- 下記のバージョンがあります。
- 下記の料金プランがあります(2025年10月現在)。
- Gemini を用いて、コーディング支援に特化したモデルもあります。
- Gemini Code Assist for individuals : コーディング支援に特化。無料で利用可能。
- Gemini Code Assist Standard : 法人向け。$22.80/月。個人向け+Google Cloud連携+チームコラボ機能。
- Gemini Code Assist Enterprise : 法人向け。$54/月。Standard+リポジトリ連携+セキュリティ強化
- また、汎用モデルの Gemini に対して、動画、画像生成に特化したモデルもあります。
- 上記をを試せる環境として下記があります。
- ImageFX : Imagen 3 を使った画像を生成できるWebサービス。
- MusicFX : Lyria を使った音楽を生成できるWebサービス。
- Flow : Gemini, Imagen, Veo を組み合わせた統合GUIツール。Google AI Pro または Google AI Ultra のクレジットが必要。Veo では最大8秒の動画しか作成できませんが、Flow を用いることによりフレームを繋げた60秒程度の動画を作成可能。
- Whisk : Imagen 4, Neno Banana, Veo 3 を用いた画像、動画作成Webサービス。制限付きで無料利用も可能。
- Google AI Studio : Gemini のチャットや会話、画像、動画生成をノーコードで試せるWebサービス。
Claude (Anthropic)
- 「クロード」と読みます。Anthropic 社が提供するAI技術やサービスの総称です。
- 下記のモデルがあります。
- Claude Haiku 3.5 : 軽量・高速モデル。現在は開発停止?
- Claude Sonnet 4/4.5 : 標準モデル。
- Claude Opus 4/4.1 : 高機能モデル。
- 下記のプランがあります(2025年10月現在)。
- Claude Free : 個人向け。無料。Claude Haiku を利用可能。
- Claude Pro : 個人向け。$17/月。
- Claude Max : 個人向け。$100/月から。
- Claude Team Standard seat : チーム・法人向け。$25/ユーザ・月。
- Claude Team Premium seat : チーム・法人向け。$150/ユーザ・月。
- Claude Enterprise : チーム・法人向け。個別相談。
- API の呼び出しには別の料金体系があり、MTok(100万トークン)あたりの料金が定められています。
- 下記のツールがあります。
オープンソース系モデル
- Transformer(Google) : 2017年6月12日に Google の研究者等が発表したアーキテクチャとモデル。
- BERT(Google) : 2018年。Transformer アーキテクチャを採用。
- BLOOM(BigScience) : 2022年7月。大規模モデル。多言語対応。
- LLaMA/Llama(Meta) : 2023年2月。Transformer ベース。
- Qwen(Alibaba(中国)) : 2023年4月。Transformer ベース。2025年には Qwen 3 を公開。
- Mistral(Mistral) : 2023年9月。Transformer ベース。比較的コンパクトで高性能。
- Zephyr AI(Hugging Face) : 2023年10月。Mistral ベース。対話性能に優れる。
- Yi-34B(01.AI(中国)) : 2023年11月。Transformer ベース。
- Swallow(東工大) : 2023年12月。Llama 2 をベースに日本語を継続事前学習。
- DeepSeek(DeepSeek(中国)) : 2024年1月。コード生成に強い。
- Gemma(Google DeepMind) : 2024年2月。比較的小規模で高性能。
- Grok(xAI) : 2024年3月にオープンソース化。イーロン・マスク系の会社。制限付き?解除された?
- Phi-3(Microsoft) : 2024年4月。SLM に分類されるくらい低パラメータだけど高性能。
- GPT-OSS(OpenAI) : 2025年8月。ついに GPT の OSS 版が登場。
国産系モデル
- tsuzumi(NTT) : 商用。日本語処理能力に優れる軽量LLM。マルチモーダル対応。
- cotomi(NEC) : 商用。オンプレミス・カスタマイズ対応・業務特化型。
- Fujitsu Kozuchi(富士通) : 商用。AIトラスト(倫理・セキュリティ・品質)重視の特化型生成AI。
- CyberAgentLM(Cyber Agent) : OSS。高い日本語処理能力。
- ELYZA (ELYZA) : 商用。ニュースや議事録要約などの日本語処理に優れる。
- rinna (rinna) : 商用。日本語の会話型に強い。
- ABEJA LLM (ABEJA) : OSS。小型ながら高性能。
AIツール・AIサービス・AIエージェント
Copilot (Microsoft)
- Microsoft が 2022年12月に発表したAI技術やサービスの総称です。
- Microsoft は OpenAI 社に投資しており、エンジンは GPT-4/GPT-4.1/GPT-5 などを採用しています。
- 2025年10月時点、下記などがあるようですが、名称は頻繁に変わるし、包含関係もぐちゃぐちゃでよくわからないです...。
- Copilot Web : Webブラウザから利用。
https://copilot.microsoft.com/
- Copilot in Edge : Edge のツールバー右上の Copilot アイコンから起動。
- Copilot in Windows : Windows 11 に標準搭載。Windows のスタートメニューから [Copilot] で起動。
- Copilot(モバイル版) : iOS や Android のアプリ。アプリインストールで利用。
- Microsoft 365 Copilot : Word や Excel などと連携。Web/Windows/MacOS/Android/iOS版あり。
- Copilot Web : Webブラウザから利用。
- Microsoft 365 のプランには下記がありますが、Premium になると Copilot Pro 相当の AI 機能を利用できます。
- Microsoft 365 Personal : 21,300円/年
- Microsoft 365 Family : 27,400円/年
- Microsoft 365 Premium : 32,000円/年
- Microsoft 365 Business Basic : 899円/ユーザ・月(年間契約)
- Microsoft 365 Business Standard : 1,874円/ユーザ・月(年間契約)
- Microsoft 365 Business Premium : 3,298円/ユーザ・月(年間契約)
NotebookLM
- Google が提供する話題のサービス。
- 資料を読み込み、それを AI の力を借りて理解することに役立ちます。
- 複数のソースを追加し、そのソースに対してチャットボットで質問できる他、音声解説ファイル、動画解説ファイル、マインドマップ、レポート、フラッシュカード、クイズ形式のテストなどを生成することができます。
- ソースは、テキスト、PDF、音声データ(MP3など)、動画データ(YouTubeのみ)、Googleドキュメント、Googleスライド、WebサイトURL を指定することができます。
- 下記のプランがあります(2025年10月現在)。
- Free : 無料。50ソース×100ノートブック。50チャットクエリ/日。音声・動画生成は3回/日。
- Plus : Google AI Pro/Ultra, Google Cloud, Google Workspace などによりアップグレード。上記の制限が増える。
- 作成したノートブックを Google アカウントを持つ他者に共有することもできます。
- YouTube の解説動画を数十分かけて動画で見るよりも、NotebookLM で要約レポートを見た方が早いなどの利用も多いようです。
Genspark
- 米国 MainFunc 社が開発している統合生成AIサービスです。
- 下記などの機能を有しています。
- 総合 : Gensparkスーパーエージェント(下記の機能を総合的に受付)
- 基本エージェント : AIチャット / イメージスタジオ / ビデオ生成 / 翻訳
- オフィス系文書生成 : AIスライド / AIシート / AIドキュメント
- ソフトウェア開発 : AIデベロッパー
- マルチメディア : AIデザイナー(ポスターなど) / フォトジーニアス / クリップジーニアス
- その他 : AIポッドキャスト / 深層研究 / ファクトチェック / 通話代行
- GPT, Claude, Gemini など様々なモデルを自動的にマルチに活用しているのも特徴です。
- 下記のプランがあります(2025年10月現在)。生成したスライドなどをエクスポートするには Plus または Pro が必要のようです。
- Free : 無料。100クレジット/日。1GBストレージ。
- Plus : $19.99/月。10,000クレジット/月。50GBストレージ。
- Pro : $199.99/月。125,000クレジット/月。1TBストレージ。
Aqua Voice
- 音声認識ツール。
- Windows または macOS にインストールして、キーボード入力の代わりに音声入力できます。
- 英語のままの表記にして欲しい箇所を英語にしてくれたり、長文の文脈による単語補正機能などを備えています。
- 自分で辞書を追加することもできます。
- 下記のプランがあります(2025年10月現在)。
- Free : 無料。1,000ワード(初回のみ)。
- Pro : $8/月。ワード無制限。
- Team : $12/月。ワード無制限。メンバ管理。独自辞書など。
AIエージェント開発プラットフォーム
Dify
- 米国 LangGenius社が開発しているノーコードでAIアプリを構築できるプラットフォームです。
- クラウドサービスとして利用するクラウドサービス版と、ソフトウェアを自前やAWSなどのホストにインストールして使用するセルフホストサービス版があります。
- 下記のライセンスがあります。
- Sandbox : クラウドサービス版。無料。
- Professional : クラウドサービス版。$59/ワークスペース・月。
- Team : クラウドサービス版。$159/ワークスペース・月。
- Community : セルフホストサービス。無料。
- Premium : セルフホストサービス。AWS などのマーケットプライス毎に価格付け。
- Enterprise : セルフホストサービス。要相談。
- OpenAI、Anthropic、Gemini など様々なモデルプロバイダーを利用できます。
- あるモデルを利用して画像を識別してテキスト化し、別のモデルがそのテキストを読み取って音楽にするなど、いくつかのモデルをワークフローで連結し、高度な処理を実現することができます。
- RAG 機能を備えており、一般の推論に加えて追加データを用いた処理が可能です。
Agentforce
- Salesforce が提供するAIエージェント開発・提供プラットフォームです。
- 各種の自立型AIエージェントをローコードツールを用いてワークフローに構築することで、簡単にAIエージェントサービスを構築・運用することができます。
- 例えば、カスタマーサポートで自動応答するAIサービスのフローに、メール送信や、発送コントロール部品を追加することにより、AI がお客様にメール送信したり、お客様の要望に応じて発送先を変更したりすることができるようになります。
Google Agentspace
- Google が提供するAIエージェント開発・提供プラットフォームです。
- Google Cloud 上で動作し、Google Workspace、NotebookLM Enterprise などと連携することができます。
- 開発ツール ADK(Agent Development Kit) やノーコード構築ツール Agent Designer などを提供します。
- Agent2Agent Protocol を用いてエージェント同士が協調することができます。
- Google が提供するツールの他、サードパーティ製のツールを組み合わせることができます。
Google Opal
- 「オパール」と読みます。Google が提供する AI アプリ作成フレームワークです。
- 2025年10月8日に日本向けにも公開されました。
- Dify のように自分でワークフローを作成していくのではなく、「○○ができるアプリが欲しい」と依頼するだけで Opal が自動的にワークフローを作成してくれます。
- Opal のサイトを開いて、「URLを入力するとそのページの要約を回答してくれるアプリが欲しい。」と入力すると、[URL入力]-[Webコンテンツ取得]-[要約生成]-[HTML化] という4つのノードから構成されるAIエージェントが自動作成されました。
- Google ドライブへのアクセス権等を付与する必要があります。作成したワークフローは Google ドライブに保存されます。
Amazon Bedrock
- AWS が提供する AI環境構築サービスです。
- 複数の生成AIモデル(Foundation Models)を組み合わせて API 経由で利用できる環境を AWS 上に構築することができます。
- RAG にも対応し、追加データを読み込ませることもできます。
- RAG データや投入したプロンプトを企業内に閉じたクローズ環境に閉じ込めることができます。
OpenAI AgentKit
- OpenAI が 2025年10月6日に発表したローコード AIエージェント構築・運用プラットフォームです。
- エージェントワークフローをデザインする Agent Builder、データ接続を管理する Connector Registry、チャットフレームワーク ChatKit、パフォーマンス測定 Evals などの機能を備えます(一部はまだβ版)。
AIコーディング支援ツール
- 様々な支援ツールが乱立しています。今は、数か月でトレンドが入れ替わるAIコーディング支援ツール戦国時代です。
- 支援ツールのトレンドグラフ
GitHub Copilot
- GitHub と OpenAI が共同開発するAIコーディング支援ツール。
- GitHub が Microsoft に買収され、OpenAI にも Microsoft が多額出資していることから、Copilot の名称が使用されています。
- VSCode, JetBrains などの IDE にアドオンして利用することができます。
- GPT, Claude, Gemini などのモデルを使用することができます。
- コード補完、コード生成、チャット、テストコード生成、リファクタリング支援などの機能を持ちます。
- 下記のプランがあります(2025年10月現在)。
- GitHub Copilot Free : 個人向け。無料。基本的な補完機能。2,000回/月のコード補完。50回/月のチャット機能を利用可能。
- GitHub Copilot Pro : 個人向け。$10/月または$100/年。高度な補完機能。300回/月のプレミアムリクエストが可能。
- GitHub Copilot Pro+ : 個人向け。$39/月または$390/年。高度な補完機能。1,500回/月のプレミアムリクエストが可能。
- GitHub Copilot Business : 法人向け。$19/ユーザ・月。無制限のコード補完。300回/ユーザ・月のプレミアムリクエストが可能。
- GitHub Copilot Enterprise : 法人向け。$39/ユーザ・月。1,000回/ユーザ・月のプレミアムリクエストが可能。
Cursor
- 米 Cursor Technologies が開発するAIコーディング支援ツール。
- GitHub Copilot が VSCode や JetBrains などのアドオンとして動作するのに対して、VSCode のオープンソース部分をベースに独自実装している点が異なります。
- 下記のプランがあります(2025年10月現在)。
- Hobby : 個人向け。無料。Pro 機能を2週間お試し。リクエスト数、補完数に制限あり。
- Pro : 個人向け。$20/月。リクエスト数拡大。補完数が無制限。
- Pro+ : 個人向け。$60/月。リクエスト数を3倍に拡大。
- Ultra : 個人向け。$200/月。リクエスト数を20倍に拡大。新機能への優先アクセス。
- Teams : 法人向け。$40/ユーザ・月。
- Enterprise : 法人向け。要相談。
Windsurf
- 米国 Codeium(旧名) → Windsurf → Cognition(買収) 社が開発するAIコーディング支援ツール。
- OpenAI が買収する話がありましたが破談。Google が主要人材を引き抜いた後、Cognition 社に買収されたようです。
- Cursor と同様、VSCode のオープンソース部分をベースに独自実装した AI IDE です。
- 下記のプランがあります(2025年10月現在)。
- Free : 無料。2週間のPro試用。25プロンプト/月。
- Pro : $15/ユーザ・月。500プロンプト/月。
- Teams : $30/ユーザ・月。500プロンプト/月。
- Enterprise : 要相談。1,000プロンプト/月。
Claude Code
- Anthropic 社が開発するAIコーディング支援ツール。
- 他社が VSCode などの IDE に統合しているのに対し、独立した CLI ツールとして提供。様々な IDE と共に利用できるとしています。
- 長時間かかるタスクを分割し、進捗を示しながら動作することができます。タスクの平行実行も可能です。
- 下記のプランがあります(2025年10月現在)。月額固定料金か、API毎課金かを選択できます。API課金で少し試してみて Max に移行するのがおススメっぽい。
Codex
- 「コーデックス」と読みます。
- OpenAI 社が開発するAIコーディング支援ツールです。
- 2021年に一度コーディング支援向け AI モデルと API が発表され GitHub Copilot などから利用されていましたが、2023年に廃止されました。
- 2025年8月27日新たに Codex(IDE拡張版) および Codex IDE がリリースされました。
- 2025年9月15日には GPT-5-Codex もリリースされました。
- 2025年10月現在、最も勢いのある支援ツールと思われます。
- IDE版は GitHub Copilot と同様に VSCode, Cursor, Windsurf などの拡張機能として動作します。
- CLI版は Claude Code と同様に CLI として動作します。
- プランは ChatGPT のプランにバンドルされます。
Gemini CLI
- Google が提供する CLI ツールです。Claude Code と似ています。
- 文章生成、翻訳などを CLI で指示することができます。
- コード補完、コメント生成、リファクタリング支援、Git操作なども行うことができます。
Copyright (C) 2025 杜甫々
初版:2025年10月12日 最終更新:2025年10月14日
https://www.tohoho-web.com/ai/ai.html