とほほのAI入門 (AIモデル)
目次
- ChatGPT (OpenAI)
- Gemini (Google)
- Claude (Anthropic)
- Grok (xAI)
- DeepSeek (DeepSeek)
- その他モデル
- オープンソース系モデル
- 国産系モデル
ChatGPT (OpenAI)
- OpenAI 社が 2022年11月に発表したAI技術やサービスの総称です。
- 同社のチャットサービス ChatGPT は「チャッピー」とも呼ばれ、2025年の流行語大賞にもノミネートされるなど、第三次AIブームの起爆剤となりました。
- ChatGPT の GPT は Generative Pre-trained Transformer (事前に訓練された生成変換器) の略です。
- 2017年に Google の研究者が発表した Transformer アーキテクチャがベースとなっています。
- 課金体系は、チャットケーサービスを利用する月額固定課金と、API を使用する従量課金があります。
- OpenAI が提供するモデルやサービスの詳細は「とほほのOpenAI入門」を参照してください。
Gemini (Google)
- Google 社が 2023年3月に発表したAI技術やサービスの総称です。
- 下記のバージョンがあります。
- Gemini Nano : モバイル向け最軽量モデル。Pixel などに搭載。
- Gemini 2.5 Flash : 軽量モデル。テキスト・コード生成など。制限付きで無料で利用可能。
- Gemini 2.5 Flash-lite : 最軽量モデル。制限付きで無料で利用可能。
- Gemini 2.5 Flash Image : 画像生成モデル。別名: Nano Banana。500回/日まで無料で利用可能。
- Gemini 2.5 Pro : 高性能モデル。Pro 以上のプランで利用可能。
- Gemini 2.5 Ultra : 最高性能モデル。Ultra プランで利用可能。
- Gemma : オープンソースとして公開されている軽量版。
- Gemini 3:2025年11月18日リリース。様々な ベンチマーク で GPT-5.1 や Sonnet 4.5 を上回る。
- 下記の料金プランがあります(2026年1月現在)。
- Gemini を用いて、コーディング支援に特化したモデルもあります。
- Gemini Code Assist for individuals : コーディング支援に特化。無料で利用可能。
- Gemini Code Assist Standard : 法人向け。$22.80/月。個人向け+Google Cloud連携+チームコラボ機能。
- Gemini Code Assist Enterprise : 法人向け。$54/月。Standard+リポジトリ連携+セキュリティ強化
- また、汎用モデルの Gemini に対して、動画、画像生成に特化したモデルもあります。
- 上記をを試せる環境として下記があります。
- ImageFX : Imagen 3 を使った画像を生成できるWebサービス。
- MusicFX : Lyria を使った音楽を生成できるWebサービス。
- Flow : Gemini, Imagen, Veo を組み合わせた統合GUIツール。Google AI Pro または Google AI Ultra のクレジットが必要。Veo では最大8秒の動画しか作成できませんが、Flow を用いることによりフレームを繋げた60秒程度の動画を作成可能。
- Whisk : Imagen 4, Neno Banana, Veo 3 を用いた画像、動画作成Webサービス。制限付きで無料利用も可能。
- Google AI Studio : Gemini のチャットや会話、画像、動画生成をノーコードで試せるWebサービス。
Claude (Anthropic)
- 「クロード」と読みます。Anthropic 社が提供するAI技術やサービスの総称です。
- 下記のモデルがあります。
- Claude Haiku 3.5 : 軽量・高速モデル。現在は開発停止?
- Claude Sonnet 4/4.5 : 標準モデル。
- Claude Opus 4/4.1 : 高機能モデル。
- 下記のプランがあります(2025年10月現在)。
- Claude Free : 個人向け。無料。Claude Haiku を利用可能。
- Claude Pro : 個人向け。$17/月。
- Claude Max : 個人向け。$100/月から。
- Claude Team Standard seat : チーム・法人向け。$25/ユーザ・月。
- Claude Team Premium seat : チーム・法人向け。$150/ユーザ・月。
- Claude Enterprise : チーム・法人向け。個別相談。
- API の呼び出しには別の料金体系があり、MTok(100万トークン)あたりの料金が定められています。
- 下記のツールがあります。
Grok (xAI)
- イーロン・マスク氏が設立した xAI 社が提供する AI サービスです。
- ロバート・A・ハインラインの「異星の客」という SF 小説に出てくる「深く理解する」という意味の grok が由来です。
- X(旧Twitter)の投稿を取り込むことにより、世論や話題の即時性が優れています。
- 音声・画像・動画生成などマルチモーダルに対応しています。
- 2025年8月にマスク氏の意向により性的コンテンツが生成可能なモデルが投入され、批判を浴びたり対応を余儀なくされています。
- 下記のモデルがあります。
- Grok-4 : 2025年7月9日リリース。
- Grok 4.1 : 2025年11月17日リリース。
- 下記のプランがあります(2026年2月現在)
- Free : 無料版。
- SuperGrok : $30.00/月 または $300.00/年。
- SuperGrok Heavy : $300.00/月 または $3,000.00/年。
DeepSeek (DeepSeek)
- 中国の DeepSeek(深度求探) 社が開発するモデルやサービスです。
- オープンソース LLM を中核としており、低コストの割には機能性のあるコストパフォーマンスが特徴です。
- 下記などのモデルがあります。
- DeepSeek-V3 : MeE(Mixture‑of‑Experts) 技術を用いたコスパモデル。
- DeepSeek-R1 : 推論性能に特化。
その他モデル
MiniMax (MiniMax)
- 中国アリババが出資する MiniMax 社が開発したモデルです。
- 一部のモデルはオープンソースとしても公開されています。
- MiniMax-M1:2025年6月16日リリース。OSS公開。
- MiniMax Speech 2.5:2025年8月7日リリース。音声生成に特化。
- MiniMax M2:2025年10月27日リリース。OSS公開。
hailuo (MiniMax)
- 中国アリババが出資する MiniMax 社が開発した動画生成モデルです。
- 現在(2025年11月3日)、Hailuo 2.3 の Free Trial 実施中で無料でも4枚の動画を作成できるようです。
- Hailuo Prototype:2024年3月公開。
- Hailuo 02:2025年6月18日リリース。
- Hwiluo 2.3:2025年10月28日リリース。
オープンソース系モデル
- Transformer(Google) : 2017年6月12日に Google の研究者等が発表したアーキテクチャとモデル。
- BERT(Google) : 2018年。Transformer アーキテクチャを採用。
- BLOOM(BigScience) : 2022年7月。大規模モデル。多言語対応。
- LLaMA/Llama(Meta) : 2023年2月。Transformer ベース。
- Qwen(Alibaba(中国)) : 2023年4月。Transformer ベース。2025年には Qwen 3 を公開。
- Mistral(Mistral) : 2023年9月。Transformer ベース。比較的コンパクトで高性能。
- Zephyr AI(Hugging Face) : 2023年10月。Mistral ベース。対話性能に優れる。
- Yi-34B(01.AI(中国)) : 2023年11月。Transformer ベース。
- Swallow(東工大) : 2023年12月。Llama 2 をベースに日本語を継続事前学習。
- Gemma(Google DeepMind) : 2024年2月。比較的小規模で高性能。
- Phi-3(Microsoft) : 2024年4月。SLM に分類されるくらい低パラメータだけど高性能。
- GPT-OSS(OpenAI) : 2025年8月。ついに GPT の OSS 版が登場。
- GLM(Z.ai) : 中国のZ.ai社がリリース。コーディング力が強い。
国産系モデル
- tsuzumi(NTT) : 商用。日本語処理能力に優れる軽量LLM。マルチモーダル対応。
- cotomi(NEC) : 商用。オンプレミス・カスタマイズ対応・業務特化型。
- Fujitsu Kozuchi(富士通) : 商用。AIトラスト(倫理・セキュリティ・品質)重視の特化型生成AI。
- CyberAgentLM(Cyber Agent) : OSS。高い日本語処理能力。
- ELYZA (ELYZA) : 商用。ニュースや議事録要約などの日本語処理に優れる。
- rinna (rinna) : 商用。日本語の会話型に強い。
- ABEJA LLM (ABEJA) : OSS。小型ながら高性能。
Copyright (C) 2025-2026 杜甫々
https://www.tohoho-web.com/ai/models.html