# 様々なLLMモデルの使用

- 著者: [eunhhyy](https://github.com/eunhhyy)
- ピアレビュー: [Wooseok Jeong](https://github.com/jeong-wooseok)
- 校正: [Chaeyoon Kim](https://github.com/chaeyoonyunakim)
- これは [LangChain Open Tutorial](https://github.com/LangChain-OpenTutorial/LangChain-OpenTutorial) の一部です

[![Open in Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/LangChain-OpenTutorial/LangChain-OpenTutorial/blob/main/04-Model/01-Models.ipynb)[![Open in GitHub](https://img.shields.io/badge/Open%20in%20GitHub-181717?style=flat-square&logo=github&logoColor=white)](https://github.com/LangChain-OpenTutorial/LangChain-OpenTutorial/blob/main/04-Model/01-Models.ipynb)
## 概要

このチュートリアルは、AI市場における主要な```大規模言語モデル(LLM)```の包括的なガイドを提供します。

### 目次

- [概要](#概要)
- [OpenAI GPTシリーズ](#openai-gptシリーズ)
- [Meta Llamaシリーズ](#meta-llamaシリーズ)
- [Anthropic Claudeシリーズ](#anthropic-claudeシリーズ)
- [Google Geminiシリーズ](#google-geminiシリーズ)
- [Mistral AIモデルシリーズ](#mistral-aiモデルシリーズ)
- [Alibaba Qwenシリーズ](#alibaba-qwenシリーズ)


### 参考文献
- [OpenAIのモデル概要](https://platform.openai.com/docs/models#models-overview)
- [Metaのモデル概要](https://www.llama.com/)
- [Anthropicのモデル概要](https://docs.anthropic.com/en/docs/intro-to-claude)
- [Googleのモデル概要](https://ai.google.dev/gemini-api/docs/models/gemini)
- [Mistralのモデル概要](https://mistral.ai/technology/#models)
- [Alibaba Cloudのモデル概要](https://mistral.ai/technology/#models)

----

## OpenAI - GPTシリーズ

OpenAIのGPTモデルは、テキスト生成、要約、翻訳、Q&Aなどのタスク向けに設計された高度なトランスフォーマーベースの言語モデルです。主にクラウドベースのAPIとして提供され、開発者はモデルをホスティングせずに使用できます。オープンソースではありませんが、GPTは微調整機能を備えた事前学習済みモデルを提供します。

### モデルバリアント

1. **GPT-4oシリーズ（フラッグシップモデル）**
   - **GPT-4o**: Turboより高速化された高信頼性モデル
   - **GPT-4-turbo**: ビジョン、JSON、関数呼び出し機能を備えた最新モデル
   - **GPT-4o-mini**: GPT-3.5 Turboの性能を上回るエントリーレベルモデル

2. **O1シリーズ（推論スペシャリスト）**
   - **O1**: 複雑な問題解決のための高度な推論モデル
   - **O1-mini**: 特化したタスク向けの高速でコスト効果的なモデル

3. **GPT-4oマルチメディアシリーズ（ベータ版）**
   - **GPT-4o-realtime**: リアルタイム音声およびテキスト処理モデル
   - **GPT-4o-audio-preview**: 音声入出力に特化したモデル

### GPT-4o概要

**コア機能**
- 信頼性が向上した最先端のGPT-4モデル
- GPT-4-turboバリアントと比較して高速処理
- 広範な128,000トークンのコンテキストウィンドウ
- 16,384トークンの最大出力容量

**パフォーマンス**
- 応答の信頼性と一貫性が優れている
- 多様なタスクにわたる推論能力の強化
- リアルタイムアプリケーション向けに最適化された速度
- リソース利用のバランスの取れた効率性

**使用例**
- 複雑な分析と問題解決
- 長文コンテンツの生成
- 詳細な技術文書
- 高度なコード生成とレビュー

**技術仕様**
- 最新のGPTアーキテクチャの最適化
- 応答精度の向上
- 組み込みの安全対策
- コンテキスト保持の強化

詳細については、[OpenAIの公式ドキュメント](https://platform.openai.com/docs/models#models-overview)を参照してください。

## Meta - Llamaシリーズ

MetaのLlama AIシリーズは、微調整、蒸留、柔軟なデプロイメントを可能にするオープンソースモデルを提供します。

### モデルバリアント

1. **Llama 3.1（多言語）**
   - **8B**: モバイルおよびエッジデバイス向けの軽量で超高速モデル
   - **405B**: 多様なユースケース向けのフラッグシップ基盤モデル

2. **Llama 3.2（軽量およびマルチモーダル）**
   - **1Bおよび3B**: デバイス上処理向けの効率的なモデル
   - **11Bおよび90B**: 高解像度画像推論を備えたマルチモーダルモデル

3. **Llama 3.3（多言語）**
   - **70B**: パフォーマンスが向上した多言語サポート

### Llama 3.3概要

**安全機能**
- 安全な応答のためのアライメント技術を組み込み

**パフォーマンス**
- より少ないリソースで大規模モデルに匹敵

**効率性**
- 一般的なGPU向けに最適化され、ハードウェア要件を削減

**言語サポート**
- 英語とスペイン語を含む8言語をサポート

**トレーニング**
- 15兆トークンで事前学習
- 教師付き微調整(SFT)とRLHFを通じて微調整

   > **教師付き微調整(SFT)**: 教師付き微調整は、ラベル付きデータで既存のAIモデルのパフォーマンスを向上させるプロセスです。例えば、モデルにテキスト要約を教えたい場合、「元のテキスト」と「要約されたテキスト」のペアをトレーニングデータとして提供します。この正解ペアでのトレーニングを通じて、モデルは特定のタスクでパフォーマンスを向上させることができます。
   >
   > **人間のフィードバックからの強化学習(RLHF)**: RLHFは、AIモデルが人間のフィードバックを通じてより良い応答を生成することを学ぶ方法です。AIが応答を生成すると、人間がそれらを評価し、モデルはこれらの評価に基づいて改善します。学生が教師のフィードバックを通じてスキルを向上させるように、AIは人間のフィードバックを通じてより倫理的で有用な応答を提供するように発展します。

詳細については、[Metaの公式ドキュメント](https://www.llama.com/)を参照してください。

## Anthropic - Claudeシリーズ

AnthropicのClaudeモデルは、多様なNLPタスク向けのクラウドベースAPIを備えた高度な言語モデルです。これらのモデルは、パフォーマンス、安全性、リアルタイム応答性のバランスを取ります。

### モデルバリアント

1. **Claude 3シリーズ（フラッグシップモデル）**
   - **Claude 3 Haiku**: ほぼ瞬時の応答性
   - **Claude 3 Sonnet**: 知能と速度のバランス
   - **Claude 3 Opus**: 複雑なタスクに強力なパフォーマンス

2. **Claude 3.5シリーズ（強化モデル）**
   - **Claude 3.5 Haiku**: 強化されたリアルタイム応答
   - **Claude 3.5 Sonnet**: 高度な研究と分析機能

### Claude 3 Opus概要

**コア機能**
- 数学やコーディングなどの非常に複雑なタスクを処理
- 詳細な文書処理のための広範なコンテキストウィンドウ

**パフォーマンス**
- 優れた信頼性と一貫性
- リアルタイムアプリケーション向けに最適化

**使用例**
- 長文コンテンツの生成
- 詳細な技術文書
- 高度なコード生成とレビュー

詳細については、[Anthropicの公式ドキュメント](https://docs.anthropic.com/en/docs/intro-to-claude)を参照してください。

## Google - Gemini

GoogleのGeminiモデルは、効率性とスケーラビリティを優先し、幅広い高度なアプリケーション向けに設計されています。

### モデルバリアント

1. **Gemini 1.5 Flash**: 100万トークンのコンテキストウィンドウを提供
2. **Gemini 1.5 Pro**: 200万トークンのコンテキストウィンドウを提供
3. **Gemini 2.0 Flash（実験版）**: 速度とパフォーマンスが強化された次世代モデル

### Gemini 2.0 Flash概要

**コア機能**
- リアルタイムビジョンおよびオーディオストリーミングアプリケーション用のマルチモーダルライブAPIをサポート
- 空間理解の強化とネイティブ画像生成機能
- 統合されたツール使用と改善されたエージェント機能

**パフォーマンス**
- 以前のモデルと比較して高速化され、パフォーマンスが向上

**使用例**
- リアルタイムストリーミングアプリケーション
- 複雑な問題解決のための推論タスク
- 画像とテキストの生成

詳細については、[GoogleのGeminiドキュメント](https://ai.google.dev/gemini-api/docs/models/gemini)を参照してください。

## Mistral AIモデル概要

Mistral AIは、多様なNLPタスク向けの商用およびオープンソースモデルを提供し、特殊なソリューションも含まれます。

### モデルバリアント

**商用モデル**
- Mistral Large 24.11: 128kコンテキストウィンドウを備えた多言語モデル
- Codestral: 80以上の言語をサポートするコーディングスペシャリスト
- Ministralシリーズ: 低レイテンシアプリケーション向けの軽量モデル

**オープンソースモデル**
- Mathstral: 数学に焦点を当てたモデル
- Codestral Mamba: コーディングタスク用の256kコンテキスト

詳細については、[Mistralの公式ドキュメント](https://mistral.ai/technology/#models)を参照してください。

## Alibaba - Qwen

AlibabaのQwenモデルは、多様な業界とタスク向けに最適化されたオープンソースおよび商用バリアントを提供します。

### モデルバリアント

1. **Qwen 2.5**: 高度な多言語モデル
2. **Qwen-VL**: テキストと画像のマルチモーダル機能
3. **Qwen-Audio**: オーディオ文字起こしと分析に特化
4. **Qwen-Coder**: コーディングタスク向けに最適化
5. **Qwen-Math**: 高度な数学問題解決用に設計

### 主な機能

- 様々なベンチマークで優れたパフォーマンス
- Alibaba Cloudのプラットフォームで簡単にデプロイ
- ライティング、画像生成、オーディオ分析などの生成AIアプリケーション

詳細については、[Alibaba CloudのQwen公式ページ](https://mistral.ai/technology/#models)をご覧ください。