＃　0614　課題

In [None]:
#  ハンズオンラボ：機械学習入門

このノートブックでは、**Irisデータセット**を使用して、シンプルな分類モデルを構築します。  
Pythonとscikit-learnを使って、以下のステップを順を追って実施します。

---

## 目的

- 機械学習ワークフロー（前処理 → 学習 → 評価）を体験する
- scikit-learnの基本的な使い方に慣れる

---

##  実施内容

1. ライブラリのインポート
2. データの読み込みと可視化
3. 学習データとテストデータの分割
4. モデルの構築と学習
5. モデルの評価

---

## 対象者

- Pythonの基本構文を理解している方
- 機械学習の実装を一通り体験してみたい方

---



In [None]:
##  データサイエンスで使われる主要なプログラミング言語

データサイエンスの分野では、さまざまな目的に応じて複数のプログラミング言語が利用されます。

---

### Python
- 機械学習・データ分析の最も人気な言語
- 豊富なライブラリ：NumPy, Pandas, scikit-learn, TensorFlow, PyTorch など
- 初学者にも優しい文法

---

### R
- 統計解析に特化した言語
- ggplot2やdplyrなどの強力なデータ可視化・操作ツールが充実
- 学術研究や政府系レポート作成に多用される



In [None]:
## 📚 データサイエンスでよく使われるPythonライブラリ一覧

データサイエンスのプロジェクトでは、以下のようなライブラリを組み合わせて使用します。

---

###  数値計算・配列処理
- **NumPy**：高速な配列計算と線形代数演算をサポート  
- **SciPy**：数値解析、最適化、統計、信号処理の機能を提供

---

###  データ操作・前処理
- **Pandas**：表形式データ（DataFrame）の操作に特化  

---

###  可視化
- **Matplotlib**：基本的なプロット作成ライブラリ（低レベル）  

---

###  機械学習・モデル構築
- **scikit-learn**：分類、回帰、クラスタリングなどの定番ライブラリ  
- **XGBoost / LightGBM**：高性能な勾配ブースティングモデル  


---

###  ディープラーニング
- **TensorFlow / Keras**：Google発のDLライブラリ。Kerasは高レベルAPI  
- **PyTorch**：Facebook発のDLライブラリ。柔軟で使いやすい

---

### 🗃データベース・データ取得
- **SQLAlchemy / sqlite3**：Pythonからデータベースに接続するためのライブラリ  


---

###  その他よく使うツール
- **Jupyter Notebook**：対話型ノート環境（可視化＋ドキュメント）  





In [None]:
##  データサイエンスで使用される主要ツール一覧

| カテゴリ           | ツール名              | 主な用途                                 | 特徴                                               |
|--------------------|------------------------|------------------------------------------|----------------------------------------------------|
| 開発環境           | Jupyter Notebook       | コード実行・可視化・ドキュメント作成     | データ分析に最適な対話型環境                      |
|                    | Google Colab           | クラウドベースのJupyter環境              | 無料でGPUが使える、共有しやすい                   |
| プログラミング言語 | Python                 | 一般的なデータ処理、機械学習             | 豊富なライブラリとコミュニティ                   |
|                    | R                      | 統計解析・可視化                          | 学術・医療分野に強い                              |
|                    | SQL                    | データベースからのデータ抽出              | データ分析の前処理として必須                     |
| データ可視化       | Tableau                | BIツールによる可視化                     | ノーコードで美しいダッシュボードが作成可能       |
|                    | Power BI               | Microsoft製の可視化ツール                | Excel連携に強い                                   |
|                    | matplotlib / seaborn   | グラフ・チャートの作成                   | Pythonに組み込みやすい                           |
| 機械学習           | scikit-learn           | 分類・回帰・クラスタリング               | 初学者から実務まで幅広く利用可能                 |
|                    | TensorFlow / Keras     | ディープラーニング                       | Google製、高性能かつ柔軟                         |
|                    | PyTorch                | ディープラーニング                       | Facebook製、研究用途にも人気                     |
| データベース       | MySQL / PostgreSQL     | 関係データベース                         | 広く使われているオープンソースDB                 |
|                    | MongoDB                | NoSQLデータベース                        | ドキュメント指向、柔軟なスキーマ設計が可能       |
| クラウド / 環境    | AWS / GCP / Azure      | データ分析基盤、モデルのデプロイ         | スケーラブルでエンタープライズ向け               |
|                    | Docker                 | 実行環境のコンテナ化                     | 環境構築が簡単、再現性が高い                     |


In [None]:
## ➗ 算術式の例（LaTeX形式）

Jupyter Notebook では、`$...$` または `$$...$$` を使って LaTeX 形式の数式を表示できます。以下に代表的な算術演算の例を紹介します。

---

### 🔹 四則演算

- 加算：                             $3 + 5 = 8$
- 減算：                             $10 - 4 = 6$
- 乗算：                             $6 \times 7 = 42$
- 除算：                             $\frac{20}{5} = 4$

---

### 🔹 指数と平方根

- 2の3乗：                         $2^3 = 8$
- 平方根：                         $\sqrt{49} = 7$
- n乗根：                         $\sqrt[n]{x}$

---

### 🔹 分配法則の例

$$
a(b + c) = ab + ac
$$

---

### 🔹 組み合わせの公式

$$
\binom{n}{k} = \frac{n!}{k!(n-k)!}
$$

---



In [None]:
# 🔢 2つの数を使って、加算と乗算を行う

# 数値の定義
a = 7
b = 3

# 加算
sum_result = a + b
print(f"{a} + {b} = {sum_result}")

# 乗算
product_result = a * b
print(f"{a} * {b} = {product_result}")


In [None]:
# ⏱️ 分を「時間＋分」に変換する

# 分数（整数）を定義
total_minutes = 130

# 時間と分に分割
hours = total_minutes // 60
minutes = total_minutes % 60

# 結果を出力
print(f"{total_minutes} 分 = {hours} 時間 {minutes} 分")


In [None]:
## 🎯目的語（対象）リスト

以下は、データサイエンスやプログラミングに関連する目的語

- データセット（例：データを読み込む）
- モデル（例：モデルを訓練する）
- ファイル（例：ファイルを保存する）
- グラフ（例：グラフを描画する）
- 結果（例：結果を評価する）
- データベース（例：データベースに接続する）
- API（例：APIからデータを取得する）
- レポート（例：レポートを生成する）
- パラメータ（例：パラメータを調整する）
- 画像（例：画像を前処理する）

---



In [None]:
---

**著者**：Tokyo taro
**作成日**：2025年6月14日  
**ノートブック名**：データサイエンス入門ハンズオン

---
