## ジニ係数

ジニ係数（Gini coefficient）は、所得や財産の分配の不平等度を測るための指標です。0から1までの値をとり、0は完全に平等な分配（すべての人が同じ所得を持つ）を、1は完全に不平等な分配（1人がすべての所得を持ち、他のすべての人が無所得）を示します。

### ジニ係数の計算方法

ジニ係数は、ローレンツ曲線を用いて計算されます。ローレンツ曲線は、所得の累積分布を示す曲線で、横軸に人口の累積割合、縦軸に所得の累積割合をとります。

ジニ係数は、ローレンツ曲線と完全平等線（45度線）の間の面積を、45度線の下の全体の面積で割った値として計算されます。具体的には以下の式で表されます。

$$
G = 1 - 2 \int_0^1 L(x) \, dx
$$

ここで $L(x)$ はローレンツ曲線です。この計算を簡略化するため、以下のように離散データから近似的に計算することができます。

$$
G = \frac{\sum_{i=1}^n \sum_{j=1}^n |x_i - x_j|}{2n \sum_{i=1}^n x_i}
$$

ここで $x_i$ は個々の所得、$n$ は人口の数です。

### ジニ係数の具体例

例えば、以下のような所得分布があるとします。

- 人1: 10万円
- 人2: 20万円
- 人3: 30万円
- 人4: 40万円
- 人5: 50万円

この場合のジニ係数を計算してみます。

1. まず、すべてのカップル $(x_i, x_j)$ の所得の差の絶対値を計算し、その合計を求めます。

$$
\sum_{i=1}^n \sum_{j=1}^n |x_i - x_j| = |10 - 10| + |10 - 20| + |10 - 30| + |10 - 40| + |10 - 50| + \ldots + |50 - 50|
$$

このように計算していくと、

$$
= 0 + 10 + 20 + 30 + 40 + 10 + 0 + 10 + 20 + 30 + \ldots + 0 = 400
$$

2. 次に、所得の合計を求めます。

$$
\sum_{i=1}^n x_i = 10 + 20 + 30 + 40 + 50 = 150
$$

3. そして、ジニ係数を求めます。

$$
G = \frac{400}{2 \times 5 \times 150} = \frac{400}{1500} \approx 0.267
$$

この例では、ジニ係数は約0.267となります。

### ジニ係数の解釈

- **0に近い**: 所得分配が平等であることを示します。
- **1に近い**: 所得分配が非常に不平等であることを示します。

### まとめ

ジニ係数は、所得や財産の不平等度を示す指標であり、経済学や社会科学の分野で広く使用されています。社会の不平等を評価するための重要なツールです。

## 最小二乗法
最小二乗法 (Least Squares Method) は、データの散布図に最もよくフィットする直線を見つける方法です。ここでは、直線 $y = ax + b$ の係数 $a$ と $b$ を導出する過程を説明します。

データ点 $(x_i, y_i)$ が $n$ 個あるとします。このデータ点に対して、誤差 (residual) の二乗和を最小にする $a$ と $b$ を求めます。

### ステップ 1: 誤差の定義

直線 $y = ax + b$ に対する各データ点 $(x_i, y_i)$ の誤差は、
$$
\epsilon_i = y_i - (ax_i + b)
$$
です。

### ステップ 2: 誤差の二乗和を求める

全てのデータ点に対する誤差の二乗和 (Sum of Squared Errors, SSE) は、
$$
S = \sum_{i=0}^{n-1} \epsilon_i^2 = \sum_{i=0}^{n-1} (y_i - (ax_i + b))^2
$$
です。

### ステップ 3: $a$ と $b$ の導出

$S$ を $a$ と $b$ で偏微分し、それぞれを 0 に設定して最小値を求めます。

1. $a$ で偏微分：
$$
\frac{\partial S}{\partial a} = \sum_{i=0}^{n-1} -2x_i (y_i - (ax_i + b)) = 0
$$

2. $b$ で偏微分：
$$
\frac{\partial S}{\partial b} = \sum_{i=0}^{n-1} -2 (y_i - (ax_i + b)) = 0
$$

これらの方程式を展開して整理すると、次の連立方程式が得られます。

### ステップ 4: 正規方程式の解

$$
\begin{cases}
\sum_{i=0}^{n-1} x_i y_i = a \sum_{i=0}^{n-1} x_i^2 + b \sum_{i=0}^{n-1} x_i \\
\sum_{i=0}^{n-1} y_i = a \sum_{i=0}^{n-1} x_i + nb
\end{cases}
$$

この連立方程式を解くと、$a$ と $b$ が求められます。

1. $a$ の式：
$$
a = \frac{n \sum_{i=0}^{n-1} x_i y_i - \sum_{i=0}^{n-1} x_i \sum_{i=0}^{n-1} y_i}{n \sum_{i=0}^{n-1} x_i^2 - (\sum_{i=0}^{n-1} x_i)^2}
$$

2. $b$ の式：
$$
b = \frac{\sum_{i=0}^{n-1} y_i - a \sum_{i=0}^{n-1} x_i}{n}
$$

これで、最小二乗法により $a$ と $b$ の値を導出することができます。具体的な計算例を以下に示します。

### 具体例

データ点が $(1, 2), (2, 3), (3, 5)$ の場合を考えます。

1. 各種和の計算：
$$
\sum x_i = 1 + 2 + 3 = 6
$$
$$
\sum y_i = 2 + 3 + 5 = 10
$$
$$
\sum x_i^2 = 1^2 + 2^2 + 3^2 = 14
$$
$$
\sum x_i y_i = 1 \cdot 2 + 2 \cdot 3 + 3 \cdot 5 = 23
$$

2. $a$ の計算：
$$
a = \frac{3 \cdot 23 - 6 \cdot 10}{3 \cdot 14 - 6^2} = \frac{69 - 60}{42 - 36} = \frac{9}{6} = 1.5
$$

3. $b$ の計算：
$$
b = \frac{10 - 1.5 \cdot 6}{3} = \frac{10 - 9}{3} = \frac{1}{3} = 0.333
$$

この結果、最小二乗法で求めた直線は $y = 1.5x + 0.333$ となります。