# Scatter Plots（散布図）の描画


## 1.ライブラリのインポート

今回はPlotly Expressを使って描画していきます。\
（Plotly Expressは2019年の3月に公開された、plotlyの高レベルAPI群で、インタラクティブで複雑な描画を簡単に書けるのが特徴です）
https://plotly.com/python/plotly-express/

以下のセルを実行して、Plotly expressをインポートします。\
"as px"としているので、今後は"px"で呼び出すことができます。





In [7]:
import plotly.express as px

## 2.データの準備

今回はアヤメのデータセットを使います。\
アヤメのがく片や花びら幅や長さの数値、そしてその花がどのアヤメ属(花)の種類なのかを集めているデータセットです。\
データセットを読み込んで、変数に代入しておきます。

In [8]:
df = px.data.iris()
df.head()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species,species_id
0,5.1,3.5,1.4,0.2,setosa,1
1,4.9,3.0,1.4,0.2,setosa,1
2,4.7,3.2,1.3,0.2,setosa,1
3,4.6,3.1,1.5,0.2,setosa,1
4,5.0,3.6,1.4,0.2,setosa,1


## 3.散布図を描く
まずはベーシックな散布図（scatter plot）を描いてみましょう！\
散布図は、縦軸、横軸に２項目の量や大きさを対応させ、データを点でプロットしたものです。\
2項目の相関関係や分布のしかたなどを確認することができます。

px.scatter(**使用するデータ, x="横軸に設定したい特徴量", y="縦軸に設定したい特徴量"**)\

一度変数に代入して、それをshowで描画しています。

In [13]:
fig = px.scatter(df, 
                 x="sepal_width", 
                 y="sepal_length")
fig.show()

なんとなく把握は出来ましたが、ここから何かを読み取るのは難しいです。\
３種類のあやめが、どのように分布しているかを知りたいですね。

では、種類ごとに色分けをして表示してみましょう。\
**color="色分けしたい特徴量"**　を追加します。


**color="species"**


In [14]:
fig = px.scatter(df, 
                 x="sepal_width", 
                 y="sepal_length", 
                 color="species")
fig.show()

色分けする色は、自分で設定することもできます。

**color_discrete_sequence=["yellow","violet", "orange"]**)

In [15]:
fig = px.scatter(df, 
                 x="sepal_width", 
                 y="sepal_length", 
                 color="species", 
                 color_discrete_sequence=["yellow","violet", "orange"])
fig.show()

タイトルをつけましょう！

**title="あやめの分布図"**


In [None]:
fig = px.scatter(df, 
                 x="sepal_width", 
                 y="sepal_length", 
                 color="species", 
                 color_discrete_sequence=["yellow","violet", "orange"], 
                 title="あやめの分布図")
fig.show()

傾向線（トレンドライン）をひいてみるとどうなるでしょうか？\
散布図に、線形の最小2乗回帰（OLS：Ordinary Least Squares regression）トレンドラインを追加します。\
https://plotly.com/python/linear-fits/

**trendline="ols"**

In [12]:
fig = px.scatter(df, 
                 x="sepal_width", 
                 y="sepal_length", 
                 color="species", 
                 color_discrete_sequence=["yellow","violet", "orange"], 
                 title="あやめの分布図", 
                 trendline="ols")
fig.show()

他にも色々試してみたい方は、公式ページをご参照ください。\
https://plotly.com/python/plotly-express/