### 단변량 그래프 그리기 - 히스토그램

In [1]:
import seaborn as sns

In [2]:
tips = sns.load_dataset('tips')

In [3]:
%matplotlib notebook
import matplotlib.pyplot as plt

#### histogram 도수분포표를 그래프로 나타낸 것 보통 x축이 계급이고 y축이 도수이다.

In [4]:
ax = plt.subplots()
ax = sns.histplot(tips['total_bill'], kde=True)
ax.set_title('Total Bill Histogram with Density Plot''Total Bill Histogram with Density Plot')
ax.set_ylabel('Freuency')
ax.set_xlabel('Total Bill')

<IPython.core.display.Javascript object>

Text(0.5, 0, 'Total Bill')

In [5]:
ax = plt.subplots()
ax = sns.kdeplot(tips['total_bill'])
ax.set_title('Total Bill Histogram with Density Plot''Total Bill Histogram with Density Plot')
ax.set_ylabel('Unit Probability')
ax.set_xlabel('Total Bill')

<IPython.core.display.Javascript object>

Text(0.5, 0, 'Total Bill')

#### rugplot은 양탄자 그래프라고 하며 그래프의 축에 동일한 길이의 직선을 붙여 데이터의 밀집 정도를 표현한 것이다.

In [6]:
ax = plt.subplots()
ax = sns.histplot(tips['total_bill'], kde=True)
ax = sns.rugplot(tips['total_bill'])
ax.set_title('Total Bill Histogram with Density Plot''Total Bill Histogram with Density Plot')
ax.set_ylabel('Freuency')
ax.set_xlabel('Total Bill')

<IPython.core.display.Javascript object>

Text(0.5, 0, 'Total Bill')

In [7]:
tips.head()

Unnamed: 0,total_bill,tip,sex,smoker,day,time,size
0,16.99,1.01,Female,No,Sun,Dinner,2
1,10.34,1.66,Male,No,Sun,Dinner,3
2,21.01,3.5,Male,No,Sun,Dinner,3
3,23.68,3.31,Male,No,Sun,Dinner,2
4,24.59,3.61,Female,No,Sun,Dinner,4


In [8]:
ax = plt.subplots()
ax = sns.countplot('day', data=tips)
ax.set_title('Count of days')
ax.set_xlabel('Day of the Week')
ax.set_ylabel('Frequency')

<IPython.core.display.Javascript object>



Text(0, 0.5, 'Frequency')

### 다양한 종류의 이변량 그래프 그리기

In [9]:
ax = plt.subplots()
# regplot 회귀 선과 함께 산점도 그래프가 그려진다. fit_reg 인자로 회귀선 유무를 결정할 수 있다.
ax = sns.regplot(x='total_bill', y='tip', data=tips)
ax.set_title('Scatterplot of Total Bill and Tip')
ax.set_xlabel('Total_Bill')
ax.set_ylabel('Tip')

<IPython.core.display.Javascript object>

Text(0, 0.5, 'Tip')

In [10]:
ax = plt.subplots()
# regplot 회귀 선과 함께 산점도 그래프가 그려진다. fit_reg 인자로 회귀선 유무를 결정할 수 있다.
ax = sns.regplot(x='total_bill', y='tip', data=tips, fit_reg=False)
ax.set_title('Scatterplot of Total Bill and Tip')
ax.set_xlabel('Total_Bill')
ax.set_ylabel('Tip')

<IPython.core.display.Javascript object>

Text(0, 0.5, 'Tip')

#### jointplot 산점도 그래프와 히스토그래 그래프를 한 번에 그린다.

In [11]:
joint = sns.jointplot(x='total_bill', y='tip', data=tips)
joint.set_axis_labels(xlabel='Total_Bill', ylabel='Tip')
joint.fig.suptitle('Joint Plot of Total Bill and Tip', fontsize=10, y=1.03) # 제목이 왜 안나오지?
joint.fig.tight_layout()

<IPython.core.display.Javascript object>

In [12]:
joint = sns.jointplot(x='total_bill', y='tip', data=tips, kind='hex') # 기존 산점도 그래프를 보완하여 가시성을 높임
joint.set_axis_labels(xlabel='Total_Bill', ylabel='Tip')
joint.fig.suptitle('Joint Plot of Total Bill and Tip', fontsize=10, y=1.03) # 제목이 왜 안나오지?
joint.fig.tight_layout()

<IPython.core.display.Javascript object>

#### 이차원 밀집도 그래프 그리기

In [13]:
ax = plt.subplots()
ax = sns.kdeplot(x=tips['total_bill'],
                y=tips['tip'],
                shade=True)
ax.set_title('Kernal Density Plot of Total Bill and Tip')

<IPython.core.display.Javascript object>

Text(0.5, 1.0, 'Kernal Density Plot of Total Bill and Tip')

#### 바 그래프 그리기
- 지정한 변수의 평균을 계산하여 그림

In [14]:
ax = plt.subplots()
ax = sns.barplot(x='time', y='total_bill', data=tips)
ax.set_title('Bar plot of average totla bill for time of day')
ax.set_xlabel('Time of day')
ax.set_ylabel('Average total bill')

<IPython.core.display.Javascript object>

Text(0, 0.5, 'Average total bill')

#### 박스 그래프 그리기
- 박스 그래프는 최소값, 1분위수, 중간값, 3분위수, 최댓값, 이상치 등 다양한 통계량을 한 번에 표현하는 그래프입니다.

In [15]:
ax = plt.subplots()
ax = sns.boxplot(x='time', y='total_bill', data=tips)
ax.set_title('Boxplot of total bill by time of day')
ax.set_xlabel('Time of day')
ax.set_ylabel('Total Bill')

<IPython.core.display.Javascript object>

Text(0, 0.5, 'Total Bill')

#### 바이올린 그래프
- 박스 그래프에서 데이터 분산이 모호한 것을 대신하는? 그래프

In [16]:
ax = plt.subplots()
ax = sns.violinplot(x='time', y='total_bill', data=tips)
ax.set_title('Boxplot of total bill by time of day')
ax.set_xlabel('Time of day')
ax.set_ylabel('Total Bill')

<IPython.core.display.Javascript object>

Text(0, 0.5, 'Total Bill')

#### 관계 그래프 그리기

In [17]:
fig = sns.pairplot(tips)

<IPython.core.display.Javascript object>

In [18]:
pair_grid = sns.PairGrid(tips)
pair_grid = pair_grid.map_upper(sns.regplot)
pair_grid = pair_grid.map_lower(sns.kdeplot)
pair_grid = pair_grid.map_diag(sns.distplot, rug=True)
# pair_grid = pair_grid.map_diag(sns.kdeplot)
# pair_grid = pair_grid.map_diag(sns.histplot)
# pair_grid = pair_grid.map_diag(sns.rugplot)
plt.show()

<IPython.core.display.Javascript object>



### 다변량 그래프 그리기

In [21]:
ax = plt.subplots()
ax = sns.violinplot(x='time', y='total_bill', hue='sex', data=tips, split=True)

<IPython.core.display.Javascript object>

In [29]:
scatter = sns.lmplot(x='total_bill', y='tip', data=tips, hue='sex', fit_reg=False)

<IPython.core.display.Javascript object>

In [23]:
fig = sns.pairplot(tips, hue='sex')

<IPython.core.display.Javascript object>

In [48]:
scatter = sns.lmplot(x='total_bill', y='tip', data=tips, fit_reg=False, hue='sex',
                    scatter_kws=s)

<IPython.core.display.Javascript object>

TypeError: inner() keywords must be strings

In [62]:
s = dict(tips['size']*10)
s.keys

<function dict.keys>

In [66]:
for k, v in s.items:
    print(k)
    print(v)
    break

TypeError: 'builtin_function_or_method' object is not iterable

In [None]:
for k, v in s.items:
    print(k)
    print(v)
    break