## Wine Quality DataSet 

- 얼마전 대전 컨벤션 센터에서 열린 세계 와인 페어에 다녀왔다. 우리나라를 포함한 세계 여러나라의 회사들이 참가했고, 자유롭게 시음을 해볼 수 있었다. 평소에 와인을 즐겨마시지 않아 와인 맛을 모르는 나에게 와인은 너무 쓰고 떫고 그냥 맛이 없었다. 그래서 와인 데이터셋을 분석해보고자 한다. 와인의 어떤 성분이 와인의 등급을 정하는지, 좋은 와인의 성분은 어떤 분포를 따르는지 알아보고자 했다. 사실 어떤 와인이 맛이 있는지를 분석해보고 싶었으나, 맛은 주관적이기도 하고 맛에 대한 평가를 나타내는 데이터셋이 없었기 때문에 와인의 등급에 따라 분석해보고자 했다.

In [21]:
import os
from os.path import join

import pandas as pd
import numpy as np

input_dir = 'Dataset'

data = pd.read_csv(join(input_dir,'wine.data.txt'), names =['Class','Alcohol','Malic Acid','Ash','Alcalinity of ash',
                                                               'Magnesium','Total phenols','Flavanoids',
                                                               'Nonflavanoid phenols','Proanthocyanins',
                                                               'Color intensity','Hue','OD280/OD315 of diluted wines',
                                                               'Proline'])

In [22]:
df_data = pd.DataFrame(data)

In [23]:
df_label = df_data['Class']

In [24]:
df_data.head()

Unnamed: 0,Class,Alcohol,Malic Acid,Ash,Alcalinity of ash,Magnesium,Total phenols,Flavanoids,Nonflavanoid phenols,Proanthocyanins,Color intensity,Hue,OD280/OD315 of diluted wines,Proline
0,1,14.23,1.71,2.43,15.6,127,2.8,3.06,0.28,2.29,5.64,1.04,3.92,1065
1,1,13.2,1.78,2.14,11.2,100,2.65,2.76,0.26,1.28,4.38,1.05,3.4,1050
2,1,13.16,2.36,2.67,18.6,101,2.8,3.24,0.3,2.81,5.68,1.03,3.17,1185
3,1,14.37,1.95,2.5,16.8,113,3.85,3.49,0.24,2.18,7.8,0.86,3.45,1480
4,1,13.24,2.59,2.87,21.0,118,2.8,2.69,0.39,1.82,4.32,1.04,2.93,735


### Feature Description

0. 와인의 맛을 이루는 3대 요소는 탄닌(떫은 맛), 산(신맛), 당(단맛)이다. 

1. Alcohol : Degree of Alcohol (알콜 도수)
2. Malic Acid : one of the principal organic acids found in wine grapes. (와인 특유의 신맛을 나타내는 성분) 
3. Ash (영양학에서, 음식물 속에 들어 있는 무기물 또는 그것의 전체 분량에 대한 비율을 이르는 말.)
4. Alcalinity of ash
5. Magnesium 
6. Total phenols : 와인에 들어있는 phenols의 전체 양
7. Flavonoids : In red wine, up to 90% of the wine's phenolic content falls under the classification of flavonoids. (레드 와인의 페놀 성분 중 최대 90% 비율을 나타내는 폴리 페놀 성분들 플라보노이드 라고 한다. 떫은 맛을 내는 탄닌이 플라보노이드에 속한다.)
8. Nonflavanoid phenols : (90% 성분을 제외한 10%의 페놀 성분들)
9. Proanthocyanins : 심장혈관 질환의 발병률을 낮추는데 도움을 주는 성분.
10. Color intensity	: 색의 강도
11. Hue : 와인을 잔에 따라 흔들었을 때 와인과 글라스의 경계 부분의 색깔이 다른 정도. (Edge 라고도 한다.)
12. OD280/OD315 of diluted wines
13. Proline : one kind of amino acid (와인의 아미노산 성분 중 가장 많은 양을 차지함)

In [20]:
df_label.head()

0    1
1    1
2    1
3    1
4    1
Name: Class, dtype: int64

In [27]:
class_1 = list()
class_2 = list()
class_3 = list()
for row in df_data.values :
    if row[0] == 1:
        class_1.append(row)
    elif row[0] == 2:
        class_2.append(row)
    else :
        class_3.append(row)
df_class_1 = pd.DataFrame(class_1, columns = df_data.columns)
df_class_2 = pd.DataFrame(class_2, columns = df_data.columns)
df_class_3 = pd.DataFrame(class_3, columns = df_data.columns)

In [29]:
del df_class_1['Class']
del df_class_2['Class']
del df_class_3['Class']

In [37]:
means = list()

In [38]:
means.append(df_class_1.mean())
means.append(df_class_2.mean())
means.append(df_class_3.mean())

In [51]:
df_means = pd.DataFrame(means, columns = df_class_1.columns,
                        index = range(1,4))
df_means

Unnamed: 0,Alcohol,Malic Acid,Ash,Alcalinity of ash,Magnesium,Total phenols,Flavanoids,Nonflavanoid phenols,Proanthocyanins,Color intensity,Hue,OD280/OD315 of diluted wines,Proline
1,13.744746,2.010678,2.455593,17.037288,106.338983,2.840169,2.982373,0.29,1.899322,5.528305,1.062034,3.157797,1115.711864
2,12.278732,1.932676,2.244789,20.238028,94.549296,2.258873,2.080845,0.363662,1.630282,3.08662,1.056282,2.785352,519.507042
3,13.15375,3.33375,2.437083,21.416667,99.3125,1.67875,0.781458,0.4475,1.153542,7.39625,0.682708,1.683542,629.895833


In [53]:
medians = list()
medians.append(df_class_1.median())
medians.append(df_class_2.median())
medians.append(df_class_3.median())

In [54]:
df_medians = pd.DataFrame(medians, columns = df_class_1.columns,
                        index = range(1,4))
df_medians

Unnamed: 0,Alcohol,Malic Acid,Ash,Alcalinity of ash,Magnesium,Total phenols,Flavanoids,Nonflavanoid phenols,Proanthocyanins,Color intensity,Hue,OD280/OD315 of diluted wines,Proline
1,13.75,1.77,2.44,16.8,104.0,2.8,2.98,0.29,1.87,5.4,1.07,3.17,1095.0
2,12.29,1.61,2.24,20.0,88.0,2.2,2.03,0.37,1.61,2.9,1.04,2.83,495.0
3,13.165,3.265,2.38,21.0,97.0,1.635,0.685,0.47,1.105,7.55,0.665,1.66,627.5
