In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
from scipy import stats
from statsmodels.graphics.gofplots import qqplot
import pylab as py
from scipy.stats import skew

In [None]:
df = pd.read_csv('dataset/final_df.csv', index_col='Unnamed: 0')

## Bayes: výpočet pravdepodobnosti spokojnosti s celkovým letom na základe spokojnosti zákazníkov s komfortom počas dlhých letov. 

### Získavanie priorov spokojnosti s komfortom pre dlhé lety

Ako dlhé lety sú klasifikované tie, ktorých dĺžka je väčšia ako medián (843). Ako spokojných zákazníkov sme klasifikovali tých, ktorí ohodnotili komfort známkou 4 alebo 5. S komfortom počas dlhých letov bolo spokojných 62% (33.94% + 28.06%) zákazníkov. Ako nespokojných zákazníkov sme klasifikovali tých, ktorí ohodnotili komfort známkou 3 alebo menej. S komfortom počas dlhých letov bolo nespokojných 38% (9.34% + 12.33% + 16.32%) zákazníkov. 

In [None]:
long_flights = df.loc[(df['Flight Distance'] > 843)]
long_flights_discomfort = long_flights['Seat comfort']

long_flights_discomfort.value_counts().sort_index().plot(kind='bar')

discomfort = long_flights_discomfort.value_counts().sort_index()
discomfort / sum(discomfort.values.tolist()) * 100

In [None]:
long_flights_discomfort = df.loc[(df['Flight Distance'] > 843) & (df['Seat comfort'] <= 3), 'satisfaction']
long_flights_comfort = df.loc[(df['Flight Distance'] > 843) & (df['Seat comfort'] > 3), 'satisfaction']

### Získavanie priorov spokojnosti s celkovým letom ak bol zákazník nespokojný s komfortom počas dlhého letu

Ak bol zákazník počas dlhého letu nespokojný s komfortom, tak na 75.58% bol nespokojný aj s celkovým letom. Na druhej strane na 24.42% bol spokojný s celkovým letom.  

In [None]:
long_flights_discomfort.value_counts().sort_index().plot(kind='bar')

discomfort = long_flights_discomfort.value_counts().sort_index()
discomfort / sum(discomfort.values.tolist()) * 100

### Získavanie priorov spokojnosti s celkovým letom ak bol zákazník spokojný s komfortom počas dlhého letu

Ak bol zákazník počas dlhého letu spokojný s komfortom, tak na 71.55% bol spokojný aj s celkovým letom. Na druhej strane na 28.45% bol nespokojný s celkovým letom.  

In [None]:
long_flights_comfort.value_counts().sort_index().plot(kind='bar')

comfort = long_flights_comfort.value_counts().sort_index()
comfort / sum(comfort.values.tolist()) * 100

![bajes 1](img/bajes2.png)

## Otázky

1. Aká je pravdepodobnosť, že zákazník je počas dlhého letu spokojný s komfortom a zároveň je spokojný s celkovým letom? Odpoveď: 44.36%  
2. Aká je pravdepodobnosť, že zákazník je počas dlhého letu spokojný s komfortom, ak je nespokojný s celkovým letom? Odpoveď: 38.05% (V2/(V2+V4))

## Bayes: výpočet pravdepodobnosti spokojnosti s celkovým letom na základe typu zákazníka a spokojnosti so službami počas letu. 

### Získavanie priorov pre typy zákazníkov

Rozlišujeme dva typy zákazníkov. Tými sú tí loajálny a neloajálny. Loajálny zákazníci predstavujú 81.72% z celkového počtu zákazníkov. Neloajálny zákazníci predstavujú 18.28% z celkového počtu zákazníkov.

In [None]:
customer_type = df['Customer Type']

customer_type.value_counts().sort_index().plot(kind='bar')

c_type = customer_type.value_counts().sort_index()
c_type / sum(c_type.values.tolist()) * 100

### Získavanie priorov pre spokojnosť loajálnych zákazníkov so službami počas letu

Ako spokojných, loajálnych zákazníkov sme klasifikovali tých, ktorí ohodnotili služby počas letu známkou 4 alebo 5. So službami počas letu bolo spokojných 62.30% (35.96% + 26.34%) loajálnych zákazníkov. Ako nespokojných, loajálnych zákazníkov sme klasifikovali tých, ktorí ohodnotili službami počas letu známkou 3 alebo menej. So službami počas letu bolo nespokojných 37.70% (0.01% + 7.09% + 11.62% + 19%) loajálnych zákazníkov.

In [None]:
loyal_customer = df.loc[(df['Customer Type'] == 'Loyal Customer')]
loyal_customer_bad = loyal_customer['Inflight service']

loyal_customer_bad.value_counts().sort_index().plot(kind='bar')

loyal_bad = loyal_customer_bad.value_counts().sort_index()
loyal_bad / sum(loyal_bad.values.tolist()) * 100

### Získavanie priorov pre spokojnosť neloajálnych zákazníkov so službami počas letu

Ako spokojných, neloajálnych zákazníkov sme klasifikovali tých, ktorí ohodnotili služby počas letu známkou 4 alebo 5. So službami počas letu bolo spokojných 64.22% (39.11% + 25.11%) neloajálnych zákazníkov. Ako nespokojných, neloajálnych zákazníkov sme klasifikovali tých, ktorí ohodnotili službami počas letu známkou 3 alebo menej. So službami počas letu bolo nespokojných 35.78% (5.59% + 8.34% + 21.85%) neloajálnych zákazníkov.

In [None]:
disloyal_customer = df.loc[(df['Customer Type'] == 'disloyal Customer')]
disloyal_customer_bad = disloyal_customer['Inflight service']

disloyal_customer_bad.value_counts().sort_index().plot(kind='bar')

disloyal_bad = disloyal_customer_bad.value_counts().sort_index()
disloyal_bad / sum(disloyal_bad.values.tolist()) * 100

In [None]:
loyal_customer = df.loc[(df['Customer Type'] == 'Loyal Customer') & (df['Inflight service'] <= 3), 'satisfaction']
disloyal_customer = df.loc[(df['Customer Type'] == 'disloyal Customer') & (df['Inflight service'] <= 3), 'satisfaction']

### Získavanie priorov spokojnosti s celkovým letom ak bol loajálny zákazník nespokojný so službami počas letu

Ak bol loajálny zákazník nespokojný so službami počas letu, tak na 70% bol nespokojný aj s celým letom. Na druhej strane na 30% bol spokojný s celkovým letom.

In [None]:
loyal_customer.value_counts().sort_index().plot(kind='bar')

loyal = loyal_customer.value_counts().sort_index()
loyal / sum(loyal.values.tolist()) * 100

### Získavanie priorov spokojnosti s celkovým letom ak bol neloajálny zákazník nespokojný so službami počas letu

Ak bol neloajálny zákazník nespokojný so službami počas letu, tak na 89.12% bol nespokojný aj s celým letom. Na druhej strane na 10.88% bol spokojný s celkovým letom.

In [None]:
disloyal_customer.value_counts().sort_index().plot(kind='bar')

disloyal = disloyal_customer.value_counts().sort_index()
disloyal / sum(disloyal.values.tolist()) * 100

In [None]:
loyal_customer = df.loc[(df['Customer Type'] == 'Loyal Customer') & (df['Inflight service'] > 3), 'satisfaction']
disloyal_customer = df.loc[(df['Customer Type'] == 'disloyal Customer') & (df['Inflight service'] > 3), 'satisfaction']

### Získavanie priorov spokojnosti s celkovým letom ak bol loajálny zákazník spokojný so službami počas letu

Ak bol loajálny zákazník spokojný so službami počas letu, tak na 58.47% bol spokojný aj s celým letom. Na druhej strane na 41.53% bol nespokojný s celkovým letom.

In [None]:
loyal_customer.value_counts().sort_index().plot(kind='bar')

loyal = loyal_customer.value_counts().sort_index()
loyal / sum(loyal.values.tolist()) * 100

### Získavanie priorov spokojnosti s celkovým letom ak bol neloajálny zákazník spokojný so službami počas letu

Ak bol neloajálny zákazník spokojný so službami počas letu, tak na 30.82% bol spokojný aj s celým letom. Na druhej strane na 69.18% bol nespokojný s celkovým letom.

In [None]:
disloyal_customer.value_counts().sort_index().plot(kind='bar')

disloyal = disloyal_customer.value_counts().sort_index()
disloyal / sum(disloyal.values.tolist()) * 100

![bajes2](img/bajes1.png)

## Otázky

1. Aká je pravdepodobnosť, že loajálny zákazník je spokojný so službami počas letu a zároveň je spokojný s celkovým letom? Odpoveď: 29.77% (V1)  
2. Aká je pravdepodobnosť, že neloajálny zákazník je spokojný so službami počas letu, ak je nespokojný s celkovým letom? Odpoveď: 14.33% (V6/(V2+V4+V6+V8))

## Belief Network: výpočet pravdepodobnosť spokojnosti s celkovým letom na základe spokojnosti s jedlom a nápojmi, a zábavou počas letu. 

### Získavanie priorov pre spokojnosť s jedlom a nápojmi

Ako spokojných zákazníkov sme klasifikovali tých, ktorí ohodnotili jedlo a nápoje známkou 4 alebo 5. S jedlom a nápojmi bolo spokojných 44.90% (23.45% + 21.45%) zákazníkov. Ako nespokojných zákazníkov sme klasifikovali tých, ktorí ohodnotili jedlo a nápoje známkou 3 alebo menej. S jedlom a nápojmi bolo nespokojných 55.10% (0.1% + 12.36% + 21.16% + 21.47%) zákazníkov.

In [None]:
food_drink = df['Food and drink']
fd = food_drink.value_counts().sort_index()
print(f'food_drink: \n{fd / sum(fd.values.tolist()) * 100}')

### Získavanie priorov pre spokojnosť so zábavou

Ako spokojných zákazníkov sme klasifikovali tých, ktorí ohodnotili zábavu známkou 4 alebo 5. So zábavou bolo spokojných 52.59% (23.45% + 21.45%) zákazníkov. Ako nespokojných zákazníkov sme klasifikovali tých, ktorí ohodnotili zábavu známkou 3 alebo menej. So zábavou bolo nespokojných 47.41% (0.01% + 12.01% + 16.97% + 18.42%) zákazníkov.

In [None]:
entertainment = df['Inflight entertainment']
fd = entertainment.value_counts().sort_index()
print(f'entertainment: \n{fd / sum(fd.values.tolist()) * 100}')

### Získavanie priorov ak bol zákazník spokojný s celkovým letom

Ak bol zákazník spokojný s jedlom a nápojmi a zároveň bol spokojný so zábavou, tak na 56.54% bol spokojný s celkovým letom.  
Ak bol zákazník spokojný s jedlom a nápojmi a zároveň nebol spokojný so zábavou, tak na 37.88% bol spokojný s celkovým letom.  
Ak nebol zákazník spokojný s jedlom a nápojmi a zároveň bol spokojný so zábavou, tak na 79.36% bol spokojný s celkovým letom.  
Ak nebol zákazník spokojný s jedlom a nápojmi a zároveň nebol spokojný so zábavou, tak na 18.86% bol spokojný s celkovým letom.

In [None]:
food_entertainmet_good_good = df.loc[(df['Food and drink'] > 3) & (df['Inflight entertainment'] > 3), 'satisfaction']
food_entertainmet_good_bad = df.loc[(df['Food and drink'] > 3) & (df['Inflight entertainment'] <= 3), 'satisfaction']
food_entertainmet_bad_good = df.loc[(df['Food and drink'] <= 3) & (df['Inflight entertainment'] > 3), 'satisfaction']
food_entertainmet_bad_bad = df.loc[(df['Food and drink'] <= 3) & (df['Inflight entertainment'] <= 3), 'satisfaction']

In [None]:
fd = food_entertainmet_good_good.value_counts().sort_index()
print(f'food_entertainmet_good_good: \n{fd / sum(fd.values.tolist()) * 100}')

In [None]:
fd = food_entertainmet_good_bad.value_counts().sort_index()
print(f'food_entertainmet_good_bad: \n{fd / sum(fd.values.tolist()) * 100}')

In [None]:
fd = food_entertainmet_bad_good.value_counts().sort_index()
print(f'food_entertainmet_bad_good: \n{fd / sum(fd.values.tolist()) * 100}')

In [None]:
fd = food_entertainmet_bad_bad.value_counts().sort_index()
print(f'food_entertainmet_bad_bad: \n{fd / sum(fd.values.tolist()) * 100}')

![belief](img/belief.png)