In [None]:
import pandas as pd

# Считываем данные из файла train.csv
df = pd.read_csv('train.csv')
print(df.head())

import seaborn as sns
import matplotlib.pyplot as plt

# Устанавливаем стиль графиков
sns.set(style="whitegrid")

# Визуализация распределения Survived
plt.figure(figsize=(12, 6))
sns.countplot(x='Survived', data=df)
plt.title('Распределение выживаемости')
plt.xlabel('Выживаемость (0 = не выжил, 1 = выжил)')
plt.ylabel('Количество пассажиров')
plt.show()

# Визуализация распределения Pclass
plt.figure(figsize=(12, 6))
sns.countplot(x='Pclass', data=df)
plt.title('Распределение классов пассажиров')
plt.xlabel('Класс')
plt.ylabel('Количество пассажиров')
plt.show()

# Визуализация распределения Age
plt.figure(figsize=(12, 6))
sns.histplot(df['Age'].dropna(), bins=30, kde=True)
plt.title('Распределение возраста пассажиров')
plt.xlabel('Возраст')
plt.ylabel('Частота')
plt.show()

# Визуализация распределения Sex
plt.figure(figsize=(12, 6))
sns.countplot(x='Sex', data=df)
plt.title('Распределение по полу')
plt.xlabel('Пол')
plt.ylabel('Количество пассажиров')
plt.show()

plt.figure(figsize=(12, 6))
sns.boxplot(x='Age', data=df)
plt.title('Диаграмма размаха для возраста пассажиров')
plt.xlabel('Возраст')
plt.show()

# Pie chart для Survived
survived_counts = df['Survived'].value_counts()
plt.figure(figsize=(8, 8))
plt.pie(survived_counts, labels=['Не выжил', 'Выжил'], autopct='%1.1f%%', startangle=90)
plt.title('Соотношение выживших и погибших')
plt.axis('equal')  # Equal aspect ratio ensures that pie is drawn as a circle.
plt.show()

# Pie chart для Pclass
pclass_counts = df['Pclass'].value_counts()
plt.figure(figsize=(8, 8))
plt.pie(pclass_counts, labels=pclass_counts.index, autopct='%1.1f%%', startangle=90)
plt.title('Соотношение классов пассажиров')
plt.axis('equal')
plt.show()

sns.pairplot(df.select_dtypes(include=['float64', 'int64']))
plt.suptitle('Парные графики для числовых переменных', y=1.02)
plt.show()

import plotly.express as px

# Создаем новый DataFrame для sunburst plot
sunburst_data = df.groupby(['Pclass', 'Sex']).size().reset_index(name='count')

fig = px.sunburst(sunburst_data, path=['Pclass', 'Sex'], values='count',
                  title='Sunburst Plot: Пассажиры по классам и полу')
fig.show()
