In [None]:
import pandas as pd
import numpy as np

# Шаг 1.1. Создаем список словарей students 
students = [
    {"name": "Макс", "group": "A", "math": 95, "python": 88, "hours": 15, "passed": True, "city": "Москва"},
    {"name": "Данил", "group": "B", "math": 67, "python": 72, "hours": 10, "passed": True, "city": "Санкт-Петербург"},
    {"name": "Виктор", "group": "A", "math": 82, "python": 91, "hours": 20, "passed": True, "city": "Москва"},
    {"name": "Сын бетона", "group": "B", "math": 73, "python": None, "hours": 8, "passed": False, "city": "Карабаш"},
    {"name": "Илья", "group": "A", "math": 89, "python": 76, "hours": 12, "passed": True, "city": "Уфа"},
    {"name": "Владислав", "group": "C", "math": None, "python": 65, "hours": 6, "passed": False, "city": "Екатеринбург"},
    {"name": "Рома", "group": "B", "math": 78, "python": 84, "hours": 14, "passed": True, "city": "Москва"},
    {"name": "Иван", "group": "C", "math": 92, "python": 96, "hours": 18, "passed": True, "city": "Санкт-Петербург"},
    {"name": "Гигамакс", "group": "A", "math": 61, "python": 58, "hours": 9, "passed": False, "city": "Тверь"},
    {"name": "Никита", "group": "B", "math": 85, "python": 79, "hours": 11, "passed": True, "city": "Уфа"}
]

# Шаг 1.2. Создаем DataFrame
df = pd.DataFrame(students)
print("1.2. Исходный DataFrame:")
print(df)
print("\n" + "="*80)

# Шаг 1.3. Выводим информацию о DataFrame
print("1.3. Первые 5 строк (head):")
print(df.head())
print("\n1.3. Информация о столбцах и типах (info):")
print(df.info())
print("\n1.3. Базовая статистика (describe):")
print(df.describe())
print("\n" + "="*80)

In [None]:
# Шаг 2.1. Выводим столбцы name, group, python
print("2.1. Столбцы name, group, python:")
print(df[['name', 'group', 'python']])
print("\n" + "="*80)

# Шаг 2.2. Выводим строки по индексу
print("2.2. Строка с индексом 0:")
print(df.iloc[0])
print("\n2.2. Строки со 2 по 5 (включительно):")
print(df.iloc[2:6])  # 2:6 означает строки с индексом 2, 3, 4, 5
print("\n" + "="*80)

# Шаг 2.3. Делаем столбец name индексом
df2 = df.set_index('name')
print("2.3. DataFrame с name в качестве индекса (первые 5 строк):")
print(df2.head())
print("\n2.3. Доступ к студенту 'Иван' по имени через .loc:")
print(df2.loc['Иван'])
print("\n" + "="*80)


In [None]:
# Шаг 3.1. Студенты с python >= 80
top_python = df[df['python'] >= 80]
print("3.1. Студенты с python >= 80:")
print(top_python)
print("\n" + "="*80)

# Шаг 3.2. Студенты из группы "A" И с math >= 70
a_good_math = df[(df['group'] == 'A') & (df['math'] >= 70)]
print("3.2. Студенты из группы A с math >= 70:")
print(a_good_math)
print("\n" + "="*80)

# Шаг 3.3. Строки с пропусками в оценках
with_missing = df[df[['math', 'python']].isna().any(axis=1)]
print("3.3. Строки с пропусками в math или python:")
print(with_missing)
print("\n" + "="*80)

In [None]:
# Шаг 4.1. Создаем столбец avg_score = среднее между math и python
# Используем mean с axis=1 для расчета по строкам, skipna=True для игнорирования NaN
df['avg_score'] = df[['math', 'python']].mean(axis=1, skipna=True)
print("4.1. DataFrame с новым столбцом avg_score (первые 5 строк):")
print(df.head())
print("\nПроверка пропусков в avg_score:", df['avg_score'].isna().sum())
print("\n" + "="*80)

# Шаг 4.2. Создаем столбец level на основе avg_score
def make_level(avg_score):
    """Функция для определения уровня на основе среднего балла"""
    if pd.isna(avg_score):
        return np.nan
    elif avg_score >= 85:
        return "high"
    elif avg_score >= 70:
        return "mid"
    else:
        return "low"

# Применяем функцию к столбцу avg_score
df['level'] = df['avg_score'].apply(make_level)
print("4.2. DataFrame с новым столбцом level:")
print(df[['name', 'group', 'avg_score', 'level']].head(10))
print("\nРаспределение по уровням:")
print(df['level'].value_counts(dropna=False))
print("\n" + "="*80)

In [None]:
# Шаг 5.1. Группировка по group и агрегация
group_stats = df.groupby('group').agg(
    avg_score_mean=('avg_score', 'mean'),
    hours_mean=('hours', 'mean'),
    student_count=('name', 'count')
).round(2)
print("5.1. Статистика по группам:")
print(group_stats)
print("\n" + "="*80)

# Шаг 5.2. Процент студентов passed == True в каждой группе
passed_percent = df.groupby('group')['passed'].mean() * 100
print("5.2. Процент студентов, сдавших экзамен, по группам (%):")
print(passed_percent.round(2))
print("\n" + "="*80)

In [None]:
# Шаг 6.1. Сортировка по avg_score по убыванию
rating = df.sort_values('avg_score', ascending=False)
print("6.1. Рейтинг студентов по убыванию avg_score (первые 5 строк):")
print(rating[['name', 'group', 'avg_score', 'level']].head())
print("\n" + "="*80)

# Шаг 6.2. Формируем итоговую таблицу
final_view = rating[['name', 'group', 'avg_score', 'level', 'hours', 'passed']]
print("6.2. Итоговая таблица (топ-5):")
print(final_view.head())
print("\n" + "="*80)