In [449]:
import pandas as pd
import numpy as np
import warnings
warnings.filterwarnings("ignore")

In [451]:
df_8 = pd.read_excel("Отчет_по_месяцам_8А_2023_2024.xlsx", header=1)
df_9 = pd.read_excel("Отчет_по_месяцам_9А_2024_2025.xlsx", header=1)
df_8.head(15)

Unnamed: 0.1,Unnamed: 0,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8,Unnamed: 9,...,Unnamed: 244,Unnamed: 245,Unnamed: 246,Unnamed: 247,Unnamed: 248,Unnamed: 249,Unnamed: 250,Unnamed: 251,Unnamed: 252,Unnamed: 253
0,Отчет об успеваемости и посещаемости ученика,,,,,,,,,,...,,,,,,,,,,
1,,,,,,,,,,,...,,,,,,,,,,
2,,,,,,,,,,,...,,,,,,,,,,
3,Учебный год: 2023/2024,,,,,,,,,,...,,,,,,,,,,
4,Класс: 8А,,,,,,,,,,...,,,,,,,,,,
5,Период: с 01.09.23 по 31.05.24,,,,,,,,,,...,,,,,,,,,,
6,Ученик 1,,,,,,,,,,...,,,,,,,,,,
7,,,,,,,,,,,...,,,,,,,,,,
8,Предмет,Сентябрь,,,,,,,,,...,,,,,,,,,,
9,,1,4.0,5.0,7.0,8.0,11.0,12.0,13.0,14.0,...,,,,,,,,,,


In [453]:
def clean_df(df):
    words_to_exclude = ['Год', 'Класс', 'Период', 'год', 'Уважительная', 'Болезнь', 'Неуважительная', 'Опоздание']
    exclude_pattern = '|'.join(words_to_exclude)

    df_cleaned = df[~df.iloc[:, 0].str.contains(exclude_pattern, na=False)]
    df_cleaned = df_cleaned[~df_cleaned.iloc[:, 1].str.contains(exclude_pattern, na=False)]
    df_cleaned = df_cleaned.dropna(how='all')
    df_cleaned = df_cleaned.iloc[1:].reset_index(drop=True)

    return df_cleaned

In [455]:
def create_students_dict(df, rows_per_student):
    student_data = {}
    # Итерируемся по датасету с шагом в 'rows_per_student'
    for i in range(0, len(df), rows_per_student):
        student_df_full = df.iloc[i:i + rows_per_student].copy().reset_index(drop=True)

        # Получаем имя ученика из первой строки
        student_name = student_df_full.iloc[0, 0]  # Предполагаем, что имя ученика в первом столбце

        # Устанавливаем корректные заголовки
        header_subject = student_df_full.iloc[1].fillna('')
        header_date = student_df_full.iloc[2].fillna('')

        new_columns = []
        month = ''
        for j in range(len(header_subject)):
            if header_subject[j] and header_date[j]:
                new_columns.append(f"{header_subject[j]}")
                month = header_subject[j]
            elif header_subject[j]:
                new_columns.append(header_subject[j])
            else:
                str_to_append = f"{month}_{header_date[j]}"
                if str_to_append in new_columns:
                    new_columns.append(f"{month}_{header_date[j]}.1")
                else:
                    new_columns.append(f"{month}_{header_date[j]}")

        student_df_full.columns = new_columns
        student_df_processed = student_df_full.iloc[3:].reset_index(drop=True)
        student_df_processed.rename(columns={student_df_processed.columns[0]: 'Предмет'}, inplace=True)

        # Ищем индекс столбца "Средняя оценка"
        try:
            last_valid_column_index = student_df_processed.columns.get_loc('Средняя оценка') + 1
            # Выбираем все столбцы до "Средняя оценка" включительно
            cleaned_student_df = student_df_processed.iloc[:, :last_valid_column_index].copy()
            student_data[student_name] = cleaned_student_df
        except KeyError:
            print(f"В данных ученика '{student_name}' не найден столбец 'Средняя оценка'.")
            student_data[student_name] = student_df_processed.copy() # Сохраняем весь DataFrame, если столбец не найден

    return student_data

In [457]:
df_8_clean = clean_df(df_8.copy())
student_dict = create_students_dict(df_8_clean, 24)
stud1 = student_dict['Ученик 1']

In [461]:
df_9_clean = clean_df(df_9.copy())
student_dict_9 = create_students_dict(df_9_clean, 20)

In [407]:
def clean_grade(grade):
    if isinstance(grade, str):
        if '/' in grade:
            try:
                parts = grade.split('/')
                return np.mean([float(x) for x in parts])
            except ValueError:
                return np.nan
        elif grade.strip().lower() in ['у', 'б', 'н']:
            return grade.strip().lower()
    try:
        return float(grade)
    except (ValueError, TypeError):
        return np.nan

def analyze_single_student(student_df):
    metrics = {}
    months_russian = ['Сентябрь', 'Октябрь', 'Ноябрь', 'Декабрь', 'Январь', 'Февраль', 'Март', 'Апрель', 'Май']

    # Identify the starting column index for each month
    month_start_indices = {}
    for i, col in enumerate(student_df.columns):
        if col in months_russian:
            month_start_indices[col] = i

    # Define the column ranges for each month
    month_column_ranges = {}
    month_keys = list(month_start_indices.keys())
    for i in range(len(month_keys)):
        month = month_keys[i]
        start_index = month_start_indices[month]
        if i + 1 < len(month_keys):
            end_index = month_start_indices[month_keys[i + 1]]
        else:
            # For the last month, go up to the 'Средняя оценка' column
            if 'Средняя оценка' in student_df.columns:
                end_index = student_df.columns.get_loc('Средняя оценка')
            else:
                end_index = len(student_df.columns)
        month_column_ranges[month] = list(range(start_index, end_index))

    # Collect grades by month
    monthly_grades = {month: [] for month in months_russian}
    non_numeric_monthly = {month: [] for month in months_russian}

    for month, col_indices in month_column_ranges.items():
        month_grade_cols = [student_df.columns[i] for i in col_indices if i < len(student_df.columns)]
        for col in month_grade_cols:
            grades = student_df[col].apply(clean_grade).dropna()
            numeric_grades = pd.to_numeric(grades, errors='coerce').dropna()
            if not numeric_grades.empty:
                monthly_grades[month].extend(numeric_grades.tolist())
            non_numeric = grades[~pd.to_numeric(grades, errors='coerce').notna()]
            if not non_numeric.empty:
                non_numeric_monthly[month].extend(non_numeric.tolist())

    # Расчет среднего балла за месяц
    for month, grades in monthly_grades.items():
        if grades:
            metrics[f'Средний балл за {month}'] = np.mean(grades)
        else:
            metrics[f'Средний балл за {month}'] = np.nan

    # Расчет среднего балла за 3 месяца
    month_per_three = [['Сентябрь', 'Октябрь', 'Ноябрь'], ['Декабрь', 'Январь', 'Февраль'], ['Март', 'Апрель', 'Май']]
    for three_elem in month_per_three:
        m1, m2, m3 = three_elem
        avg1 = metrics.get(f'Средний балл за {m1}')
        avg2 = metrics.get(f'Средний балл за {m2}')
        avg3 = metrics.get(f'Средний балл за {m3}')
        valid_avgs = [avg for avg in [avg1, avg2, avg3] if pd.notna(avg)]
        if valid_avgs:
            metrics[f'Средний балл за 3 месяца ({m1}-{m2}-{m3})'] = np.mean(valid_avgs)
        else:
            metrics[f'Средний балл за 3 месяца ({m1}-{m2}-{m3})'] = np.nan

    # Оценки и статусы за весь год
    all_numeric_grades_year = get_grades_for_months(monthly_grades, months_russian)
    all_non_numeric_year = get_statuses_for_months(non_numeric_monthly, months_russian)

    year_grade_counts = calculate_grade_counts(all_numeric_grades_year)
    for key, value in year_grade_counts.items():
        metrics[f'Общее {key} за год'] = value

    year_status_counts = calculate_status_counts(all_non_numeric_year)
    for key, value in year_status_counts.items():
        metrics[f'Общее {key} за год'] = value

     # Оценки и статусы за полугодия
    first_half_months = ['Сентябрь', 'Октябрь', 'Ноябрь', 'Декабрь']
    second_half_months = ['Январь', 'Февраль', 'Март', 'Апрель', 'Май']

    # 1 полугодие
    grades_1_half = get_grades_for_months(monthly_grades, first_half_months)
    statuses_1_half = get_statuses_for_months(non_numeric_monthly, first_half_months)

    grade_counts_1_half = calculate_grade_counts(grades_1_half)
    for key, value in grade_counts_1_half.items():
        metrics[f'Общее {key} за 1 полугодие'] = value
        if len(student_df) > 0:
            metrics[f'Среднее {key} за 1 полугодие (на предмет)'] = value / len(student_df)
        else:
            metrics[f'Среднее {key} за 1 полугодие (на предмет)'] = 0

    status_counts_1_half = calculate_status_counts(statuses_1_half)
    for key, value in status_counts_1_half.items():
        metrics[f'Общее {key} за 1 полугодие'] = value
        if len(student_df) > 0:
            metrics[f'Среднее {key} за 1 полугодие (на предмет)'] = value / len(student_df)
        else:
            metrics[f'Среднее {key} за 1 полугодие (на предмет)'] = 0

    # 2 полугодие
    grades_2_half = get_grades_for_months(monthly_grades, second_half_months)
    statuses_2_half = get_statuses_for_months(non_numeric_monthly, second_half_months)

    grade_counts_2_half = calculate_grade_counts(grades_2_half)
    for key, value in grade_counts_2_half.items():
        metrics[f'Общее {key} за 2 полугодие'] = value
        if len(student_df) > 0:
            metrics[f'Среднее {key} за 2 полугодие (на предмет)'] = value / len(student_df)
        else:
            metrics[f'Среднее {key} за 2 полугодие (на предмет)'] = 0

    status_counts_2_half = calculate_status_counts(statuses_2_half)
    for key, value in status_counts_2_half.items():
        metrics[f'Общее {key} за 2 полугодие'] = value
        if len(student_df) > 0:
            metrics[f'Среднее {key} за 2 полугодие (на предмет)'] = value / len(student_df)
        else:
            metrics[f'Среднее {key} за 2 полугодие (на предмет)'] = 0

    # Расчет среднего количества 5, 4, 3, 2, У, Б, Н в месяц
    num_months_with_grades = len([month for month in months_russian if month in monthly_grades and monthly_grades[month]])
    if num_months_with_grades > 0:
        for grade_value in [5.0, 4.0, 3.0, 2.0]:
            total_count = all_numeric_grades_year.count(grade_value)
            metrics[f'Среднее кол-во {int(grade_value)} в месяц'] = total_count / num_months_with_grades
    else:
        for grade_value in [5.0, 4.0, 3.0, 2.0]:
            metrics[f'Среднее кол-во {int(grade_value)} в месяц'] = np.nan

    num_months_with_status = len([month for month in months_russian if month in non_numeric_monthly and non_numeric_monthly[month]])
    if num_months_with_status > 0:
        for status in ['у', 'б', 'н']:
            total_count = all_non_numeric_year.count(status)
            metrics[f'Среднее кол-во {status.upper()} в месяц'] = total_count / num_months_with_status
    else:
        for status in ['у', 'б', 'н']:
            metrics[f'Среднее кол-во {status.upper()} в месяц'] = np.nan

    # Определение "Успешный" (нет троек за год)
    all_grades_numeric = []
    for month in monthly_grades:
        all_grades_numeric.extend([g for g in monthly_grades[month] if pd.notna(g)])

    if 3.0 in all_grades_numeric:
        metrics['Успешный(нет троек за год)'] = 'Нет'
    else:
        metrics['Успешный(нет троек за год)'] = 'Да'

    return metrics

# Предполагается, что у тебя уже есть функция create_students_dict,
# которая создает словарь student_dict

# Пример использования:
# metrics_stud1 = analyze_single_student(stud1)
# print(metrics_stud1)

# Чтобы применить ко всем ученикам:
# all_students_metrics = []
# for student_name, student_df in student_dict.items():
#     metrics = analyze_single_student(student_df)
#     metrics['Ученик'] = student_name
#     all_students_metrics.append(metrics)

# final_metrics_df = pd.DataFrame(all_students_metrics)
# final_metrics_df

In [467]:
class StudentAnalyzer:
    def __init__(self, student_df):
        self.student_df = student_df
        self.months = ['Сентябрь', 'Октябрь', 'Ноябрь', 'Декабрь', 'Январь', 'Февраль', 'Март', 'Апрель', 'Май']
        self.monthly_grades = {month: [] for month in self.months}
        self.non_numeric_monthly = {month: [] for month in self.months}
        self.metrics = {}
        self._extract_month_data()

    @staticmethod
    def clean_grade(grade):
        if isinstance(grade, str):
            if '/' in grade:
                try:
                    return np.mean([float(x) for x in grade.split('/')])
                except ValueError:
                    return np.nan
            elif grade.strip().lower() in ['у', 'б', 'н']:
                return grade.strip().lower()
        try:
            return float(grade)
        except (ValueError, TypeError):
            return np.nan

    @staticmethod
    def calculate_grade_counts(grades_list):
        return {f'кол-во {int(g)}': grades_list.count(g) for g in [5.0, 4.0, 3.0, 2.0]}

    @staticmethod
    def calculate_status_counts(statuses_list):
        return {f'кол-во {s.upper()}': statuses_list.count(s) for s in ['у', 'б', 'н']}

    def _extract_month_data(self):
        month_start_indices = {col: i for i, col in enumerate(self.student_df.columns) if col in self.months}
        month_keys = list(month_start_indices.keys())

        month_column_ranges = {}
        for i, month in enumerate(month_keys):
            start = month_start_indices[month]
            if i + 1 < len(month_keys):
                end = month_start_indices[month_keys[i + 1]]
            elif 'Средняя оценка' in self.student_df.columns:
                end = self.student_df.columns.get_loc('Средняя оценка')
            else:
                end = len(self.student_df.columns)
            month_column_ranges[month] = list(range(start, end))

        for month, indices in month_column_ranges.items():
            for col in [self.student_df.columns[i] for i in indices]:
                cleaned = self.student_df[col].apply(self.clean_grade).dropna()
                numeric = pd.to_numeric(cleaned, errors='coerce').dropna()
                if not numeric.empty:
                    self.monthly_grades[month].extend(numeric.tolist())
                non_numeric = cleaned[~pd.to_numeric(cleaned, errors='coerce').notna()]
                if not non_numeric.empty:
                    self.non_numeric_monthly[month].extend(non_numeric.tolist())

    def analyze(self):
        self._calculate_monthly_averages()
        self._calculate_three_month_averages()
        self._calculate_year_and_semesters_stats()
        self._calculate_monthly_averages_counts()
        self._determine_success()
        return self.metrics

    def _calculate_monthly_averages(self):
        for month in self.months:
            grades = self.monthly_grades[month]
            self.metrics[f'Средний балл за {month}'] = np.mean(grades) if grades else np.nan

    def _calculate_three_month_averages(self):
        blocks = [['Сентябрь', 'Октябрь', 'Ноябрь'], ['Декабрь', 'Январь', 'Февраль'], ['Март', 'Апрель', 'Май']]
        for block in blocks:
            avgs = [self.metrics[f'Средний балл за {m}'] for m in block if pd.notna(self.metrics[f'Средний балл за {m}'])]
            self.metrics[f'Средний балл за 3 месяца ({block[0]}-{block[1]}-{block[2]})'] = np.mean(avgs) if avgs else np.nan

    def _calculate_year_and_semesters_stats(self):
        all_grades = self._get_combined_grades(self.months)
        all_statuses = self._get_combined_statuses(self.months)

        for key, val in self.calculate_grade_counts(all_grades).items():
            self.metrics[f'Общее {key} за год'] = val
        for key, val in self.calculate_status_counts(all_statuses).items():
            self.metrics[f'Общее {key} за год'] = val

        self._semester_stats('1 полугодие', ['Сентябрь', 'Октябрь', 'Ноябрь', 'Декабрь'])
        self._semester_stats('2 полугодие', ['Январь', 'Февраль', 'Март', 'Апрель', 'Май'])

    def _semester_stats(self, label, months):
        grades = self._get_combined_grades(months)
        statuses = self._get_combined_statuses(months)
        row_count = len(self.student_df)

        for key, val in self.calculate_grade_counts(grades).items():
            self.metrics[f'Общее {key} за {label}'] = val
            self.metrics[f'Среднее {key} за {label} (на предмет)'] = val / row_count if row_count > 0 else 0
        for key, val in self.calculate_status_counts(statuses).items():
            self.metrics[f'Общее {key} за {label}'] = val
            self.metrics[f'Среднее {key} за {label} (на предмет)'] = val / row_count if row_count > 0 else 0

    def _calculate_monthly_averages_counts(self):
        valid_months_grades = [m for m in self.months if self.monthly_grades[m]]
        valid_months_statuses = [m for m in self.months if self.non_numeric_monthly[m]]

        for grade in [5.0, 4.0, 3.0, 2.0]:
            total = sum([self.monthly_grades[m].count(grade) for m in valid_months_grades])
            self.metrics[f'Среднее кол-во {int(grade)} в месяц'] = total / len(valid_months_grades) if valid_months_grades else np.nan

        for status in ['у', 'б', 'н']:
            total = sum([self.non_numeric_monthly[m].count(status) for m in valid_months_statuses])
            self.metrics[f'Среднее кол-во {status.upper()} в месяц'] = total / len(valid_months_statuses) if valid_months_statuses else np.nan

    def _determine_success(self):
        """
        Успешный студент — если по каждому предмету (строке) средний балл >= 3.5
        """
        all_columns = []
        for month in self.months:
            all_columns.extend([col for col in self.student_df.columns if col.startswith(month)])
        
        for _, row in self.student_df.iterrows():
            grades = []
            for col in all_columns:
                if col in row:
                    val = clean_grade(row[col])
                    if isinstance(val, float) and pd.notna(val):
                        grades.append(val)
            if grades:
                avg = np.mean(grades)
                if avg < 3.5:
                    self.metrics['Успешный (нет предмета со ср. баллом < 3.5)'] = False
                    return
        self.metrics['Успешный (нет предмета со ср. баллом < 3.5)'] = True

    def _get_combined_grades(self, months):
        grades = []
        for m in months:
            grades.extend(self.monthly_grades[m])
        return [g for g in grades if pd.notna(g)]

    def _get_combined_statuses(self, months):
        statuses = []
        for m in months:
            statuses.extend(self.non_numeric_monthly[m])
        return statuses


In [473]:
# Предполагается, что у тебя уже есть функция create_students_dict,
# которая создает словарь student_dict

# Пример использования:
# metrics_stud1 = analyze_single_student(stud1)
# print(metrics_stud1)

# Чтобы применить ко всем ученикам:
all_students_metrics = []
for student_name, student_df in student_dict.items():
    analyzer = StudentAnalyzer(student_df)
    metrics = analyzer.analyze()
    metrics['Ученик'] = student_name
    all_students_metrics.append(metrics)

final_metrics_df_8 = pd.DataFrame(all_students_metrics)

column_list = final_metrics_df_8.columns.tolist()
last_column = column_list[-1]
other_columns = column_list[:-1]
new_column_order = [last_column] + other_columns

final_metrics_df_8 = final_metrics_df_8[new_column_order]
final_metrics_df_8

Unnamed: 0,Ученик,Средний балл за Сентябрь,Средний балл за Октябрь,Средний балл за Ноябрь,Средний балл за Декабрь,Средний балл за Январь,Средний балл за Февраль,Средний балл за Март,Средний балл за Апрель,Средний балл за Май,...,Общее кол-во Н за 2 полугодие,Среднее кол-во Н за 2 полугодие (на предмет),Среднее кол-во 5 в месяц,Среднее кол-во 4 в месяц,Среднее кол-во 3 в месяц,Среднее кол-во 2 в месяц,Среднее кол-во У в месяц,Среднее кол-во Б в месяц,Среднее кол-во Н в месяц,Успешный (нет предмета со ср. баллом < 3.5)
0,Ученик 1,3.807018,3.6,3.852941,3.666667,3.902439,3.839286,3.8,3.83,3.86,...,21,1.0,10.444444,12.111111,14.333333,2.0,2.111111,20.333333,2.555556,False
1,Ученик 2,3.382979,3.212121,3.483871,3.316667,3.342857,3.3,3.15,3.261905,3.304878,...,25,1.190476,4.222222,6.555556,22.333333,4.0,4.888889,13.777778,2.888889,False
2,Ученик выбывший,3.342105,3.378049,3.289474,3.370968,3.294118,3.53125,3.711538,3.387097,3.0,...,25,1.190476,3.888889,6.777778,11.555556,4.111111,37.875,7.75,3.125,False
3,Ученик 3,2.965517,2.972222,3.085366,3.166667,3.15,3.048077,3.089744,3.108696,3.317073,...,8,0.380952,4.111111,5.555556,26.444444,10.0,3.25,7.25,1.125,False
4,Ученица 4,3.842593,3.702703,3.646341,3.576923,3.566667,3.518182,3.75,3.525,4.015152,...,8,0.380952,10.111111,11.111111,16.555556,3.555556,11.5,3.375,1.0,False
5,Ученик 5,3.298246,3.076923,3.160377,3.35,3.222222,3.163636,3.104167,3.238806,3.4,...,12,0.571429,4.222222,7.666667,23.333333,6.888889,11.5,8.125,1.5,False
6,Ученица 6,4.068966,4.093023,4.088235,4.056818,4.076923,3.845455,3.926471,3.913043,3.934211,...,4,0.190476,15.333333,16.0,10.666667,2.333333,3.6,5.6,0.8,False
7,Ученик 7,3.354839,3.170732,3.56,3.548387,3.512195,3.486111,3.103448,3.5625,3.569444,...,11,0.52381,6.444444,9.0,20.111111,4.555556,5.875,9.125,1.5,False
8,Ученица 8,3.818182,3.686047,3.75,3.642857,3.65,3.310811,3.446429,3.6,3.533333,...,43,2.047619,6.555556,9.666667,13.0,3.111111,14.888889,14.444444,6.888889,False
9,Ученик 9,3.862069,3.701923,3.974576,3.914286,3.731707,3.754545,3.65625,4.078125,4.305556,...,2,0.095238,16.333333,13.666667,13.111111,4.111111,11.142857,0.0,0.285714,False


In [475]:
final_metrics_df_8.to_csv('8A_для_кластеризации.csv',index=False, encoding="utf-8-sig")

In [477]:
all_students_metrics = []
for student_name, student_df in student_dict_9.items():
    analyzer = StudentAnalyzer(student_df)
    metrics = analyzer.analyze()
    metrics['Ученик'] = student_name
    all_students_metrics.append(metrics)

final_metrics_df_9 = pd.DataFrame(all_students_metrics)

column_list = final_metrics_df_9.columns.tolist()
last_column = column_list[-1]
other_columns = column_list[:-1]
new_column_order = [last_column] + other_columns

final_metrics_df_9 = final_metrics_df_9[new_column_order]
final_metrics_df_9

Unnamed: 0,Ученик,Средний балл за Сентябрь,Средний балл за Октябрь,Средний балл за Ноябрь,Средний балл за Декабрь,Средний балл за Январь,Средний балл за Февраль,Средний балл за Март,Средний балл за Апрель,Средний балл за Май,...,Общее кол-во Н за 2 полугодие,Среднее кол-во Н за 2 полугодие (на предмет),Среднее кол-во 5 в месяц,Среднее кол-во 4 в месяц,Среднее кол-во 3 в месяц,Среднее кол-во 2 в месяц,Среднее кол-во У в месяц,Среднее кол-во Б в месяц,Среднее кол-во Н в месяц,Успешный (нет предмета со ср. баллом < 3.5)
0,Ученик 1,3.734694,3.434211,3.283784,3.573529,3.586207,3.527778,3.921053,3.607143,,...,0,0.0,5.25,9.125,11.125,3.5,10.625,19.125,0.375,False
1,Ученик 2,3.153846,3.1875,3.04902,3.0,3.052632,3.148148,3.397059,2.894737,,...,0,0.0,2.375,5.5,17.75,6.75,8.125,25.0,1.375,False
2,Ученик 3,2.95614,2.953704,3.033333,3.0625,2.892857,3.009804,3.069444,2.704545,,...,0,0.0,3.25,5.125,22.375,13.375,5.666667,0.333333,0.0,False
3,Ученица 4,3.819149,3.862745,3.829787,3.731707,3.628571,3.625,3.290323,2.833333,,...,0,0.0,7.625,14.0,10.25,4.625,15.2,0.4,0.0,False
4,Ученик 5,3.317073,3.201923,3.050847,3.229167,2.906977,3.009434,3.125,2.833333,,...,0,0.0,3.25,7.375,21.875,9.375,2.0,5.5,2.5,False
5,Ученица 6,4.428571,4.447917,4.076271,4.204545,4.345238,3.98913,3.878378,4.090909,,...,0,0.0,18.75,15.875,6.75,1.5,0.333333,0.0,0.666667,True
6,Ученик 7,3.72549,3.574074,3.542553,3.731707,3.66129,3.397436,3.5625,3.575,,...,0,0.0,6.25,14.25,13.75,3.875,5.4,0.0,0.2,False
7,Ученица 8,3.702381,3.485714,3.630952,3.551724,3.560976,3.5,3.87037,3.178571,,...,0,0.0,7.125,8.625,10.625,4.625,12.5,13.625,5.625,False
8,Ученик 9,4.196429,4.076923,3.93,4.09375,4.292683,4.011628,4.22619,3.675,,...,1,0.058824,19.25,12.625,7.75,3.5,15.333333,1.0,0.333333,False
9,Ученица 10,4.06383,4.12766,4.117647,4.021739,3.822581,4.119048,3.472222,3.692308,,...,0,0.0,11.5,12.875,7.125,2.125,15.75,5.125,0.25,False


In [479]:
final_metrics_df_9.to_csv('9A_для_кластеризации.csv',index=False, encoding="utf-8-sig")