In [53]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

In [54]:
# Загружаем данные из CSV-файла
data = pd.read_csv('data.csv')

In [55]:
# Добавил игнорирование первого столбца, так как в нем хранится время прохождения опроса, которое не надо анализировать
data = data.iloc[:, 1:]

In [56]:
# Функция для анализа вопросов с одним вариантом ответа
def analyze_single_choice(responses, title):
    # Подсчитываем частоту каждого ответа
    counts = responses.value_counts()
    print(f"\nАнализ вопроса: {title}")
    print(counts)

    # Визуализация
    plt.figure(figsize=(8, 6))
    sns.barplot(x=counts.values, y=counts.index, palette='viridis')
    plt.title(title)
    plt.xlabel('Количество ответов')
    plt.ylabel('Варианты ответов')
    plt.show()

In [57]:
# Функция для анализа вопросов с множественным выбором
def analyze_multiple_choice(responses, title):
    # Разделяем ответы по точке с запятой и создаем список всех ответов
    all_responses = responses.dropna().str.split(';').explode()
    
    # Подсчитываем частоту каждого ответа
    counts = all_responses.value_counts()
    print(f"\nАнализ вопроса: {title}")
    print(counts)

    # Визуализация
    plt.figure(figsize=(8, 6))
    sns.barplot(x=counts.values, y=counts.index, palette='viridis')
    plt.title(title)
    plt.xlabel('Количество ответов')
    plt.ylabel('Варианты ответов')
    plt.show()

In [58]:
# Функция для анализа вопросов с шкалой
def analyze_scale_question(responses, title):
    mean_value = responses.mean()
    distribution = responses.value_counts().sort_index()
    print(f"\nАнализ вопроса: {title}")
    print(f"Среднее значение: {mean_value:.2f}")
    print(distribution)

    plt.figure(figsize=(8, 6))
    sns.countplot(x=responses, palette='coolwarm', order=sorted(responses.unique()))
    plt.title(title)
    plt.xlabel('Оценка')
    plt.ylabel('Количество ответов')
    plt.show()


In [59]:
# Функция для автоматического анализа всех вопросов
def analyze_all_questions(data):
    for column in data.columns:
        print(f"\n=== Анализ вопроса: {column} ===")
        
        # Определяем тип вопроса
        if data[column].dtype == 'object':  # Если данные текстовые
            # Проверяем, есть ли разделители (точка с запятой) для множественного выбора
            if data[column].dropna().str.contains(';').any():
                analyze_multiple_choice(data[column], column)
            else:
                # Если текстовые данные без разделителей, считаем это вопросом с одним вариантом ответа
                analyze_single_choice(data[column], column)
        elif pd.api.types.is_numeric_dtype(data[column]):  # Если данные числовые
            analyze_scale_question(data[column], column)
        else:
            print("Неизвестный тип данных для анализа.")

In [None]:
# Запускаем автоматический анализ
analyze_all_questions(data)