# Количество стратегий, встречающихся в предложениях заданного типа
Печатает, сколько и каких стратегий встречается в предложениях заданного семантического типа. Можно забивать как один семантический тип, так и несколько (если вводится несколько семантических типов, нужно разделять их запятой).

Пример ввода одного семантического типа: УсК - негенерализованное

Пример ввода нескольких семантических типов: УсК - негенерализованное, ограничительное УсК

Внимание: Прописывайте все заглавные буквы, необходимо написать каждый семантический тип **в точно таком же** формате, в каком он написан в таблице в столбце "Семантические типы по Храковскому" в файле с данными.

In [None]:
import pandas as pd

def filter_and_count_strategies(sheet_path, sheet_name, semantic_type_query):
    # Читаем данные с указанного листа Excel
    df = pd.read_excel(sheet_path, sheet_name=sheet_name)

    # Разделяем семантические типы по запятой и убираем лишние пробелы
    semantic_types = [stype.strip() for stype in semantic_type_query.split(",")]

    # Фильтруем строки, где семантический тип содержит хотя бы один из запросов пользователя
    filtered_df = df[df['Семантические типы по Храковскому'].str.contains('|'.join(semantic_types), na=False)]

    # Словарь для подсчёта стратегий
    strategies_count = {}
    # Словарь для подсчёта starred-стратегий
    starred_count = {}

    # Обрабатываем все столбцы со стратегиями
    for col in df.columns:
        if col.startswith("Стратегии"):
            for value in filtered_df[col].dropna():
                if isinstance(value, str):  # Проверяем, что значение является строкой
                    strategies = value.split("\n")  # Разделяем стратегии, если они идут через перенос строки
                    for strategy in strategies:
                        strategy = strategy.strip()  # Убираем лишние пробелы и символы новой строки
                        if strategy:  # Игнорируем пустые строки
                            if strategy.startswith("*"):
                                starred_count[strategy] = starred_count.get(strategy, 0) + 1
                            else:
                                strategies_count[strategy] = strategies_count.get(strategy, 0) + 1

    # Сортируем стратегии по убыванию частоты
    sorted_strategies = sorted(strategies_count.items(), key=lambda x: x[1], reverse=True)

    # Формируем основную часть результата
    result = [f"{strategy} ({count})" for strategy, count in sorted_strategies]

    # Добавляем две пустые строки перед starred-стратегиями
    result.append("")  # пустая строка
    result.extend([f"{strategy} ({count})" for strategy, count in starred_count.items()])

    return result

# Путь к файлу и название листа
sheet_path = "путь_к_файлу.xlsx"  # путь к файлу XLSX
sheet_name = "Стратегии респондентов"  # название листа

# Ввод пользователя
semantic_type_query = input("Введите семантический тип(ы) по Храковскому (разделяйте запятыми): ")

# Получение и вывод результата
result = filter_and_count_strategies(sheet_path, sheet_name, semantic_type_query)
print("\n".join(result))

# Количество стратегий с вспомогательными словами, встречающимися в предложениях заданного типа

In [None]:
import pandas as pd

def filter_and_count_strategies(sheet_path, sheet_name, semantic_type_query):
    # Читаем данные с указанного листа Excel
    df = pd.read_excel(sheet_path, sheet_name=sheet_name)

    # Разделяем семантические типы по запятой и убираем лишние пробелы
    semantic_types = [stype.strip() for stype in semantic_type_query.split(",")]

    # Фильтруем строки, где семантический тип содержит хотя бы один из запросов пользователя
    filtered_df = df[df['Семантические типы по Храковскому'].str.contains('|'.join(semantic_types), na=False)]

    # Словарь для подсчёта стратегий
    strategies_count = {}
    # Словарь для подсчёта starred-стратегий
    starred_count = {}

    # Обрабатываем все столбцы со стратегиями
    for col in df.columns:
        if col.startswith("Стратегии"):
            for value in filtered_df[col].dropna():
                if isinstance(value, str):  # Проверяем, что значение является строкой
                    strategies = value.split("\n")  # Разделяем стратегии, если они идут через перенос строки
                    for strategy in strategies:
                        strategy = strategy.strip()  # Убираем лишние пробелы и символы новой строки
                        if strategy:  # Игнорируем пустые строки
                            if strategy.startswith("*"):
                                starred_count[strategy] = starred_count.get(strategy, 0) + 1
                            else:
                                strategies_count[strategy] = strategies_count.get(strategy, 0) + 1

    # Сортируем стратегии по убыванию частоты
    sorted_strategies = sorted(strategies_count.items(), key=lambda x: x[1], reverse=True)

    # Формируем основную часть результата
    result = [f"{strategy} ({count})" for strategy, count in sorted_strategies]

    # Добавляем две пустые строки перед starred-стратегиями
    result.append("")  # пустая строка
    result.extend([f"{strategy} ({count})" for strategy, count in starred_count.items()])

    return result

# Путь к файлу и название листа
sheet_path = "путь_к_файлу.xlsx"  # путь к файлу XLSX
sheet_name = "Стратегии респондентов c доп. с"  # название листа

# Ввод пользователя
semantic_type_query = input("Введите семантический тип(ы) по Храковскому (разделяйте запятыми): ")

# Получение и вывод результата
result = filter_and_count_strategies(sheet_path, sheet_name, semantic_type_query)
print("\n".join(result))

# Семантические типы предложений, в которых встречается введённая стратегия выражения УСК

Можно забивать только одну стратегию, на вход могут подаваться как стратегии со звездочкой (запрещенные), так и стратегии без звездочки (разрешенные). Стратегию нужно забивать именно в том виде, в каком она встречается в столбце "Стратегии..." на листе "Стратегии респондентов" таблицы с данными.

In [None]:
import pandas as pd
from collections import defaultdict

def find_strategies(file_path, sheet_name, strategies_input):
    # Загружаем таблицу
    df = pd.read_excel(file_path, sheet_name=sheet_name, header=0)

    # Преобразуем стратегии из ввода в список
    strategies = [s.strip() for s in strategies_input.split(",")]

    # Словарь: {тип предложения: количество}
    result = defaultdict(int)

    for _, row in df.iterrows():
        sem_type = row["Семантические типы по Храковскому"]

        for col in row.index:
            if col.startswith("Стратегии"):
                cell = row[col]
                if pd.isna(cell):
                    continue

                # Разделяем стратегии по строкам
                strategies_in_cell = [s.strip() for s in str(cell).split("\n")]

                # Считаем точные совпадения
                for strategy in strategies:
                    if strategy in strategies_in_cell:
                        result[sem_type] += 1

    # Выводим в нужном формате
    for sem_type, count in sorted(result.items(), key=lambda x: -x[1]):
        print(f"{sem_type} ({count})")

# Параметры
file_path = "/content/drive/MyDrive/Экспедиция/Элицитация (размеченная) (1).xlsx"
sheet_name = "Стратегии респондентов"
strategies_input = input("Введите стратегию: ")

find_strategies(file_path, sheet_name, strategies_input)

# Носители, употребившие ту или иную стратегию
Можно забивать только одну стратегию, на вход могут подаваться как стратегии со звездочкой (запрещенные), так и стратегии без звездочки (разрешенные).

In [None]:
from openpyxl import load_workbook

# Загрузка Excel-файла
filename = "/content/drive/MyDrive/Экспедиция/Элицитация (размеченная) (1).xlsx"  # Укажи нужное имя
wb = load_workbook(filename)
sheet = wb["Стратегии респондентов"]

# Ввод стратегии для поиска
target_strategy = input("Введите точную стратегию (с * если нужно): ").strip()

matching_respondents = []

# Первая строка — заголовки с именами респондентов
header = [cell.value for cell in sheet[1]]

# Перебираем каждый столбец с респондентом
for col_idx, name in enumerate(header):
    if name is None:
        continue

    # Проверяем ячейки в столбце (начиная со второй строки)
    for row_idx in range(2, sheet.max_row + 1):
        cell = sheet.cell(row=row_idx, column=col_idx + 1).value
        if cell is None:
            continue

        # Разделяем ячейку на отдельные стратегии
        strategies_in_cell = [s.strip() for s in str(cell).split("\n")]

        # Если нужная стратегия найдена точно
        if target_strategy in strategies_in_cell:
            matching_respondents.append(name)
            break  # Можно выходить: нашли у этого респондента, идём к следующему

# Вывод результатов
if matching_respondents:
    print("Респонденты, использующие стратегию:", target_strategy)
    for r in matching_respondents:
        print("-", r)
else:
    print("Ни один респондент не использует стратегию:", target_strategy)
