In [7]:
import pandas as pd

# Загрузка данных
df = pd.read_csv('data.csv')

# Функция для расчета средних значений по выбранным категориям и метрикам
def compute_selected_means(direction):
    # Фильтрация данных по направлению и категориям "Журналистика" и "Научный"
    filtered_df = df[(df['Направление перевода'] == direction) & 
                     (df['Категория'].isin(['Журналистика', 'Научный']))]

    # Вычисление средних значений для BLEU, ROUGE-1 и METEOR
    bleu_mean = filtered_df['BLEU'].mean()
    rouge_1_mean = filtered_df['ROUGE-1'].mean()
    meteor_mean = filtered_df['METEOR'].mean()

    print(f"\nСредние значения для категорий 'Журналистика' и 'Научный' ({direction}):")
    print(f"BLEU: {bleu_mean}")
    print(f"ROUGE-1: {rouge_1_mean}")
    print(f"METEOR: {meteor_mean}")

# Средние значения для EN-RU
compute_selected_means('EN-RU')

# Средние значения для RU-EN
compute_selected_means('RU-EN')



Средние значения для категорий 'Журналистика' и 'Научный' (EN-RU):
BLEU: 0.20942325257268707
ROUGE-1: 0.3981428984095682
METEOR: 0.39476301021081694

Средние значения для категорий 'Журналистика' и 'Научный' (RU-EN):
BLEU: 0.19272781253033744
ROUGE-1: 0.41394123965582236
METEOR: 0.41474240767188597


En-Ru Technic Metric. Техническая метрика с английского на русский:

In [8]:
# Среднее арифметическое метрик оценки качества перевода технических текстов 
er_bleu_score = 0.20942325257268707
er_rouge1_score = 0.3981428984095682
er_meteor_score = 0.39476301021081694


# Функция для вычисления взвешенной метрики на основе предоставленных BLEU, METEOR и ROUGE-1
def calculate_weighted_metric(er_bleu, er_meteor, er_rouge1):
    # Вычисление суммы всех метрик
    er_k = er_bleu + er_meteor + er_rouge1

    # Вычисление весов для каждой метрики
    er_w_bleu = er_bleu / er_k
    er_w_rouge1 = er_rouge1 / er_k
    er_w_meteor = er_meteor / er_k
   

    # Вычисление суммы весов (должно быть 1)
    er_total_weight = er_w_bleu + er_w_meteor + er_w_rouge1

    # Вычисление новой технической метрики с весами
    er_tech = er_w_bleu * er_bleu + er_w_meteor * er_meteor + er_w_rouge1 * er_rouge1

    return er_w_bleu, er_w_meteor, er_w_rouge1, er_total_weight, er_tech



# Вызов функции для вычисления весов и взвешенной метрики
er_w_bleu, er_w_meteor, er_w_rouge1, er_total_weight, er_tech = calculate_weighted_metric(er_bleu_score, er_meteor_score, er_rouge1_score)

print("En-Ru веса для метрики BLEU", er_w_bleu)
print("En-Ru веса для метрики ROGUE:", er_w_rouge1)
print("En-Ru веса для метрики METEOR:", er_w_meteor)
print("En-Ru сумма всех весов:", er_total_weight)
print("En-Ru техническая метрика:", er_tech)


En-Ru веса для метрики BLEU 0.2089366055392528
En-Ru веса для метрики ROGUE: 0.3972177143241635
En-Ru веса для метрики METEOR: 0.39384568013658366
En-Ru сумма всех весов: 1.0
En-Ru техническая метрика: 0.35738130184341743


Ru-En Technic Metric. Техническая метрика с русского на английский:

In [9]:
# Среднее арифметическое метрик оценки качества перевода технических текстов 
re_bleu_score = 0.19272781253033744
re_rouge1_score = 0.41394123965582236
re_meteor_score = 0.41474240767188597


# Функция для вычисления взвешенной метрики на основе предоставленных BLEU, METEOR и ROUGE-1
def calculate_weighted_metric(re_bleu, re_meteor, re_rouge1):
    # Вычисление суммы всех метрик
    re_k = re_bleu + re_meteor + re_rouge1

    # Вычисление весов для каждой метрики
    re_w_bleu = re_bleu / re_k
    re_w_rouge1 = re_rouge1 / re_k
    re_w_meteor = re_meteor / re_k
   

    # Вычисление суммы весов (должно быть 1)
    re_total_weight = re_w_bleu + re_w_meteor + re_w_rouge1

    # Вычисление новой технической метрики с весами
    re_tech = re_w_bleu * re_bleu + re_w_meteor * re_meteor + re_w_rouge1 * re_rouge1

    return re_w_bleu, re_w_meteor, re_w_rouge1, re_total_weight, re_tech



# Вызов функции для вычисления весов и взвешенной метрики
re_w_bleu, re_w_meteor, re_w_rouge1, re_total_weight, re_tech = calculate_weighted_metric(re_bleu_score, re_meteor_score, re_rouge1_score)

print("Ru-En веса для метрики BLEU", re_w_bleu)
print("Ru-En веса для метрики ROGUE:", re_w_rouge1)
print("Ru-En веса для метрики METEOR:", re_w_meteor)
print("Ru-En сумма всех весов:", re_total_weight)
print("Ru-En техническая метрика:", re_tech)

Ru-En веса для метрики BLEU 0.1886877327155919
Ru-En веса для метрики ROGUE: 0.4052639469243387
Ru-En веса для метрики METEOR: 0.40604832036006944
Ru-En сумма всех весов: 1.0
Ru-En техническая метрика: 0.3725262925725177


Technic Metric Weights. Среднее арифметическое весов технической метрики.

In [10]:
tech_bleu = (er_w_bleu + re_w_bleu) / 2
tech_rouge = (er_w_rouge1 + re_w_rouge1) / 2
tech_meteor = (er_w_meteor + re_w_meteor) / 2
tech_total_weight = (er_total_weight+ re_total_weight) / 2
tech_average = (er_tech + re_tech) / 2

print("Ru-En веса для метрики BLEU", tech_bleu)
print("Ru-En веса для метрики ROGUE:", tech_rouge)
print("Ru-En веса для метрики METEOR:", tech_meteor)
print("Ru-En сумма всех весов:", tech_total_weight)
print("Ru-En художественная метрика:", tech_average)

Ru-En веса для метрики BLEU 0.19881216912742233
Ru-En веса для метрики ROGUE: 0.4012408306242511
Ru-En веса для метрики METEOR: 0.3999470002483265
Ru-En сумма всех весов: 1.0
Ru-En художественная метрика: 0.36495379720796756


Метрика оценки качества перевода технических текстов с уникальными весами.

In [11]:
# Вычисление суммы всех метрик
k = bleu_score + sum(rouge['rouge-1']['f'] for rouge in scores) + score 

# Уникальные веса для каждой метрики оценки качества перевода технических текстов
w_bleu = 0.2
w_rouge_1 = 0.4
w_score = 0.4

# Вычисление метрики оценки качества перевода технических текстов с уникальными весами
tech_met = w_bleu * bleu_score + w_rouge_1 * sum(rouge['rouge-1']['f'] for rouge in scores) + w_score * score 

# Результаты оценки качества перевода технического текста
print("Оценка качества перевода технического текста:", tech_met)

NameError: name 'bleu_score' is not defined