1) Создать скрипт для анализа тестовых файлов - сбора статистики упоминания слов. Аргументом командной строки является имя файла, который нужно проанализировать. Второй аргумент - количество слов, которые нужно выводить на экран (если аргумент не указан, то выводим статистику по 100 словам, статистика выводится в порядке убывания частоты слов, по каждому слову на экран выводится строка в формате "<слово> <частота>"). Если второй аргумент не целое число, то его рассматриваем как имя файла, в который в формате CSV с заголовком сохраняем статистику слов (Первый столбец - слово, второй столбце - частота).

In [None]:
import sys
import collections


def analyze_file(filename, n_words=100, output_file=None):      #Анализирует тестовый файл, собирая статистику упоминания слов.
  with open(filename, 'r') as f:
    text = f.read().lower()
  words = text.split()

  # Подсчет частоты слов
  word_counts = collections.Counter(words)

  # Вывод статистики на экран
  if not output_file:
    print(f"Статистика по {n_words} самым частотным словам в файле {filename}:")
    for word, count in word_counts.most_common(n_words):
      print(f"{word} {count}")

  # Сохранение статистики в CSV-файл
  else:
    with open(output_file, 'w') as f:
      f.write("Слово,Частота\n")
      for word, count in word_counts.most_common():
        f.write(f"{word},{count}\n")

  return word_counts


if __name__ == "__main__":
  if len(sys.argv) < 2:
    print("Usage: python analyze_test_file.py <filename> [n_words|output_file]")
    sys.exit(1)

  filename = sys.argv[1]

  # Обработка второго аргумента
  if len(sys.argv) == 2:
    n_words = 100
  elif len(sys.argv) == 3:
    try:
      n_words = int(sys.argv[2])
    except ValueError:
      output_file = sys.argv[2]
  else:
    print("Usage: python analyze_test_file.py <filename> [n_words|output_file]")
    sys.exit(1)

  # Анализ файла и вывод статистики
  analyze_file(filename, n_words, output_file)


формате CSV с заголовком содержится информация о частоте слов: первый столбец - слово, второй столбце - частота. Выполнить агрегацию информации о частоте слов из всех переданных файлов (т.е. рассчитать суммарную частоту для всех упомянутых слов). Результат сохранить в файл с именем, которое введет пользователь в ответ на соответствующий запрос.
2.1) Скрипт должен адекватно реагировать на ситуацию отсутствия файлов и другие проблемы с вводом/выводом.
2.2) Оформить модуль с функциями, которые используются в задании 1 и 2.


In [None]:
import sys
import collections
from pathlib import Path


def analyze_files(filenames):
  """
  Агрегирует информацию о частоте слов из всех переданных файлов.

  Args:
    filenames: Список имен файлов.

  Returns:
    collections.Counter: Объект Counter, содержащий суммарную частоту слов.
  """
  word_counts = collections.Counter()
  for filename in filenames:
    try:
      with open(filename, 'r') as f:
        text = f.read().lower()
      words = text.split()
      word_counts.update(words)
    except FileNotFoundError:
      print(f"Файл '{filename}' не найден.")
    except IOError as e:
      print(f"Ошибка при чтении файла '{filename}': {e}")

  return word_counts


def save_results(word_counts, output_filename):
  """
  Сохраняет статистику слов в CSV-файл.

  Args:
    word_counts: collections.Counter: Объект Counter, содержащий статистику слов.
    output_filename: Имя файла, в который нужно сохранить статистику.
  """
  with open(output_filename, 'w') as f:
    f.write("Слово,Частота\n")
    for word, count in word_counts.most_common():
      f.write(f"{word},{count}\n")


def main():
  """
  Запрашивает у пользователя имена файлов, агрегирует статистику слов и сохраняет результат в CSV-файл.
  """
  filenames = []
  while True:
    filename = input("Введите имя файла (или 'q' для завершения): ")
    if filename.lower() == 'q':
      break
    filenames.append(filename)

  if not filenames:
    print("Необходимо указать хотя бы один файл.")
    return

  word_counts = analyze_files(filenames)

  output_filename = input("Введите имя файла для сохранения результатов: ")
  save_results(word_counts, output_filename)

  print(f"Статистика слов сохранена в файл '{output_filename}'.")


if __name__ == "__main__":
  main()


In [None]:
import collections


def count_words(filename):
  """
  Подсчитывает частоту слов в файле.

  Args:
    filename: Имя файла.

  Returns:
    collections.Counter: Объект Counter, содержащий статистику слов.
  """
  with open(filename, 'r') as f:
    text = f.read().lower()
  words = text.split()
  return collections.Counter(words)


def merge_counts(counts1, counts2):
  """
  Объединяет два объекта Counter.

  Args:
    counts1: collections.Counter: Первый объект Counter.
    counts2: collections.Counter: Второй объект Counter.

  Returns:
    collections.Counter: Объединенный объект Counter.
  """
  merged_counts = collections.Counter()
  for word, count in counts1.items():
    merged_counts[word] += count
  for word, count in counts2.items():
    merged_counts[word] += count
  return merged_counts


def save_results(word_counts, output_filename):
  """
  Сохраняет статистику слов в CSV-файл.

  Args:
    word_counts: collections.Counter: Объект Counter, содержащий статистику слов.
    output_filename: Имя файла, в который нужно сохранить статистику.
  """
  with open(output_filename, 'w') as f:
    f.write("Слово,Частота\n")
    for word, count in word_counts.most_common():
      f.write(f"{word},{count}\n")


3.1) Написать программу, которая запускается из консоли и считает сумму переданных в неё чисел

In [None]:
def main():
  """
  Считывает числа из командной строки и выводит их сумму.
  """
  numbers = [int(x) for x in sys.argv[1:]]
  print(f"Сумма: {sum(numbers)}")


if __name__ == "__main__":
  main()


3.2) Добавить в эту программу произведение

In [None]:
def main():
  """
  Считывает числа из командной строки и выводит их произведение.
  """
  numbers = [int(x) for x in sys.argv[1:]]
  product = 1
  for number in numbers:
    product *= number
  print(f"Произведение: {product}")


if __name__ == "__main__":
  main()


3.3) По переданному параметру считать либо сумму, либо произведение

In [None]:
def main():
  """
  Считывает числа из командной строки и выводит их сумму или произведение, в зависимости от переданного параметра.
  """
  operation = sys.argv[1]
  numbers = [int(x) for x in sys.argv[2:]]

  if operation == "sum":
    result = sum(numbers)
  elif operation == "product":
    product = 1
    for number in numbers:
      product *= number
    result = product
  else:
    print(f"Неизвестная операция: {operation}")
    return

  print(f"{operation}: {result}")


if __name__ == "__main__":
  main()


3.4) Оформить это дополнительный модуль

In [None]:
def sum_numbers(numbers):
  """
  Вычисляет сумму чисел.

  Args:
    numbers: Список чисел.

  Returns:
    int: Сумма чисел.
  """
  return sum(numbers)


def product_numbers(numbers):
  """
  Вычисляет произведение чисел.

  Args:
    numbers: Список чисел.

  Returns:
    int: Произведение чисел.
  """
  product = 1
  for number in numbers:
    product *= number
  return product


def main(operation, numbers):
  """
  Вычисляет сумму или произведение чисел, в зависимости от переданного параметра.

  Args:
    operation: str: "sum" или "product".
    numbers: Список чисел.

  Returns:
    int: Сумма или произведение чисел.
  """
  if operation == "sum":
    return sum_numbers(numbers)
  elif operation == "product":
    return product_numbers(numbers)
  else:
    raise ValueError(f"Неизвестная операция: {operation}")


if __name__ == "__main__":
  operation = sys.argv[1]
  numbers = [int(x) for x in sys.argv[2:]]
  result = main(operation, numbers)
  print(f"{operation}: {result}")

In [None]:
4) Реализовать модуль calculate.py, содержащий набор функций для работы с целыми числами, записанными как на русском языке (например: тридцать восемь), так и в виде простых арифметических выражений (например: 2 + 3).
На базе этого модуля подготовить скрипт calculate.py со следующими возможностями:
1) python claculate.py to_numbers my_file.txt
Вызов приводит к преобразованию всех чисел, написанных на русском языке в числовом виде и сохранению изменений в файл с тем же именем.
python claculate.py to_numbers my_file.txt my_file_res.txt
(результат сохраняется в файл с именем my_file_res.txt)


In [None]:
from pymorphy2 import MorphAnalyzer
from num2words import num2words

morph = MorphAnalyzer()

def to_number(text):
  """
  Преобразует текст, написанный на русском языке, в число.

  Args:
    text: str: Текст, который нужно преобразовать.

  Returns:
    int: Число.
  """
  words = morph.parse(text)
  numbers = []
  for word in words:
    if word.tag.POS == 'NUMB':
      numbers.append(word.normal_form)
  if not numbers:
    raise ValueError(f"В тексте '{text}' не найдено число.")
  number_str = ''.join(numbers)
  return int(num2words.num2words(number_str, lang='ru'))


def from_number(number):
  """
  Преобразует число в текст, написанный на русском языке.

  Args:
    number: int: Число.

  Returns:
    str: Текст, написанный на русском языке.
  """
  return num2words.num2words(number, lang='ru')


def calculate(expression):
  """
  Вычисляет значение арифметического выражения.

  Args:
    expression: str: Арифметическое выражение.

  Returns:
    int: Значение выражения.
  """
  return eval(expression)


if __name__ == "__main__":
  print(to_number("тридцать восемь"))  # 38
  print(from_number(38))  # тридцать восемь
  print(calculate("2 + 3"))  # 5
  