# Основы программирования в Python

## Практикум 12. Повторение, подготовка к НЭ

*Алла Тамбовцева, НИУ ВШЭ*

### Задача 1

В текстовом файле находится выгрузка постов из Твиттера, за некоторый период, в которых встречаются имена пользователей. Выясните, каких пользователей упоминали чаще, а каких реже, подсчитав количество употреблений каждого.

**ФОРМАТ ВВОДА**

Текстовый файл `data.txt`, в котором записана подборка постов из Твиттера. Упомянутым пользователем считается любое слово, начинающееся с '@'.  Знак пробела не может содержаться в имени пользователя и сигнализирует, что имя закончилось.

**ФОРМАТ ВЫВОДА**

Словарь, где ключи — имена пользователей, а значения — количество упоминаний. Имена должны быть добавлены в словарь в том же порядке, в каком они встречались в оригинальном файле

**ДОПОЛНИТЕЛЬНО**

В открытом тесте используются файл data.txt. Вы можете скачать его и проверить свое решение локально.

В примере в первой колонке отображается номер теста (0 — открытый тест), считывать это число или использовать его в вашем решении не нужно.

Пример результата:

    {'@Simone_Biles': 4, '@amyycoylee': 2, '@UCLAFootball': 1, '@jasonbskates': 3}

In [4]:
with open("data.txt", "r", encoding = "UTF-8") as file:
    text = file.read()
words = text.split()
counts = {}
for word in words:
    if word.startswith("@"):
        counts[word] = counts.get(word, 0) + 1
print(counts)

{'@Simone_Biles': 4, '@amyycoylee': 2, '@UCLAFootball': 1, '@jasonbskates': 3}


In [5]:
with open("data.txt", "r", encoding = "UTF-8") as file:
    text = file.read()
words = text.split()
counts = {}
for word in words:
    if word.startswith("@"):
        if word not in counts:
            counts[word] = 1
        else:
            counts[word] += 1
print(counts)

{'@Simone_Biles': 4, '@amyycoylee': 2, '@UCLAFootball': 1, '@jasonbskates': 3}


### Задача 2

В текстовом файле находится выгрузка постов из Твиттера, за некоторый период, в которых встречаются имена пользователей. Выясните, каких пользователей упоминали чаще, а каких реже, подсчитав количество употреблений каждого, и запишите результат в файл.

**ФОРМАТ ВВОДА**

Текстовый файл `data.txt`, в котором записана подборка постов из Твиттера. Упомянутым пользователем считается любое слово, начинающееся с '@'.  Знак пробела не может содержаться в имени пользователя и сигнализирует, что имя закончилось.

**ФОРМАТ ВЫВОДА**

Текстовый файл `users.txt` в кодировке utf-8, где каждый пользователь, упомянутый в файле `data.txt`, записан в формате "пользователь: <@имя пользователя>, упоминаний: <кол-во упоминаний>". Каждый пользователь должен быть записан на отдельной строке, имена нужно отсортировать по количеству упоминаний от самого большого к самому маленькому

**ДОПОЛНИТЕЛЬНО**

В открытом тесте используются файлы `data.txt` и `users.txt`. Вы можете скачать их и проверить свое решение локально.

В примере в первой колонке отображается номер теста (0 — открытый тест), считывать это число или использовать его в вашем решении не нужно.

Пример результата:

    пользователь: @Simone_Biles, упоминаний: 4
    пользователь: @jasonbskates, упоминаний: 3
    пользователь: @amyycoylee, упоминаний: 2
    пользователь: @UCLAFootball, упоминаний: 1

In [8]:
with open("data.txt", "r", encoding = "UTF-8") as file:
    text = file.read()
words = text.split()
counts = {}
for word in words:
    if word.startswith("@"):
        counts[word] = counts.get(word, 0) + 1

L = sorted(counts.items(), key = lambda x: x[1], reverse = True)

with open("users.txt", "w", encoding = "UTF-8") as result:
    for user, freq in L:
        print(f"пользователь: {user}, упоминаний: {freq}", file = result)

### Задача 3

Маша и Ася хотят снять квартиру. У них есть база данных, где содержится информация о количестве комнат в квартире, ближайшей станции метро и цене. Помогите девушкам найти самые дешевые квартиры возле нужной станции метро. 

**ФОРМАТ ВВОДА**

Файл `apartments.csv`, на каждой строке которого через запятую записаны id квартиры (произвольная строка), количество комнат (целое число), ближайшая станция метро и цена (вещественное число). Например, "384848,2,Бабушкинская,45000". 
Также вводится предпочитаемая станция метро. 

**ФОРМАТ ВЫВОДА**

Файл `filtered-apartments.csv`, где записаны строки из вводного файла, соответствующие квартирам, находящимся возле введённой станции метро. 
Строки должны быть упорядочены по цене квартир от самых дешевых к самым дорогим.

**ДОПОЛНИТЕЛЬНО**

В открытом тесте используется вводный файл `apartments.csv`, а на выходе должен получаться файл `filtered-apartments.csv`. Вы можете скачать их и проверить свое решение локально. 

В примере в первой колонке отображается номер теста (0 — открытый тест), считывать это число или использовать его в вашем решении не нужно.

Ваше решение будет проверяться на закрытых тестах. Ваш код должен считывать файл `'apartments.csv'` без дополнительных указаний (например, пути к файлу на вашем компьютере). Также ваш код просто записывает данные в файл `'filtered-apartments.csv'` и не выводит его. При проверке ваш файл считается автоматически.

In [12]:
metro = input()
with open("apartments.csv", encoding = "UTF-8") as input_file:
    lines = input_file.readlines()
    lines = [line.rstrip() for line in lines] 
data = [line.split(",") for line in lines]

chosen = []
for part in data:
    if part[2] == metro:
        chosen.append(part)
final = sorted(chosen, key = lambda x: float(x[-1]))

with open("filtered-apartments.csv", "w", encoding = "UTF-8") as out_file:
    for f in final:
        print(*f, sep = ",", file = out_file)

In [35]:
H = {"a", "b", "c"}

In [37]:
hello = "hello"

In [39]:
print(*range(7, 10))

7 8 9
