# Техническое задание

**Проект:** Классификация аудиозвонков на целевые и нецелевые.

**Цель проекта:** Разработать нейронную сеть, способную классифицировать аудиозвонки на целевые и нецелевые на основе предоставленной базы данных и csv-таблицы с описаниями и метками классов.

**Введение:**

Входной набор данных представляет из себя два набора файлов:

> a)	[Первый набор файлов](https://drive.google.com/drive/folders/1cQWMpQkscZJbbOTxiJNy0o3nuaeIiB1P?usp=sharing) - это выгрузки в формате `CSV` с информацией по звонкам, а так же с проставленным статусом `“целевой/нецелевой”` в отдельном столбце (обратите внимание, что по проекту `“Павелецкая сити”` две выгрузки - эти наборы данных отличаются и относятся к разным наборам клиентов внутри одного и того же проекта).

> b)	[Второй набор файлов](https://drive.google.com/drive/folders/1K3jGCH60uzFcsI3aj89VIXOOFEXvZxD6?usp=sharing) - аудиозаписи звонков. Они хранятся в корневом каталоге в одноимённых папках. К примеру, в папке `“Записи звонков_павелецкая сити”` лежат записи звонков по проекту `“Павелецкая Сити”`.

**Требования:**

1.   Нейронная сеть должна быть спроектирована и обучена для точной классификации аудиозвонков на два класса: целевые и нецелевые (с точностью `90+%`).
2.   Необходимо обеспечить интеграцию модели через `API`.
3.   Модель должна быть оптимизирована для обработки большого объёма данных.
4.   Код должен быть написан с соблюдением стандартов кодирования, и должна быть составлена подробная техническая документация.
5.   Код должен включать в себя систему журналирования для фиксации ошибок.
6.   Код должен принимать на вход регулярное выражение, по которому будет осуществляться проверка столбца `“теги”` в выгрузках `CSV` для определения статуса звонка `“целевой/нецелевой”`:

>> a)	по проектам `“Примавера”` и `“Павелецкая сити”` наличие в столбце с тегами подстроки `“Целевой_М108“` будет равняться тому, что данный звонок целевой (пример регулярного выражения: `.*Целевой_М108.*`);

>> b)	по проекту `“Хедлайнер”` - наличие в столбце с тегами подстроки `“первичный целевой“` будет равняться тому, что данный звонок целевой.

7.   После реализации необходимо иметь возможность получения поддержки по предоставленному решению в течение `2 месяцев`.

Список рекомендуемых параметров для звуковой записи (данный список носит информационный характер и не является обязательным):

*   Эмоция (базовые 11: радость; печаль; гнев; отвращение; удивление; страдание (горе); волнение (интерес); презрение; смущение; стыд; вина).
*   Пол.
*   Возраст.
*   Семантический анализ диалога (по конкретным ключевым словам и/или по тематикам диалогов).
*   Характеристики, присутствующие в `CSV`/`XLSX` таблицах.

# Критерии классификации

Критерии `уникально-целевого` обращения:
1. Длительность звонка должна быть не менее `75 секунд`;
2. Телефонный номер абонента должен быть `уникальным`, т. е. его не должно быть в `CRM` заказчика. Либо, по нему не должно быть активности за последние `90 дней`. Исключение составляют `топовые площадки`, работающие по своим критериям (`ЦИАН`, `Яндекс.Недвижимость`, `Авито`, и т. д.);
3. Клиент должен знать минимальную информацию об объекте (понимать, куда он звонит): название `ЖК`, расположение, ценовую политику;
4. Номер абонента должен быть доступен в течение `15 дней` после совершённого звонка (при этом со стороны заказчика должно быть обеспечено `2 попытки` исходящего звонка в течение указанного срока);
5. Клиент должен быть `«адекватным»`. Не общаться на повышенных тонах, не употреблять ненормативную лексику и т. д.;
6. Клиент не должен быть повторным. Например, клиент `уже` купил квартиру и через `90 дней` решил купить машиноместо;
7. Заявка. В заявке должен быть указан номер телефона, а абонент при контакте с менеджером должен соответствовать всем критериям `уникально-целевого` обращения, перечисленным выше;
8. Озвученный общий бюджет покупки не должен быть `ниже 90%` от стоимости квартиры или коммерческого помещения, соответствующих площади/комнатности на момент обращения;
9. В случае, если клиент является уникальным, интересуется покупкой недвижимости, не является представителем партнёров или исполнителей и изъявил желание посетить офис продаж. При этом не обязательна фиксация уровня знания клиента об объекте в диалоге. При этом источник не должен относиться к каналам `«лидогенерация»` или `«тематические площадки»`;
10. Основной целью звонка клиента не должна являться покупка/аренда исключительно нежилого помещения, если это не являлось целью проводимой рекламной кампании.

Критерии НЕ `уникально-целевого` (вторичного) обращения:
1. Клиент позвонил повторно менее чем через `3 месяца` (`90 дней`) с момента последнего обращения;
2. Клиент, либо члены его семьи, уже купил (купили) `квартиру`/`машиноместо`/`кладовое помещение`, и хочет (хотят) совершить ещё одну покупку. В данном случае клиент относится к показателю `LTV` (показатель прибыли, которую компания получает от одного клиента за всё время работы с ним).

# 9 неделя

## Интеграция в `prod`

### Тестирование модели нейронной сети на текстовых данных

In [None]:
# Подключение google-диска
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
# Установка autokeras
!pip -q install autokeras

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m148.6/148.6 kB[0m [31m2.6 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m129.5/129.5 kB[0m [31m4.7 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m590.1/590.1 kB[0m [31m8.8 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m950.8/950.8 kB[0m [31m11.6 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m6.5/6.5 MB[0m [31m23.9 MB/s[0m eta [36m0:00:00[0m
[?25h

In [None]:
# Загрузка модели
import autokeras as ak
from tensorflow.keras.models import load_model
model = load_model('/content/drive/MyDrive/media108.ru/Модели/2023.10.15_text_model.keras')

Using TensorFlow backend




In [None]:
# Загрузка датафреймов
import pickle as pkl
import pandas as pd
with open('/content/drive/MyDrive/media108.ru/Датафреймы/total_targets_test_df.pkl', 'rb') as f:
  total_targets_test_df = pkl.load(f)
with open('/content/drive/MyDrive/media108.ru/Датафреймы/total_not_targets_test_df.pkl', 'rb') as f:
  total_not_targets_test_df = pkl.load(f)

In [None]:
# Классы
classes_names = ['Целевой', 'Нецелевой']

In [None]:
# Тестовые данные
test_targets_sample = total_targets_test_df['Текст whisper-транскрибации записи звонка'].head(1).values
test_not_targets_sample = total_not_targets_test_df['Текст whisper-транскрибации записи звонка'].head(1).values

In [None]:
# Инференс модели на целевом звонке
pred = model.predict(test_targets_sample, verbose=0)
print(classes_names[round(pred[0][0])])

Целевой


In [None]:
# Инференс модели на нецелевом звонке
pred = model.predict(test_not_targets_sample, verbose=0)
print(classes_names[round(pred[0][0])])

Нецелевой


### API (текстовые данные)

In [None]:
# Подключение google-диска
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
# Установка autokeras
!pip -q install autokeras

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m148.6/148.6 kB[0m [31m2.4 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m129.5/129.5 kB[0m [31m5.2 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m590.1/590.1 kB[0m [31m8.0 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m950.8/950.8 kB[0m [31m10.2 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m6.5/6.5 MB[0m [31m22.3 MB/s[0m eta [36m0:00:00[0m
[?25h

In [None]:
# Установка fastapi и дополнительных библиотек
!pip -q install fastapi uvicorn python-multipart typing-extensions==4.5.0 kaleido

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m92.9/92.9 kB[0m [31m1.4 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m59.6/59.6 kB[0m [31m2.2 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m45.7/45.7 kB[0m [31m3.5 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m79.9/79.9 MB[0m [31m8.5 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m67.0/67.0 kB[0m [31m6.1 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m92.9/92.9 kB[0m [31m8.2 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m66.3/66.3 kB[0m [31m6.3 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m58.3/58.3 kB[0m [31m5.0 MB/s[0m eta [36m0:00:00[0m
[?25h

In [None]:
# Эндпойнт
main_file = '''
import autokeras as ak
from tensorflow.keras.models import load_model
from fastapi import FastAPI
from pydantic import BaseModel

model = load_model('/content/drive/MyDrive/media108.ru/Модели/2023.10.15_text_model.keras')
classes_names = ['Целевой', 'Нецелевой']

class Item(BaseModel):
  text: str

app = FastAPI()

@app.post('/predict')
async def predict(item: Item):
  pred = model.predict([item.text], verbose=0)
  return {'result': classes_names[round(pred[0][0])]}
'''
with open('main.py', 'w') as f:
  f.write(main_file)

In [None]:
# Запуск uvicorn
!nohup uvicorn main:app --reload &

nohup: appending output to 'nohup.out'


In [None]:
# Лог
!cat nohup.out

INFO:     Will watch for changes in these directories: ['/content']
INFO:     Uvicorn running on http://127.0.0.1:8000 (Press CTRL+C to quit)
INFO:     Started reloader process [1077] using StatReload
Using TensorFlow backend
2023-11-05 14:11:09.946370: E tensorflow/compiler/xla/stream_executor/cuda/cuda_dnn.cc:9342] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
2023-11-05 14:11:09.946443: E tensorflow/compiler/xla/stream_executor/cuda/cuda_fft.cc:609] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered
2023-11-05 14:11:09.946512: E tensorflow/compiler/xla/stream_executor/cuda/cuda_blas.cc:1518] Unable to register cuBLAS factory: Attempting to register factory for plugin cuBLAS when one has already been registered
2023-11-05 14:11:09.960311: I tensorflow/core/platform/cpu_feature_guard.cc:182] This TensorFlow binary is optimized to use available CP

In [None]:
# Тестовые данные
import pickle as pkl
import pandas as pd
with open('/content/drive/MyDrive/media108.ru/Датафреймы/total_targets_test_df.pkl', 'rb') as f:
  total_targets_test_df = pkl.load(f)
with open('/content/drive/MyDrive/media108.ru/Датафреймы/total_not_targets_test_df.pkl', 'rb') as f:
  total_not_targets_test_df = pkl.load(f)
test_targets_sample = total_targets_test_df['Текст whisper-транскрибации записи звонка'].head(1).values
test_not_targets_sample = total_not_targets_test_df['Текст whisper-транскрибации записи звонка'].head(1).values

In [None]:
# Целевой звонок
import requests
response = requests.post('http://127.0.0.1:8000/predict', json={'text': test_targets_sample[0]})
print(response.text)

{"result":"Целевой"}


In [None]:
# Нецелевой звонок
import requests
response = requests.post('http://127.0.0.1:8000/predict', json={'text': test_not_targets_sample[0]})
print(response.text)

{"result":"Нецелевой"}


### Whisper + Тестирование модели нейронной сети на текстовых данных

In [None]:
# Подключение google-диска
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
# Установка autokeras
!pip -q install autokeras

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m148.6/148.6 kB[0m [31m3.3 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m129.5/129.5 kB[0m [31m14.3 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m590.1/590.1 kB[0m [31m24.5 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m950.8/950.8 kB[0m [31m40.0 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m6.5/6.5 MB[0m [31m105.3 MB/s[0m eta [36m0:00:00[0m
[?25h

In [None]:
# Тестовые данные
import pickle as pkl
import pandas as pd
with open('/content/drive/MyDrive/media108.ru/Датафреймы/total_targets_test_df.pkl', 'rb') as f:
  total_targets_test_df = pkl.load(f)
with open('/content/drive/MyDrive/media108.ru/Датафреймы/total_not_targets_test_df.pkl', 'rb') as f:
  total_not_targets_test_df = pkl.load(f)
test_targets_sample_file = '/content/drive/MyDrive/media108.ru/Датасет/' + total_targets_test_df['Файл записи звонка'].head(1).values[0]
test_not_targets_sample_file = '/content/drive/MyDrive/media108.ru/Датасет/' + total_not_targets_test_df['Файл записи звонка'].head(1).values[0]

In [None]:
# Загрузка модели
import autokeras as ak
from tensorflow.keras.models import load_model
model = load_model('/content/drive/MyDrive/media108.ru/Модели/2023.10.15_text_model.keras')

Using TensorFlow backend




In [None]:
# Классы
classes_names = ['Целевой', 'Нецелевой']

In [None]:
# Инференс модели на целевом звонке
pred = model.predict(total_targets_test_df['Текст whisper-транскрибации записи звонка'].head(1).values, verbose=0)
print(classes_names[round(pred[0][0])])

Целевой


In [None]:
# Инференс модели на нецелевом звонке
pred = model.predict(total_not_targets_test_df['Текст whisper-транскрибации записи звонка'].head(1).values, verbose=0)
print(classes_names[round(pred[0][0])])

Нецелевой


In [None]:
# Установка openai-whisper
!pip install git+https://github.com/openai/whisper.git

In [None]:
# Транскрибация
import whisper
whisper_model = whisper.load_model('large')
test_targets_sample = whisper_model.transcribe(test_targets_sample_file, language='ru')
test_not_targets_sample = whisper_model.transcribe(test_not_targets_sample_file, language='ru')

100%|██████████████████████████████████████| 2.87G/2.87G [00:29<00:00, 106MiB/s]


In [None]:
test_targets_sample['text']

' Вы позвонили в группу компании «Картрос». Благодарим вас за звонок. Пожалуйста, дождитесь ответа оператора. Добрый день. Группа компании «Картрос». Лилия. ЖК «Хэдлайнер». Здравствуйте. «Хэдлайнер», да, ЖК? Я бы хотела знать, что узнать. А у вас есть возможность показать готовые квартиры хотя бы? Или у вас еще вообще все на уровне только застройки? Нет, у нас есть уже сданные корпуса. Давайте я вас соединю с менеджером отдела продаж. Там шоурум есть, где посмотреть. Отлично, хорошо, давайте, соединяемся. Подскажите, как вас зовут? Динара. Я вас соединяю с менеджером. Отдай минуту. Динара, добрый день. Меня зовут Алена, менеджер проекта «Хэдлайнер». Чем могу вам помочь? Здравствуйте. А я могу сейчас подъехать к вам, и вы мне все покажете, что есть у вас? Да, вы можете приехать в офис продаж, Шмидтовский проезд, 39, корпус 1. А вы можете мне геолокацию скинуть на WhatsApp, на этот номер? Я просто сейчас уже буду выезжать, и там где какая парковка? Там на улице можно встать, правильно? Я

In [None]:
total_targets_test_df['Текст whisper-транскрибации записи звонка'].head(1).values[0]

'Вы позвонили в группу компании «Картрос». Благодарим вас за звонок. Пожалуйста, дождитесь ответа оператора. Добрый день. Группа компании «Картрос». Лилия. ЖК «Хэдлайнер». Здравствуйте. «Хэдлайнер», да, ЖК? Я бы хотела знать, что узнать. А у вас есть возможность показать готовые квартиры хотя бы? Или у вас еще вообще все на уровне только застройки? Нет, у нас есть уже сданные корпуса. Давайте я вас соединю с менеджером отдела продаж. Там шоурум есть, где посмотреть. Отлично, хорошо, давайте, соединяемся. Подскажите, как вас зовут? Динара. Я вас соединяю с менеджером. Отдай минуту. Динара, добрый день. Меня зовут Алена, менеджер проекта «Хэдлайнер». Чем могу вам помочь? Здравствуйте. А я могу сейчас подъехать к вам, и вы мне все покажете, что есть у вас? Да, вы можете приехать в офис продаж, Шмидтовский проезд, 39, корпус 1. А вы можете мне геолокацию скинуть на WhatsApp, на этот номер? Я просто сейчас уже буду выезжать, и там где какая парковка? Там на улице можно встать, правильно? Я 

In [None]:
test_not_targets_sample['text']

' Здравствуйте! Вы позвонили в группу компании «Картроф». Благодарим вас за звонок. Пожалуйста, дождитесь ответа оператора. Добрый день, группа компании «Картроф». Меня зовут Любовь. Здравствуйте, Любовь. Меня зовут Татьяна. У меня уникальный клиент. Я бы хотела пообщаться с менеджером, которого вы прикрепили, но не могу дозвониться, у него абонент недоступен. Какой менеджер? Что за фамилия? Ванда Даев. Прикрепили этого. Так. Хорошо. Соединяю вас, Татьяна, с отделом продаж. Сейчас любой свободный менеджер пройти ситуацию. Оставайтесь на линии. Благодарю. Спасибо. Татьяна, добрый день. Меня зовут Антон. Слушаю вас. Чем могу помочь? Добрый день. Уникального клиента. Клиент уникальный. Хочу уточнить по квартире. У нас бюджет 20 миллионов. Ну, плюс-минус там 2 миллиона, да? Да. Нужна готовая квартира, но пойти ипотеки. Уже в готовом построенном доме? Да. Такое возможно? Нужно... Уточнить будет у отдела ипотеки. По готовым домам возможно пойти ипотеку или нет. Вот у нас осталась одна кварти

In [None]:
total_not_targets_test_df['Текст whisper-транскрибации записи звонка'].head(1).values[0]

'Здравствуйте! Вы позвонили в группу компании «Картроф». Благодарим вас за звонок. Пожалуйста, дождитесь ответа оператора. Добрый день, группа компании «Картроф». Меня зовут Любовь. Здравствуйте, Любовь. Меня зовут Татьяна. У меня уникальный клиент. Я бы хотела пообщаться с менеджером, которого вы прикрепили, но не могу дозвониться, у него абонент недоступен. Какой менеджер? Что за фамилия? Ванда Даев. Прикрепили этого. Так. Хорошо. Соединяю вас, Татьяна, с отделом продаж. Сейчас любой свободный менеджер пройти ситуацию. Оставайтесь на линии. Благодарю. Спасибо. Татьяна, добрый день. Меня зовут Антон. Слушаю вас. Чем могу помочь? Добрый день. Уникального клиента. Клиент уникальный. Хочу уточнить по квартире. У нас бюджет 20 миллионов. Ну, плюс-минус там 2 миллиона, да? Да. Нужна готовая квартира, но пойти ипотеки. Уже в готовом построенном доме? Да. Такое возможно? Нужно... Уточнить будет у отдела ипотеки. По готовым домам возможно пойти ипотеку или нет. Вот у нас осталась одна квартир

In [None]:
# Инференс модели на целевом звонке
pred = model.predict([test_targets_sample['text']], verbose=0)
print(classes_names[round(pred[0][0])])

Целевой


In [None]:
# Инференс модели на нецелевом звонке
pred = model.predict([test_not_targets_sample['text']], verbose=0)
print(classes_names[round(pred[0][0])])

Нецелевой


### API (Whisper)

In [None]:
# Подключение google-диска
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
# Установка openai-whisper
!pip install git+https://github.com/openai/whisper.git

In [None]:
# Установка autokeras
!pip -q install autokeras

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m148.6/148.6 kB[0m [31m2.6 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m129.5/129.5 kB[0m [31m11.3 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m590.1/590.1 kB[0m [31m10.0 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m950.8/950.8 kB[0m [31m11.4 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m6.5/6.5 MB[0m [31m13.6 MB/s[0m eta [36m0:00:00[0m
[?25h

In [None]:
# Установка дополнительных библиотек
!pip -q install fastapi uvicorn python-multipart typing-extensions==4.5.0 kaleido

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m92.9/92.9 kB[0m [31m1.6 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m59.6/59.6 kB[0m [31m3.4 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m45.7/45.7 kB[0m [31m3.3 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m79.9/79.9 MB[0m [31m6.4 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m67.0/67.0 kB[0m [31m5.1 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m92.9/92.9 kB[0m [31m5.4 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m66.3/66.3 kB[0m [31m5.3 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m58.3/58.3 kB[0m [31m2.6 MB/s[0m eta [36m0:00:00[0m
[?25h

In [None]:
# Эндпойнт
main_file = '''
import autokeras as ak
from tensorflow.keras.models import load_model
model = load_model('/content/drive/MyDrive/media108.ru/Модели/2023.10.15_text_model.keras')
classes_names = ['Целевой', 'Нецелевой']

from fastapi import FastAPI

import whisper
whisper_model = whisper.load_model('medium')

from pydantic import BaseModel
class Item(BaseModel):
  file: str

app = FastAPI()

@app.post('/predict')
async def predict(item: Item):
  test_sample = whisper_model.transcribe(item.file, language='ru')
  pred = model.predict([test_sample['text']], verbose=0)
  return {'result': classes_names[round(pred[0][0])]}
'''
with open('main.py', 'w') as f:
  f.write(main_file)

In [None]:
# Запуск uvicorn
!nohup uvicorn main:app --reload &

nohup: appending output to 'nohup.out'


In [None]:
# Лог
!cat nohup.out

In [None]:
# Тестовые данные
import pickle as pkl
import pandas as pd
with open('/content/drive/MyDrive/media108.ru/Датафреймы/total_targets_test_df.pkl', 'rb') as f:
  total_targets_test_df = pkl.load(f)
with open('/content/drive/MyDrive/media108.ru/Датафреймы/total_not_targets_test_df.pkl', 'rb') as f:
  total_not_targets_test_df = pkl.load(f)
test_targets_sample_file = '/content/drive/MyDrive/media108.ru/Датасет/' + total_targets_test_df['Файл записи звонка'].head(1).values[0]
test_not_targets_sample_file = '/content/drive/MyDrive/media108.ru/Датасет/' + total_not_targets_test_df['Файл записи звонка'].head(1).values[0]

In [None]:
# Целевой звонок
import requests
response = requests.post('http://127.0.0.1:8000/predict', json={'file': test_targets_sample_file})
print(response.text)

{"result":"Целевой"}


In [None]:
# Нецелевой звонок
import requests
response = requests.post('http://127.0.0.1:8000/predict', json={'file': test_not_targets_sample_file})
print(response.text)

{"result":"Нецелевой"}
