In [None]:
# Імпортування необхідних бібліотек
import pandas as pd
from sklearn.model_selection import train_test_split
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, LSTM, Dense
import tensorflow as tf

# ✅ Крок 1: Завантаження даних у Colab
# Завантажуємо файл з Colab
from google.colab import files

uploaded = files.upload()  # Завантажте `spam.csv` у вікно Colab

# Перевіряємо файл
file_path = 'spam.csv'
data = pd.read_csv(file_path, encoding='latin1')

# ✅ Крок 2: Обробка даних
# Зберігаємо тільки необхідні стовпці
data = data[['v1', 'v2']]
data.columns = ['label', 'text']

# Замінюємо мітки 'ham' та 'spam' на 0 та 1
data['label'] = data['label'].map({'ham': 0, 'spam': 1})

# Видаляємо будь-які порожні значення
data.dropna(inplace=True)

# Перевіряємо дані після обробки
print("Розмір даних:", data.shape)
print(data.head())

# ✅ Крок 3: Розбиваємо дані на навчальну та тестову вибірки
X_train, X_test, y_train, y_test = train_test_split(data['text'], data['label'], test_size=0.2, random_state=42)

# ✅ Крок 4: Токенізуємо тексти
num_words = 10000
max_length = 100

tokenizer = Tokenizer(num_words=num_words, oov_token='<OOV>')
tokenizer.fit_on_texts(X_train)

# Перетворюємо тексти у послідовності токенів
train_sequences = tokenizer.texts_to_sequences(X_train)
train_padded = pad_sequences(train_sequences, maxlen=max_length, padding='post')

test_sequences = tokenizer.texts_to_sequences(X_test)
test_padded = pad_sequences(test_sequences, maxlen=max_length, padding='post')

# ✅ Крок 5: Створення нейронної мережі
model = Sequential([
    Embedding(num_words, 64, input_length=max_length),
    LSTM(64),
    Dense(1, activation='sigmoid')
])

# Компілюємо модель
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

# ✅ Крок 6: Навчаємо модель
model.fit(train_padded, y_train, epochs=5, batch_size=64, validation_split=0.2)

# ✅ Крок 7: Оцінка моделі на тестовій вибірці
loss, accuracy = model.evaluate(test_padded, y_test)
print(f"Точність на тестовій вибірці: {accuracy * 100:.2f}%")

# ✅ Крок 8: Збереження моделі
model.save('spam_classifier_model.h5')

Saving spam.csv to spam (1).csv
Розмір даних: (5572, 2)
   label                                               text
0      0  Go until jurong point, crazy.. Available only ...
1      0                      Ok lar... Joking wif u oni...
2      1  Free entry in 2 a wkly comp to win FA Cup fina...
3      0  U dun say so early hor... U c already then say...
4      0  Nah I don't think he goes to usf, he lives aro...
Epoch 1/5




[1m56/56[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m9s[0m 109ms/step - accuracy: 0.8179 - loss: 0.4685 - val_accuracy: 0.8621 - val_loss: 0.4098
Epoch 2/5
[1m56/56[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m9s[0m 84ms/step - accuracy: 0.8621 - loss: 0.4020 - val_accuracy: 0.8621 - val_loss: 0.4019
Epoch 3/5
[1m56/56[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 114ms/step - accuracy: 0.8666 - loss: 0.3937 - val_accuracy: 0.8621 - val_loss: 0.4040
Epoch 4/5
[1m56/56[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 83ms/step - accuracy: 0.8712 - loss: 0.3866 - val_accuracy: 0.8621 - val_loss: 0.4020
Epoch 5/5
[1m56/56[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 89ms/step - accuracy: 0.8674 - loss: 0.3924 - val_accuracy: 0.8621 - val_loss: 0.4025
[1m35/35[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 28ms/step - accuracy: 0.8760 - loss: 0.3789




Точність на тестовій вибірці: 86.55%


In [None]:
# Встановлюємо необхідні пакети
!pip install Flask pyngrok tensorflow

# Імпортуємо необхідні бібліотеки
import os
import tensorflow as tf
import numpy as np
from flask import Flask, request, jsonify, render_template
from pyngrok import ngrok

# Підключаємо Google Drive для доступу до моделі
from google.colab import drive
drive.mount('/content/drive')

# Створення Flask-додатку
app = Flask(__name__)

# Шлях до моделі
MODEL_PATH = 'spam_classifier_model.h5'

# Перевірка доступності моделі
if os.path.exists(MODEL_PATH):
    model = tf.keras.models.load_model(MODEL_PATH)
    print("Модель успішно завантажено.")
else:
    raise FileNotFoundError(f"Модель не знайдено за шляхом {MODEL_PATH}")

# Основний маршрут для головної сторінки
@app.route('/')
def index():
    return render_template('index.html')

# Роут для передбачення спаму
@app.route('/predict', methods=['POST'])
def predict():
    try:
        data = request.get_json()
        input_data = np.array(data['input'])

        # Перевірка розмірів даних
        if len(input_data.shape) == 1:
            input_data = np.reshape(input_data, (1, -1))

        predictions = model.predict(input_data)
        return jsonify({"predictions": predictions.tolist()})
    except Exception as e:
        return jsonify({"error": str(e)})

# Запускаємо ngrok для доступу до сервера Flask
public_url = ngrok.connect(5000)
print(f"Сервіс Flask доступний за посиланням: {public_url}")

# Запуск сервера Flask
if __name__ == '__main__':
    app.run(port=5000)





Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
Модель успішно завантажено.
Сервіс Flask доступний за посиланням: NgrokTunnel: "https://65ea-35-230-26-62.ngrok-free.app" -> "http://localhost:5000"
 * Serving Flask app '__main__'
 * Debug mode: off


 * Running on http://127.0.0.1:5000
INFO:werkzeug:[33mPress CTRL+C to quit[0m
ERROR:__main__:Exception on / [GET]
Traceback (most recent call last):
  File "/usr/local/lib/python3.10/dist-packages/flask/app.py", line 1511, in wsgi_app
    response = self.full_dispatch_request()
  File "/usr/local/lib/python3.10/dist-packages/flask/app.py", line 919, in full_dispatch_request
    rv = self.handle_user_exception(e)
  File "/usr/local/lib/python3.10/dist-packages/flask/app.py", line 917, in full_dispatch_request
    rv = self.dispatch_request()
  File "/usr/local/lib/python3.10/dist-packages/flask/app.py", line 902, in dispatch_request
    return self.ensure_sync(self.view_functions[rule.endpoint])(**view_args)  # type: ignore[no-any-return]
  File "<ipython-input-11-1aff43fec4fa>", line 31, in index
    return render_template('index.html')
  File "/usr/local/lib/python3.10/dist-packages/flask/templating.py", line 149, in render_template
    template = app.jinja_env.get_or_select_templat