#**Imports**

In [23]:
import numpy as np
from keras.models import Sequential
from keras.layers import Dense, LSTM, Embedding
from keras.callbacks import EarlyStopping
from tensorflow.keras.utils import to_categorical
import pickle
from keras.models import load_model
from pickle import load

#**Data preprocessing**

This code performs data loading and preprocessing for a text file containing names. It divides the names into sequences of length 3 and creates a mapping of unique characters to integers. By changing the input data file, you can generate a corresponding model for the new dataset by rerunning the code cells.

In [24]:
# load data
def load_doc(filename):
    with open(filename, 'r', encoding="utf8") as file:
        text = file.read()
    return text

# tokenization, one dialog per line
def save_doc(lines, filename):
    data = '\n'.join(lines)
    with open(filename, 'w', encoding="utf8") as file:
        file.write(data)


raw_text = load_doc('names.txt')
print(raw_text)

# start preprocess
tokens = raw_text.split()
raw_text = ' '.join(tokens)

# devide into seq
seq_len = 3
step = 1
sequences = []
next_chars = []
for i in range(0, len(raw_text) - seq_len, step):
    sequences.append(raw_text[i:i + seq_len])
    next_chars.append(raw_text[i + seq_len])
print('Total Sequences:', len(sequences))

# create a mapping of unique characters to integers , in other words dict with an int for each charcter
chars = sorted(list(set(raw_text)))
char_to_int = dict((c, i) for i, c in enumerate(chars))
int_to_char = dict((i, c) for i, c in enumerate(chars))

# create input and output pairs encoded as integers
X = np.zeros((len(sequences), seq_len), dtype=np.int32)
y = np.zeros((len(sequences), len(chars)), dtype=np.bool)
for i, seq in enumerate(sequences):
    for j, char in enumerate(seq):
        X[i, j] = char_to_int[char]
    y[i, char_to_int[next_chars[i]]] = 1

﻿آلاء آمال آمنة آيات
آية أبرار أثيل أحلام
أروى أريج  أزهار أسارير
أسماء أسمى أسيل أشجان
أطياف أغاريد أفراح أفكار
أفنان ألطاف ألوف أم كلثوم
أمارة أمال أمامة أماميان
أمانة أماني أمرات أملة
أمنية أمورة أمونة أمية
أميرة أميمة أميمية أمينة
أمينة أناة أنار أنارات
أنسام أنسة أنسوقة أنشودة
أنصار أنظارأنظام أنغم
أنوار أنوس أنوف أنيسة 
أنيسة أهداف أوبية أودة
أوسال أوصاف أوصال أولياء
أوها إباء إجلالإحسان
إخلاص إدراك إسراء إسعاد
إسعاف إشراف إصلاح إعزاز 
إقبال إقدام إكليل إمداد
إمهال إناس إنجاح إنشاد
إنصاف إنعام إهداف إهلال 
إيتاء إيثار إيحاء إيداع
إيضاح إيفاء إيماء إيمان
إيناس ابتسام ابتهاج ابتهال
اجتهاد احتشام ازدهاراعتدال
اعتماد افتخار افتكار الحد
الحدة الدرداء السعدية السكينة
النعيمة امتثال امتيازانبساط 
انبهاج انتصارانتظار انتهاء
انجرار انسجام انشراح انشراف 
انشقار انفصال بائقة بادرة 
بارزة بارعة باركة بارية
بازعة باسة باسطة باسقة
باسلة بتول بثينة بحرية
براء بسمة بسيمة بشرى 
بشيرة بلقيس بليغة بهيجة
بهيسة بيبي تانيا تغاني
تمارة تماضر تنال تودد
تيسير تيماء تيمة ثراء 
ثوابة ثوبة ثويبة جبرة 
جبلة 

Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations
  y = np.zeros((len(sequences), len(chars)), dtype=np.bool)


# **Modelization**

In [25]:
# define the LSTM model
model = Sequential()
model.add(Embedding(len(chars), 128, input_length=seq_len))
model.add(LSTM(256))
model.add(Dense(len(chars), activation='softmax'))
print(model.summary())

# compile model
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# define early stopping callback
early_stop = EarlyStopping(monitor='loss', patience=3, verbose=1)

# fit the model
model.fit(X, y, epochs=50, batch_size=128, callbacks=[early_stop])

# save the model to file
model.save('model.h5')
with open('mapping.pkl', 'wb') as file:
    pickle.dump(char_to_int, file)
    pickle.dump(int_to_char, file)

Model: "sequential_4"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 embedding_4 (Embedding)     (None, 3, 128)            4864      
                                                                 
 lstm_4 (LSTM)               (None, 256)               394240    
                                                                 
 dense_4 (Dense)             (None, 38)                9766      
                                                                 
Total params: 408,870
Trainable params: 408,870
Non-trainable params: 0
_________________________________________________________________
None
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoc

#**Prediction**

In [26]:
def generate_seq(model,  seed_text, num_chars):
    seq_len=len(seed_text)
    generated = seed_text
    for i in range(num_chars):
        # encode the characters as integers
        x_pred = np.zeros((1, seq_len), dtype=np.int32)
        for j, char in enumerate(seed_text):
            x_pred[0, j] = char_to_int[char]
        # predict character
        preds = model.predict(x_pred, verbose=0)[0]
        next_index = np.argmax(preds)
        next_char = int_to_char[next_index]
        # append to input
        generated += next_char
        seed_text = seed_text[1:] + next_char
    return generated

# load the model
model = load_model('model.h5')
# load the mapping
mapping = load(open('mapping.pkl', 'rb'))
print(generate_seq(model, 'أوس', 2)) # should print 'أوسام'
print(generate_seq(model, 'نبي', 3)) # should print 'نبيهة'
print(generate_seq(model, 'مثا', 2)) # should print 'مثابة'



أوسام
نبيهة 
مثابة


# **Full code**

In [27]:
import numpy as np
from keras.models import Sequential
from keras.layers import Dense, LSTM, Embedding
from keras.callbacks import EarlyStopping
from tensorflow.keras.utils import to_categorical
import pickle
from keras.models import load_model
from pickle import load


# load data
def load_doc(filename):
    with open(filename, 'r', encoding="utf8") as file:
        text = file.read()
    return text

# tokenization, one dialog per line
def save_doc(lines, filename):
    data = '\n'.join(lines)
    with open(filename, 'w', encoding="utf8") as file:
        file.write(data)


raw_text = load_doc('names.txt')
print(raw_text)

# start preprocess
tokens = raw_text.split()
raw_text = ' '.join(tokens)

# devide into seq
seq_len = 3
step = 1
sequences = []
next_chars = []
for i in range(0, len(raw_text) - seq_len, step):
    sequences.append(raw_text[i:i + seq_len])
    next_chars.append(raw_text[i + seq_len])
print('Total Sequences:', len(sequences))

# create a mapping of unique characters to integers , in other words dict with an int for each charcter
chars = sorted(list(set(raw_text)))
char_to_int = dict((c, i) for i, c in enumerate(chars))
int_to_char = dict((i, c) for i, c in enumerate(chars))

# create input and output pairs encoded as integers
X = np.zeros((len(sequences), seq_len), dtype=np.int32)
y = np.zeros((len(sequences), len(chars)), dtype=np.bool)
for i, seq in enumerate(sequences):
    for j, char in enumerate(seq):
        X[i, j] = char_to_int[char]
    y[i, char_to_int[next_chars[i]]] = 1

# define the LSTM model
model = Sequential()
model.add(Embedding(len(chars), 128, input_length=seq_len))
model.add(LSTM(256))
model.add(Dense(len(chars), activation='softmax'))
print(model.summary())

# compile model
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# define early stopping callback
early_stop = EarlyStopping(monitor='loss', patience=3, verbose=1)

# fit the model
model.fit(X, y, epochs=50, batch_size=128, callbacks=[early_stop])

# save the model to file
model.save('model.h5')
# save the mapping
with open('mapping.pkl', 'wb') as file:
    pickle.dump(char_to_int, file)
    pickle.dump(int_to_char, file)

# generate a sequence of characters with a trained model
def generate_seq(model,  seed_text, num_chars):
    seq_len=len(seed_text)
    generated = seed_text
    for i in range(num_chars):
        # encode the characters as integers
        x_pred = np.zeros((1, seq_len), dtype=np.int32)
        for j, char in enumerate(seed_text):
            x_pred[0, j] = char_to_int[char]
        # predict character
        preds = model.predict(x_pred, verbose=0)[0]
        next_index = np.argmax(preds)
        next_char = int_to_char[next_index]
        # append to input
        generated += next_char
        seed_text = seed_text[1:] + next_char
    return generated

# load the model
model = load_model('model.h5')
# load the mapping
mapping = load(open('mapping.pkl', 'rb'))

print(generate_seq(model, 'أوس', 2)) # should print 'أوسام'
print(generate_seq(model, 'نبي', 3)) # should print 'نبيهة'
print(generate_seq(model, 'مثا', 2)) # should print 'مثابة'




﻿آلاء آمال آمنة آيات
آية أبرار أثيل أحلام
أروى أريج  أزهار أسارير
أسماء أسمى أسيل أشجان
أطياف أغاريد أفراح أفكار
أفنان ألطاف ألوف أم كلثوم
أمارة أمال أمامة أماميان
أمانة أماني أمرات أملة
أمنية أمورة أمونة أمية
أميرة أميمة أميمية أمينة
أمينة أناة أنار أنارات
أنسام أنسة أنسوقة أنشودة
أنصار أنظارأنظام أنغم
أنوار أنوس أنوف أنيسة 
أنيسة أهداف أوبية أودة
أوسال أوصاف أوصال أولياء
أوها إباء إجلالإحسان
إخلاص إدراك إسراء إسعاد
إسعاف إشراف إصلاح إعزاز 
إقبال إقدام إكليل إمداد
إمهال إناس إنجاح إنشاد
إنصاف إنعام إهداف إهلال 
إيتاء إيثار إيحاء إيداع
إيضاح إيفاء إيماء إيمان
إيناس ابتسام ابتهاج ابتهال
اجتهاد احتشام ازدهاراعتدال
اعتماد افتخار افتكار الحد
الحدة الدرداء السعدية السكينة
النعيمة امتثال امتيازانبساط 
انبهاج انتصارانتظار انتهاء
انجرار انسجام انشراح انشراف 
انشقار انفصال بائقة بادرة 
بارزة بارعة باركة بارية
بازعة باسة باسطة باسقة
باسلة بتول بثينة بحرية
براء بسمة بسيمة بشرى 
بشيرة بلقيس بليغة بهيجة
بهيسة بيبي تانيا تغاني
تمارة تماضر تنال تودد
تيسير تيماء تيمة ثراء 
ثوابة ثوبة ثويبة جبرة 
جبلة 

Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations
  y = np.zeros((len(sequences), len(chars)), dtype=np.bool)


Model: "sequential_5"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 embedding_5 (Embedding)     (None, 3, 128)            4864      
                                                                 
 lstm_5 (LSTM)               (None, 256)               394240    
                                                                 
 dense_5 (Dense)             (None, 38)                9766      
                                                                 
Total params: 408,870
Trainable params: 408,870
Non-trainable params: 0
_________________________________________________________________
None
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoc

In [28]:
!pip install pyngrok


Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


In [None]:
from flask import Flask, render_template, request
import numpy as np
import pickle
from keras.models import load_model
from tensorflow.keras.preprocessing.sequence import pad_sequences
from pyngrok import ngrok
from flask import url_for



app = Flask(__name__,static_url_path='/static')
ngrok.set_auth_token("type your token here")
public_url =  ngrok.connect(5000).public_url
# load the model and character mapping
model = model = load_model('model.h5')


@app.route('/')
def index():
    css_url = url_for('static', filename='style.css')
    return render_template('index.html',css_url=css_url)

@app.route('/generate_names', methods=['POST'])
def generate_names():
    css_url = url_for('static', filename='style.css')
    n_chars = 3
    seed_text = request.form['seed_text']
    num_names = 1
    generated_names = []
    for _ in range(num_names):
        generated = generate_seq(model, seed_text, n_chars)
        generated_names.append(generated)
    
    return render_template('index.html', names=generated_names,css_url=css_url)


def generate_seq(model, seed_text, num_chars):
    seq_len = len(seed_text)
    generated = seed_text
    for i in range(num_chars):
        x_pred = np.zeros((1, seq_len), dtype=np.int32)
        for j, char in enumerate(seed_text):
            x_pred[0, j] = char_to_int[char]
        
        preds = model.predict(x_pred, verbose=0)[0]
        next_index = np.argmax(preds)
        next_char = int_to_char[next_index]
        
        generated += next_char
        seed_text = seed_text[1:] + next_char
    
    return generated



if __name__ == '__main__':
    print(f"To acces the Gloable link please click {public_url}")
    app.run(debug=False)
    # Connect your local port (5000) to a public URL




To acces the Gloable link please click https://a1aa-34-74-167-201.ngrok-free.app
 * Serving Flask app '__main__'
 * Debug mode: off


 * Running on http://127.0.0.1:5000
INFO:werkzeug:[33mPress CTRL+C to quit[0m
INFO:werkzeug:127.0.0.1 - - [04/May/2023 18:21:22] "GET / HTTP/1.1" 200 -
INFO:werkzeug:127.0.0.1 - - [04/May/2023 18:21:23] "GET /static/style.css HTTP/1.1" 200 -
INFO:werkzeug:127.0.0.1 - - [04/May/2023 18:21:23] "[33mGET /favicon.ico HTTP/1.1[0m" 404 -
INFO:werkzeug:127.0.0.1 - - [04/May/2023 18:22:00] "POST /generate_names HTTP/1.1" 200 -
INFO:werkzeug:127.0.0.1 - - [04/May/2023 18:22:00] "[36mGET /static/style.css HTTP/1.1[0m" 304 -
INFO:werkzeug:127.0.0.1 - - [04/May/2023 18:22:08] "POST /generate_names HTTP/1.1" 200 -
INFO:werkzeug:127.0.0.1 - - [04/May/2023 18:22:08] "[36mGET /static/style.css HTTP/1.1[0m" 304 -
INFO:werkzeug:127.0.0.1 - - [04/May/2023 18:22:14] "POST /generate_names HTTP/1.1" 200 -
INFO:werkzeug:127.0.0.1 - - [04/May/2023 18:22:15] "[36mGET /static/style.css HTTP/1.1[0m" 304 -


In [None]:
!pip install ngrok

In [None]:
!ngrok http 5000