In [None]:
!pip install mishkal
!pip install Unidecode
!pip install noisereduce
!pip install ffmpeg-python
!pip install gtts
!pip install jiwer
!pip install pyspellchecker
!pip install librosa==0.9.1
!git clone https://github.com/ARBML/klaam
%cd klaam

In [10]:
import os
import librosa
import numpy as np
from klaam import SpeechRecognition
from google.colab.patches import cv2_imshow
import IPython.display as ipd
from sklearn.model_selection import train_test_split
from gtts import gTTS
from IPython.display import Audio
from io import BytesIO
from sklearn.preprocessing import LabelEncoder
from spellchecker import SpellChecker
from keras import layers, models, utils
from keras.applications import VGG16
from keras.callbacks import ModelCheckpoint
from keras.preprocessing.image import img_to_array, array_to_img
import matplotlib.pyplot as plt
from keras.models import load_model
import noisereduce as nr



In [None]:
# Load the trained model
stt = SpeechRecognition()
spell = SpellChecker(language='ar')

In [12]:
def text_to_speech_arabic(text):
    # Create a gTTS object with the language code for Arabic ('ar')
    tts = gTTS(text=text, lang='ar', slow=False)

    # Save the speech as an audio file
    bytes_io = BytesIO()
    tts.write_to_fp(bytes_io)

    # Play the audio using IPython Audio
    return Audio(bytes_io.getvalue(), autoplay=True)

In [13]:
def preprocess_input(file_path, n_mels=128, hop_length=512, target_size=(128, 32), noise_reduction_strength=0.02, silence_threshold=0.02):
    # Load audio
    y, sr = librosa.load(file_path)

    # Denoise audio
    y_denoised = nr.reduce_noise(y, sr,prop_decrease=noise_reduction_strength)

    # Trim silence
    y_trimmed, _ = librosa.effects.trim(y_denoised, top_db=silence_threshold)

    # Extract and resize log mel spectrogram
    mel_spec = librosa.feature.melspectrogram(y_trimmed, sr=sr, n_mels=n_mels, hop_length=hop_length)
    log_mel_spec = librosa.power_to_db(mel_spec, ref=np.max)
    log_mel_spec_resized = np.resize(log_mel_spec, target_size)

    # Add batch and channel dimensions
    log_mel_spec_resized = log_mel_spec_resized[np.newaxis, ..., np.newaxis]

    return log_mel_spec_resized


In [14]:
def wordCorrection(char):
  words = char.split()
  misspelled = spell.unknown(words)
  for word in misspelled:
      correction = spell.correction(word)
  return correction

# Predict Pronunciation (The Alphabet Classification)


In [None]:
aleph_file_path='/content/Aleph_recorded_speech.wav'
ba_file_path='/content/ba_recorded_speech.wav'
tha_file_path='/content/mehad_tha_recorded_speech.wav'
zua_file_path='/content/1_6_Taj_Zua_T (1).wav'

In [None]:
# Load your trained Keras model
loaded_model = load_model('/content/alphabetModel2.h5')

In [None]:
preprocessed_input_a = preprocess_input(aleph_file_path)
prediction_a = loaded_model.predict(preprocessed_input_a)
aleph_predicted = np.argmax(prediction_a)

# Test Pronunciation


In [None]:
def AlphabetCheker(audio_path, correct_char, example):
  letterText= stt.transcribe(audio_path)
  correctSpell = spell.correction(letterText)
  if correctSpell[0] == correct_char:
    return print("أحسنت!!! بارك الله فيك")
  else:
    return text_to_speech_arabic(example)

In [None]:
stt.transcribe(aleph_file_path)

'قالف'

In [None]:
aleph_example = "حاول مرة أخرى, أ مِثْل أُمّـي"
aleph_char='أ'
AlphabetCheker(aleph_file_path, aleph_char,aleph_example)

In [None]:
ba_example="حاول مرة أخرى, ب مِثْل بلادي"
ba_char= 'ب'
AlphabetCheker(ba_file_path, ba_char, ba_example)

أحسنت!!! بارك الله فيك


In [None]:
tha_example = "حاول مرة أخرى, ث مِثْل ثعلب"
tha_char= 'ث'
AlphabetCheker(tha_file_path, tha_char,tha_example)

In [None]:
zua_example= "حاول مرة أخرى, ظاء مِثْل ظِلال"
zua_char= 'ظ'
AlphabetCheker(zua_file_path, zua_char,zua_example)

In [None]:
ta_example= "حاول مرة أخرى, تاء مِثْل تمر"
ta_char= 'ت'


In [None]:
jeem_example= "حاول مرة أخرى, جيم مِثْل جمل"
jeem_char= 'ج'

In [None]:
hha_example= "حاول مرة أخرى, حاء مِثْل حفرة"
hha_char= 'ح'

In [None]:
kha_example= "حاول مرة أخرى, خاء مِثْل خيل"
kha_char= 'خ'

In [None]:
dal_example= "حاول مرة أخرى, دال مِثْل دراسة"
dal_char= 'د'

In [None]:
zal_example= "حاول مرة أخرى, ذال مِثْل ذراع"
zal_char= 'ذ'

In [None]:
raa_example= "حاول مرة أخرى, راء مِثْل رأي"
raa_char= 'ر'

In [None]:
zaa_example= "حاول مرة أخرى, زاي مِثْل زعيم"
zaa_char= 'ز'

In [None]:
seen_example= "حاول مرة أخرى, سين مِثْل سورة"
seen_char= 'س'

In [None]:
shen_example= "حاول مرة أخرى, شين مِثْل شؤوني"
shen_char= 'ش'

In [None]:
sad_example= "حاول مرة أخرى, صاد مِثْل صيد"
sad_char= 'ص'

In [None]:
dad_example= "حاول مرة أخرى, ضاد مِثْل ضوء"
dad_char= 'ض'

In [None]:
tua_example= "حاول مرة أخرى, طاء مِثْل طاب"
tua_char= 'ط'

In [None]:
ain_example= "حاول مرة أخرى, عين مِثْل عاش"
ain_char= 'ع'

In [None]:
gain_example= "حاول مرة أخرى, غين مِثْل غشاء"
gain_char= 'غ'

In [None]:
faa_example= "حاول مرة أخرى, فاء مِثْل فخار"
faa_char= 'ف'

In [None]:
qaf_example= "حاول مرة أخرى, قاف مِثْل قمر"
qaf_char= 'ق'

In [None]:
kaf_example= "حاول مرة أخرى, كاف مِثْل كف"
kaf_char= 'ك'

In [None]:
lam_example= "حاول مرة أخرى, لام مِثْل لبن"
lam_char= 'ل'

In [None]:
mim_example= "حاول مرة أخرى, ميم مِثْل منارة"
mim_char= 'م'

In [None]:
non_example= "حاول مرة أخرى, نون مِثْل نجوم"
non_char= 'ن'

In [None]:
haa_example= "حاول مرة أخرى, هاء مِثْل هرة"
haa_char= 'ه'

In [None]:
wow_example= "حاول مرة أخرى, واو مِثْل وسادة"
wow_char= 'و'

In [None]:
yaa_example= "حاول مرة أخرى, ياء مِثْل يقرأ"
yaa_char= 'ي'