# Using regex to explore consonant clusters in WikiPron


The goal of this homework is to identify, count, and compare <b>word-initial and word-final consonant clusters</b> in two languages: English and Arabic.


- Created by Geoff Bacon; lightly touched up by Terry Regier, Aug 30 2020.
- [WikiPron](https://github.com/kylebgorman/wikipron) is a great project, [check it out](https://www.aclweb.org/anthology/2020.lrec-1.521.pdf)!

In [1]:
import re

In [2]:
# Read in English words.  
with open("data-WP/eng_rp.txt") as file:
    eng_words = file.read().split("\n")
# uncomment the following lines if you want to look at the words before processing them.
for w in eng_words:
   print(w)

d e ɪ ɪ t i
d iː ɪ t i
k ɒ z
k ɔ z
k ə z
d z w u n d z
m̩
ə m
ɛ m
ɪ m
ə m s ɛ l v z
f ɹ e ɪ d
ɡ æ n s t
ə l
m
m̩
ə m
m ʌ ŋ
m ɝ ɪ k ə
ə n
n ʌ f
n ʌ f
ɪ z
z b l ʌ d
s k j uː s
s k j uː z
z d ɛ θ
s f ɑː ɹ
z w u n d z
t ɪ z
t ɪ z n t
t͡ʃ æ l
t j uː d
t w ɒ z
t w ɒ z n̩ t
t w ɪ l
t w ɪ k s t
ə d
ʌ l ə ʊ
ʌ n
p l ʌ s p l ʌ s
d ɒ t k ɒ m
d ɒ t ɪ n t
e ɪ
e ɪ̯
ɑ
ɑː
ɔ
ə
æ n t
ɑː ɑː
ɔː s ə m
ɑː k ə n
e ɪ e ɪ k e ɪ j ʊ
æ k ʊ
ɔː l b ɔː ɡ
ɔː l b ɔː ɹ
ɑː l iː iː
ɑː l s t
ɑː m
ɔː m
ɑː n t b l ɒ m
ɑː ɹ
aː ɹ a u
ɑː d v ɑː k
ɑː d w ʊ l f
ɑː ɹ ə
ɔː h uː s
æ ɹ ə n
ɛ ə ɹ ə n
æ ɹ ɒ n ɪ k
ɛː ɹ ɒ n ɪ k
æ ɹ ɑ n ɪ k ə l
ɛː ɹ ɑ n ɪ k ə l
e ə ɹ n̩ a ɪ t
ɑː s f ə ʊ ɡ ə l
æ b
ə b ɑː
æ b ə k ɑ
ə b æ k ə v ɪ ə ɹ
æ b ə k a ɪ
æ b æ s ɪ n e ɪ t
ə b æ k
ə b æ k w ə d
æ b æ k o ʊ
æ b ə k o ʊ
æ b ə k ɒ s t
æ b ə k a ɪ
æ b ə k ə s
ə b æ f t
ə b ɑː f t
ə b ɑː t
æ b ə l ə ʊ n i
æ b æ m p ɪ ə
ə b æ n d
ə b æ n d n̩
ə b æ n d n̩ d
ə b æ n d n̩ ə d l i
ə b æ n d n̩ m n̩ t
æ b ə ɹ ə ɡ n ə ʊ s ɪ s
ə b e ɪ s
ə b e ɪ s t
ə b e ɪ s ɪ d

æ m b iː ə n t
æ m b ɪ ɡ j uː ɪ t i
æ m b ɪ ɡ j u ə s
æ m b ɪ l iː v ə s
æ m b ɪ t
æ m b ɪ t ə s
æ m b ɪ v ə l ə n t
æ m b ɪ v ɜː ʃ ə n
æ m b ɪ v ɜː t
æ m b ɪ v ɜː t ɪ d
a m b ɪ v ə ɹ t s
æ m b ə l
æ m b l ə
æ m b ə l z
æ m b l ɪ ə ʊ p ɪ ə
æ m b l iː o ʊ p ɪ k
æ m b l iː ɒ p ɪ k
æ m b ə ʊ
æ m b ɹ ə ʊ z
a m b ɹ ə ʊ z ɪ ə l
ɑː m b ɹ i
e i m z e i s
æ m b j ə l ə n s
a m b j ə l ə t ɔ ɹ i
æ m b ə s k e ɪ d
æ m b ʊ ʃ
æ m b ʊ ʃ t
æ m b ʊ ʃ ɪ z
æ m b ʊ ʃ ɪ ŋ
æ m b ʊ ʃ ɪ ŋ z
ə m iː b ə
e ɪ m i
ɑː m ə l æ n d
ə m iː l i ə
ə m iː l j ə
ə m iː l i ə ɹ e ɪ t
e ɪ m ɛ n
ɑː m ɛ n
ə m iː n ə b l
ə m ɛ n d
ə m ɑː n d
ə m ɒ n d
ə m e n d m ə n t
ə m iː n ə t i
ə m ɛ n ə t i
e ɪ m ɛ n ə ɹ iː ə
ə m ɛ n ə ɹ iː ə
e ɪ m ə n t
e ɪ m ɛ n ʃ ə
ə m ɛ n ʃ ə
ə m ɜː s
ə m ɛ ɹ ɪ k ə
ə m ɛ ɹ ɪ k ə n
ə m ɛ ɹ ɪ k e ɪ n ə
ə m ɛ ɹ ɪ k æ n ə
ə m ɛ ɹ ɪ k ɑː n ə
æ m ɛ ɹ ɪ k ə n a ɪ z d
ə m ɛ ɹ ə k ə n ə s
ə m ɛ ɹ ɪ k ə n ə s
ə m ɛ ɹ ɪ k ə z
æ m ə ɹ ɪ s i ə m
ə m ɛ ɹ ɪ k ə
æ m ə ɹ ɪ n d
æ m ə ɹ ɪ n d i ə n
æ m ə ɹ ɪ n d ʒ ə 

ɔː ɹ ɪ ə s
ɔː ɹ ɪ k ə l
a ʊ ɹ ɒ k s
ɔː ɹ ɒ k s
ɔː ɹ ɔː ɹ ə
ə ɹ ɔː ɹ ə
ɔː ɹ ɔ ə ɹ ə l
ɔː ɹ ɔː ɹ ə l
ɔː ɹ ɔ ə ɹ ɪ ə n
ɔː ɹ ə ʊ θ a ɪ ə ʊ m æ l e ɪ t
ɔː ɹ ə m
a ʊ̯ ʃ v ɪ t s
a ʊ̯ ʃ w ɪ t s
ɔ s k ə l t e ɪ ʃ ə n
ɔː s k ə l t e ɪ ʃ ə n
a ʊ s l a ʊ t
a ʊ s l e ɪ z ə
ɔː s ə ʊ n i ə n
ɔː s p ɪ s
ɔː s p ɪ ʃ ə s
ɒ s i
ɒ z i
ɒ s t ɪ n
ɔː s t ə n ɛ s k
ɔː s t iː n ɪ ə n
ɒ s t ɪ n a ɪ t
ɒ s t ə
ɒ s t ə ɹ
ɔː s t ə
ɔː s t ə ɹ
ɒ s t ɪ ə ɹ
ɔː s t ɪ ə ɹ
a ʊ s t ə l ɪ t s
ɔː s t ə l ɪ t s
ɒ s t ɪ n
ɒ s t ɪ n a ɪ t
ɒ s t ɪ n a ɪ t s
ɒ s t ɹ ə l
ɔː s t ɹ ə l
ɒ s t ɹ ə l e ɪ ʒ ə
ɒ s t ɹ e ɪ l i j ə
ɒ s t ɹ e ɪ l iː ə
ɔː s t ɹ e ɪ l ɪ j ə
ɔː s t ɹ e ɪ l ɪ ə
ɒ s t ɹ e ɪ l i j ə n
ɒ s t ɹ e ɪ l iː ə n
ɔ s t ɹ e ɪ l i e ɪ n ə
ɔ s t ɹ e ɪ l i æ n ə
ɔ s t ɹ e ɪ l i ɑ n ə
ɒ s t ɹ e ɪ l j ə n a ɪ z
ɒ s t ɹ e ɪ l j ə n a ɪ z
ɒ s t ɹ ə l ə ʊ p ɪ θ ɪ s iː n
ɒ s t ɹ ɪ ə
ɔː s t ɹ ɪ ə
ɒ s t ɹ i ə n
ɒ s t ɹ i ə n ɪ z ə m
ɒ s t ɹ i ə n ɪ z ə m s
ɒ s t ɹ i ə n s
ɒ s t ɹ ə n iː ʒ ə
ɔː s t ɹ o ʊ n iː ʒ ə n
ɔː s t ɹ o ʊ n iː ʒ

b ɪ ʃ ə p
b ɪ ʃ ə p ɹ ɪ k
b ɪ ʃ ə p s
b ɪ ʃ l ə m ɑː
b ɪ s m ɪ l ɑː
b ɪ z m ə θ
b a ɪ̯ s ə n
b a ɪ s p ɛ s ɪ f ɪ s ɪ t i
b ɪ s f iː n ɒ l
b ɪ s k
b ɪ s k s
b ɪ s ɛ k s t ɪ l
b ɪ s i n
b ɪ s t ʊ ɹ i
b iː s t ɹ ə ʊ
b ɪ s t ɹ ə ʊ
b a ɪ s ɪ l æ b ɪ k
b ɪ t
b ɪ t͡ʃ
b ɪ t ʃ t
b ɪ t ʃ ə z
b ɪ t ʃ ɪ z
b ɪ t͡ʃ i n ə s
b ɪ t ʃ ɪ ŋ
b ɪ t ʃ l ə t
b ɪ t ʃ i
b ɪ t k ɔ ɪ n
b a ɪ t
b a ɪ t ə b ə l
b a ɪ t ə
b a ɪ t s
b a ɪ t i
b ɪ θ ɪ n i ə
b a ɪ t ɪ ŋ
b a ɪ t ɪ ŋ z
b ɪ t p l e ɪ n
b ɪ t s
b ɪ t n̩
b ɪ t ə n
b ɪ t ə
b ɪ t ə l i
b ɪ t ə n
b ɪ t ə n ə s
b ɪ t i
b ɪ t j ʊ m ɪ n
b ɪ t͡ʃ ʊ m ɪ n
b ɪ t j u m ɛ n z
b ɪ t j u m ɪ n ə
b a ɪ v e ɪ l ə n t
b ɪ v ə l ə n t
b a ɪ v æ l v
b ɪ v ɪ ə s
b ɪ v u æ k
b ɪ v w æ k
b a ɪ w iː k l i
b iː ʃ e ɪ
b iː ʃ i e ɪ
b ɪ k s i
b ɪ z
b ə z ɑː ɹ
b ɪ z ɑː ɹ
b ɪ z ɑː n ə s
b ɪ z ɑː ɹ ə ɹ i
b ɪ z b æ b ə l
b l æ b
b l æ b d
b l æ b ə ɹ
b l æ b ə ɹ m a ʊ θ
b l æ b ɪ ŋ
b l æ b i
b l æ b z
b l e ɪ b i
b l æ k
b l a k ə v ʌ ɪ z d
b l æ k b ɔː l
b l æ k b ə ɹ i
b l æ k b ɹ i
b 

k æ l ɪ s θ ɛ n ɪ k s
k a l ɪ v ə
k æ l k
k ɔː ɫ
k ɔː l t
k æ l ə h ə n
k æ l ə l uː
k ɔː l d
k ɔː l ə
k ə l ɪ ɡ ɹ ə f iː t i
k æ l ɪ ɡ ɹ æ m
k æ l ɪ ɡ ɹ æ f
k æ l ɪ ɡ ɹ ɑː f
k ə l ɪ ɡ ɹ ə f ə ɹ
k æ l ɪ ɡ ɹ æ f ɪ k
k ə l ɪ ɡ ɹ ə f i
k ɔː l ɪ ŋ
k ə l a ɪ ə p i
k ə l iː ə p i
k æ l ɪ p æ ʃ
k a l ɪ p ɪ d ʒ ə s
k a l ɪ p ʌ ɪ ɡ ə s
k æ l ɪ θ ʌ m p
k ə l uː
k æ l ə s
k a l ə ʊ
k ɔː l z
k æ l ə s
k a ɹ m
k ɑː m
k ɑː m ə
k ɑː ɹ m l i
k ɑː m n ə s
k ɑː l n
k æ l ə ɹ i
k ə l a ʊ n d ɹ ə
k ə l ɔ ɪ ə
k æ l k
k æ l t ɛ k
k ɔː l t ɹ ə p
k æ l j ʊ m ɛ t
k ə l ʌ m n i e ɪ t
k æ l ə m n i
k ə l ʌ m n i
k æ l v ə ɹ i
k ɑː v
k ɑː v ə
k ɑː v z
k æ l v ɪ n
k æ l v ə n ɪ s t
k æ l v ɪ n ɪ s t
k æ l v ɪ t i z
k æ l v ɪ t i
k æ l v ə s
k æ l k s
k ə l ɪ k j ə l ə s
k ə l ɪ p s ə ʊ
k e ɪ l ɪ k s
k æ l ɪ k s
k æ l t s ə ʊ n i
k æ l z ə ʊ n i
k ə l ɛ ʃ
k ɑː m ə
k æ m ə ɹ ɑː d ə ɹ i
k æ m b ə
k æ m b ə w ɛ l
k a m b ɪ ə m
k e ɪ m b ɹ i ə
k æ m b ɹ i ə
k a m b ɹ ɪ ə n
k e ɪ m b ɹ ɪ d ʒ
k e ɪ m b ɹ ɪ d ʒ ʃ ə ɹ
k æ 

s ɜː k ə m s t ə n s
s ɜː k ə m s t ɑː n s ɪ z
s ɜː k ə m s t ə n s ɪ z
s əː k ə m s t a n ʃ ə l
s ɜː ɹ k ə m s t æ n ʃ ə l ɪ i
s ɜː k ə m s t ɛ l ə
s ɜː k ə m v æ l e ɪ t
s ɜː k ə m v æ l e ɪ ʃ ə n
s ɜː ɹ k ə m v ɛ n ʃ ə n
s ɜː k ə s
s ʌ ɪ ɹ ə n s ɛ s t ə
s iː ɹ ə ʊ n
s ɜː k
s ɪ ɹ o ʊ s ɪ s
s ɪ ɹ ə s t ɹ e ɪ t ə s
s ɪ ɹ ə s
s ɪ ɹ ə s
s ɪ s
s ɪ s æ t l æ n t ɪ k
s ɪ s k
s ɪ s k ə ʊ
s ɪ s d ʒ ɛ n d ə
s ɪ s h ɛ t
s ɪ s l ɒ k ə t ɪ v
s ɪ s i
k ɪ s t
s ɪ s t
s ɪ s t ə n
s ɨ s t ɪ k ɘ l ɘ
s ɪ t
s ɪ t ə d ə l
s ɪ t ə d ɛ l
s a ɪ t ə l
s ʌ ɪ t ə l
s a ɪ t
s a ɪ t ɪ d
s ɪ t ɪ ə ɹ ɪ ə
s a ɪ t iː z
s a ɪ t s
s ɪ t i z
s a ɪ t ɪ ŋ
s ɪ t ɪ z ə n
s ɪ t ɪ z ə n z
s ɪ t ɹ ə n d ʒ k w ɑː t
s ɪ t ɹ ɪ ə s
s ɪ t ɹ ɪ k
s ɪ t ɹ i n
s ɪ t ɹ iː n
s ɪ t ɹ ə n
s ɪ t ɹ ə n
s ɪ t ɹ ə s
s ɪ t i
s ɪ v ɪ t
s ɪ v i
s ɪ v ɪ k
s ɪ v ɪ k s
s ɪ v ə l
s ɪ v ɪ l j ə n
s ɪ v ɪ l a ɪ z e ɪ ʃ ə n
s ɪ v ɪ l a ɪ z
s ɪ v ɪ l ɪ s t
s ɪ v ɪ l ɪ s t s
s ɪ v ɪ l ɪ t i
s ɪ v ɪ l a ɪ z e ɪ ʃ ə n
s ɪ v ɪ l a ɪ z d
s ɪ v l̩ z
k i w ɪ t

k uː
k uː t ʃ
k uː t ʃ ɪ z
k uː t͡ʃ i
k uː t ʃ i z
k uː d
k uː iː
k uː ɪ ŋ
k uː ɪ ŋ z
k uː d͡ʒ ɒ ŋ
k ʊ k
k ʊ k ə b ə l
k ʊ k b ʊ k
k ʊ k t
k ʊ k ə
k ʊ k ə ɹ i
k ʊ k i
k ʊ k i z
k ʊ k ɪ ŋ
k ʊ k s
k uː l
k uː l ə n t
k uː l d a ʊ n
k uː l d
k uː l ə ɹ
k u l i
k uː l ɪ b ɑː
k u l ɪ d ʒ
k uː l i
k uː l ɪ ŋ
k uː l i
k uː l n ə s
k uː l z
k uː l θ
k uː m
k uː n d
k uː n ɪ ŋ
k uː n z
k a ʊ p
k uː p
k ə ʊ ɒ p
k uː p t
k uː p ə ɹ
k o ʊ ɒ p ə ɹ e ɪ t
k u ɒ p ə ɹ e ɪ t
k o w ɑ p ə ɹ e j ʃ ə n
k uː p ɪ ŋ
k uː p s
k w ɔː d ɪ n n e ɪ t
k w ɔː d ɪ n ɪ t
k ə ʊ ɔː d ɪ n e ɪ t
k ə ʊ ɔː d ɪ n ɪ t
k uː z
k uː t
k u t ɚ
k u d ɚ z
k uː t i z
k uː t s
k uː z
k ɒ p
k ə ʊ p ə s ɛ t ɪ k
k ɒ p ə ɡ æ n d ə
k ə ʊ p ə l
k ə ʊ p
k ə ʊ p iː d ə n t
k o ʊ p m ə n
k ə ʊ p ə n h e ɪ ɡ ə n
k ə ʊ p ə n h ɑː ɡ ə n
k o ʊ p ə ɹ n ɪ s i ə m
k ə ʊ f ə
k ɒ p i d
k ɒ p ɪ ə
k ɒ p i z
k ə ʊ p l e ɪ n ə ɹ
k ɒ p ə
k ɒ p ə f iː l d
k ɒ p ə ɹ ɒ p ɒ l ɪ s
k ɒ p ɪ s
k ɒ p ɹ ə
k o ʊ p ɹ ɪ s ɪ p ɪ t e ɪ ʃ ə n
k ɒ p ɹ ə ʊ l ʌ ɪ t
k ɒ p s
k

d ɛ b ɪ ə ɫ
d ɪ b ɪ l ɪ t ə n t
d ɪ b ɪ l ɪ t e ɪ t
d ɪ b ɪ l ɪ t e ɪ t ə d
d ɪ b ɪ l ɪ t e ɪ t ɪ ŋ ɡ
d ɪ b ɪ l ɪ t e ɪ ʃ ə n
d ɪ b ɪ l ɪ t i
d ɛ b ɪ t
d iː b ɪ t j ə m ɪ n a ɪ z e ɪ ʃ ə n
d iː b ɪ t j ə m ɪ n a ɪ z
d iː b l ɛ n d
d iː b l ɛ n d ɪ ŋ ɡ
d iː b l ə ʊ t
d iː b l ɒ k
d iː b l ɒ k t
d iː b l ɜː ɹ
d iː b l ɜː ɹ ɪ ŋ ɡ
d ɪ b ɔː ɹ d
d ɛ b ə n e ə ɹ
d iː b ə ʊ n
d iː b ə ʊ n d
d iː b ə ʊ n ə ɹ
d ɛ b ə ɹ ə
d ɛ b ə ɹ ə
d ɪ b ɒ s
d ɪ b a ʊ t͡ʃ
d ɪ b uː ʃ
d ɪ b uː ʃ
d ɪ b uː ʃ ə
d ɪ b uː ʃ ɪ ə
d iː b a ʊ n s
d iː b a ʊ n s ə ɹ
d ɛ b ɹ ə
d iː b ɹ ɑː n t ʃ
d iː b ɹ ɑː n t ʃ ɪ ŋ ɡ
d iː b ɹ æ n d
d iː b ɹ ɛ s t ə d
d ɪ b ɹ iː d
d e ɪ b ɹ iː d m ɑ̃
d ɪ b ɹ iː d m ə n t
d iː b ɹ iː f
d iː b ɹ iː f ə ɹ
d iː b ɹ iː f ɪ ŋ
d e ɪ b ɹ iː
d ɛ b ɹ iː
d ɛ t
d ɛ t ə d
d ɛ t ə
d ɛ t s
d iː b ʊ k ə l a ɪ z e ɪ ʃ ə n
d iː b ʌ k ə l a ɪ z e ɪ ʃ ə n
d iː b ʊ f
d iː b ʌ f
d iː b ʌ ɡ
d iː b ʊ ɡ ə b ɪ l ɪ t i
d iː b ʌ ɡ ə b ɪ l ɪ t i
d iː b ʊ ɡ i
d iː b ʌ ɡ i
d iː b ʊ ɡ ə
d iː b ʌ ɡ ə ɹ
d iː b ʌ ɡ ɪ ŋ
d i b

d ɪ ɡ b i
d a ɪ d ʒ ɛ n ɪ s ɪ s
d ʌ ɪ d ʒ ɪ n ɛ t ɪ k
d ɪ d ʒ ɪ ɹ ɑː t i
d a ɪ d ʒ ə s t
d a ɪ d ʒ ɛ s t
d ə d ʒ ɛ s t
d a ɪ d ʒ ɛ s t ə b ə ɫ
d a ɪ d ʒ ɛ s t ɪ f
d iː ʒ ɛ s t iː f
d a ɪ d ʒ ɛ s t ʃ ə n
d ɨ d ʒ ɛ s t ʃ ə n
d a ɪ d ʒ ɛ s t ɪ v
d ɪ ɡ ɪ n z
d ɪ ɡ ə
d ɪ ɡ z
d ɪ ɡ ɪ n
d ɪ ɡ ɪ ŋ ɡ
d ɪ ɡ ɪ n z
d ɪ ɡ z
d a ɪ t
d a ɪ t ə d
d ɪ d ʒ iː b ɒ k s
d ɪ d ʒ iː k æ m
d ɪ d ʒ iː l æ n t i
d ɪ d ʒ iː p æ k
d ɪ d ʒ ɪ t
d ɪ d͡ʒ ɪ t ə ɫ
d ɪ d ʒ ɪ t ɑː l ɪ n
d ɪ d ʒ ɪ t ɑː l ɪ s
d ɪ d ʒ ɪ t ə l a ɪ z e ɪ ʃ ə n
d ɪ d ʒ ɪ t ə l a ɪ z
d ɪ d ʒ ɪ t e ɪ ʃ ə n
d ɪ d ʒ ɪ t ɪ ɡ ɹ e ɪ d
d ɪ d ʒ ɪ t a ɪ z e ɪ ʃ ə n
d ɪ d ʒ ɪ t a ɪ z
d ɪ d ʒ ɪ t a ɪ z ə ɹ
d ɪ d ʒ ɪ t ə ʊ n ɪ n
d a ɪ ɡ l ɒ s i ə
d a ɪ ɡ l ɒ t ɪ z ə m
d a ɪ ɡ l uː k ə n e ɪ t
d a ɪ ɡ l ɪ s ə ɹ a ɪ d
d a ɪ ɡ l a ɪ s iː n
d a ɪ ɡ l ɪ f
d ɪ ɡ n ɪ f a ɪ d
d ɪ ɡ n ɪ f a ɪ
d ɪ ɡ n ɪ t ɹ i
d ɪ ɡ n ɪ t i
d a ɪ ɡ ɒ n
d a ɪ ɡ ə n
d ɪ d͡ʒ ɒ k s ɪ n
d a ɪ ɡ ɹ æ m
d a ɪ ɡ ɹ æ f
d a ɪ ɡ ɹ ɑː f
d a ɪ ɡ ɹ ɛ s
d ɪ ɡ ɹ ɛ s
d ɪ ɡ ɹ ɛ ʃ ə n
d ʌ ɪ ɡ ɹ ɛ ʃ ə n


ɪ ɡ æ l ɪ t ɛ ə ɹ i ə n
ɪ d ʒ ɪ ə ɹ ɪ ə
iː d ʒ ɛ s t
iː d͡ʒ ɛ s t͡ʃ ə n
ɛ ɡ
ɛ ɡ ə
ɛ ɡ k ɔː n
ɛ ɡ d
ɛ ɡ ə
ɛ ɡ ɪ ŋ
ɛ ɡ ɪ ŋ z
ɛ ɡ n ɒ ɡ
ɛ ɡ z
ɛ ɡ ʃ ɛ l
ɛ ɡ i
ɛ ɡ ə m
iː ɡ ə ʊ
iː ɡ ə ʊ b uː
iː ɡ ə ʊ n ɒ m ɪ k s
ɛ ɡ ə ʊ n ɒ m ɪ k s
iː ɡ ə ʊ z
ə ɡ ɹ iː d ʒ i ə s
ɪ ɡ ɹ iː d ʒ ə s
ɪ ɡ ɹ i d ʒ ə s l i
ɛ ɡ ɹ ɪ ɡ ɔ ɹ
iː ɡ ɹ ɛ s
ɪ ɡ ɹ ɛ s
i ɡ ɹ ɪ t
iː d ʒ ɪ p t
ɪ d ʒ ɪ p ʃ ə n
iː d ʒ ɪ p t ɒ l ə d ʒ i
e ɪ
ɛ
iː d
ʌ ɪ d ə n t
a ɪ d ə
a ɪ d ɛ t ɪ k
a ɪ d ə ʊ l ə n
a ɪ d ɒ s
a ɪ f ə l
a ɪ ɡ ə n ɡ ɹ a ʊ
a ɪ ɡ ə n v æ l j uː
e ɪ t
e ɪ t iː n θ
e ɪ t θ
e ɪ t i ə θ
e ɪ t i
e ɪ n ə
a ɪ n d h ə ʊ v ə n
ʌ ɪ n z iː d ə l n
a ɪ n s t a ɪ n
a ɪ n s t a ɪ n ɪ ə n
ɛ ə
ɛ ə ɹ ə
a ɪ ɹ iː n i
a ɪ ɹ iː n ɪ k ɒ n
ɛ ə ɹ z
a ɪ s ɪ d ʒ iː s ɪ s
a ɪ z ə n h a ʊ ə ɹ
e ɪ ʃ
e ɪ s t e ð v ɒ d
iː s t e ð v ɒ d
ə s t ɛ d f ə d
æ ɪ s t ɛ ð f ə d s
a ɪ ð ə ɹ
iː ð ə ɹ
ɪ d ʒ æ k j ʊ l e ɪ t
ɪ d ʒ æ k j ʊ l ə t
i d ʒ æ k j u l e ɪ ʃ ə n
ɪ d ʒ æ k j ə l e ɪ t ə ɹ
ɪ d ʒ æ k j ə l ə t ɔ ɹ i
iː d ʒ ɛ k t
ɪ d ʒ ɛ k t
ə d ʒ ɛ k t ə
ə j e k

f e ɪ k n̩
f ə l æ f ə l
f ə l ɑː f ə l
f ə l ɒ f ə l
f æ l k e ɪ t
f ɔː l ʃ ə n
f ɔː l ʃ ə n d
f æ l s ɪ f ə ɹ ə s
f æ l s ɪ f ɔː m
f ɒ l s ɪ f ɔː m
f æ l s ɪ f ɔː m ɪ t ɪ
f ɒ l k ə n
f ɔː l k ə n
f ɒ l k ə n ə ɹ
f ɔː k n ə ɹ
f æ l k ə n ɛ t
f ə l ɪ s k ə n
f ɔː l
f ə l e ɪ ʃ ə s
f æ l ə s i
f ɔː l b æ k
f ɔː l ə n
f æ l ɪ b ɪ l ɪ z ə m
f ɔː l ɪ ŋ
f ɔː l a ʊ t
f æ l ə ʊ
f ɔː l z
f æ l m ə θ
f ɒ l s
f ɔː l s
f ɒ l s h ʊ d
f ɒ l s ɛ t ə ʊ
f ɔː l s ɛ t ə ʊ
f ɒ l s ɪ f a ɪ
f ɒ l t ə r
f ɔː l t ə r
f æ m ə ɡ ʊ s t ə
f e ɪ m
f e ɪ m d
f æ m ɪ l ɛ k t
f ə m ɪ l j ə l
f ə m ɪ l i ə
f ə m ɪ l ɪ æ ɹ ɪ t i
f æ m ɪ l i
f æ m ɪ n
f a m ɪ ʃ
f æ m ɪ ʃ t
f a m ɪ ʃ m ə n t
f e ɪ m ə s
f æ n
f æ n æ k
f ə n æ t ɪ k
f ə n æ t ɪ k ə l
f æ n s i d
f æ n s i z
f æ n s i
f æ n d æ b iː d ə ʊ z i
f æ n d æ ŋ ɡ ə ʊ
f æ n d ə m ə ʊ n i ə m
f æ n d ə m
f æ n d ʌ b
f e ɪ n
f æ n ɛ d
f æ n f ɛ ə
f æ ŋ
f æ ŋ ɡ ə l
f æ ŋ k ə l
f æ n l ɪ ŋ
f æ n m æ ɡ
f æ n
f æ n d
f æ n ɪ ŋ
f æ n ɪ ŋ z
f æ n ɪ ʃ
f æ n i
f æ n ə n
f

f ʌ n d ʒ ɪ b l
f ʌ n d ʒ ɪ b ə l
f ʌ n d ʒ ɪ s a ɪ d
f ʌ ŋ ɡ ɪ s a ɪ d
f ʌ n d ʒ ɪ f ɔː m
f ʌ ŋ ɡ ɪ f ɔː m
f ʌ n d ʒ ɪ v ɜ ɹ ə s
f ʌ ŋ ɡ ɪ v ɜ ɹ ə s
f ʌ ŋ ɡ ə s
f j ʊ n ɪ k j ʊ l ə s
f ʌ ŋ k
f ʌ ŋ k ə d ɛ l ɪ k
f ʌ ŋ k s
f ʌ ŋ k t æ s t ɪ k
f ʌ n l ə s n ə s
f ʌ n ə l
f ʌ n i ə
f ʌ n ɪ ə
f ʌ n i ɪ s t
f ʌ n ɪ ɪ s t
f ʌ n ə l i
f ʌ n i
f ʌ n ɪ
f ʌ n t æ s t ɪ k
f u k ɑ h ɑ
f ɜː ɹ
f əː b ə l ə ʊ
f əː b ɪ l ə ʊ
f ɜ ɹ k ə l
f əː k e ɪ t
f əː k ə t
f j ʊ ɹ
f ɜː f ə
f j ʊ ə ɹ ɪ ə s
f j ʊ ə̯ ɹ i ə̯ s l i
f ɜː ɹ l ɒ ŋ
f ɜː ɹ l ə ʊ
f ɜː n ɪ s
f ɜː n ɪ ʃ
f ɜː n ɪ ʃ t
f ɜː n ɪ t ʃ ə
f j ɜ ɹ ə
f j ʊ ə ɹ ə
f j ʊ ə ɹ ɔː ɹ i
f ɜː ɹ i ə
f ʌ ɹ i ə
f ʌ ɹ ə ʊ
f ɜː ɹ i
f ɜː z
f ə ʃ l ʌ ɡ ɪ n ə
f ɜː s ə ʊ n ə
f ɜː s uː t ə
f ɜː ɹ ð ə ɹ
f ɜː ɹ ð ə ɹ ə n s
f ɜː ɹ ð ə ɹ m ɔː ɹ
f ɜː ɹ ð ɪ s t
f ɜː t ɪ v
f ɜː t ɪ v l i
f ɜː t l
f j ʊ ɹ ʌ ŋ k j ʊ l ə
f j ʊ ə ɹ i
f ɜː ɹ z
f ʊ s h ə
f ʌ s k ə s
f j uː z
f j uː z d
f j uː z ə l ɑː ʒ
f j uː z ɪ z
f ʊ s h ə
f j uː s ɪ d ɪ k
f j uː z ɪ l
f j uː z ɪ l ɪ ə
f j uː z ɪ ŋ

ɡ ɹ a ʊ n d ɪ d
ɡ ɹ a ʊ n d ə ɹ
ɡ ɹ a ʊ n d ɪ ŋ
ɡ ɹ a ʊ n d ɪ ŋ z
ɡ ɹ a ʊ n d z
ɡ ɹ a ʊ n d s ə l
ɡ ɹ a ʊ n s ə l
ɡ ɹ a ʊ n d s ə l
ɡ ɹ uː p
ɡ ɹ uː p t
ɡ ɹ uː p ə ɹ
ɡ ɹ uː p i
ɡ ɹ uː p ɪ ŋ
ɡ ɹ uː p ɪ ŋ z
ɡ ɹ uː p s
ɡ ɹ uː p θ ɪ ŋ k
ɡ ɹ uː p ə s k j uː l
ɡ ɹ a ʊ s
ɡ ɹ a ʊ t
ɡ ɹ ə ʊ v
ɡ ɹ ə ʊ v z
ɡ ɹ ə ʊ v i
ɡ ɹ ə ʊ
ɡ ɹ ə ʊ ɪ ŋ
ɡ ɹ a ʊ l
ɡ ɹ a ʊ l d
ɡ ɹ a ʊ l ə
ɡ ɹ a ʊ l z
ɡ ɹ ə ʊ n
ɡ ɹ ə ʊ z
ɡ ɹ ə ʊ θ
ɡ ɹ ɔ ɪ n
ɡ ɹ ʌ b
ɡ ɹ ʌ b d
ɡ ɹ ʌ b ɪ ŋ
ɡ ɹ ʌ b ɪ ŋ z
ɡ ɹ ʌ b i
ɡ ɹ ʌ b z
ɡ ɹ ʌ d ʒ
ɡ ɹ ʌ d ʒ d
ɡ ɹ ʌ d ʒ ɪ z
ɡ ɹ ʌ d ʒ ɪ ŋ
ɡ ɹ uː
ɡ ɹ uː ə l
ɡ ɹ ʊ ə l ɪ ŋ
ɡ ɹ uː z
ɡ ɹ ʌ f
ɡ ɹ ʌ f ɪ ʃ
ɡ ɹ ʌ m
ɡ ɹ ʌ m b l̩
ɡ ɹ uː m
ɡ ɹ ʌ m ə l
ɡ ɹ ə m ɚ
ɡ ɹ ə m ɪ s t
ɡ ɹ ʌ m p
ɡ ɹ ʌ m p t
ɡ ɹ ʌ m p ɪ ŋ
ɡ ɹ ʌ m p s
ɡ ɹ ʌ m p i
ɡ ɹ ʌ n d ə l
ɡ ɹ ʌ n d ʒ
ɡ ɹ ʌ n d ʒ i
ɡ ɹ ʌ n j ə n
ɡ ɹ ʌ n t
ɡ ɹ ʌ n t ɪ d
ɡ ɽ ʌ n t ə
ɡ ɹ ʌ n t ɪ ŋ
ɡ ɹ ʌ n t ɪ ŋ z
ɡ ɹ ʌ n t l̩ d
ɡ ɹ ʌ n t s
ɡ r uː j ɛː
ɡ r uː ɛː
ɡ ɹ iː k æ s t ə
d ʒ iː s k j uː
ɡ w ɑː d ə l ə h ɑː ɹ ə
ɡ w ɑː d ə l k ə n ɑː l
ɡ w ɑː d ə l k ɪ v ɪ ə
ɡ w ɑː d ə l

h ɒ ɹ ɪ f ɪ k e ɪ ʃ ə n
h ɒ ɹ ɪ f a ɪ
h ɒ ɹ ɪ p ɪ l e ɪ t
h ɒ ɹ ɪ p ɪ l e ɪ t ɪ d
h ɒ ɹ ɪ p ɪ l e ɪ t ɪ ŋ
h ɒ ɹ ə
h ɒ ɹ ə s ə m
h ɔː s
h ɔː s b æ k
h ɔː s m ə n
h ɔː s m ə n
h ɔː s p a ʊ ə
h ɔː s ɹ æ d ɪ ʃ
h ɔː s ɹ æ d ɪ ʃ t
h ɔ r s ə s
h ɔ r s ɪ z
h ɔː s ʃ uː
h ɔː ɹ s t e ɪ l
h ɔː ɹ s i
h ɔː s t
h ɔː s i
h ɔː t ə t ɪ v
h ɔː t ə t ə ɹ i
h ɔː ɹ t ɛ n z i ə
h ɔː t ɪ k ʌ l t ʃ ə ɹ
h o ʊ z æ n ə
h o ʊ z ɑ n ə
h ə ʊ z
h ə ʊ z d
h ə ʊ z ɪ z
h ə ʊ z ə ɹ
h ə ʊ z ɪ ə ɹ
h ə ʊ ʒ ə ɹ
h ə ʊ ʒ ɪ ə ɹ
h ə ʊ z ɪ ŋ
h ə ʊ z ɪ ŋ z
h ɒ s p ɪ s
h ɒ s p ɪ t ə b l̩
h ɒ s p ɪ t l̩
ɒ s p ɪ t l̩
h ɒ s p ɪ t æ l ɪ t i
h ɒ s p ɪ t ɪ s a ɪ d
h ə ʊ s t
h ɒ s t ə
h ɒ s t ɪ d ʒ
h ə ʊ s t ɪ d
h ɒ s t ə l
h ə ʊ s t ə s
h ɒ s t ɪ s a ɪ d
h ɒ s t a ɪ l
h ɒ s t ə l
h ɒ s t ɪ l ɪ t i z
h ɒ s t ɪ l ɪ t i
h ə ʊ s t ɪ ŋ
h ə ʊ s t ɪ ŋ z
h ɒ s l ə
h ə ʊ s t s
h ɒ t
h ɒ t ʃ
h ɒ t ʃ ə
h ɒ t͡ʃ p ɒ t͡ʃ
h ɒ t d ɒ ɡ
h ə ʊ t ɛ l
h ə ʊ t ɛ l i ə
h ɒ t k iː
h ɒ t i
h ɒ k
h a ʊ n d
h a ʊ n d ɪ d
h a ʊ n d ɪ ŋ
h a ʊ n d ɪ ŋ z
h a ʊ n d z
h

ɪ n t ə l ɒ k j ʊ t ə
ɪ n t ə ɹ m æ ɹ i
ɪ n t ə m ɛ d ə l
ɪ n t ə m iː d ɪ ə s i
ɪ n t ə m iː d ɪ ə t ə ɹ ɪ
ɪ n t ə m iː d ɪ ə t ɹ i
ɪ n t ə m ɛ t s ə ʊ
ɪ n t ɜː ɹ m ɪ n ə b ə l
ɪ n t ə m ɪ t
ɪ n t ə m ɪ t n̩ t
ɪ n t ə m ɪ t ə n t l ɪ
ɪ n t ɜː n
ɪ n t ə n æ ʃ ə n ə l
ɪ n t ɚ n æ ʃ ə n æ l
ɪ n t ɚ n æ ʃ ə n ə l
ɪ n t ə n æ ʃ ə n ə l ə z e ɪ ʃ ə n
ɪ n t ə n iː s a ɪ n
ɪ n t ə n iː ʃ ə n
ɪ n t ɜː n iː
ɪ n t ə n ɛ t
ɪ n t ə ɹ ə ʊ ʃ iː æ n ɪ k
ɪ n t ə ɹ ɒ k j ə l ə ɹ
ɪ n t ə ɹ ɒ p ə ɹ ə b ɪ l ə t i
ɪ n t ə ɹ p ɛ l e ɪ t
ɪ n t ɜ ɹ p ə l e ɪ t
ɪ n t ɜ ɹ p ə l e ɪ t
ɪ n t ə p ə ʊ z
ɪ n t ə p ə ʊ z d
ɪ n t ɜː p ɹ ɪ t
ɪ n t ə p ɹ ə t e ɪ ʃ ə n
ɪ n t ɜː p ɹ ɪ t ɪ d
ɪ n t ɜː p ɹ ɪ t ə
ɪ n t əː p ɹ ɪ t ə s
ɪ n t ə ɹ e ɪ ʃ ə l
ɪ n t ɛ ɹ ə ʊ b æ ŋ
ɪ n t ɛ ɹ ə ɡ ə b ɪ l ɪ t i
ɪ n t e ɹ ə ɡ e ɪ ʃ ə n
ɪ n t ə ɹ ɒ ɡ ə t ɪ v
ɪ n t ə ɹ ʌ p t ɪ d
ɪ n t ə ɹ ʌ p ʃ ə n
ɪ n t ə s ɛ k t
ɪ n t ə ɹ s ɛ k ʃ ə n
ɪ n t ə s ɛ k ʃ ə n æ l ɪ t i
ɪ n t ə s ɛ k s
ɪ n t ɚ s l ɑː v ɪ k
ɪ n t ə s p ə s ɪ f ɪ k
ɪ n t ə ɹ s p 

l æ d ʒ ɨ d z
l æ n j æ p
l æ ɡ ə m ɔ ɹ f ɪ k
l ə ɡ uː n
l ə ɡ ə ʊ p ə d iː z
l ə ɡ ə ʊ p ə ʊ d z
l ə ɡ ə ʊ p ə s
l e ɪ ɡ ɒ s
l æ ɡ t a ɪ m
l ɑ
l ɑ h ɑ ɹ
l ə p ɛ t
l a ɪ
l e ɪ ə k ɪ z ə m
l e ɪ ɪ k ɪ z ə m
l e ɪ ɪ s ɪ t i
l e ɪ d
l e ɪ n
l ɛ ə
l ɛː d
l e ɪ s
l e ɪ ə t i
l e ɪ ɪ t i
l a ɪ ə s
l e ɪ k
l e ɪ k b ɛ d
l e ɪ k ə ɹ
l e ɪ k s
l e ɪ k ʃ ɔ ɹ
l e ɪ k ʃ ɔː
l ɑː k
l ɑː k s
l e ɪ k ɪ n
l ə k ə ʊ t ə
l æ m
l ɑː m ə
l ə m ɑː s ə ɹ i
l ə m a s uː
l æ m
l æ m b ɑː
l æ m b e ɪ s t
l æ m b æ s t
l æ m t ʃ ɒ p
l æ m d ə
l æ m b d ə s ɪ z ə m
l æ m b ə n t
l æ m ə ɹ
l æ m k ɪ n
l æ m b ə ʊ
l æ m b ə ɹ ɡ i n i
l æ m z
l e ɪ m
l ɑː m ɛ d
l ə m ɛ l ə
l e ɪ m l i
l ə m ɛ n t
l æ m ə n t ə b ə l
l ə m ɛ n t ə b ə l
l æ m ə n t e ɪ ʃ ə n
l æ m ɪ n t e ɪ ʃ ə n
l ə m ɛ n t f ʊ l
l e ɪ m z
l ə m i s ə
l e ɪ m t æ s t ɪ k
l ə m ɛ t ə
l e ɪ m ɪ ə
l æ m ɪ n ə
l æ m ɪ n ə
l æ m ɪ n e ɪ t
l æ m ɪ n ə t
l æ m ə n e ɪ ʃ ə n
l æ m ɪ n e ɪ ʃ ə n
l æ m ɪ ŋ t ə n
l æ m ə s
l a m ə ɡ a ɪ ə
l æ m p
l æ m p æ s ə

m ə d ʒ ɔː k ə
m ə j ɔː k ə
m e ɪ d ʒ ə d ə ʊ m ə ʊ
m e ɪ d ʒ ə ɹ ɛ t
m ə d͡ʒ ɒ ɹ ɪ t i
m æ d ʒ ə ɹ ə ʊ
m ə d ʒ ʊ ə ɹ ə ʊ
m æ d ʒ ə s k j uː l
m ə k ɑː
m æ k ə
m e ɪ k
m e ɪ k l ə s
m ɑ k e m ɑ k e
m e ɪ k p iː s
m e ɪ k ə
m e ɪ k s
m e ɪ k ʃ ɪ f t
m ə k ɔː ɹ k ə
m ə x ɔː ɹ k ə
m e ɪ k ɪ ŋ
m æ k ɪ w ɑː ɹ ə
m e ɪ k o ʊ
m ɑː k ə ʊ
m ə k ɒ n d e ɪ
m ə l æ k ə
m æ l ə k a ɪ t
m a l ə d m ɪ n ɪ s t ɹ e ɪ ʃ ə n
m a l ə d ɹ ɔ ɪ t n ə s
m æ l ə d i
m æ l ə ɡ æ ʃ
m æ l ə ɡ e ɪ z i
m æ l ə ɡ æ s i
m a l ə ɡ ɛ t ə
m æ l e ɪ z
m ə l e ɪ z
m æ l ə m j uː t
m a l ə p əː t
m æ l ə p əː t
m æ l ə p ɹ ɒ p ɪ z ə m
m e ɪ l ə
m ə l ɛ ə ɹ i ə
m ə l ɑː k i
m ə l ɑː w i
m e ɪ l e ɪ
m ə l e ɪ
m ə l e ɪ ə
m a l ə j ɑː l ə m
m ə l e ɪ ʒ ə
m ə l e ɪ z i ə n
m ə l e ɪ ʒ ə n
m ə l e ɪ z i ə n z
m ə l e ɪ ʒ ə n z
m æ l k ə m
m a l k ə n t ɛ n t
m ɒ l d iː v s
m ɔː l d a ɪ v s
m ɔː l d iː v s
m e ɪ l
m æ l ə d a ɪ t
m ə l ɛ f ɪ k
m ə l ɛ f ɪ s ə n s
m ə l ɛ f ɪ s ə n t
m a l ɛ n d ʒ ɪ n
m e ɪ l z
m ə l ɛ v ə l ə n s

n ɛ m ə ʊ t ɛ k n ɪ k ə l
n iː m ə t ɛ k n i
m ə ʊ
m ə ʊ ə
m o ʊ a ɪ
m ə ʊ n
m ə ʊ n d
m ə ʊ n i
m ə ʊ t
m ɒ b
m ə ʊ b a ɪ l
m ə ʊ b iː l
m ə ʊ b ʌ ɪ l
m ə ʊ b ɪ l ɪ t i
m ə ʊ b ə l
m ə ʊ b ə l d
m ɒ b ɒ k ɹ ə s i
m ɒ k ə s ɪ n
m ɒ k ə
m ɒ k
m ɒ k ə ɹ i
m ɒ k ɪ ŋ
m ɒ k n i
m ɒ k ʌ p
m ɒ d
m ə ʊ d
m ɒ d l̩
m ɒ d l̩ s
m ə ʊ d ə m
m ə ʊ d ɛ m
m ɒ d ə ɹ e ɪ ʃ ə n
m ɒ d ə n
m ə d ɜː ɹ n ɪ t i
m ɒ d ə n a ɪ z e ɪ ʃ n̩
m ɒ d ə n ɪ z e ɪ ʃ n̩
m ɒ d ə n a ɪ z
m ɒ d ɪ s t ə ɹ
m ɒ d ɪ s t ɪ s t
m ɒ d ə s t i
m ɒ d ɪ k ə m
m ɒ d ɪ f ɪ k e ɪ ʃ ə n
m ɒ d ɪ f a ɪ d
m ɒ d ɪ f a ɪ ə
m ɒ d ɪ f a ɪ
m ə ʊ d iː s t
m ə d ʒ ɑː d ʒ i
m ɑː d ʒ ə l e ɪ t
m ɒ d j uː l
m ɒ d j ʊ l ə ʊ
m ə ʊ d ə s
m ə ʊ
m ə ʊ e ɪ
m ʊ x uː
m ʊ ɡ uː
m ɔ ɪ l
m iː s i ə
m ɒ f i
m ə ʊ f ə ʊ
m ə ʊ f ʌ s ə l
m ɒ ɡ i
m ə ʊ ɡ ɹ ə
m o ʊ ɡ ə l
m ə ʊ ɡ ə l
m ə ʊ ɡ ə l d
m ə ʊ ɡ ʌ l d
m ɒ ɡ w a ɪ
m ə ʊ h ɛ ə
m o ʊ h i ɡ ə n
m ɔ ɪ ə l
m ɔ ʊ ɛ l
m ə ʊ ɪ z ə m
m ə ʊ h ə ɹ
m ɔ ɪ ə t i
m ɔ ɪ l
m ɔ ɪ ɹ ə
m w ɑː
m w a ɹ e ɪ
m ɔ ɹ e ɪ
m ɔ ɪ s t
m ɔ ɪ

n o ʊ v ə m d ə s ɪ l i ə n
n ɒ v ɡ ə ɹ ɒ d
n ɔː v ɡ ə ɹ ə t
n ɒ v ɪ s
n ə v ɪ ʃ i ə t
n ɒ v ɪ t ɪ
n a ʊ
n a ʊ ə d e ɪ z
n ə ʊ w e ɪ
n ə ʊ w ɛ ə
n ə ʊ w a ɪ z
n ə ʊ̯ ɹ uː z
n a ʊ z
n ɒ k ʃ ə s
n ɔ ɪ
n w a j aː d
n ɔ ɪ ə n s
n ɔ ɪ z
n ɔ ɪ ə s
n ɒ z ə l
ɛ n p iː ə ʊ v iː
ɛ n ɑː iː ɛ m
ɛ n ɹ ɛ m
ɛ n ɹ ɒ f
ə n s uː t a ɪ t
ɛ n θ
ɛ n t ɪ ɡ ɹ æ m
n j uː
n j uː ɑː n s
n u b
n ʌ b
n uː b k e ɪ k
n ʌ b k e ɪ k
n j uː b a ɪ l
n j uː k
n ʌ k
n ʌ t ʃ
n j uː k ə
n j uː k l ɪ ə
n j uː k l ɪ ɪ n
n j uː k l i o ʊ f ɛ k t ɪ d
n j uː k l i ə f ɛ k t ɪ d
n j uː k l i ɔ ɪ d
n j uː k l i ə tʰ a ɪ d
n j uː k l i ə s
n j uː k l a ɪ d
n j uː k j ə l ə
n j uː d
n ʌ d ʒ
n j uː d ɪ b ɹ æ ŋ k
n j uː d ɪ z ə m
n j u d ɪ t i
n j ʊ d i ə s t ɜ ʃ ɪ ə n
n j uː d ɪ v a ɪ ɹ ə l
n ʊ d n ɪ k
n uː ə
n j uː ɡ ə t ɔ ɹ i
n ʌ ɡ ə t
n ɐː
n ə
n j uː s ə n s
n j uː k
n j uː k s
n ʌ l
n ʌ l d
n ʌ l ɪ b a ɪ ɪ t i
n ʌ l ɪ b ɪ k w ɪ t ə s
n ʌ l ɪ f a ɪ
n ʌ l ɪ ŋ
n ʌ l z
n ʌ m
n ʌ m b ə
n ʌ m ə
n ʌ m b ə d
n ʌ m b ə z
n j uː m ə n
n j

p æ n d
p æ n ɪ ə
p æ n ɪ ə w a ɪ z
p æ n ɪ ŋ
p æ n ɪ ŋ z
p æ n ə p l i
p a n ɒ p t ɪ k
p æ n ə ɹ æ m ə
p æ n ə ɹ ɑː m ə
p a n ə ɹ a m ə t ə
p a n ə ɹ ɑː m ə t ə
p a n p ə θ i
p æ n p ə θ ɪ
p æ n f ɪ l ɪ ə
p æ n f ɪ l i æ k
p a n s ʌ ɪ k ɪ z ə m
p æ n s a ɪ k ɪ z ə m
p æ n z
p a n s ɛ n s ɪ z m
p æ n s ɛ n ʃ ə n s
p æ n s ɛ k s j u æ l ɪ t i
p æ n z i
p æ n t
p æ n t ɛ k n ɪ k ə n
p a n θ ɪ a
p æ n θ i ɪ z ə m
p æ n θ i ɪ s t ɪ k
p æ n t h i ĭ s t s
p a n θ ɪ ə n ʌ ɪ z e ɪ ʃ ə n
p æ n θ ə
p a n t ʌ ɪ l
p æ n t ɪ ŋ
p æ n t ɪ ŋ z
p a n t l ə s
p æ n t ə ʊ
p æ n t ɒ k ɹ ə t ə
p a n t ɒ f l̩
p a n t ə f l̩
p a n t ə ɡ ɹ a f
p a n t ə ɡ ɹ ɑː f
p æ n t ɒ ɡ ɹ ə f ə ɹ
p a n t ə m ʌ ɪ m
p æ n t ɹ i z
p a n t ɹ i
p æ n t ɹ i
p æ n t s
p æ n t ɪ h ə u z
p æ n ɜː ɹ d͡ʒ ɪ k
p æ n j ɒː d
p a n t s ə ɹ ɒ t ɪ
p a n z ə ɹ ɒ t ɪ
p a n t s ə ɹ ɒ t ɪ
p a n z ə ɹ ɒ t ɪ
p a n t s ə ɹ ɒ t ə ʊ
p a n z ə ɹ ɒ t ə ʊ
p æ n z o ĭ z ə m
p æ n z o ĭ s t
p æ n z ə ʊ ɪ s t ɪ k
p æ n e ɪ
p ɑ n e ɪ
p æ n e ɪ d
p ɑ n 

p l iː t ɪ d
p l ɛ b
p l iː b
p l ɪ b iː ə n
p l ɛ b ɨ s a ɪ t
p l ɛ b z
p l ɛ k
p l ɛ k t ɹ ə m
p l ɛ d
p l ɛ d ʒ
p l ɛ d ʒ d
p l ɛ d ʒ ə t
p l ɛ d ʒ ɪ ŋ
p l ɛ d ʒ ɪ ŋ z
p l a ɪ ə d iː z
p l a ɪ ɒ t ɹ ə p i
p l iː n ə ɹ i
p l ɛ n ɪ p ə t ɛ n ʃ ə l
p l ɛ n ɪ p ə ʊ t ɛ n ʃ i ə ɹ i
p l ɛ n ɪ p ə ʊ t ɛ n ʃ ə ɹ i
p l ɛ n ɪ ʃ
p l ɛ n ɪ t j uː d
p l ɛ n t i ə s
p l ɛ n t ɪ f l̩
p l ɛ n t i
p l iː n ə m
p l iː ə n æ z ə m
p l i ə n ɛ k s i ə
p l ɪ ə ɹ ə ʊ s ɜː k ɔ ɪ d
p l iː z ɪ ə n ɪ m
p l iː s i ə s ɔː ɹ
p l ɛ ð ə ɹ ə
p l ɛ θ ə ɹ ə
p l ɪ θ ɔː ɹ ə
p l ɛ θ ɒ ɹ ɪ k
p l ɛ θ ə ɹ ɪ k
p l e k s ə
p l ɛ k s ə s
p l a ɪ ə b ə l
p l a ɪ ə n t
p l a ɪ k e ɪ t
p l a ɪ k ə t
p l ɪ k e ɪ t
p l ɪ k e ɪ ʃ ə n
p l a ɪ d
p l a ɪ ə ɹ z
p l a ɪ z
p l a ɪ t
p l ɪ ŋ
p l ɪ ŋ k
p l ɪ n θ
p l ɪ n i
p l ɒ s i
p l ə ʊ s i
p l ɒ d
p l ɒ d ʒ
p l ɔ ɪ d i
p l ɒ ŋ k
p l ɒ ŋ k ə ɹ
p l uː p
p l ə ʊ s ɪ v
p l ə ʊ z ɪ v
p l ɒ t
p l ɑ t l ə s
p l ɑ t l ə s n ə s
p l ɒ t s
p l a ʊ
p l a ʊ m ə n
p l ʌ v ə
p l a ʊ d
p l a ʊ m ə n

t ɒ l ə m e ɪ ɪ k
t ɒ l ə m i
t ə ʊ m e ɪ n
t ə ʊ s ɪ s
p ʌ b
p j uː b ɑː ɹ k i
p ʌ b d
p ʌ b ɪ ŋ
p ʌ b i
p j uː b
p j uː b l ə s
p j uː b i z
p j uː b z
p j uː b ɪ k
p j u b ɪ s
p ʌ b l ɪ k
p ʌ b l ɪ k ə n
p ʌ b l ə k e ɪ t
p ʌ b l ɪ k e ɪ ʃ ə n
p ʌ b l ɪ s a ɪ z
p ʌ b l ɪ s a ɪ z
p ʌ b l ɪ k l i
p ʌ b l ɪ ʃ
p ʌ b l ɪ ʃ t
p ʌ b z
p ʌ k uː n
p j uː s ə l ɑː ʒ
p j uː s ə l ɪ d ʒ
p ʊ s ɛ l
p ʌ k
p ʌ k ɪ ʃ
p ʌ k s
p ʌ k i
p uː d
p ə d
p ʊ d
p ʌ d
p ʊ d ɪ ŋ
p ʌ d ə l
p j uː d ɛ n d ə
p j ʊ d ɛ n d ə
p j uː d ɛ n d ə m
p j ʊ d ɛ n d ə m
p j uː d ɜː
p ʌ d͡ʒ
p ʌ d ʒ i
p j uː d ɪ b ʌ n d
p j uː d ɪ k
p j uː d ɔː
p j uː d ə r
p uː d uː
p ʊ d ʊ t ʃ ɛ ɹ i
p w ɛ b l ə ʊ
p j u l a ɪ l
p j uː ə
p j ʊ ə
p j ʊ ə ɹ a ɪ l
p uː ɚ p iː ɹ i æ
p uː ɝ p iː ɹ i æ
p uː ɚ p iː ɹ i ə m
p uː ɝ p iː ɹ i ə m
p ʌ f
p ʌ f t
p ʌ f ə
p ʌ f ɪ n
p ʌ f l ɪ ŋ
p ʌ f s
p ʌ f i
p ʌ f t ə l uː n
p ʌ ɡ
p ʌ ɡ l̩
p ʌ ɡ ɹ iː
p ʌ ɡ ɹ iː
p j uː
p j uː d ʒ ə l ɪ s t
p j uː d ʒ ɪ l ɪ s t ɪ k l i
p ʌ ɡ n e ɪ ʃ ə s
p ʌ ɡ n æ s ə t i
p ʌ

ɹ ɪ z ɜː v d
ɹ ɛ z ə v w ɑː ɹ
r ə s ɛ t
ɹ iː s ɛ t
ɹ ɛ ʃ
ɹ ɪ z a ɪ d
ɹ ɛ z ɪ d ə n s
ɹ ɛ z ɪ d ə n s i
ɹ ɛ z ɪ d ə n t
ɹ ɛ z ɪ d j u æ
ɹ ɪ z ɪ d j ə l
ɹ ɪ z ɪ d j ʊ ə l
ɹ ɪ z ɪ d ʒ ə l
ɹ ɪ z ɪ d ʒ ʊ ə l
ɹ ɛ z ɪ d j uː
ɹ ɛ z ɪ d j u ʌ m
ɹ iː s a ɪ n
ɹ ɪ z a ɪ n
ɹ ɛ z ɪ ɡ n e ɪ ʃ ə n
ɹ ɪ z a ɪ n d
ɹ ɪ z a ɪ l
ɹ ə z ɪ l ɪ ə n s
ɹ ɛ z ɪ n
ɹ ɛ s ɪ p ɪ s ə n s
ɹ ə z ɪ k w ɪ m ɒ d
ɹ ə z ɪ s t
ɹ ɪ z ɪ s t
ɹ ɪ z ɪ s t ə n s
ɹ ə z ɪ s t ɪ d
ɹ ɪ z ɪ s t ɪ d
ɹ ɪ z ɪ s t l ə s
ɹ ɪ z ɪ s t l ə s l i
ɹ ɪ z ɪ s t ə
ɹ iː s o ʊ l d
ɹ ɛ z ə l j uː t
ɹ ɛ z ə l j uː t l i
ɹ ɛ z ə l uː ʃ ə n
ɹ i s ɒ l v
ɹ iː z ɒ l v
ɹ ɪ z ɒ l v
ɹ ɪ z ɒ l v d
ɹ ɛ z ə n ə n s
ɹ ɛ z ə n ə n t
ɹ ɛ z ə n e ɪ t
ɹ ɪ z ɔː ɹ b ə b ə l
ɹ iː s ɔ ɹ t
ɹ ɨ z ɔ ɹ t
ɹ iː s a ʊ n d
ɹ ɨ z a ʊ n d
ɹ iː s a ʊ n d ɪ ŋ
ɹ ɪ z a ʊ n d ɪ ŋ
ɹ ɪ z a ʊ n d ɪ ŋ l i
ɹ iː s ɔː s
ɹ ɪ s ɔː s
ɹ ɪ z ɔː s
ɹ ɪ s p ɛ k t
ɹ ɪ s p ɛ k t ɪ d
ɹ ɪ s p ɛ k t f ə l
ɹ ɪ s p ɛ k t f ə l i
ɹ ɪ s p ɛ k t ɪ ŋ
ɹ ɪ s p ɛ k t ɪ v
ɹ ɪ s p ɛ k t ɪ v l i
ɹ ɪ s p ɛ k t s
ɹ ɛ s p 

s k ɹ u i
s k ɹ a ɪ b æ l ɪ t i
s k ɹ ɪ b æ l ɪ t i
s k ɹ ɪ b ə l
s k ɹ a ɪ b
s k ɹ ɪ l ə
s k ɹ ɪ m p
s k ɹ ɪ m ʃ æ n d ə
s k ɹ ɪ m ʃ ɔː
s k ɹ ɪ p
s k ɹ ɪ p t
s k ɹ ɪ p t ɪ ŋ
s k ɹ ɪ p t ɪ ŋ s
s k ɹ ɪ p t ɔː ɹ ɪ ə m
s k ɹ ɪ p t ʃ ə
s k ɹ ɪ t ʃ
s k ɹ ɪ v n ə ɹ
s k ɹ ɪ v ɛ n ɪ ŋ
s k ɹ ɒ b ə l
s k ɹ ɒ d
s k ɹ ɒ f j ʊ l ə
s k ɹ ɒ f j ʊ l ə s
s k ɹ o ʊ l
s k ɹ uː d ʒ
s k ɹ uː n t ʃ
s k ɹ ʊ n t ʃ
s k ɹ ə ʊ t ə
s k ɹ ə ʊ t
s k ɹ ə ʊ t ə m
s k ɹ a ʊ n d ʒ
s k ɹ ʌ b
s k ɹ ʌ b ɚ
s k ɹ ʌ f
s k ɹ ʌ f i
s k ɹ ʌ m
s k ɹ ʌ m d ɪ d l ɪ ʌ m p ʃ ə s
s k ɹ ʌ m d ɪ d l̩ ɪ ʌ m p ʃ ə s
s k ɹ ʌ m ɪ d ʒ
s k ɹ ʌ m i
s k ɹ ʌ m p
s k ɹ ʌ m p ʃ ə s
s k ɹ ʌ m p i
s k ɹ ʌ n t ʃ
s k ɹ ʌ n d͡ʒ
s k ɹ uː p ə l
s k ɹ uː p j ʊ l ə s l i
s k ɹ uː t ə b l̩
s k ɹ uː t ɪ n ɪ ə ɹ
s k ɹ uː t ɨ n a ɪ z
s k ɹ uː t ɪ n i
s k ɹ a ɪ
s k uː b ə
s k ʌ f
s k ʌ f ə l
s k ʌ ɡ
s k ʌ l
s k ʌ l ə ɹ i
s k ʌ l p t ɹ ɪ s iː z
s k ʌ l p t ɹ ɪ k s
s k ʌ l p t j ʊ ə
s k ʌ l p t͡ʃ ə
s k ʌ m
s k ʌ m b ə l
s k ʌ n t ʃ ə n
s k ʌ n ʃ ə n
s k ʌ n θ ɔː

s l e ɪ v ə ɹ i
s l e ɪ v z
s l e ɪ v i
s l ɒ v iː
s l ɑː v i ə
s l æ v ɪ k
s l ɑː v ɪ k
s l e ɪ v ɪ ʃ
s l ə v ɒ n ɪ k
s l ɔː
s l e ɪ
s l e ɪ ə
s l e ɪ ɪ ŋ
ɛ s ɛ l s iː
s l iː v
s l iː z
s l iː z i
s l ɛ b
s l ɛ d
s l ɛ d ʒ
s l ɛ d ʒ ə ɹ
s l iː k
s l iː k l i
s l iː k i
s l iː p
s l iː p ɪ ŋ
s l iː p a ʊ t
s l iː p s
s l iː p i
s l iː t
s l iː t i
s l iː v
s l iː v z
s l e ɪ
s l iː v iː n
s l ɛ n d ə
s l ɛ p t
s l j uː θ
s l uː θ
s l uː θ h a ʊ n d
s l uː
s l a ɪ s
s l a ɪ t
s l ɪ x t
s l ɪ k
s l ɪ d
s l a ɪ d
s l a ɪ d z
s l a ɪ d i
s l a ɪ d ɪ ŋ
s l a ɪ t
s l a ɪ t ə n
s l a ɪ t ɪ s t
s l a ɪ t l i
s l ɪ m
s l a ɪ m
s l a ɪ m b ɔː l
s l a ɪ m ɪ ŋ
s l a ɪ m i
s l ɪ ŋ
s l ɪ ŋ ʃ uː t
s l ɪ ŋ ʃ uː t ɪ ŋ
s l ɪ ŋ ʃ uː t s
s l ɪ ŋ ʃ ɒ t
s l ɪ ŋ ʃ ɒ t ə n
s l ɪ ŋ s t ə ʊ n
s l ɪ ŋ k
s l ɪ ŋ k i
s l ɪ p
s l ɪ p t
s l ɪ p ə ɹ i
s l ɪ p ɹ i
s l ɪ p ɪ ŋ
s l ɪ p i
s l ɪ p ʃ ɒ d
s l ɪ ʃ
s l ɪ t
s l a ɪ t
s l ɪ ð ə ɹ
s l a ɪ ð i
s l ɪ t s
s l a ɪ v
s l ɪ v əː
s l ɪ v ə v ɪ t ʃ
s l ɪ v ə v ɪ t s
s l

s ʌ b d ɪ v ɪ ʒ ə n
s ʌ b d ʌ k t
s ə b d ʌ k ʃ ə n
s ə b d j uː
s ə b d j uː d
s ʌ b d j u ə ɹ
s ə b ɛ θ
s ʌ b f j uː
s ɐ b f ɐ s k
s uː b ɪ t ə ʊ
s ʌ b d ʒ e ɪ s ə n t
s ə b d ʒ ɛ k t
s ʌ b d ʒ ɛ k t
s ʌ b d ʒ ɪ k t
s ə b d ʒ ɛ k t ɪ d
s ə b d ʒ ɛ k t ɪ v
s ʌ b d ʒ ɛ k t ɪ v
s ə b d ʒ ɛ k t
s ʌ b d ʒ ɛ k t s
s ʌ b d ʒ u ɡ e ɪ t
s ʌ b d ʒ ʊ ɡ e ɪ ʃ ə n
s ə b d ʒ ʌ ŋ k t ɪ v
s ʌ b l ɛ t
s ʌ b l ɪ m e ɪ t
s ə b l a ɪ m
s ə b l ɪ m ɪ n ə l
s ʌ b l ɪ m ɪ n ə l
s ʌ b l ɪ ŋ ɡ w ə l
s ʌ b l uː n ə ɹ i
s ʌ b l ʌ k s e ɪ ʃ ə n
s ʌ b m ə ɹ iː n
s ʌ b m æ ɹ ɪ n ə
s ʌ b m ɜː d ʒ
s ə b m ɪ ʃ ə n
s ʌ b m ɪ ʃ ə n
s ə b m ɪ s ɪ v
s ə b m ɪ t
s ə b m ɪ t ɪ d
s ʌ b n a ɪ v ə l
s ʌ b n ɔː m æ l ɪ t ɪ
s ə b ɔː d ɪ n e ɪ t
s ə b ɔː d ɪ n ə t
s ə b ɔː d ɪ n e ɪ ʃ n̩
s ʌ b p ɑː ɹ t
s ʌ b p ɛ ɹ i ɒ s t ɪ ə l
s ə p iː n ə
s ə p i n ə b ə l
s ʌ b p ɹ ʌ ɪ m
s ʌ b s ə k w ə n t
s ʌ b s ɪ k w ə n t
s ʌ b s ɪ k w ə n t l i
s ʌ b s ɛ t
s ʌ b s a ɪ d ə n s
s ʌ b s ɨ d ə n s
s ʌ b s ɪ d i ə ɹ i
s ʌ b s ɪ d ə ɹ i
s ʌ 

θ ɹ uː p ʊ t
θ ɹ ʌ p l̩
θ ɹ ə ʊ
θ ɹ ə ʊ b æ k
θ ɹ ə ʊ b æ k s
θ ɹ ə ʊ d
θ ɹ ə ʊ ɪ ŋ
θ ɹ ə ʊ n
θ ɹ ə ʊ z
θ ɹ uː
θ ɹ ʌ m
θ ɹ ʌ ʃ
θ ɹ ɐ ʃ ə z
θ ɹ ʌ s t
θ ɹ ʌ s t s
θ ɹ ʌ t ʃ
θ j uː s ɪ d ɪ d iː z
θ ʌ d
θ ʌ ɡ
θ ʌ ɡ ɪ ʃ
θ ʌ ɡ ɑ k ɹ ə s i
t ʊ k p ɑː
t uː l iː
θ j uː l
θ j uː l iː
θ uː l
θ uː l iː
θ j uː l i ə m
θ uː l i ə m
θ ʌ m
θ ʌ m b ə l iː n ə
θ ʌ m n e ɪ l
θ ʌ m t æ k
θ ʌ m p
θ ʌ m p ɪ ŋ
θ ʌ n d ə
θ ʌ n d ə b ɜː d
θ ʌ n d ə ɹ b ɜː ɹ d
θ ʌ n d ɚ b l æ s t
θ ʌ n d ə ɹ b o ʊ l t
θ ʌ n d ɚ d ə ʊ m
θ ʌ n d ə ɹ ə s
θ ʌ n d ə ɹ s t ɔː ɹ m
θ ʌ n ə ɹ s t ɔː ɹ m
θ ʌ n d ə ɹ s t ɹ ɪ k ə n
θ ʌ n d ə s t ɹ ʌ k
θ ʌ ŋ k
θ j ʊ ə ɹ ɪ b ə l
θ ə ɹ ɪ n d ʒ i ə
θ j ʊ ɹ ɪ n d ʒ ɪ ə n
θ ɜː l
θ ʌ ɹ ə k
θ ɜː z d e ɪ
θ ɜː z d i
ð ʌ s
ð ʌ s l i
ð ʌ s w ʌ ɪ z
θ w æ k
θ w e ɪ t
θ w ɔː t
θ w ɔː ɹ t ə ɹ
ð a ɪ
θ a ɪ l
t a ɪ m
θ a ɪ m a ɪ
θ a ɪ m ɪ n
θ a ɪ m ə s
θ a ɪ̯ ɹ ɔ ɪ̯ d
θ ɜː s ə s
ð a ɪ s ɛ l f
θ ɪ s ɛ n
ð o ʊ
t iː
t i ɑː ɹ ə
t ɪ b
t a ɪ b ə
t a ɪ b ɪ ə ɹ i ə s
t ɪ b ɛ ɹ i ʊ s
t ə b e t
t ɪ b e t
t ɪ b ɛ t n̩


ʌ n k ɒ m ə n
ʌ n k ɒ m p l ɪ̈ m ɛ n t ə ɹ i
ʌ n k ɒ m p ɹ ə h ɛ n s ɪ v
ʌ n k ɒ n ʃ ə s
ʌ n k ɒ n ʃ ə s l i
ʌ n k ɒ n s t ə n s i
ʌ n k ə n s t ɹ ʌ k t ɪ v
ʌ n k a ʊ n t ə b ɪ l ɪ t i
ʌ n k a ʊ n t ə b ə l
ʌ n k ʌ p ə l
ʌ n k uː θ
ʌ n k ʌ v ə ɹ
ʌ n k ʌ v ə d
ʌ n k ʌ v ɛ t ɪ d
ə n k ə ʊ ɔː d ɪ n ə t
ə n k ə ʊ ɔː d ɪ n e ɪ t ɪ d
ʌ n k ɹ i e ɪ t
ʌ n k ɹ ɪ e ɪ t ɪ v
ʌ n k ɹ ɒ p t
ʌ ŋ k ʃ ə n
ʌ n k t ʃ u ə s
ʌ ŋ k t ʃ u ə s n ə s
ʌ n d
ʌ n d a ʃ ɪ ŋ l i
ʌ n d ɛ d
ʌ n d ə s ɪ l i ə n
ʌ n d ɪ s a ɪ f ə ɹ ə b ə l
ʌ n d ɪ s a ɪ f ɹ ə b ə l
ʌ n d ə ɹ
ʌ n d ə ɹ æ k ʃ ə n
ʌ n d ə ɹ e ɪ d ʒ
ʌ n d ə ɹ ɪ d ʒ
ʌ n d ə ɹ e ɪ d ʒ d
ʌ n d ə b ɛ l i
ʌ n d ə b uː b
ʌ n d ə k æ ɹ ɪ d͡ʒ
ʌ n d ə k ʌ ɹ ə n t
ʌ n d ɚ ɛ s t ɨ m e ɪ t
ʌ n d ɚ ɛ s t ɨ m ə t
ʌ n d ɚ ɛ s t ɨ m ɨ t
ʌ n d ə f iː l ɪ ŋ
ʌ n d ə f a ɪ ə
ʌ n d ə f a ɪ ə d
ʌ n d ə f ʊ t
ʌ n d ə ɡ ə ʊ
ə n d ə ɹ ɡ ɹ a j ə w ə s ē
ʌ n d ə ɡ ɹ a ʊ n d
ʌ n d ə ɡ ɹ a ʊ n d ə
ʌ n d ə ɹ h æ n d
ʌ n d ə k ɪ l
ʌ n d ə ɹ l e ɪ n
ʌ n d ə ɹ l e ɪ
ʌ n d ə ɹ l a ɪ
ʌ n d

w ɪ ə ɹ i
w iː z ə n d
w iː z ə l
w ɛ ð ə
w ɛ ð ə b a ʊ n d
w iː v
w iː v ə ɹ
w iː v ɪ ŋ
w ɛ b
w ɛ b d
w ɛ b ɪ ŋ
v e ɪ b ə
w ɛ b ə
w ɛ b h ʊ k
w ɛ b h ʊ k s
w ɛ b z
w ɛ b s a ɪ t
w ɛ b s t ə
w ɛ b s t ə ɹ a ɪ t
w ɛ b w ɜː k
w ɛ b z iː n
w iː t͡ʃ æ t
w ɛ k
w ɛ d
w ɛ d ə d
w ɛ d ɪ ŋ
w ɛ d ɪ ŋ z ɪ l ə
w ɛ d ʒ
w ɛ d ʒ i
w ɛ d ʒ i
w ɛ d l ɒ k
w ɛ n z b ə ɹ i
w ɛ n z d e ɪ
w ɛ n z d i
w ɛ n z d ɪ
w iː
w iː ə b uː
w iː d
w iː d i n ə s
w iː d ɪ ŋ
w iː d z
w iː d i
w iː
w iː f i
w iː k
w iː k d e ɪ
w iː k ɛ n d
w iː k l i
w iː k s
w iː l i
w iː n
w iː p
w iː p i
w iː p ɪ ŋ
w iː p i
w iː ə
w iː t
w iː t l ə s
w iː v ə
w iː v ə l
w iː f i
w ɛ f t
w ɛː
v ɛ ə r b
w e ɪ
w e ɪ b ɹ ɪ d͡ʒ
w e ɪ d
w e ɪ ə
w e ɪ ɪ ŋ
w e ɪ z
w e ɪ t
w e ɪ t ɪ d
w e ɪ t l ɪ f t ɪ ŋ
w e ɪ t s
w e ɪ t i
v a ɪ m ɑː
v a ɪ m ə ɹ ɑː n ə ɹ
v a ɪ m ɑː ɹ a ɪ z e ɪ ʃ ə n
w ɪ ə
w iː ə d
w ɪ ə d
w ɪ ə d ə ʊ
w ɪ ə d s ə m
w ɛ l t ʃ
w ɛ l k ə m
w ɛ l k ə m d
w ɛ l d
w ɛ l d ə b l̩
w ɛ l d ə ɹ
w ɛ l d m ə n t
w ɛ l f ɛ ə
w ɛ l f ɛː ɹ ɪ 

In [3]:
# Read in Arabic words.  
with open("data-WP/ara.txt") as file:
    ara_words = file.read().split("\n")
# uncomment the following lines if you want to look at the words before processing them.
for w in ara_words:
   print(w)

ʔ
ʔ aː t ʃ i j oː t
ʔ aː x a r
ʔ aː x i r
ʔ aː x i r a
ʔ aː d a m
ʔ aː d a m i j j
ʔ aː ð a r j uː n
ʔ aː ð aː
ʔ aː s
ʔ aː ʃ uː r i j j
ʔ aː l
ʔ aː l a
ʔ aː l u
ʔ aː l a
ʔ aː m a n
ʔ aː m a n a
ʔ aː m a n u
ʔ aː m i n
ʔ aː m u n
ʔ aː m u n a
ʔ aː m u n u
ʔ aː m iː n a
ʔ aː n i s a h
ʔ aː n u k
ʔ aː j a
ʔ aː j s l a n d aː
ʔ
ʔ a b
ʔ a b aː ʒ uː r
b aː n a
ʔ a b t a r
ʔ a b a d a n
ʔ a b d aː
b a r a z a
ʔ a b r a z
ʔ a b r u z
ʔ a b r u z a
ʔ a b r iː l
ʔ a b tˤ a l a
ʔ a b k a m
ʔ a b l a s a
ʔ a b l a h
ʔ a b a n uː s
ʔ a b n uː s
ʔ a b h a d͡ʒ a
ʔ a b j a dˤ
ʔ a t aː ħ a
ʔ a t aː j
ʔ o t o b uː s
ʔ o t o b iː s
ʔ a t t uː n
ʔ a t aː
ʔ a θ aː θ
ʔ a θ θ a θ a
ʔ a θ a l aː t
ʔ a θ l
ʔ a θ l a
ʔ u θ uː l
ʔ a θ n aː ʔ
ʔ a θ n aː ʔ a
ʔ a θ i j uː b i j aː
ʔ a d͡ʒ aː b a
ʔ u d͡ʒ aː b u
ʔ a d͡ʒ r a b
ʔ a d͡ʒ r a d
ʔ a d͡ʒ z aː ʔ
ʔ a d͡ʒ l a ħ
ʔ a d͡ʒ m a ʕ
ʔ a d͡ʒ m a ʕ a
ʔ a d͡ʒ n a b i j j
ʔ a d͡ʒ w a f
ʔ a ħ aː tˤ a
ʔ u ħ aː tˤ a
ʔ u ħ aː tˤ u
ʔ a ħ a b b
ʔ a ħ a b b a
ʔ u ħ i b b u k a
ʔ

d iː n aː r
ð
ð aː l
ð i ʔ b a
ð aː b a
ð aː q a
ð aː k i r a
ð aː l
ð a x iː r a
ð i r aː ʕ
d u r a
z a r r a
ð a r r a
ð u r a
ð u r w a
ð u r r i j j a h
ð a r iː ʕ
ð a r iː ʕ a
ð a k a r
ð a k a r a
ð a k k a r a
ð i k r
ð aː l i k a
ð a n a b
ð a n a b a
ð a n b
ð a n n a b a
ð a h a b
ð a h a b a
ð a h h a b a
ð uː
ð a w w a b a
ð a j l
r
r aː ʔ
r a ʔ a s a
r a ʔ s
r a ʔ s m aː l
r a ʔ l
r a ʔ aː
r a ʔ j
r u ʔ uː s
r i ʔ aː s i j j
r a ʔ iː s i j j
r aː ʔ
r aː ʔ i n
r aː ʔ i ħ a
r aː ʔ i ʕ
r aː b a
r aː b i ʕ
r aː t iː n a d͡ʒ
r aː d͡ʒ i l
r aː d͡ʒ i m a
r aː ħ a
r aː d a f a
r aː s u x t
r aː ʕ a
r aː ʕ i n
r aː ʕ i d a
r aː k i b
r aː m a
r aː n a
r aː w a n d
r a b b
r a b b a
r a b b i
r u b b
r u b b a
r i b aː tˤ
r u b aː ʕ i j j aː t
r u b b a m aː
r u b w a
r a b iː ʕ
r u t a j l
r u t a j l aː ʔ
r a t iː n a d͡ʒ
r a d͡ʒ d͡ʒ
r a d͡ʒ d͡ʒ a
r a d͡ʒ a ʕ a
r a d͡ʒ d͡ʒ a ʕ a
r a d͡ʒ ʕ
r u d͡ʒ u ʕ
r a d͡ʒ d͡ʒ a l a
r a d͡ʒ i l
r a d͡ʒ i l a
r a d͡ʒ l
r a d͡ʒ u l
r i d͡ʒ l
r ɑː 

l aː k i n
l aː k i n n a
l i l ɣ aː j a
l a ɫ ɫ aː h
l i l l aː h
l i l l aː h i
l a m
l i m a
l u m
l a m a ʕ a
l a m m a ʕ a
l a n
l a h aː
l a h d͡ʒ a
l a h ɡ a
l a h ʒ e
l ə h d͡ʒ ə
l i h æː ð æː
l a h h aː
l a h i j a
l a w
l a w w aː ʔ
l i w aː ʔ
l ɪ w ɑː tˤ
l a w ħ
l oː ħ
l a w ħ a
l o r d
l uː tˤ
l uː tˤ iː
l a w n
l a w w a n a
l iː b i j aː
l a j t a
l a j θ
l a j r a
l a j i s a
l a j s a
l a j l
l a j l a
l a j l a k
l iː l a k
l a j m uː n i j j
l a j m i j j
m
m iː m
m a ʔ s aː h
m a ʔ w a n
m u ʔ aː m a r a
m u ʔ t a m a r
m u ʔ a s s a s
m u ʔ a s s i s
m u ʔ a s s a s a
m u ʔ a s s i s a
m u ʔ a l l a f
m u ʔ a l l i f
m u ʔ m a n
m u ʔ m i n
m u ʔ a n n a θ
m i ʔ b a r
m aː ʔ a
m i ʔ a
m i ʔ ð a n a
m aː
m aː ʔ
m aː ʔ i d a
m aː t a
m ō t
m aː d͡ʒ i d
m a ɡ uː r
m aː d͡ʒ uː r
m aː ħ i q
m aː ð aː
m aː r
m aː r a s a
m aː r i s
m aː r s
m aː z a
m aː z a r i j uː n
m aː z a r j uː n
m aː s i ħ
m aː s uː r a
m aː ʕ uː n
m aː ʕ uː n a
m aː l
m aː l aː w iː
m aː l tˤ aː

In [4]:
# We are simplifying the task by focusing only on consonant clusters involving the two phonemes /s/ and /t/.
# Note that phonemes are space-separated in the input, so you need to take that into account in your regex.

# Create a regex to search for consonant clusters involving /s/ and/or /t/.
cc_RE = r"[st](?:\s[st])+"  # PLACEHOLDER - PUT YOUR OWN RE HERE!
# Now a regex to search for WORD-INITIAL consonant clusters involving /s/ and/or /t/.
wicc_RE = r"^[st](?:\s[st])+"  # PLACEHOLDER - PUT YOUR OWN RE HERE!
# Now a regex to search for WORD-FINAL consonant clusters involving /s/ and/or /t/.
wfcc_RE = r"[st](?:\s[st])+$"   # PLACEHOLDER - PUT YOUR OWN RE HERE!
print(cc_RE)
print(wicc_RE)
print(wfcc_RE)

[st](?:\s[st])+
^[st](?:\s[st])+
[st](?:\s[st])+$


In [7]:
# Now search for consonant clusters in the English words you read in.
# Print out - and count - what you find.
cc_count = 0
wicc_count = 0
wfcc_count = 0
for w in eng_words:
    cc_results = re.findall(cc_RE,w)
    wicc_results = re.findall(wicc_RE,w)
    wfcc_results = re.findall(wfcc_RE,w)
    if cc_results:
        cc_count += 1
        print(w,"\t",cc_results,end="")
    if wicc_results:
        wicc_count += 1
        print ('  initial  ',end="")
    if wfcc_results:
        wfcc_count += 1
        print ('  final  ',end="")
        print()

ɡ æ n s t 	 ['s t']  final  
t w ɪ k s t 	 ['s t']  final  
ɑː l s t 	 ['s t']  final  
æ b ə k ɒ s t 	 ['s t']  final  
ə b e ɪ s t 	 ['s t']  final  
ə b e ɪ t s 	 ['t s']  final  
æ b ə t ɪ s t 	 ['s t']  final  
æ b ə t s 	 ['t s']  final  
ə b d j uː s t 	 ['s t']  final  
æ b ə ɹ ɪ s t w ɪ θ 	 ['s t']ə b ɛ t s 	 ['t s']  final  
ə b h ɒ ɹ n̩ t s 	 ['t s']  final  
ə b a ɪ d ɪ s t 	 ['s t']  final  
æ b ə l ɪ ʃ n̩ ɪ s t 	 ['s t']  final  
æ b ə l ɪ ʃ n̩ ɪ s t s 	 ['s t s']  final  
ə b ɹ ɛ s t 	 ['s t']  final  
æ b ɹ ə ɡ e ɪ ʃ n̩ ɪ s t 	 ['s t']  final  
æ b s n̩ t s 	 ['t s']  final  
æ b s ə l j uː t ɪ s t 	 ['s t']  final  
æ b s ə l uː t ɪ s t 	 ['s t']  final  
ə b s t e ɪ n 	 ['s t']æ b s t iː m ɪ ə s 	 ['s t']æ b s t i m i ə s l i 	 ['s t']ə b s t i m i ə s l i 	 ['s t']ə b s t ɛ n ʃ n̩ 	 ['s t']ə b s t ɛ n ʃ n̩ ɪ z m̩ 	 ['s t']ə b s t ɛ n ʃ n̩ ɪ s t 	 ['s t', 's t']  final  
ə b s t ɜː ɹ d͡ʒ 	 ['s t']ə b s t ɝː ɹˑ d͡ʒ n̩ t 	 ['s t']ə b s t ɜː ɹ s 	 ['s t']æ b s t ɜː ʒ n̩ 

b ɛ n t s 	 ['t s']  final  
b ɪ k w ɛ s t 	 ['s t']  final  
b ɛ ɹ ə s t ɒ l ə d͡ʒ i 	 ['s t']b ɜː ɹ k ə m s t ɛ d 	 ['s t']b ɛ s t 	 ['s t']  final  
b ɛ s t ɪ d 	 ['s t']b ɪ s t ɛ d 	 ['s t']b ɛ s t i ə l 	 ['s t']b ɛ s t ʃ ə l l ɪ t ɪ 	 ['s t']b ɛ s t i 	 ['s t']b ɛ s t ɪ ŋ 	 ['s t']b ɪ s t ɜː 	 ['s t']b ɪ s t ə ʊ 	 ['s t']b ɪ s t ə ʊ d 	 ['s t']b ɛ s t s 	 ['s t s']  final  
b ɛ t s 	 ['t s']  final  
b ɪ t w ɪ k s t 	 ['s t']  final  
b ɪ b l i ɒ m ə t ɹ ɪ s t 	 ['s t']  final  
b ɪ b l ɪ s t 	 ['s t']  final  
b ɪ s t ə 	 ['s t']b ɪ ɡ ə m ɪ s t 	 ['s t']  final  
b ɪ ɡ ɪ s t 	 ['s t']  final  
b a ɪ t s 	 ['t s']  final  
b ɪ ɡ ə t s 	 ['t s']  final  
b ɪ n d ə l s t ɪ f 	 ['s t']b a ɪ o ʊ s t ə t ɪ s t ɪ k l̩ 	 ['s t', 's t']b a ɪ ə ʊ t ɛ ɹ ə ɹ ɪ s t 	 ['s t']  final  
b ɪ s ɛ k s t ɪ l 	 ['s t']b ɪ s t ʊ ɹ i 	 ['s t']b iː s t ɹ ə ʊ 	 ['s t']b ɪ s t ɹ ə ʊ 	 ['s t']b a ɪ t s 	 ['t s']  final  
b ɪ t s 	 ['t s']  final  
b l æ k ə s t 	 ['s t']  final  
b l æ k l ɪ s t 	 ['s t']

k ɹ ɪ s t ə 	 ['s t']k ɹ ɪ s t a ɪ 	 ['s t']k ɹ ɪ s t i 	 ['s t']k ɹ ɒ s t 	 ['s t']  final  
k ɹ ɒ s l ɒ t s 	 ['t s']  final  
k ɹ ʌ s t 	 ['s t']  final  
k ɹ ʌ s t e ɪ ʃ ə n 	 ['s t']k ɹ ʌ s t e ɪ ʃ ə s 	 ['s t']k ɹ ʌ s t ə l 	 ['s t']k ɹ ʌ s t ɪ d 	 ['s t']k ɹ ʌ s t ɪ ŋ 	 ['s t']k ɹ ʌ s t ɪ ŋ z 	 ['s t']k ɹ ʊ s t ə ʊ s 	 ['s t']k ɹ ʌ s t s 	 ['s t s']  final  
k ɹ ʌ s t i 	 ['s t']k ɹ ɪ s t ə l 	 ['s t']k ɹ ɪ s t ə l a ɪ z 	 ['s t']k ɹ ɪ s t ə l a ɪ n 	 ['s t']k ɹ ɪ s t ə l a ɪ z 	 ['s t']k ɹ ɪ s t ə l z 	 ['s t']k j uː b ɪ s t 	 ['s t']  final  
t s uː d ʒ uː 	 ['t s']  initial  k j uː l ɒ t s 	 ['t s']  final  
k ʌ l t ɪ s t 	 ['s t']  final  
k ʌ l t ɪ s t s 	 ['s t s']  final  
k ʌ l t s 	 ['t s']  final  
k ʌ m ʃ ɑ t s 	 ['t s']  final  
k ʌ n t s 	 ['t s']  final  
k ɜː s t 	 ['s t']  final  
k ɜː t s ɪ 	 ['t s']k ʌ s t 	 ['s t']  final  
k ʌ s t ə d 	 ['s t']k ʌ s t ə d iː 	 ['s t']k ʌ s t ə m 	 ['s t']k ʌ s t ə m ə ɹ i 	 ['s t']k ʌ s t ə m ə 	 ['s t']k ʌ s t ə m ə z 	 ['s 

ɪ v æ n d͡ʒ ə l ɪ s t ɪ k 	 ['s t']ɪ v ɛ n t s 	 ['t s']  final  
ɛ v ə ɹ ɪ s t ə ɹ 	 ['s t']ɛ v ɹ ɪ s t ə ɹ 	 ['s t']ɛ v ə l ɑː s t ɪ ŋ 	 ['s t']ɛ k s s ɛ n t ɹ ɪ k 	 ['s s']ɛ k s t ʃ e ɪ n d ʒ 	 ['s t']ɛ k s t ʃ e ɪ n d ʒ d 	 ['s t']ɛ k s t͡ʃ ɛ k ɚ 	 ['s t']ɪ k s t͡ʃ ɛ k ɚ 	 ['s t']ɛ k s t 	 ['s t']  final  
ɪ ɡ z ɔː s t 	 ['s t']  final  
ɪ ɡ z ɔː s t ɪ d 	 ['s t']ɪ ɡ z ɔː s t ʃ ə n 	 ['s t']ɛ ɡ z ɔː s t ɪ v 	 ['s t']ɛ ɡ z ɔː s t ɪ v l i 	 ['s t']ɛ ɡ z ɔː s t ɪ v n ə s 	 ['s t']ɪ ɡ z ɪ s t 	 ['s t']  final  
ɪ ɡ z ɪ s t ɪ d 	 ['s t']ɛ ɡ z ɪ s t ɛ n ʃ ə l ɪ z ə m 	 ['s t']ɪ ɡ z ɪ s t ɪ ŋ 	 ['s t']ɪ ɡ z ɪ s t s 	 ['s t s']  final  
ɪ k s p ɪ ə ɹ ɪ ə n s t 	 ['s t']  final  
ɪ k s p ɛ ɹ ɪ m ə n t s 	 ['t s']  final  
ɪ k s p ɪ ɹ ɪ m ə n t s 	 ['t s']  final  
ɛ k s p ɹ ɛ s t 	 ['s t']  final  
ɪ k s p ɹ e s t 	 ['s t']  final  
ɛ k s s ʌ k ə s 	 ['s s']ɛ k s t æ n t 	 ['s t']ɛ k s t ə n t 	 ['s t']ɛ k s t ɛ m p ɜː ɹ e ɪ n i ə 	 ['s t']ɛ k s t ɛ m p ɜː ɹ e ɪ n i ə s 	 ['s t']ɛ k s t ɛ m

ɪ m p ɹ ɛ s t 	 ['s t']  final  
ɪ m p ɹ uː v m ə n t s 	 ['t s']  final  
ɪ n s s ɛ s ɪ v 	 ['s s']ɪ n s ɛ s t 	 ['s t']  final  
ɪ n t ʃ æ s t ɪ t i 	 ['s t']ɪ n s ɪ d ə n t s 	 ['t s']  final  
ɪ ŋ k ə m b ʌ s t ɪ b ə l 	 ['s t']ɪ n k ə n s ɪ s t ə n s i 	 ['s t']ɪ n k ə n s ɪ s t ə n t 	 ['s t']ɪ n k ɹ iː s t 	 ['s t']  final  
ɪ n k ɹ ʌ s t e ɪ ʃ ə n 	 ['s t']ɪ n k ʌ m b ɹ ə n t s 	 ['t s']  final  
ɪ n d ə p ɛ n d ə n t ɪ s t 	 ['s t']  final  
ɪ n d ɪ k e ɪ t s 	 ['t s']  final  
ɪ n d ɪ d͡ʒ ɛ s t ɪ d 	 ['s t']ɪ n d ɪ s t ɪ ŋ k ʃ ə n 	 ['s t']ɪ n d j uː s t 	 ['s t']  final  
ɪ n d ʌ s t ɹ ɪ ə l 	 ['s t']ɪ n d ʌ s t ɹ ɪ ə l z 	 ['s t']ɪ n d ə s t ɹ i z 	 ['s t']ɪ n d ʌ s t ɹ i ə s 	 ['s t']ɪ n d ə s t ɹ i 	 ['s t']ɪ n d ʌ s t r i 	 ['s t']ɪ n ɛ s t ɪ m ə b l 	 ['s t']ɪ n ɛː s t ɪ m ə b ə l 	 ['s t']ɪ n ɪ ɡ z ɪ s t ə n s 	 ['s t']ɪ n ɪ ɡ z ɪ s t ə n t 	 ['s t']ɪ n ə k s p ɪ ə ɹ i ə n s t 	 ['s t']  final  
ɪ n f ɑ r k t s 	 ['t s']  final  
ɪ n f ɛ s t 	 ['s t']  final  
ɪ n f ɛ 

m ɪ s t ɹ uː θ 	 ['s t']m ɪ s t ɹ a ɪ 	 ['s t']m ɪ s t s 	 ['s t s']  final  
m ɪ s t i 	 ['s t']m ɪ s ʌ n d ə ɹ s t æ n d 	 ['s t']m ɪ s ʌ n d ə s t ʊ d 	 ['s t']m ɪ t s ʊ b ɪ ʃ i 	 ['t s']m ɪ k s t 	 ['s t']  final  
m iː k s t 	 ['s t']  final  
m ɪ k s t ʃ ə n 	 ['s t']m ɪ k s t ʃ ə 	 ['s t']m ɪ z ə n m ɑː s t 	 ['s t']  final  
n iː m ɪ s t 	 ['s t']  final  
m ɒ d ɪ s t ə ɹ 	 ['s t']m ɒ d ɪ s t ɪ s t 	 ['s t', 's t']  final  
m ɒ d ə s t i 	 ['s t']m ə ʊ d iː s t 	 ['s t']  final  
m ɔ ɪ s t 	 ['s t']  final  
m ɔ ɪ s t ʃ ɚ 	 ['s t']m ə l ɛ s t 	 ['s t']  final  
m ɒ l ɪ s t e ɪ ʃ ə n 	 ['s t']m ə ʊ l ɪ s t e ɪ ʃ ə n 	 ['s t']m ə l ɛ s t ɚ 	 ['s t']m ə ʊ m ə n t s 	 ['t s']  final  
m ə ʊ m ɪ s t 	 ['s t']  final  
m ɒ n ə s t ɹ i 	 ['s t']m ə n æ s t ɪ k 	 ['s t']m ɒ n ɪ s t ɪ k 	 ['s t']m ə n ɪ s t ɪ k 	 ['s t']m ɒ n ə ʊ ɛ s t ə 	 ['s t']m ɒ n ə ʊ θ iː ɪ s t ɪ k 	 ['s t']m ɒ n ə ʊ θ ɪ ɪ s t ɪ k 	 ['s t']m ɒ n s t ə ɹ 	 ['s t']m ɒ n s t ɹ ə n s 	 ['s t']m ɒ n s t ɹ ɪ s a ɪ d 	 [

f i n ə p l æ s t 	 ['s t']  final  
f ɪ l æ t ə l ɪ s t 	 ['s t']  final  
f ɪ l ə ɹ a s t 	 ['s t']  final  
f ɪ l ə s t a ɪ n 	 ['s t']f ɪ l ɪ s t a ɪ n 	 ['s t']f ɪ l uː m ə n ɪ s t 	 ['s t']  final  
f ɪ l ɒ s ə f ʌ ŋ k j ʊ l ɪ s t 	 ['s t']  final  
f ɪ l ə ʊ s t ɔː d ʒ i 	 ['s t']f l ə ʊ d ʒ ɪ s t ɒ n 	 ['s t']f ɑː s f ə ɹ ɛ s ə n t s 	 ['t s']  final  
f ɒ s f ə ʊ t ʌ ŋ s t ɪ k 	 ['s t']f ɪ z ɪ s ɪ s t 	 ['s t']  final  
f ʌ ɪ s ə ʊ s t ɪ ɡ m iː n 	 ['s t']p i ə n ɪ s t 	 ['s t']  final  
p i æ t s ə 	 ['t s']p i ɑ t s ə 	 ['t s']p ɪ ə s t 	 ['s t']  final  
p ʌ ɪ ɪ t ɪ s t ɪ k 	 ['s t']p ɪ ɡ l ə t s 	 ['t s']  final  
p ɪ ɡ s t a ɪ 	 ['s t']p ɪ l a s t ə 	 ['s t']p a ɪ l ə t s 	 ['t s']  final  
p ɪ n s t ɹ a ɪ p 	 ['s t']p a ɪ f ɪ l ɒ l ə d ʒ ɪ s t 	 ['s t']  final  
p ɪ p ɪ s t ɹ ɛ l 	 ['s t']p a ɪ ɹ ə t s 	 ['t s']  final  
p ɪ s t 	 ['s t']  final  
p ɪ s t e ɪ k 	 ['s t']p ɪ s t æ ʃ i ə ʊ 	 ['s t']p ɪ s t ɪ k 	 ['s t']p ɪ s t ə l 	 ['s t']p ɪ s t ə ʊ l 	 ['s t']p ɪ s t ə 

s ə k w ɛ s t ə 	 ['s t']s ɪ k w ɛ s t ə 	 ['s t']s iː k w ə s t ɹ e ɪ t 	 ['s t']s iː k w ə s t ɹ e ɪ t ə ɹ 	 ['s t']s ɜː v ə n t s 	 ['t s']  final  
s ɜː v ɪ s t 	 ['s t']  final  
s ɛ s t ɜː s 	 ['s t']s ɛ t f ɑː s t 	 ['s t']  final  
s ɛ t p ɔ ɪ n t s 	 ['t s']  final  
s ɛ t s 	 ['t s']  final  
s ɛ t s w ɑː n ə 	 ['t s']s e t l m ə n t s 	 ['t s']  final  
s ə v æ s t ə p o ʊ l 	 ['s t']s ɛ v ə s t o ʊ p ə l 	 ['s t']s ɛ k s t 	 ['s t']  final  
s ɛ k s i ə s t 	 ['s t']  final  
s ɛ k s ɪ s t 	 ['s t']  final  
s ɛ k s t 	 ['s t']  final  
s ɛ k s t ə n t 	 ['s t']s e k s t æ s t ɪ k 	 ['s t', 's t']s ɛ k s t e ɪ t 	 ['s t']s ɛ k s t ɛ t 	 ['s t']s ɛ k s t a ɪ l 	 ['s t']s ɛ k s t a ɪ l z 	 ['s t']s ɛ k s t ɪ l i ə n θ 	 ['s t']s ɛ k s t ɪ ŋ 	 ['s t']s ɛ k s t ə n 	 ['s t']s ɛ k s t j uː p l ɪ k e ɪ t 	 ['s t']s ɛ k s t j uː p l ɪ k ə t 	 ['s t']ʃ æ f t s b ɹ ɪ 	 ['t s']ʃ æ ɡ t æ s t ɪ k 	 ['s t']ʃ e ɪ m f ɑː s t 	 ['s t']  final  
ʃ iː t s 	 ['t s']  final  
ʃ iː æ t s uː 	 [

s t ɛ p 	 ['s t']  initial  s t ɛ f 	 ['s t']  initial  s t ɛ f ə n i 	 ['s t']  initial  s t ɛ f ə n 	 ['s t']  initial  s t iː v ə n z 	 ['s t']  initial  s t ɛ p m ʌ ð ə 	 ['s t']  initial  s t ɛ p n i 	 ['s t']  initial  s t ɛ p 	 ['s t']  initial  s t ɛ p t 	 ['s t']  initial  s t ɛ p ɪ ŋ 	 ['s t']  initial  s t ɛ p s 	 ['s t']  initial  s t ɛ p s ʌ n 	 ['s t']  initial  s t ɜː ɹ k ə ɹ ɛ ə ɹ i ə s 	 ['s t']  initial  s t ɛ ɹ i ə ʊ ɪ l ɛ k t ɹ ɒ n ɪ k 	 ['s t']  initial  s t ɛ ɹ ɪ ə ʊ a ɪ s ɒ m ə ɹ ɪ z ə m 	 ['s t']  initial  s t ɛ ɹ iː ɒ m ə t ɹ i 	 ['s t']  initial  s t ɛ r i ə s k ɑː p ɪ k 	 ['s t']  initial  s t ɛ ɹ iː ɒ t ə m i 	 ['s t']  initial  s t ɛ ɹ i ə t a ɪ p 	 ['s t']  initial  s t ɪ ə ɹ i ə t a ɪ p 	 ['s t']  initial  s t ɛ ɹ a ɪ l 	 ['s t']  initial  s t ɜː ɹ l ɪ ŋ 	 ['s t']  initial  s t ɜː n 	 ['s t']  initial  s t ɜː n l i 	 ['s t']  initial  s t ɜː n ə ʊ k l ʌ ɪ d ə ʊ m a s t ɔ ɪ d 	 ['s t', 's t']  initial  s t ɜː ɹ n z 	 ['s t']  initial  s t ɜː n ə m 	 ['s t'

t ɛ m p ə s t 	 ['s t']  final  
t ɛ n t s 	 ['t s']  final  
t ɜː m a ɪ t s 	 ['t s']  final  
t ə ɹ ɛ s t ɹ i ə l 	 ['s t']t ə ɹ ɛ s t ɹ i ə s 	 ['s t']t ɛ ɹ ə ɹ ɪ s t 	 ['s t']  final  
t ɛ s t 	 ['s t']  final  
t ɛ s t e ɪ ʃ ə s 	 ['s t']t ɛ s t ə m ə n t 	 ['s t']t ɛ s t e ɪ t ɹ ɪ s iː z 	 ['s t']t ɛ s t e ɪ t ɹ ɪ k s 	 ['s t']t ɛ s t k ɹ ɒ s 	 ['s t']t ɛ s t ə 	 ['s t']t ɛ s t ɪ k ə l 	 ['s t']t ɛ s t ɪ k j ə l ə 	 ['s t']t ɛ s t ɪ k j ə l ɚ 	 ['s t']t ɛ s t ɪ f a ɪ 	 ['s t']t ɛ s t ɪ m ə n i 	 ['s t']t ɛ s t ɪ ŋ 	 ['s t']t ɛ s t ɪ ŋ z 	 ['s t']t ɛ s t ɒ s t ə ɹ ə ʊ n 	 ['s t', 's t']t ɛ s t s 	 ['s t s']  final  
t ɛ s t i 	 ['s t']t ɛ t ɹ ə h a ɪ d ɹ ə ʊ d ʒ ɛ s t ɹ ɪ n ə ʊ n 	 ['s t']t ɛ t ɹ ə s t ɪ k 	 ['s t']t ɛ t ɹ a s t ə w ä n 	 ['s t']t ɛ t ɹ ə s t o ä n 	 ['s t']t ɛ t ɹ ə θ i ɪ s t 	 ['s t']  final  
t ɛ k s t 	 ['s t']  final  
t ɛ k s t 	 ['s t']  final  
t ɛ k s t b ʊ k 	 ['s t']t ɛ k s t ɪ d 	 ['s t']t ɛ k s t a ɪ l 	 ['s t']t ɛ k s t s 	 ['s t s']  final  
t ɛ k

In [8]:
num_words = len(eng_words)
print((cc_count/num_words)*100, "percent of words had consonant clusters containing /s/ and/or /t/.")
print((wicc_count/num_words)*100, "percent of words had word-initial consonant clusters with /s/ and/or /t/.")
print((wfcc_count/num_words)*100, "percent of words had word-final consonant clusters with /s/ and/or /t/.")

8.486987207763566 percent of words had consonant clusters containing /s/ and/or /t/.
1.388619320688134 percent of words had word-initial consonant clusters with /s/ and/or /t/.
2.6272606969563297 percent of words had word-final consonant clusters with /s/ and/or /t/.


In [7]:
# Now search for consonant clusters in the Arabic words you read in.
# Print out - and count - what you find.
cc_count = 0
wicc_count = 0
wfcc_count = 0
for w in ara_words:
    cc_results = re.findall(cc_RE,w)
    wicc_results = re.findall(wicc_RE,w)
    wfcc_results = re.findall(wfcc_RE,w)
    if cc_results:
        cc_count += 1
        print(w,"\t",cc_results,end="")
        if wicc_results:
            wicc_count += 1
            print ('  initial  ',end="")
        if wfcc_results:
            wfcc_count += 1
            print ('  final  ',end="")
        print()

ʔ a t t uː n 	 ['t t']
ʔ u ħ a s s a n 	 ['s s']
ʔ u ħ a s s a n a 	 ['s s']
ʔ u ħ a s s a n u 	 ['s s']
ʔ u ħ a s s i n 	 ['s s']
ʔ u ħ a s s i n a 	 ['s s']
ʔ u ħ a s s i n u 	 ['s s']
ʔ u s t aː z 	 ['s t']
ʔ u s t aː ð 	 ['s t']
ʔ u s t u r aː l i j j 	 ['s t']
ʔ u s t u r aː l i j aː 	 ['s t']
ʔ a s tˤ u r l aː b 	 ['s t']
ʔ u s tˤ u w aː n a h 	 ['s t']
ʔ u s tˤ uː r a 	 ['s t']
ʔ u s tˤ uː l 	 ['s t']
ʔ a ɣ u s tˤ u s 	 ['s t']
ʔ a f ɣ aː n i s t aː n 	 ['s t']
ʔ a m a s s a 	 ['s s']
ʔ a m a s s i 	 ['s s']
ʔ a m a s s u 	 ['s s']
ʔ u m a s s a 	 ['s s']
ʔ u m a s s i 	 ['s s']
ʔ u m a s s u 	 ['s s']
ʔ o r k e s t r aː 	 ['s t']
ʔ uː z b a k i s t aː n 	 ['s t']
ʔ i s t aː d 	 ['s t']
ʔ i s t i d j oː 	 ['s t']
ʔ i s t uː d i j oː 	 ['s t']
ʔ i s t oː n i j aː 	 ['s t']
ʔ i s tˤ a b l 	 ['s t']
i t t i ħ aː d 	 ['t t']
i t t a dˤ a ħ a 	 ['t t']
i t t a ʕ a d a 	 ['t t']
i t t i h aː m 	 ['t t']
i s t a ʔ n a f a 	 ['s t']
i s t a b ħ a r a 	 ['s t']
i s t a b a d d a 	 ['s t'

In [8]:
num_words = len(ara_words)
print((cc_count/num_words)*100, "percent of words had consonant clusters containing /s/ and/or /t/.")
print((wicc_count/num_words)*100, "percent of words had word-initial consonant clusters with /s/ and/or /t/.")
print((wfcc_count/num_words)*100, "percent of words had word-final consonant clusters with /s/ and/or /t/.")

3.0374289633548894 percent of words had consonant clusters containing /s/ and/or /t/.
0.0 percent of words had word-initial consonant clusters with /s/ and/or /t/.
0.03919263178522438 percent of words had word-final consonant clusters with /s/ and/or /t/.


# Observations

- Write your general observations about the results here.  A few short sentences would be fine.

# Directions for possible extensions (optional)

- Look for clusters involving more consonants in each language - or any consonants in the language.
- Some phonemes have representations that are more than one character long - this is the reason the Wikipron pronunciations are presented in space-separated form, to clarify phoneme segmentation.  I have avoided searching for such multi-character phonemes in this homework, to keep things simple, but if you would like to extend this to tackle such phonemes as well, you will need to represent each phoneme as a *string* rather than as a character, and you will need to search for 2 or more consecutive instances of such strings.  
- Do the same thing for other languages.  E.g. [PHOIBLE](https://phoible.org/) has phoneme inventories for many languages - you would need to first download the data and then get it in the format of the existing English and Arabic data.