In [1]:
import spacy
from spacy import displacy
nlp = spacy.load('en_core_web_sm')

In [6]:
doc = nlp(u'Apple is going to build a U.K. factory for $6 million.')
displacy.render(doc, style='dep', jupyter=True, options={'distance': 80})

In [7]:
for token in doc:
    print(f'{token.text:{10}} {token.pos_:{7}} {token.dep_:{7}} {spacy.explain(token.dep_)}')

Apple      PROPN   nsubj   nominal subject
is         AUX     aux     auxiliary
going      VERB    ROOT    None
to         PART    aux     auxiliary
build      VERB    xcomp   open clausal complement
a          DET     det     determiner
U.K.       PROPN   compound compound
factory    NOUN    dobj    direct object
for        ADP     prep    prepositional modifier
$          SYM     quantmod modifier of quantifier
6          NUM     compound compound
million    NUM     pobj    object of preposition
.          PUNCT   punct   punctuation


In [9]:
# doc = nlp(u'This is a sentence.')
# displacy.serve(doc, style='dep')

In [10]:
text = """In ancient Rome, some neighbors live in three adjacent houses. In the center is the house of Senex, who lives there with wife Domina, son Hero, and several slaves, including head slave Hysterium and the musical's main character Pseudolus. A slave belonging to Hero, Pseudolus wishes to buy, win, or steal his freedom. One of the neighboring houses is owned by Marcus Lycus, who is a buyer and seller of beautiful women; the other belongs to the ancient Erronius, who is abroad searching for his long-lost children (stolen in infancy by pirates). One day, Senex and Domina go on a trip and leave Pseudolus in charge of Hero. Hero confides in Pseudolus that he is in love with the lovely Philia, one of the courtesans in the House of Lycus (albeit still a virgin)."""
doc = nlp(text)
sentence_spans = list(doc.sents)
displacy.render(sentence_spans, style="dep",options={'distance': 50})

In [11]:
doc1 = nlp("This is a sentence.")
doc2 = nlp("This is another sentence.")
html = displacy.render([doc1, doc2], style="dep", page=True)

In [13]:
doc = nlp("Rats are various medium-sized, long-tailed rodents.")
displacy.render(doc, style="dep", options={'distance': 80})

In [14]:
from IPython.core.display import display, HTML

html = displacy.render(doc, style="dep")
display(HTML(html))

<IPython.core.display.HTML object>

In [15]:
from pathlib import Path

nlp = spacy.load("en_core_web_sm")
sentences = ["This is an example.", "This is another one."]
for sent in sentences:
    doc = nlp(sent)
    svg = displacy.render(doc, style="dep", jupyter=False)
    file_name = '-'.join([w.text for w in doc if not w.is_punct]) + ".svg"
    output_path = Path( file_name)
    output_path.open("w", encoding="utf-8").write(svg)

In [16]:
doc = nlp(u'Over the last quarter Apple sold nearly 20 thousand iPods for a profit of $6 million. '
         u'By contrast, Sony sold only 7 thousand Walkman music players.')
displacy.render(doc, style="dep", options={"compact": True, "bg": "#09a3d5",
                                           'distance': 50,"color": "white",
                                           "font": "Source Sans Pro"})

In [17]:
doc = nlp(u'Over the last quarter Apple sold nearly 20 thousand iPods for a profit of $6 million.')
displacy.render(doc, style='ent', jupyter=True)

In [19]:
# displacy.serve(doc, style='ent')

In [20]:
doc = nlp(u'Over the last quarter Apple sold nearly 20 thousand iPods for a profit of $6 million. '
         u'By contrast, Sony sold only 7 thousand Walkman music players.')

displacy.render(doc, style='ent', jupyter=True)

In [21]:
doc2 = nlp(u'Over the last quarter Apple sold nearly 20 thousand iPods for a profit of $6 million. '
         u'By contrast, my kids sold a lot of lemonade.')

for sent in doc2.sents:
    docx = nlp(sent.text)
    if docx.ents:
        displacy.render(docx, style='ent', jupyter=True)
    else:
        print(docx.text)

By contrast, my kids sold a lot of lemonade.


In [23]:
options = {'ents': ['ORG', 'PRODUCT']}

displacy.render(doc, style='ent', jupyter=True, options=options)

In [24]:
colors = {'ORG': 'linear-gradient(90deg, #aa9cfc, #fc9ce7)', 'PRODUCT': 'radial-gradient(yellow, green)'}

options = {'ents': ['ORG', 'PRODUCT'], 'colors':colors}

displacy.render(doc, style='ent', jupyter=True, options=options)

In [25]:
text = "When Sebastian Thrun started working on self-driving cars at Google in 2007, few people outside of the company took him seriously."
doc = nlp(text)
displacy.render(doc, style="ent")

In [26]:
colors = {"ORG": "linear-gradient(90deg, #aa9cfc, #fc9ce7)"}
options = {"ents": ["ORG"], "colors": colors}
displacy.render(doc, style="ent", options=options)

In [27]:
doc = nlp("This is a sentence about Google.")
doc.user_data["title"] = "This is a title"
displacy.render(doc, style="ent")

In [28]:
ex = [{"text": "But Google is starting from behind.",
       "ents": [{"start": 4, "end": 10, "label": "ORG"}],
       "title": None}]
html = displacy.render(ex, style="ent", manual=True)

In [29]:
doc = nlp('ستقوم شركة مرسيدس بشراء شركة كرايسلر بمبلغ 5 مليون دولار')
displacy.render(doc, style='dep', jupyter=True, options={'distance': 80})

In [30]:
doc = nlp(u'انا احب لغة بايثون')
displacy.serve(doc, style='dep')

OSError: [WinError 10013] An attempt was made to access a socket in a way forbidden by its access permissions

In [31]:
text = """
و عبد الله محمد بن موسى الخوارزمي عالم رياضيات وفلك وجغرافيا مسلم. يكنى باسم الخوارزمي وأبي جعفر. قيل أنه ولد حوالي 164هـ 781م (وهو غير مؤكد) وقيل أنه توفي بعد 232 هـ أي (بعد 847م). يعتبر من أوائل علماء الرياضيات المسلمين حيث ساهمت أعماله بدور كبير في تقدم الرياضيات في عصره. اتصل بالخليفة العباسي المأمون وعمل في بيت الحكمة في بغداد وكسب ثقة الخليفة إذ ولاه المأمون بيت الحكمة كما عهد إليه برسم خارطة للأرض عمل فيها أكثر من سبعين جغرافيا. قبل وفاته في 850 م/232 هـ كان الخوارزمي قد ترك العديد من المؤلفات في علوم الرياضيات والفلك والجغرافيا ومن أهمها كتاب المختصر في حساب الجبر والمقابلة الذي يعد أهم كتبه.

ترجم الكتابَ إلى اللغة اللاتينية حوالي عام 1145 م العالم روبرت مِن تشستر. دخلت على إثر ذلك كلمات مثل الجبر Algebra والصفر Zero إلى اللغات اللاتينية وترجمه بعد ذلك بقليل جيراردو الكريموني الساكن في طليطلة، متبوعا في ذلك بترجمة ثالثة قام بها الإيطالي غيوم دي لونا. استُعملت ترجمة روبرت مِن تشستر الكتاب الرئيسي في الرياضيات إلى حدود القرن السادس عشر في الجامعات الأوروبية.

"""
doc = nlp(text)
sentence_spans = list(doc.sents)
displacy.render(sentence_spans, style="dep",options={'distance': 50})

In [32]:
doc1 = nlp("هذه هي الجملة الأولي")
doc2 = nlp("هذه هي الجملة التالية لها ")
html = displacy.render([doc1, doc2], style="dep", page=True)

In [33]:
from pathlib import Path


sentences = ["هذه هي الجملة الأولي", "هذه هي الجملة التالية لها "]
for sent in sentences:
    doc = nlp(sent)
    svg = displacy.render(doc, style="dep", jupyter=False)
    file_name = '-'.join([w.text for w in doc if not w.is_punct]) + ".svg"
    output_path = Path( file_name)
    output_path.open("w", encoding="utf-8").write(svg)

In [34]:
doc = nlp(u'ستقوم شركة مرسيدس بشراء شركة كرايسلر بمبلغ 5 مليون دولار')

displacy.render(doc, style="dep", options={"compact": True, "bg": "#09a3d5",
                                           'distance': 50,"color": "white",
                                           "font": "Source Sans Pro"})

In [35]:
doc = nlp(u'ستقوم شركة مرسيدس بشراء شركة كرايسلر بمبلغ 5 مليون دولار')
displacy.render(doc, style='ent', jupyter=True)

In [None]:
displacy.serve(doc, style='ent')

In [36]:
text = """
و عبد الله محمد بن موسى الخوارزمي عالم رياضيات وفلك وجغرافيا مسلم. يكنى باسم الخوارزمي وأبي جعفر. قيل أنه ولد حوالي 164هـ 781م (وهو غير مؤكد) وقيل أنه توفي بعد 232 هـ أي (بعد 847م). يعتبر من أوائل علماء الرياضيات المسلمين حيث ساهمت أعماله بدور كبير في تقدم الرياضيات في عصره. اتصل بالخليفة العباسي المأمون وعمل في بيت الحكمة في بغداد وكسب ثقة الخليفة إذ ولاه المأمون بيت الحكمة كما عهد إليه برسم خارطة للأرض عمل فيها أكثر من سبعين جغرافيا. قبل وفاته في 850 م/232 هـ كان الخوارزمي قد ترك العديد من المؤلفات في علوم الرياضيات والفلك والجغرافيا ومن أهمها كتاب المختصر في حساب الجبر والمقابلة الذي يعد أهم كتبه.

ترجم الكتابَ إلى اللغة اللاتينية حوالي عام 1145 م العالم روبرت مِن تشستر. دخلت على إثر ذلك كلمات مثل الجبر Algebra والصفر Zero إلى اللغات اللاتينية وترجمه بعد ذلك بقليل جيراردو الكريموني الساكن في طليطلة، متبوعا في ذلك بترجمة ثالثة قام بها الإيطالي غيوم دي لونا. استُعملت ترجمة روبرت مِن تشستر الكتاب الرئيسي في الرياضيات إلى حدود القرن السادس عشر في الجامعات الأوروبية.

"""

doc = nlp(text)

displacy.render(doc, style='ent', jupyter=True)

In [37]:
doc2 = nlp(text)

for sent in doc2.sents:
    docx = nlp(sent.text)
    if docx.ents:
        displacy.render(docx, style='ent', jupyter=True)
    else:
        print(docx.text)

يعتبر من


في


قبل وفاته في
850 م/232 هـ كان الخوارزمي


من المؤلفات


والمقابلة الذي يعد أهم كتبه.


ترجم الكتابَ


ثالثة قام
بها


استُعملت
