In [3]:
import spacy
from spacy.language import Language

from spacy_language_detection import LanguageDetector

In [4]:
def get_lang_detector(nlp, name):
    return LanguageDetector(seed=42)  # We use the seed 42

In [11]:
nlp_model = spacy.load("en_core_web_sm")
Language.factory("language_detector", func=get_lang_detector)
nlp_model.add_pipe('language_detector', last=True)

# Document level language detection
text = """Hello, how are you?.
        क्या आप मेरी मदद कर सकते हैं?.
        আপনি কি আমাকে সাহায্য করতে পারেন?
        మీరు నాకు సహాయం చేయగలరా?
        எனக்கு புதிய மொழிகளை கற்க விரும்புகிறேன்.
        ನೀವು ನನಗೆ ಸಹಾಯ ಮಾಡುತ್ತೀರಾ?
        મને નવી ભાષાઓ શીખવી ગમે છે.
        तुम्ही मला मदत करू शकता का?
        J'adore apprendre de nouvelles langues.
        ¿Dónde está el restaurante más cercano?
        最近的餐厅在哪里？"""
doc = nlp_model(text)
language = doc._.language
print(language)

{'language': 'hi', 'score': 0.42857121522113195}


In [12]:
doc = nlp_model(text)
for i, sent in enumerate(doc.sents):
    print(sent, sent._.language)

Hello, how are you?. 
         {'language': 'en', 'score': 0.8571417654775959}
क्या {'language': 'mr', 'score': 0.9999966344405424}
आप मेरी मदद कर सकते हैं?. 
         {'language': 'hi', 'score': 0.9999983930135614}
আপনি কি আমাকে সাহায্য {'language': 'bn', 'score': 0.9999999956876348}
করতে পারেন?
        మీరు నాకు సహాయం చేయగలరా? 
        எனக்கு புதிய மொழிகளை கற்க விரும்புகிறேன்.
         {'language': 'ta', 'score': 0.9999999573398047}
ನೀವು ನನಗೆ ಸಹಾಯ ಮಾಡುತ್ತೀರಾ? 
         {'language': 'kn', 'score': 0.9999999999598668}
મને નવી ભાષાઓ શીખવી ગમે છે. 
        तुम्ही मला मदत करू {'language': 'gu', 'score': 0.9999988630237826}
शकता का?
        J'adore apprendre de nouvelles langues. 
         {'language': 'fr', 'score': 0.9999974737942253}
¿Dónde está el restaurante más cercano? 
         {'language': 'es', 'score': 0.9999965700844271}
最近的餐厅在哪里？ {'language': 'zh-cn', 'score': 0.5714285573531612}


In [13]:
# Sentence level language detection
text = "This is English text. Er lebt mit seinen Eltern und seiner Schwester in Berlin. Yo me divierto todos los días en el parque. Je m'appelle Angélica Summer, j'ai 12 ans et je suis canadienne."
doc = nlp_model(text)
for i, sent in enumerate(doc.sents):
    print(sent, sent._.language)

This is English text. {'language': 'en', 'score': 0.9999987929307774}
Er lebt mit seinen Eltern und seiner Schwester in Berlin. {'language': 'de', 'score': 0.999996045846908}
Yo me divierto todos los días en el parque. {'language': 'es', 'score': 0.9999960751128255}
Je m'appelle Angélica Summer, j'ai 12 ans et je suis canadienne. {'language': 'fr', 'score': 0.9999960488878062}
