<a href="https://colab.research.google.com/github/qaweb-dev/python/blob/main/colab_lingva_app.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Google Colab в лингвистике

Полный текст статьи и пояснения к коду здесь:

 https://qaweb.dev/coding/1021-google-colab-lingva

### 1. Пример с распознаванием сущностей

In [8]:
!pip install spacy



In [12]:
!python -m spacy download ru_core_news_md

Collecting ru-core-news-md==3.7.0
  Downloading https://github.com/explosion/spacy-models/releases/download/ru_core_news_md-3.7.0/ru_core_news_md-3.7.0-py3-none-any.whl (41.9 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m41.9/41.9 MB[0m [31m22.1 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: ru-core-news-md
Successfully installed ru-core-news-md-3.7.0
[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('ru_core_news_md')
[38;5;3m⚠ Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.


In [13]:
import spacy

# Загружаем модель для русского языка
nlp = spacy.load("ru_core_news_sm")

# Текст для анализа без имен
text = "Компания Tesla анонсировала новый электромобиль, который будет представлен в Лос-Анджелесе 15 марта 2025 года."

# Применяем модель для обработки текста
doc = nlp(text)

# Печатаем найденные сущности
for entity in doc.ents:
    print(f"Сущность: {entity.text}, Тип: {entity.label_}")


Сущность: Tesla, Тип: ORG
Сущность: Лос-Анджелесе, Тип: LOC


### 2. Пример с классификацией текста

###2.1 Простой пример

In [15]:
from textblob import TextBlob

# Текст для анализа
text = "I hate Python."

# Анализ сентимента
blob = TextBlob(text)
sentiment = blob.sentiment.polarity

# Определяем сентимент
if sentiment > 0:
    sentiment_label = "Положительный"
elif sentiment < 0:
    sentiment_label = "Отрицательный"
else:
    sentiment_label = "Нейтральный"

# Выводим результат
print(f"Текст: {text}")
print(f"Предсказанный sentiment: {sentiment_label}")

Текст: I hate Python.
Предсказанный sentiment: Отрицательный


### 2.2 Продвинутый вариант

In [6]:
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB

# Пример данных с увеличенным набором
texts = [
    "I love Python!", "I hate Python.", "Python is awesome.", "I dislike Java.",
    "Python is great!", "I enjoy learning Python.", "I hate JavaScript.", "JavaScript is terrible.",
    "I love programming!", "I dislike programming.", "Python is fun.", "I dislike C++."
]
labels = [1, 0, 1, 0, 1, 1, 0, 0, 1, 0, 1, 0]  # 1 - положительный, 0 - отрицательный

# Разделение данных на обучающую и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(texts, labels, test_size=0.2, random_state=42)

# Использование биграмм для векторизации текста
vectorizer = CountVectorizer(ngram_range=(1, 2))  # Учитываем как отдельные слова, так и пары слов
X_train_vec = vectorizer.fit_transform(X_train)
X_test_vec = vectorizer.transform(X_test)

# Обучение модели
model = MultinomialNB()
model.fit(X_train_vec, y_train)

# Предсказание
predictions = model.predict(X_test_vec)

# Отображение результатов
for text, prediction in zip(X_test, predictions):
    sentiment = "Положительный" if prediction == 1 else "Отрицательный"
    print(f"Текст: {text} \nПредсказанный sentiment: {sentiment}\n")



Текст: Python is fun. 
Предсказанный sentiment: Положительный

Текст: I dislike programming. 
Предсказанный sentiment: Отрицательный

Текст: I love Python! 
Предсказанный sentiment: Положительный



### 3. Пример с переводом текста

In [1]:
!pip install googletrans==4.0.0-rc1



###3.1 Переклад українською

In [2]:
from googletrans import Translator

translator = Translator()
translated = translator.translate('Hello, how are you?', src='en', dest='uk')
print(translated.text)

Привіт, як справи?


###3.2 С английского на русский

In [14]:
from googletrans import Translator

translator = Translator()
translated = translator.translate('Hello, how are you?', src='en', dest='ru')
print(translated.text)

Привет, как дела?
