# سفر یادگیری: کشف معماری‌های یادگیری عمیق 🚀🧠

**بیایید با هم سه معماری اساسی یادگیری عمیق را کشف کنیم:**

## 1. <span style="color: #4d90fe;">CNN (شبکه عصبی کانولوشنی)</span> 🖼️
- **مغز بینایی ماشین** 👁️
- از فیلترهای کانولوشنی برای تشخیص الگوهای محلی استفاده می‌کند
- ایده‌آل برای پردازش تصاویر و ویدیو
- مثال: تشخیص اشیا در عکس‌ها

## 2. <span style="color: #34a853;">RNN (شبکه عصبی بازگشتی)</span> 🔄
- **حافظه کوتاه‌مدت برای داده‌های متوالی** 📜
- می‌تواند اطلاعات را از مراحل قبلی به خاطر بسپارد
- مناسب برای متن، گفتار و داده‌های زمانی
- مثال: پیش‌بینی کلمه بعدی در جمله

## 3. <span style="color: #ea4335;">Transformer</span> ⚡
- **انقلابی در پردازش زبان** 💬
- از مکانیزم توجه (Attention) استفاده می‌کند
- می‌تواند روابط بلندمدت را در داده‌ها تشخیص دهد
- مثال: ترجمه ماشینی، مدل‌های گفتگو

📌 **نکته طلایی:**  
این معماری‌ها اغلب با هم ترکیب می‌شوند تا سیستم‌های هوشمند قدرتمندی بسازند!

🎯 **هدف ما در این مسیر:**  
یادگیری اصول هر معماری + درک کاربردهای عملی + پیاده‌سازی ساده


# یادگیری عمیق: موتور محرک هوش مصنوعی مدرن 🌟🧠

**یادگیری عمیق**، پیشرفته‌ترین شاخه یادگیری ماشین است که با الهام از ساختار مغز انسان، انقلابی در پردازش داده‌ها ایجاد کرده است. این فناوری با معماری‌های هوشمندانه خود قادر به یادگیری سلسله‌مراتبی ویژگی‌ها از داده‌های خام است:


# CNN (شبکه عصبی کانولوشنی)

In [None]:
# کتابخانه‌های مورد نیاز
import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences
import numpy as np

# مرحله 1: آماده‌سازی داده‌های متنی
# هدف: تبدیل متن به بردارهای عددی و آماده‌سازی برای ورودی شبکه
def prepare_text_data(texts, labels, max_words=10000, max_len=100):
    # توکن‌سازی: تبدیل کلمات به توکن‌های عددی
    tokenizer = Tokenizer(num_words=max_words)
    tokenizer.fit_on_texts(texts)
    # تبدیل متن به دنباله‌های عددی
    sequences = tokenizer.texts_to_sequences(texts)
    # پد کردن دنباله‌ها برای یکسان‌سازی طول
    data = pad_sequences(sequences, maxlen=max_len)
    # تبدیل برچسب‌ها به آرایه
    labels = np.array(labels)
    return data, labels, tokenizer

# مرحله 2: تعریف معماری شبکه کانولوشنی
# هدف: ایجاد یک مدل CNN برای استخراج ویژگی‌های متنی و طبقه‌بندی احساسات
def build_cnn_model(vocab_size, max_len, embedding_dim=100):
    model = models.Sequential([
        # لایه تعبیه: تبدیل توکن‌ها به بردارهای متراکم
        layers.Embedding(vocab_size, embedding_dim, input_length=max_len),
        # لایه کانولوشنی اول: استخراج ویژگی‌های محلی از متن
        layers.Conv1D(128, 5, activation='relu'),
        # لایه پولینگ: کاهش ابعاد و حفظ ویژگی‌های مهم
        layers.MaxPooling1D(pool_size=2),
        # لایه کانولوشنی دوم: استخراج ویژگی‌های پیچیده‌تر
        layers.Conv1D(128, 5, activation='relu'),
        layers.MaxPooling1D(pool_size=2),
        # مسطح‌سازی: آماده‌سازی برای لایه‌های متراکم
        layers.Flatten(),
        # لایه کاملاً متصل: ترکیب ویژگی‌ها
        layers.Dense(64, activation='relu'),
        # لایه خروجی: طبقه‌بندی دودویی (مثبت/منفی)
        layers.Dense(1, activation='sigmoid')
    ])
    return model

# مرحله 3: آموزش و ارزیابی مدل
# هدف: آموزش مدل و ارزیابی عملکرد آن در تحلیل احساسات
def train_and_evaluate_model(model, x_train, y_train, x_test, y_test):
    # کامپایل مدل با بهینه‌ساز و تابع هزینه
    model.compile(optimizer='adam',
                  loss='binary_crossentropy',
                  metrics=['accuracy'])
    # آموزش مدل
    model.fit(x_train, y_train, epochs=5, batch_size=64, validation_split=0.2)
    # ارزیابی مدل
    test_loss, test_acc = model.evaluate(x_test, y_test)
    print(f'دقت تست: {test_acc:.4f}')
    return test_acc, test_loss

# الگوریتم اصلی
def main():
    # نمونه داده‌ها
    # فرض
    texts = ["فیلم عالی بود و خیلی لذت بردم", "این بدترین تجربه من بود", ...]  # داده‌های متنی
    labels = [1, 0, ...]  # برچسب‌ها
    max_words = 10000  # حداکثر تعداد کلمات در واژگان
    max_len = 100  # حداکثر طول دنباله

    # آماده‌سازی داده‌ها
    x_data, y_data, tokenizer = prepare_text_data(texts, labels, max_words, max_len)
    # تقسیم داده‌ها به آموزشی و تست (فرض: 80% آموزشی، 20% تست)
    train_size = int(0.8 * len(x_data))
    x_train, y_train = x_data[:train_size], y_data[:train_size]
    x_test, y_test = x_data[train_size:], y_data[train_size:]

    # تعریف مدل
    model = build_cnn_model(max_words, max_len)
    # نمایش خلاصه مدل
    model.summary()
    # آموزش و ارزیابی
    train_and_evaluate_model(model, x_train, y_train, x_test, y_test)

# اجرای برنامه
if __name__ == "__main__":
    main()

# شبکه‌های عصبی بازگشتی (RNN)

In [None]:
import tensorflow as tf
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, SimpleRNN, Dense

# داده
sentences = [
    "I love this product",
    "This is bad",
    "I hate this",
    "This is great",
    "I like it",
    "It is terrible"
]
labels = [1, 0, 0, 1, 1, 0]  # 1=positive, 0=negative

# توکنایزر برای تبدیل کلمات به اعداد
tokenizer = Tokenizer(num_words=1000, oov_token="<OOV>")
tokenizer.fit_on_texts(sentences)

# تبدیل جملات به دنباله اعداد
sequences = tokenizer.texts_to_sequences(sentences)
padded = pad_sequences(sequences, padding='post')

# ساخت مدل 
model = Sequential([
    Embedding(input_dim=1000, output_dim=16, input_length=padded.shape[1]),
    SimpleRNN(32),
    Dense(1, activation='sigmoid')
])

model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

# آموزش مدل
model.fit(padded, labels, epochs=10)

# جمله جدید کاربر
new_sentence = ["I love this product! It works really well"]

# پیش‌پردازش جمله جدید
seq = tokenizer.texts_to_sequences(new_sentence)
padded_seq = pad_sequences(seq, maxlen=padded.shape[1], padding='post')

# پیش‌بینی احساس جمله
prediction = model.predict(padded_seq)[0][0]

print(f"Sentiment score (0=negative, 1=positive): {prediction:.3f}")

if prediction > 0.5:
    print("Sentiment: Positive 😊")
else:
    print("Sentiment: Negative 😞")


# شبکه‌های LSTM (Long Short-Term Memory)

## کاربردهای LSTM در تعامل احساسی
LSTM در حوزه تعامل احساسات انسان با هوش مصنوعی کاربردهای متنوعی دارد:
- **تحلیل احساسات متنی:** تشخیص احساسات (شادی، غم، خشم) در متون کاربران.
- **تشخیص گفتار احساسی:** تحلیل زیروبمی و آهنگ گفتار برای درک حالت احساسی.
- **مدل‌سازی مکالمات:** حفظ تاریخچه مکالمه برای پاسخ‌های متناسب با احساسات.
- **پیش‌بینی رفتار احساسی:** استفاده از داده‌های سری زمانی برای پیش‌بینی تغییرات احساسی.

In [None]:

import numpy as np
from tensorflow.keras.datasets import imdb
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, LSTM, Embedding
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.utils import to_categorical
import matplotlib.pyplot as plt


max_features = 10000  # تعداد کلمات پرکاربرد
maxlen = 200  # حداکثر طول نظرات (تعداد کلمات)
embedding_dim = 100  # ابعاد بردار جاسازی

# 1. بارگذاری دیتاست IMDB
(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=max_features)

# 2. پیش‌پردازش: استانداردسازی طول نظرات
x_train = pad_sequences(x_train, maxlen=maxlen)
x_test = pad_sequences(x_test, maxlen=maxlen)

# تبدیل برچسب‌ها به فرمت 
y_train = to_categorical(y_train, num_classes=2)
y_test = to_categorical(y_test, num_classes=2)

# 3. ساخت مدل 
model = Sequential()
model.add(Embedding(input_dim=max_features, output_dim=embedding_dim, input_length=maxlen))
model.add(LSTM(units=128, return_sequences=False))
model.add(Dense(units=2, activation='softmax'))

# کامپایل مدل
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# نمایش ساختار مدل
model.summary()

# 4. آموزش مدل
history = model.fit(x_train, y_train, epochs=5, batch_size=32, validation_split=0.2)

# 5. ارزیابی مدل
test_loss, test_accuracy = model.evaluate(x_test, y_test)
print(f'دقت مدل روی داده‌های آزمایشی: {test_accuracy:.4f}')

# 6. رسم نمودار دقت و خطا
plt.figure(figsize=(12, 4))

# نمودار دقت
plt.subplot(1, 2, 1)
plt.plot(history.history['accuracy'], label='دقت آموزش')
plt.plot(history.history['val_accuracy'], label='دقت اعتبارسنجی')
plt.title('دقت مدل')
plt.xlabel('دوره (Epoch)')
plt.ylabel('دقت')
plt.legend()

# نمودار خطا
plt.subplot(1, 2, 2)
plt.plot(history.history['loss'], label='خطای آموزش')
plt.plot(history.history['val_loss'], label='خطای اعتبارسنجی')
plt.title('خطای مدل')
plt.xlabel('دوره (Epoch)')
plt.ylabel('خطا')
plt.legend()

plt.show()

# واحدهای بازگشتی گیت‌دار (Gated Recurrent Units - GRU)

### کاربرد در تحلیل احساسات

**پردازش متن ترتیبی:**  
در تحلیل احساسات، متن به صورت یک توالی از کلمات یا توکن‌ها پردازش می‌شود.  
**GRU** با توجه به ترتیب کلمات، معانی و روابط بین آن‌ها را یاد می‌گیرد.

**مثال:**  
برای مثال، در جمله زیر:  
_"این فیلم اصلاً خوب نبود، خیلی خسته‌کننده بود"_

GRU می‌تواند وابستگی بین بخش‌های مختلف جمله مانند "اصلاً خوب نبود" و "خسته‌کننده" را درک کند تا احساس منفی را تشخیص دهد.

In [None]:
import numpy as np
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, GRU, Dense

# داده‌های نمونه
texts = [
    "این فیلم واقعاً عالی بود، خیلی لذت بردم!",
    "فیلم اصلاً خوب نبود، خیلی خسته‌کننده بود.",
    "داستان فیلم فوق‌العاده بود و بازیگران عالی بودند.",
    "یکی از بدترین فیلم‌هایی که دیدم، افتضاح بود."
]
labels = [1, 0, 1, 0]  # 1: مثبت، 0: منفی

# پارامترها
max_words = 1000  # حداکثر تعداد کلمات در واژگان
max_len = 20      # حداکثر طول دنباله

# پیش‌پردازش متن
tokenizer = Tokenizer(num_words=max_words)
tokenizer.fit_on_texts(texts)
sequences = tokenizer.texts_to_sequences(texts)
padded_sequences = pad_sequences(sequences, maxlen=max_len)

# تبدیل برچسب‌ها به آرایه
labels = np.array(labels)

# ساخت مدل GRU
model = Sequential()
model.add(Embedding(max_words, 50, input_length=max_len))  # لایه تعبیه‌سازی
model.add(GRU(64, return_sequences=False))  # لایه GRU با 64 واحد
model.add(Dense(1, activation='sigmoid'))   # لایه خروجی برای طبقه‌بندی باینری

# کامپایل مدل
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# نمایش ساختار مدل
model.summary()

# آموزش مدل
model.fit(padded_sequences, labels, epochs=5, batch_size=2, verbose=1)

# تست مدل روی یک نمونه جدید
test_text = ["این فیلم خیلی خوب بود و من عاشقش شدم!"]
test_sequence = tokenizer.texts_to_sequences(test_text)
test_padded = pad_sequences(test_sequence, maxlen=max_len)
prediction = model.predict(test_padded)

# نتیجه
print("احساس پیش‌بینی‌شده:", "مثبت" if prediction[0] > 0.5 else "منفی")

# ترانسفورمر (Transformer)

### تحلیل احساسات متنی

تحلیل احساسات متنی به **شناسایی احساسات** شامل:
- **مثبت**
- **منفی**
- **خنثی**

در متن‌هایی مانند:
- نظرات کاربران
- نقدها
- پست‌های شبکه‌های اجتماعی

می‌پردازد.

---

**مدل‌های ترانسفورمر** به دلیل توانایی بی‌نظیرشان در:
- درک زمینه و زمینه‌های معنایی پیچیده
- فهم روابط بلندمدت بین کلمات

در این حوزه بسیار مؤثر هستند.

---

این ترکیب، تحلیل احساسات را سریع‌تر، دقیق‌تر و کارآمدتر می‌کند.

In [None]:
from transformers import BertTokenizer, BertForSequenceClassification
import torch
import numpy as np

# داده‌های نمونه
texts = [
    "این فیلم واقعاً عالی بود، خیلی لذت بردم!",
    "فیلم اصلاً خوب نبود، خیلی خسته‌کننده بود.",
    "داستان فیلم فوق‌العاده بود و بازیگران عالی بودند.",
    "یکی از بدترین فیلم‌هایی که دیدم، افتضاح بود."
]
labels = [1, 0, 1, 0]  # 1: مثبت، 0: منفی

# بارگذاری توکنایزر و مدل BERT
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
model = BertForSequenceClassification.from_pretrained('bert-base-uncased', num_labels=2)

# پیش‌پردازش داده‌ها
inputs = tokenizer(texts, padding=True, truncation=True, max_length=20, return_tensors="pt")
labels = torch.tensor(labels)

# آماده‌سازی داده‌ها برای آموزش
input_ids = inputs['input_ids']
attention_mask = inputs['attention_mask']

# تنظیم مدل برای آموزش
optimizer = torch.optim.AdamW(model.parameters(), lr=5e-5)

# آموزش مدل
model.train()
for epoch in range(3):  # 3 دوره برای مثال
    optimizer.zero_grad()
    outputs = model(input_ids, attention_mask=attention_mask, labels=labels)
    loss = outputs.loss
    loss.backward()
    optimizer.step()
    print(f"Epoch {epoch+1}, Loss: {loss.item()}")

# تست مدل روی یک نمونه جدید
test_text = ["این فیلم خیلی خوب بود و من عاشقش شدم!"]
test_inputs = tokenizer(test_text, padding=True, truncation=True, max_length=20, return_tensors="pt")

# پیش‌بینی
model.eval()
with torch.no_grad():
    outputs = model(test_inputs['input_ids'], attention_mask=test_inputs['attention_mask'])
    predictions = torch.argmax(outputs.logits, dim=1)

# نتیجه
print("احساس پیش‌بینی‌شده:", "مثبت" if predictions[0] == 1 else "منفی")

# اتوانکودرها (Autoencoders)


توانکودرها  نوعی از شبکه‌های عصبی مصنوعی هستند که برای **یادگیری نمایش فشرده داده‌ها** به صورت **بدون نظارت**  طراحی شده‌اند.

---

## توضیحات

در این بخش، به موارد زیر پرداخته می‌شود:
- **چیستی توانکودرها**  
- **چگونگی عملکرد آن‌ها**  
- **کاربردشان در تحلیل احساسات متنی**

همچنین، یک **مثال ساده** از پیاده‌سازی توانکودر برای تحلیل احساسات متنی ارائه می‌گردد.

---

## کاربرد در تحلیل احساسات

توانکودرها می‌توانند برای کاهش ابعاد و استخراج ویژگی‌های مهم از متن‌های بزرگ و پیچیده استفاده شوند، که این کار به بهبود فرآیند تحلیل احساسات کمک می‌کند.

---

**در ادامه، مثال عملی و کد نمونه‌ای برای استفاده از توانکودر در تحلیل احساسات متن آورده شده است.**

In [None]:
import numpy as np
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Input, Dense, Embedding, LSTM, Concatenate

# داده‌های نمونه
texts = [
    "این فیلم واقعاً عالی بود، خیلی لذت بردم!",
    "فیلم اصلاً خوب نبود، خیلی خسته‌کننده بود.",
    "داستان فیلم فوق‌العاده بود و بازیگران عالی بودند.",
    "یکی از بدترین فیلم‌هایی که دیدم، افتضاح بود."
]
labels = [1, 0, 1, 0]  # 1: مثبت، 0: منفی

# پیش‌پردازش متن
max_words = 1000  # حداکثر تعداد کلمات
max_len = 20      # حداکثر طول دنباله
tokenizer = Tokenizer(num_words=max_words)
tokenizer.fit_on_texts(texts)
sequences = tokenizer.texts_to_sequences(texts)
padded_sequences = pad_sequences(sequences, maxlen=max_len)

# تبدیل داده‌ها به آرایه
X = np.array(padded_sequences)
y = np.array(labels)

# ساخت اتوانکودر
input_layer = Input(shape=(max_len,))
embedding = Embedding(max_words, 50, input_length=max_len)(input_layer)
encoded = LSTM(64, return_sequences=False)(embedding)  # لایه انکودر
decoded = Dense(max_len * 50, activation='relu')(encoded)  # لایه دیکودر
decoded = Reshape((max_len, 50))(decoded)

# مدل اتوانکودر
autoencoder = Model(input_layer, decoded)
autoencoder.compile(optimizer='adam', loss='mse')

# مدل طبقه‌بندی (استفاده از نمایش فشرده برای تحلیل احساسات)
classification_output = Dense(1, activation='sigmoid')(encoded)
classification_model = Model(input_layer, classification_output)
classification_model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# نمایش ساختار مدل طبقه‌بندی
classification_model.summary()

# آموزش اتوانکودر
autoencoder.fit(X, X.reshape(X.shape[0], max_len, 50), epochs=5, batch_size=2, verbose=1)

# آموزش مدل طبقه‌بندی
classification_model.fit(X, y, epochs=5, batch_size=2, verbose=1)

# تست روی یک نمونه جدید
test_text = ["این فیلم خیلی خوب بود و من عاشقش شدم!"]
test_sequence = tokenizer.texts_to_sequences(test_text)
test_padded = pad_sequences(test_sequence, maxlen=max_len)
prediction = classification_model.predict(test_padded)

# نتیجه
print("احساس پیش‌بینی‌شده:", "مثبت" if prediction[0] > 0.5 else "منفی")

# شبکه‌های باور عمیق (Deep Belief Networks - DBN)

### تحلیل احساسات متنی و نقش DBN‌ها

تحلیل احساسات متنی به **شناسایی احساسات** شامل موارد زیر می‌پردازد:
- **مثبت**
- **منفی**
- **خنثی**

در متن‌هایی مانند:
- نظرات کاربران
- نقدها
- پست‌های شبکه‌های اجتماعی

---

## نقش DBN‌ها در این حوزه

DBN‌ها (Deep Belief Networks) در این حوزه به روش‌های زیر استفاده می‌شوند:
- **[در این قسمت، لیستی از روش‌ها یا کاربردهای خاص که DBN‌ها در تحلیل احساسات مورد استفاده قرار می‌گیرند، آورده می‌شود.]**

---

این ابزارها کمک می‌کنند تا تحلیل احساسات دقیق‌تر و کارآمدتر انجام شود، به ویژه در پردازش داده‌های حجیم و پیچیده.

In [None]:
import numpy as np
from sklearn.feature_extraction.text import TfidfVectorizer
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout
from tensorflow.keras.optimizers import Adam

# داده‌های نمونه
texts = [
    "این فیلم واقعاً عالی بود، خیلی لذت بردم!",
    "فیلم اصلاً خوب نبود، خیلی خسته‌کننده بود.",
    "داستان فیلم فوق‌العاده بود و بازیگران عالی بودند.",
    "یکی از بدترین فیلم‌هایی که دیدم، افتضاح بود."
]
labels = [1, 0, 1, 0]  # 1: مثبت، 0: منفی

# پیش‌پردازش متن با TF-IDF
vectorizer = TfidfVectorizer(max_features=1000)
X = vectorizer.fit_transform(texts).toarray()
y = np.array(labels)

# ساخت مدل DBN-مانند (شبکه عمیق با لایه‌های Dense)
model = Sequential()
# لایه‌های مخفی مشابه RBM برای یادگیری ویژگی‌ها
model.add(Dense(512, activation='relu', input_shape=(X.shape[1],)))
model.add(Dropout(0.3))
model.add(Dense(256, activation='relu'))
model.add(Dropout(0.3))
model.add(Dense(128, activation='relu'))
model.add(Dropout(0.3))
# لایه خروجی برای طبقه‌بندی
model.add(Dense(1, activation='sigmoid'))

# کامپایل مدل
model.compile(optimizer=Adam(learning_rate=0.001), loss='binary_crossentropy', metrics=['accuracy'])

# نمایش ساختار مدل
model.summary()

# آموزش مدل
model.fit(X, y, epochs=10, batch_size=2, verbose=1)

# تست روی یک نمونه جدید
test_text = ["این فیلم خیلی خوب بود و من عاشقش شدم!"]
test_X = vectorizer.transform(test_text).toarray()
prediction = model.predict(test_X)

# نتیجه
print("احساس پیش‌بینی‌شده:", "مثبت" if prediction[0] > 0.5 else "منفی")

### جمع‌بندی

در این قسمت، با تمام الگوریتم‌هایی که از بخش **یادگیری عمیق ** برای تحلیل احساسات متنی استفاده می‌شوند، آشنا شدیم.