<a href="https://colab.research.google.com/github/parvvaresh/NLP/blob/main/svd_topic_modeling.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<div dir="rtl">
  <h1>تجزیه مقدار تکین (SVD) در داده‌کاوی متن</h1>
  <p>تجزیه مقدار تکین (SVD) یک تکنیک ریاضی است که در جبر خطی برای فاکتورگیری یک ماتریس به سه مؤلفه استفاده می‌شود. این تکنیک به یکی از ارکان بسیاری از کاربردها در <strong>داده‌کاوی متن</strong>، <strong>تحلیل اسناد</strong> و <strong>پردازش زبان طبیعی (NLP)</strong> تبدیل شده است؛ چرا که توانایی استخراج ساختارهای پنهان، کاهش ابعاد و نمایان کردن الگوهای معنادار در داده‌های متنی را دارد.</p>

  <h2>ماتریس سند-واژه (DTM)</h2>
  <p>نقطه شروع بسیاری از تکنیک‌های تحلیل متن، <strong>ماتریس سند-واژه (DTM)</strong> است. این ماتریس مجموعه‌ای از اسناد و واژه‌های مربوط به آن‌ها را نمایش می‌دهد. ساختار آن به شرح زیر است:</p>
  <ul>
    <li><strong>ردیف‌ها</strong>: نمایانگر اسناد فردی در مجموعه داده‌ها.</li>
    <li><strong>ستون‌ها</strong>: نمایانگر واژه‌های منحصر به فردی هستند که در اسناد ظاهر می‌شوند.</li>
    <li><strong>مقادیر (D<sub>ij</sub>)</strong>: نشان‌دهنده فراوانی واژه j در سند i هستند. به‌طور جایگزین، مقادیر می‌توانند وزن‌های دیگری مانند <strong>امتیازهای TF-IDF</strong> را در بر بگیرند.</li>
  </ul>

  <h3>مثال از یک ماتریس سند-واژه</h3>
  <p>در نظر بگیرید یک مجموعه کوچک از اسناد:</p>
  <table border="1">
    <thead>
      <tr>
        <th>سند/واژه</th>
        <th>سیب</th>
        <th>موز</th>
        <th>میوه</th>
        <th>برنامه‌نویسی</th>
        <th>پایتون</th>
      </tr>
    </thead>
    <tbody>
      <tr>
        <td><strong>سند 1</strong></td>
        <td>1</td>
        <td>2</td>
        <td>1</td>
        <td>0</td>
        <td>0</td>
      </tr>
      <tr>
        <td><strong>سند 2</strong></td>
        <td>0</td>
        <td>0</td>
        <td>0</td>
        <td>1</td>
        <td>1</td>
      </tr>
      <tr>
        <td><strong>سند 3</strong></td>
        <td>0</td>
        <td>0</td>
        <td>0</td>
        <td>0</td>
        <td>0</td>
      </tr>
    </tbody>
  </table>

  <p>در این مثال:</p>
  <ul>
    <li><strong>سند 1</strong> شامل واژه‌های "سیب"، "موز" و "میوه" است.</li>
    <li><strong>سند 2</strong> مرتبط با برنامه‌نویسی و شامل واژه‌های "برنامه‌نویسی" و "پایتون" است.</li>
    <li><strong>سند 3</strong> یک سند خالی است که هیچ واژه‌ای ندارد.</li>
  </ul>

  <h2>TF-IDF: بهبود ماتریس سند-واژه</h2>
  <p>قبل از استفاده از <strong>SVD</strong>، می‌توان ماتریس <strong>سند-واژه</strong> را با استفاده از <strong>TF-IDF</strong> وزن‌دهی کرد تا اهمیت واژه‌ها در هر سند نسبت به کل مجموعه اسناد منعطف شود. این تبدیل کمک می‌کند تا تسلط واژه‌های رایج ولی کم‌اطلاع (مثلاً "و"، "یا") کاهش یابد و در عین حال واژه‌هایی که از اهمیت بیشتری در اسناد فردی برخوردارند برجسته شوند.</p>

  <h3>محاسبه TF-IDF</h3>
  <p>امتیاز TF-IDF یک واژه t در سند d به‌صورت زیر محاسبه می‌شود:</p>
  <pre>
    TF-IDF(t, d) = TF(t, d) × log(N / (1 + DF(t)))
  </pre>
  <p><strong>TF</strong> (فراوانی واژه) نشان‌دهنده تعداد دفعاتی است که t در d ظاهر می‌شود. <strong>IDF</strong> (فراوانی معکوس سند) نشان‌دهنده میزان منحصر به فرد بودن t در کل اسناد است.</p>

  <h3>مثال از TF-IDF</h3>
  <p>برای یک مجموعه اسناد کوچک:</p>
  <ul>
    <li><strong>سند 1</strong>: "سیب موز سیب میوه"</li>
    <li><strong>سند 2</strong>: "میوه موز میوه پایتون برنامه‌نویسی"</li>
    <li><strong>سند 3</strong>: "پایتون برنامه‌نویسی پایتون"</li>
  </ul>

  <p>ماتریس <strong>TF-IDF</strong> به شکل زیر خواهد بود:</p>
  <pre>
    TF-IDF =
    [2.20  0.18  0.18  0   0]
    [0    0.18  0.36  0.18  0.18]
    [0    0    0    0.36  0.18]
  </pre>

  <h2>چرا TF-IDF بهتر است؟</h2>
  <p><strong>TF-IDF</strong> به دلیل ویژگی‌های خاص خود، به عنوان یک روش موثر در تحلیل متن شناخته می‌شود:</p>
  <ul>
    <li><strong>جلوگیری از تاثیر واژه‌های رایج:</strong> TF-IDF به کاهش تاثیر واژه‌های عمومی که در تمام اسناد ظاهر می‌شوند کمک می‌کند.</li>
    <li><strong>برجسته‌سازی واژه‌های منحصر به فرد:</strong> این روش واژه‌های منحصر به فرد که در تعداد کمی از اسناد ظاهر می‌شوند را برجسته می‌کند و آن‌ها را با وزن بالاتری معرفی می‌کند.</li>
    <li><strong>وزن‌دهی پویا:</strong> TF-IDF به واژه‌ها وزن‌های پویا و متفاوت می‌دهد که به تحلیلگر امکان تمرکز بر واژه‌های با اهمیت را می‌دهد.</li>
    <li><strong>افزایش دقت در مدل‌های یادگیری ماشین:</strong> TF-IDF به مدل‌های یادگیری ماشین کمک می‌کند تا ویژگی‌های دقیق‌تری برای پیش‌بینی‌ها استخراج کنند.</li>
  </ul>

  <h3>مثال چالشی از TF-IDF</h3>
  <p>فرض کنید دو سند داریم:</p>
  <ul>
    <li><strong>سند 1:</strong> " یادگیری ماشین  یک تکنیک قدرتمند است که در تجزیه و تحلیل داده‌ها کاربرد دارد."</li>
    <li><strong>سند 2:</strong> "پردازش زبان طبیعی به تحلیل و درک زبان انسان توسط ماشین‌ها می‌پردازد."</li>
  </ul>
  <p>در این مثال، TF-IDF به این گونه عمل می‌کند که واژه " یادگیری ماشین" در سند 1 وزن بیشتری می‌گیرد چون در این سند بیشتر تکرار شده و در اسناد دیگر کمتر به کار رفته است. همچنین، واژه "پردازش زبان طبیعی" در سند 2 از نظر TF-IDF اهمیت بیشتری خواهد داشت زیرا در مجموعه اسناد نادرتر است.</p>

  <h2>تجزیه مقدار تکین (SVD)</h2>
  <p>SVD ماتریس سند-واژه D را به سه ماتریس تقسیم می‌کند:</p>
  <pre>
    D = U S V^T
  </pre>

  <p>که در آن:</p>
  <ul>
    <li><strong>U</strong> (ماتریس بردارهای تکین چپ): نمایانگر اسناد در فضای موضوعات پنهان است.</li>
    <li><strong>S</strong> (ماتریس مقادیر تکین): شامل مقادیر تکین است که اهمیت موضوعات را نشان می‌دهد.</li>
    <li><strong>V^T</strong> (ماتریس بردارهای تکین راست): نمایانگر واژه‌ها در فضای موضوعات پنهان است.</li>
  </ul>

  <h2>کاهش ابعاد با استفاده از SVD</h2>
  <p>یکی از مزایای اصلی SVD <strong>کاهش ابعاد</strong> است. با نگه‌داشتن تنها k مقدار تکین بزرگتر، می‌توان یک تقریب با رتبه پایین از ماتریس اولیه ایجاد کرد.</p>

  <h2>کاربردهای SVD در داده‌کاوی متن</h2>
  <ul>
    <li><strong>تحلیل معنایی پنهان (LSA)</strong>: از SVD برای کشف موضوعات یا مفاهیم پنهان استفاده می‌شود.</li>
    <li><strong>مدلسازی موضوعات</strong>: سطرهای V^T نمایانگر مشارکت واژه‌ها در موضوعات هستند.</li>
    <li><strong>خوشه‌بندی و طبقه‌بندی اسناد</strong>: SVD به طبقه‌بندی اسناد کمک می‌کند.</li>
    <li><strong>بازیابی اطلاعات</strong>: SVD عملکرد موتور جستجو را بهبود می‌بخشد.</li>
    <li><strong>کاهش نویز و فشرده‌سازی داده‌ها</strong>: SVD نویز را حذف کرده و منابع محاسباتی را صرفه‌جویی می‌کند.</li>
  </ul>

  <h2>خلاصه</h2>
  <p><strong>SVD</strong> یک ماتریس سند-واژه را به سه مؤلفه تقسیم می‌کند: U، S و V^T. این فرایند به کشف الگوهای پنهان در داده‌ها و بهبود کارایی محاسباتی کمک می‌کند.</p>
</div>


---
---
---


<!DOCTYPE html>
<html lang="fa">
<head>
  <meta charset="UTF-8">
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
  <title></title>
  <style>
      .important {
          color: red;
          font-weight: bold;
      }
  </style>
</head>
<div dir=rtl>
<body>
  <h1>1. ماتریس <span class="important">TF-IDF</span> (ماتریس فراوانی ترم-معکوس فراوانی سند)</h1>
  <p>این ماتریس نشان‌دهنده اهمیت هر کلمه در اسناد مختلف است که بر اساس مفهوم <span class="important">TF-IDF</span> محاسبه شده است.</p>
  
  <h2>اسناد:</h2>
  <pre>
  1. I love programming in Python
  2. Machine learning is amazing
  3. Python is great for data science
  4. Deep learning is a part of machine learning
  5. I enjoy learning about AI and deep learning
  6. Data science involves programming and machine learning
  </pre>

  <h2>ماتریس <span class="important">TF-IDF</span>:</h2>
  <table border="1">
      <tr>
          <th>سند \ کلمه</th>
          <th>ai</th>
          <th>amazing</th>
          <th>and</th>
          <th>data</th>
          <th>deep</th>
          <th>enjoy</th>
          <th>great</th>
          <th>is</th>
          <th>learning</th>
          <th>machine</th>
          <th>part</th>
          <th>programming</th>
          <th>python</th>
          <th>science</th>
      </tr>
      <tr>
          <td>سند 1</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
          <td>1</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
          <td>1</td>
          <td>1</td>
          <td>0</td>
      </tr>
      <tr>
          <td>سند 2</td>
          <td>0</td>
          <td>1</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
          <td>1</td>
          <td>1</td>
          <td>1</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
      </tr>
      <tr>
          <td>سند 3</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
          <td>1</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
          <td>1</td>
          <td>1</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
          <td>1</td>
          <td>1</td>
      </tr>
      <tr>
          <td>سند 4</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
          <td>1</td>
          <td>0</td>
          <td>0</td>
          <td>1</td>
          <td>1</td>
          <td>1</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
      </tr>
      <tr>
          <td>سند 5</td>
          <td>1</td>
          <td>0</td>
          <td>1</td>
          <td>0</td>
          <td>1</td>
          <td>1</td>
          <td>0</td>
          <td>1</td>
          <td>1</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
      </tr>
      <tr>
          <td>سند 6</td>
          <td>0</td>
          <td>0</td>
          <td>1</td>
          <td>1</td>
          <td>0</td>
          <td>0</td>
          <td>0</td>
          <td>1</td>
          <td>1</td>
          <td>1</td>
          <td>0</td>
          <td>1</td>
          <td>0</td>
          <td>1</td>
      </tr>
  </table>

  <h1>2. انجام <span class="important">SVD</span> (تجزیه مقدار منفرد)</h1>
  <p>ما برای انجام <span class="important">SVD</span> از روش‌های ریاضی استفاده می‌کنیم تا ماتریس <span class="important">A</span> را به سه ماتریس <span class="important">U</span>، <span class="important">Σ</span> و <span class="important">V<sup>T</sup></span> تجزیه کنیم.</p>

  <h2>ماتریس <span class="important">A = U Σ V<sup>T</sup></span></h2>
  <p>
      <strong>ماتریس U:</strong> ویژگی‌های اسناد در فضای کاهش‌یافته.<br>
      <strong>ماتریس Σ:</strong> مقادیر منفرد که اهمیت هر بعد را نشان می‌دهند.<br>
      <strong>ماتریس V<sup>T</sup>:</strong> ویژگی‌های کلمات در فضای کاهش‌یافته.
  </p>

  <h2>3. ماتریس <span class="important">U</span> (ویژگی‌های اسناد)</h2>
  <table border="1">
      <tr>
          <th>سند \ موضوع</th>
          <th>موضوع 1</th>
          <th>موضوع 2</th>
          <th>موضوع 3</th>
          <th>موضوع 4</th>
      </tr>
      <tr>
          <td>سند 1</td>
          <td>0.8</td>
          <td>0.3</td>
          <td>0.2</td>
          <td>0.1</td>
      </tr>
      <tr>
          <td>سند 2</td>
          <td>0.7</td>
          <td>0.6</td>
          <td>0.1</td>
          <td>0.2</td>
      </tr>
      <tr>
          <td>سند 3</td>
          <td>0.9</td>
          <td>0.2</td>
          <td>0.3</td>
          <td>0.1</td>
      </tr>
      <tr>
          <td>سند 4</td>
          <td>0.4</td>
          <td>0.9</td>
          <td>0.1</td>
          <td>0.2</td>
      </tr>
      <tr>
          <td>سند 5</td>
          <td>0.6</td>
          <td>0.5</td>
          <td>0.2</td>
          <td>0.4</td>
      </tr>
      <tr>
          <td>سند 6</td>
          <td>0.5</td>
          <td>0.7</td>
          <td>0.4</td>
          <td>0.3</td>
      </tr>
  </table>

  <h2>4. ماتریس <span class="important">Σ</span> (مقادیر منفرد)</h2>
  <table border="1">
      <tr>
          <th>مقادیر منفرد</th>
      </tr>
      <tr>
          <td>3.5</td>
      </tr>
      <tr>
          <td>2.2</td>
      </tr>
      <tr>
          <td>1.0</td>
      </tr>
      <tr>
          <td>0.5</td>
      </tr>
  </table>

  <h2>5. ماتریس <span class="important">V<sup>T</sup></span> (ویژگی‌های کلمات)</h2>
  <table border="1">
      <tr>
          <th>کلمه</th>
          <th>موضوع 1</th>
          <th>موضوع 2</th>
          <th>موضوع 3</th>
          <th>موضوع 4</th>
      </tr>
      <tr>
          <td>ai</td>
          <td>0.3</td>
          <td>0.7</td>
          <td>0.1</td>
          <td>0.2</td>
      </tr>
      <tr>
          <td>amazing</td>
          <td>0.6</td>
          <td>0.4</td>
          <td>0.2</td>
          <td>0.1</td>
      </tr>
      <tr>
          <td>data</td>
          <td>0.8</td>
          <td>0.2</td>
          <td>0.5</td>
          <td>0.3</td>
      </tr>
      <tr>
          <td>deep</td>
          <td>0.9</td>
          <td>0.3</td>
          <td>0.2</td>
          <td>0.1</td>
      </tr>
      <tr>
          <td>learning</td>
          <td>0.7</td>
          <td>0.6</td>
          <td>0.1</td>
          <td>0.4</td>
      </tr>
      <tr>
          <td>python</td>
          <td>0.5</td>
          <td>0.8</td>
          <td>0.4</td>
          <td>0.3</td>
      </tr>
  </table>

  <h1>6. استخراج ۲ تاپیک با ۳ کلمه از ماتریس <span class="important">V<sup>T</sup></span></h1>
  <p>با در نظر گرفتن k=2، ۲ تاپیک از کلمات استخراج می‌شود که بیشترین تأثیر را در هر موضوع دارند:</p>
  
  <ul>
      <li><strong>تاپیک 1:</strong> <span class="important">ai</span>, <span class="important">data</span>, <span class="important">learning</span></li>
      <li><strong>تاپیک 2:</strong> <span class="important">deep</span>, <span class="important">python</span>, <span class="important">amazing</span></li>
  </ul>
</body>
</div>
</html>


In [11]:
documents = [
    "I love programming in Python",
    "Machine learning is amazing",
    "Python is great for data science",
    "Deep learning is a part of machine learning",
    "I enjoy learning about AI and deep learning",
    "Data science involves programming and machine learning",
    "Artificial intelligence is revolutionizing the tech industry",
    "Deep learning models require large amounts of data",
    "I am learning Python programming to build web apps",
    "AI and machine learning are transforming businesses",
    "Python is the best language for data analysis",
    "Machine learning and deep learning are closely related fields",
    "Data scientists use Python for machine learning projects",
    "Python's libraries like Pandas and NumPy are useful for data analysis",
    "I enjoy solving problems using Python and machine learning",
    "Data visualization is an important part of data science",
    "AI and deep learning algorithms are making advancements",
    "Machine learning models are used for predictive analysis",
    "The future of AI and machine learning is promising",
    "Learning about deep learning models is very interesting",
    "Natural language processing is a subset of AI",
    "Python supports many libraries for machine learning and AI",
    "Deep learning requires a lot of computational power",
    "Machine learning algorithms learn from data to make predictions",
    "Deep learning can be used for image recognition tasks",
    "I am building a machine learning model with Python",
    "Data analysis and machine learning go hand in hand",
    "The field of data science is rapidly evolving",
    "AI is becoming more prevalent in various industries",
    "Deep learning is a subset of machine learning",
    "I am taking a course in AI and machine learning",
    "Machine learning is being applied to finance for risk analysis",
    "Artificial intelligence can be used to improve customer service",
    "Machine learning can help in detecting fraud in transactions",
    "Deep learning helps in image classification tasks",
    "Machine learning models can be trained on large datasets",
    "The application of AI in healthcare is rapidly growing",
    "Python is a versatile language used for machine learning",
    "I am working on a project using deep learning techniques",
    "AI algorithms can be used to analyze customer behavior",
    "Machine learning can be used to optimize supply chains",
    "I enjoy building deep learning models for NLP tasks",
    "Deep learning has improved the performance of speech recognition systems",
    "AI and machine learning are key components of the fourth industrial revolution",
    "Natural language processing is helping machines understand human language",
    "I am developing a machine learning model to predict stock prices",
    "AI and machine learning are changing the landscape of technology",
    "Machine learning can be applied to autonomous vehicles",
    "I am learning how to use TensorFlow for deep learning",
    "Deep learning models are used in self-driving cars",
    "AI is being integrated into more products and services",
    "Machine learning is used in recommendation systems like Netflix",
    "I am working with Keras to build deep learning models",
    "AI is helping businesses make better decisions through data analysis",
    "Python is a great tool for building machine learning models",
    "Deep learning requires large datasets to perform well",
    "I am creating a recommendation system using machine learning",
    "Machine learning is improving the accuracy of search engines",
    "Data scientists are using machine learning for pattern recognition",
    "AI is creating new opportunities in the tech industry",
    "Machine learning can be used to predict future trends",
    "I am studying the ethical implications of AI and machine learning",
    "AI and deep learning are driving innovation in robotics",
    "Machine learning models can improve the efficiency of manufacturing",
    "I am learning how to tune machine learning models for better performance",
    "Deep learning is used in facial recognition technologies",
    "AI is used to enhance customer experiences in retail",
    "I am developing an AI-powered chatbot for customer support",
    "Machine learning is being applied in healthcare for diagnostic purposes",
    "Deep learning can be applied to video analysis tasks",
    "I am learning about reinforcement learning in AI",
    "AI is revolutionizing industries such as finance, healthcare, and retail",
    "Machine learning is being used in climate modeling",
    "Python and machine learning are a powerful combination for data analysis",
    "Deep learning has made great strides in natural language understanding",
    "AI can help solve complex problems in various fields",
    "I am exploring unsupervised learning techniques in machine learning",
    "AI is playing a key role in the future of transportation",
    "Machine learning can be used to detect anomalies in data",
    "I am working with large datasets for a deep learning project",
    "Deep learning is being applied in the field of medical imaging",
    "AI is helping companies streamline their operations",
    "Machine learning algorithms are being applied to predictive maintenance",
    "I am learning how to use scikit-learn for machine learning models",
    "AI is improving cybersecurity by detecting threats more accurately",
    "Deep learning has achieved state-of-the-art results in many tasks",
    "Machine learning is becoming a key technology in business analytics",
    "I am studying the different types of machine learning algorithms",
    "AI can be used to optimize marketing strategies",
    "Machine learning is enhancing personalized recommendations on websites",
    "Deep learning is pushing the boundaries of artificial intelligence",
    "I am learning how to build machine learning pipelines",
    "AI is automating many tasks that were previously manual",
    "Machine learning can be applied to health data for personalized treatment",
    "Deep learning is enabling advancements in robotics and automation",
    "AI is being used to predict consumer trends and behavior",
    "Machine learning models are becoming more accurate with large datasets",
    "I am using machine learning to analyze social media data",
    "Deep learning has improved the accuracy of speech-to-text systems",
    "AI is changing the way businesses approach data analysis",
    "Machine learning is being used in autonomous drones and robots",
    "I am developing a machine learning model to classify images",
    "Machine learning algorithms are used for predictive modeling in business",
    "AI is being integrated into smart devices and home automation",
    "I am studying the applications of machine learning in finance",
    "Deep learning is enabling advancements in artificial intelligence",
    "Machine learning is making significant impacts in the tech industry",
    "I am learning about transfer learning in deep learning models",
    "AI is improving the efficiency of supply chain management",
    "Machine learning is enabling better fraud detection in finance",
    "Deep learning is being used for video game development",
    "AI is enhancing the capabilities of virtual assistants",
    "Machine learning is improving the accuracy of weather forecasting",
    "I am studying the use of machine learning in healthcare",
    "AI is transforming the world of artificial intelligence research",
    "Machine learning models are being applied to cybersecurity",
    "I am learning about the applications of deep learning in AI",
    "AI and machine learning are leading to new technological breakthroughs"
]


In [13]:
import numpy as np
from collections import Counter
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.decomposition import TruncatedSVD

class TopicModelingSVD:
    def __init__(self, documents: list, num_topics: int) -> None:
        self.documents = documents
        self.num_topics = num_topics
        self.vectorizer = TfidfVectorizer(stop_words='english')
        self.dtm = self.vectorizer.fit_transform(documents)
        self.words = self.vectorizer.get_feature_names_out()
        self.svd = TruncatedSVD(n_components=num_topics)
        self.svd_matrix = self.svd.fit_transform(self.dtm)
        self.term_topic_matrix = self.svd.components_

    def fit(self, n_words=5) -> list:
        self.topics = []
        for topic in self.term_topic_matrix:
            top_word_in_topic = topic.argsort()[: -n_words - 1 : -1]
            topic = " ".join([self.words[index] for index in top_word_in_topic])
            self.topics.append(topic)

    def get_topics(self):
        return self.topics




topic_model = TopicModelingSVD(documents, num_topics=10)
topic_model.fit()

print("Extracted Topics:")
for i, topic in enumerate(topic_model.get_topics()):
    print(f"Topic {i+1}: {topic}")


Extracted Topics:
Topic 1: learning machine deep models ai
Topic 2: deep learning tasks models large
Topic 3: ai used customer algorithms future
Topic 4: machine applied models predictive studying
Topic 5: used predictive recognition modeling customer
Topic 6: large models datasets ai accurate
Topic 7: intelligence artificial applied data models
Topic 8: intelligence artificial python model tech
Topic 9: data using science recognition systems
Topic 10: language natural processing subset studying
