In [11]:
import re
import nltk
import os, glob
import pandas as pd

import chardet

import urduhack
urduhack.download()
from urduhack.normalization import normalize
from urduhack import preprocessing as ppro

import json
from urduhack.config import LEMMA_LOOKUP_TABLE_PATH

In [12]:
# Remove stop words from text
from typing import FrozenSet

# Urdu Language Stop words list
STOP_WORDS: FrozenSet[str] = frozenset("""
 آ آئی آئیں آئے آتا آتی آتے آس آمدید آنا آنسہ آنی آنے آپ آگے آہ آہا آیا اب ابھی ابے
 ارے اس اسکا اسکی اسکے اسی اسے اف افوہ البتہ الف ان اندر انکا انکی انکے انہوں انہی انہیں اوئے اور اوپر
 اوہو اپ اپنا اپنوں اپنی اپنے اپنےآپ اکثر اگر اگرچہ اہاہا ایسا ایسی ایسے ایک بائیں بار بارے بالکل باوجود باہر
 بج بجے بخیر بشرطیکہ بعد بعض بغیر بلکہ بن بنا بناؤ بند بڑی بھر بھریں بھی بہت بہتر تاکہ تاہم تب تجھ
 تجھی تجھے ترا تری تلک تم تمام تمہارا تمہاروں تمہاری تمہارے تمہیں تو تک تھا تھی تھیں تھے تیرا تیری تیرے
 جا جاؤ جائیں جائے جاتا جاتی جاتے جانی جانے جب جبکہ جدھر جس جسے جن جناب جنہوں جنہیں جو جہاں جی جیسا
 جیسوں جیسی جیسے حالانکہ حالاں حصہ حضرت خاطر خالی خواہ خوب خود دائیں درمیان دریں دو دوران دوسرا دوسروں دوسری دوں
 دکھائیں دی دیئے دیا دیتا دیتی دیتے دیر دینا دینی دینے دیکھو دیں دیے دے ذریعے رکھا رکھتا رکھتی رکھتے رکھنا رکھنی
 رکھنے رکھو رکھی رکھے رہ رہا رہتا رہتی رہتے رہنا رہنی رہنے رہو رہی رہیں رہے ساتھ سامنے ساڑھے سب سبھی
 سراسر سمیت سوا سوائے سکا سکتا سکتے سہ سہی سی سے شاید شکریہ صاحب صاحبہ صرف ضرور طرح طرف طور علاوہ عین
 فقط فلاں فی قبل قطا لئے لائی لائے لاتا لاتی لاتے لانا لانی لانے لایا لو لوجی لوگوں لگ لگا لگتا
 لگتی لگی لگیں لگے لہذا لی لیا لیتا لیتی لیتے لیکن لیں لیے لے ماسوا مت مجھ مجھی مجھے محترم محترمہ محض
 مرا مرحبا مری مرے مزید مس مسز مسٹر مطابق مل مکرمی مگر مگھر مہربانی میرا میروں میری میرے میں نا نزدیک
 نما نہ نہیں نیز نیچے نے و وار واسطے واقعی والا والوں والی والے واہ وجہ ورنہ وغیرہ ولے وگرنہ وہ وہاں
 وہی وہیں ویسا ویسے ویں پاس پایا پر پس پلیز پون پونی پونے پھر پہ پہلا پہلی پہلے پیر پیچھے چاہئے
 چاہتے چاہیئے چاہے چلا چلو چلیں چلے چناچہ چند چونکہ چکی چکیں چکے ڈالنا ڈالنی ڈالنے ڈالے کئے کا کاش کب کبھی
 کدھر کر کرتا کرتی کرتے کرم کرنا کرنے کرو کریں کرے کس کسی کسے کم کن کنہیں کو کوئی کون کونسا
 کونسے کچھ کہ کہا کہاں کہہ کہی کہیں کہے کی کیا کیسا کیسے کیونکر کیونکہ کیوں کیے کے گئی گئے گا گنا
 گو گویا گی گیا ہائیں ہائے ہاں ہر ہرچند ہرگز ہم ہمارا ہماری ہمارے ہمی ہمیں ہو ہوئی ہوئیں ہوئے ہوا
 ہوبہو ہوتا ہوتی ہوتیں ہوتے ہونا ہونگے ہونی ہونے ہوں ہی ہیلو ہیں ہے یا یات یعنی یک یہ یہاں یہی یہیں
""".split())


def remove_stopwords(text: str):
    return " ".join(word for word in text.split() if word not in STOP_WORDS)

_WORD2LEMMA = None

def lemma_lookup(text, lookup_path: str = LEMMA_LOOKUP_TABLE_PATH) -> list:
    global _WORD2LEMMA
    if _WORD2LEMMA is None:
        with open(lookup_path, "r", encoding="utf-8") as file:
            _WORD2LEMMA = json.load(file)
            
    tokens = nltk.WordPunctTokenizer().tokenize(text)
    
    return [_WORD2LEMMA[word] if word in _WORD2LEMMA else word for word in tokens]

def preprocessing(text):
    text = normalize(text)
    text = ppro.normalize_whitespace(text)
    text = ppro.remove_punctuation(text)
    text = ppro.remove_accents(text)
    text = ppro.replace_urls(text)
    text = ppro.replace_emails(text)
    text = ppro.replace_phone_numbers(text)
    text = ppro.replace_numbers(text)
    text = ppro.replace_currency_symbols(text)
    text = ppro.remove_english_alphabets(text)    
    text = re.sub(r'\<a href', ' ', text)
    text = re.sub(r'&amp;', '', text) 
    text = re.sub(r'<br />', ' ', text)
    text = remove_stopwords(text)
    text = lemma_lookup(text)

    return text

In [51]:
# create an empty DataFrame with columns
data = pd.DataFrame(columns=["Data"])

In [52]:
data_path = "./urdu"

for file_path in glob.glob(os.path.join(data_path, '*.txt')):
    with open(file_path, 'rb') as f:
        text = f.read()
        encoding = chardet.detect(text)['encoding']
        text = text.decode(encoding, errors='replace')
        data = data.append({"Data": preprocessing(text)}, ignore_index=True)        

  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data

  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data

  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data

  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data

  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data

  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data

  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data

  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data

  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data

  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data

  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data

  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data

  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data

  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data

  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data

  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data = data.append({"Data": preprocessing(text)}, ignore_index=True)
  data

In [22]:

# all_tokens = []
# error_list = []

# for filename in os.listdir(data_path):
#     file_path = os.path.join(data_path, filename)
#     with open(file_path, 'rb') as f:
#         content = f.read()
#         result = chardet.detect(content)
#         encoding = result['encoding']
        
#     try:
#         with open(file_path, 'r', encoding=encoding) as f:
#             text = f.readlines()
#             all_tokens.extend(text)
#     except Exception as e:
#         error_list.append(filename)

# # len(error_list)
# print(all_tokens)

In [14]:
# pre_tokens = []
# for x in all_tokens:
#     if x!="\n":
#         pre_tokens.append(preprocessing(x))

In [23]:
# pre_tokens = [preprocessing(x) for x in all_tokens if x != "\n"]

In [24]:
# pre_tokens

In [87]:
from sklearn.feature_extraction import text
from sklearn.cluster import KMeans

In [57]:
import numpy as np

In [103]:
data.values[0]

array([list(['پرتھ', 'مشہور', 'واکا', 'گراؤنڈ', 'پاکستان', 'کرکٹ', 'ٹیم', 'راس', 'آیاٹی', 'ٹوئنٹی', 'ورلڈ', 'کپ', 'سلسلہ', 'پرتھ', 'روزانہ', 'نئے', 'پرتھ', 'سٹیڈیم', 'پرانا', 'واکا', 'گراؤنڈ', 'گزرنا', 'بات', 'ذہن', 'مشہورگراؤنڈ', 'پاکستانی', 'کرکٹ', 'ٹیم', 'ہمیشہ', 'دکھنا', 'دوسرا', 'لفظ', 'گراؤنڈ', 'پاکستانی', 'ٹیم', 'راس'])],
      dtype=object)

In [88]:
bow_transform = text.CountVectorizer(tokenizer=lambda doc: doc, lowercase=False) 
tfidf_transform = text.TfidfTransformer()
        
bow = bow_transform.fit_transform(data) 

tfidf = tfidf_transform.fit_transform(bow)

In [101]:
# Apply k-means clustering algorithm
kmeans = KMeans(n_clusters=10)
kmeans.fit(tf_idf)

ValueError: n_samples=1 should be >= n_clusters=10.

In [None]:
# Print out the top 10 words per cluster
order_centroids = kmeans.cluster_centers_.argsort()[:, ::-1]
terms = vectorizer.get_feature_names()
for i in range(num_clusters):
    print("Cluster %d:" % i)
    for ind in order_centroids[i, :10]:
        print(' %s' % terms[ind])