In [1]:
import networkx as nx
from pyvis.network import Network
import pandas as pd
import sqlite3
from farsnet import *

# class FarsGraph: 
#     def __init__(self):
#         df = pd.read_csv('farsnet/synset_relation.csv', delimiter=',')
#         self.G = nx.from_pandas_edgelist(df, source='synsetWords1', target='synsetWords2', edge_attr='type',
#                                          create_using=nx.MultiDiGraph())
class FarsGraph:
    def __init__(self):
        df = pd.read_csv('farsnet/synset_relation.csv', delimiter=',')
        df['synsetWords1'] = df['synsetWords1'].astype(str)
        df['synsetWords2'] = df['synsetWords2'].astype(str)
        self.G = nx.from_pandas_edgelist(df, source='synsetWords1', target='synsetWords2', edge_attr='type',
                                         create_using=nx.MultiDiGraph())

    def visualize(self):
        net = Network(notebook=True, width=1124, height=700)
        net.from_nx(self.G)
        net.show_buttons(filter_=['physics'])
        net.show('farsnet.html')

    def find_pred(self, node):
        return self.G.predecessors(',' + node)

    def find_relations(self, src, des):
        return self.G.get_edge_data(src, des)

    @staticmethod
    def denormalize(token):
        """ Unfortunately, some of FarsNet entries are not normalized so the input should be denormalized to have
        a better chance of string matching! """
        return token.replace("ی", "ي")

    @classmethod
    def get_synsets_by_word(cls, searchKeyword, style):
        searchKeyword = cls.denormalize(searchKeyword)
        if style == "LIKE":
            searchKeyword = "%" + searchKeyword + "%"
        elif style == 'START':
            searchKeyword = "" + searchKeyword + "%"
            style = "LIKE"
        elif style == 'END':
            searchKeyword = "%" + searchKeyword + ""
            style = "LIKE"
        else:
            style = '='
        
        conn = sqlite3.connect('farsnet3.0.db3')  # Replace with your actual database
        cursor = conn.cursor()
        
        query = f"""
            SELECT id, pos, semanticCategory, example, gloss, nofather, noMapping FROM synset
            WHERE synset.id IN (
                SELECT synset.id as synset_id
                FROM word
                INNER JOIN sense ON sense.word = word.id
                INNER JOIN synset ON sense.synset = synset.id
                LEFT OUTER JOIN value ON value.word = word.id
                WHERE word.search_value {style} '{searchKeyword}'
                OR value.search_value {style} '{searchKeyword}'
            )
            OR synset.id IN (
                SELECT sense.synset AS synset_id
                FROM sense
                INNER JOIN sense_relation ON sense.id = sense_relation.sense
                INNER JOIN sense AS sense_2 ON sense_2.id = sense_relation.sense2
                INNER JOIN word ON sense_2.word = word.id
                WHERE sense_relation.type = 'Refer-to'
                AND word.search_value {style} '{searchKeyword}'
            )
            OR synset.id IN (
                SELECT sense_2.synset AS synset_id
                FROM sense
                INNER JOIN sense_relation ON sense.id = sense_relation.sense
                INNER JOIN sense AS sense_2 ON sense_2.id = sense_relation.sense2
                INNER JOIN word ON sense.word = word.id
                WHERE sense_relation.type = 'Refer-to'
                AND word.search_value {style} '{searchKeyword}'
            )
        """
        
        cursor.execute(query)
        results = cursor.fetchall()
        conn.close()
        return results

    @staticmethod
    def get_synset_relation_by_id(synset_id):
        conn = sqlite3.connect('farsnet3.0.db3')  # Replace with your actual database
        query = f"""
            SELECT id, type, synsetWords1, synsetWords2, synset, synset2, reverse_type 
            FROM synset_relation 
            WHERE synset={synset_id} OR
            synset2={synset_id}
        """
        df = pd.read_sql_query(query, conn)
        conn.close()
        return df

    @staticmethod
    def get_all_synsets():
        conn = sqlite3.connect('farsnet3.0.db3')  # Replace with your actual database
        query = "SELECT id, pos, semanticCategory, example, gloss, nofather, noMapping FROM synset"
        df = pd.read_sql_query(query, conn)
        conn.close()
        return df

# # instantiate jupyter notebook to visualize the graph

            
# # Instantiate the class
# fars_graph = FarsGraph()

# # Visualize the graph
# fars_graph.visualize()

# # Find predecessors of a node
# predecessors = list(fars_graph.find_pred('some_node'))
# print(predecessors)

# # Find relations between two nodes
# relations = fars_graph.find_relations('node1', 'node2')
# print(relations)

# # Get synsets by word
# synsets = FarsGraph.get_synsets_by_word('word', 'LIKE')
# print(synsets)

# # Get synset relation by ID
# synset_relations = FarsGraph.get_synset_relation_by_id(12345)
# print(synset_relations)

# # Get all synsets
# all_synsets = FarsGraph.get_all_synsets()
# print(all_synsets)


In [60]:
import networkx as nx
from pyvis.network import Network
import pandas as pd
import sqlite3
from farsnet import *
import json

# class FarsGraph: 
#     def __init__(self):
#         df = pd.read_csv('farsnet/synset_relation.csv', delimiter=',')
#         self.G = nx.from_pandas_edgelist(df, source='synsetWords1', target='synsetWords2', edge_attr='type',
#                                          create_using=nx.MultiDiGraph())
class FarsGraph:
    def __init__(self):
        df = pd.read_csv('farsnet/synset_relation.csv', delimiter=',')
        df['synsetWords1'] = df['synsetWords1'].astype(str)
        df['synsetWords2'] = df['synsetWords2'].astype(str)
        self.G = nx.from_pandas_edgelist(df, source='synsetWords1', target='synsetWords2', edge_attr='type',
                                         create_using=nx.MultiDiGraph())

    def visualize(self):
        net = Network(notebook=True, width=1124, height=700)
        net.from_nx(self.G)
        net.show_buttons(filter_=['physics'])
        net.show('farsnet.html')

    def find_pred(self, node):
        return self.G.predecessors(',' + node)

    def find_relations(self, src, des):
        return self.G.get_edge_data(src, des)

    @staticmethod
    def denormalize(token):
        """ Unfortunately, some of FarsNet entries are not normalized so the input should be denormalized to have
        a better chance of string matching! """
        return token.replace("ی", "ي")

    @classmethod
    def get_synsets_by_word(cls, searchKeyword, style):
        searchKeyword = cls.denormalize(searchKeyword)
        if style == "LIKE":
            searchKeyword = "%" + searchKeyword + "%"
        elif style == 'START':
            searchKeyword = "" + searchKeyword + "%"
            style = "LIKE"
        elif style == 'END':
            searchKeyword = "%" + searchKeyword + ""
            style = "LIKE"
        else:
            style = '='
        
        conn = sqlite3.connect('farsnet3.0.db3')  # Replace with your actual database
        cursor = conn.cursor()
        
        query = f"""
            SELECT id, pos, semanticCategory, example, gloss, nofather, noMapping FROM synset
            WHERE synset.id IN (
                SELECT synset.id as synset_id
                FROM word
                INNER JOIN sense ON sense.word = word.id
                INNER JOIN synset ON sense.synset = synset.id
                LEFT OUTER JOIN value ON value.word = word.id
                WHERE word.search_value {style} '{searchKeyword}'
                OR value.search_value {style} '{searchKeyword}'
            )
            OR synset.id IN (
                SELECT sense.synset AS synset_id
                FROM sense
                INNER JOIN sense_relation ON sense.id = sense_relation.sense
                INNER JOIN sense AS sense_2 ON sense_2.id = sense_relation.sense2
                INNER JOIN word ON sense_2.word = word.id
                WHERE sense_relation.type = 'Refer-to'
                AND word.search_value {style} '{searchKeyword}'
            )
            OR synset.id IN (
                SELECT sense_2.synset AS synset_id
                FROM sense
                INNER JOIN sense_relation ON sense.id = sense_relation.sense
                INNER JOIN sense AS sense_2 ON sense_2.id = sense_relation.sense2
                INNER JOIN word ON sense.word = word.id
                WHERE sense_relation.type = 'Refer-to'
                AND word.search_value {style} '{searchKeyword}'
            )
        """
        
        cursor.execute(query)
        results = cursor.fetchall()
        conn.close()
        return results

    @staticmethod
    def get_synset_relation_by_id(synset_id):
        conn = sqlite3.connect('farsnet3.0.db3')  # Replace with your actual database
        query = f"""
            SELECT id, type, synsetWords1, synsetWords2, synset, synset2, reverse_type 
            FROM synset_relation 
            WHERE synset={synset_id} OR
            synset2={synset_id}
        """
        df = pd.read_sql_query(query, conn)
        conn.close()
        return df

    @staticmethod
    def get_all_synsets():
        conn = sqlite3.connect('farsnet3.0.db3')  # Replace with your actual database
        query = "SELECT id, pos, semanticCategory, example, gloss, nofather, noMapping FROM synset"
        df = pd.read_sql_query(query, conn)
        conn.close()
        return df

# 1. Find All Senses of a Word with Examples and All Related Information
    @classmethod
    def get_all_senses(cls, word):
        word = cls.denormalize(word)
        conn = sqlite3.connect('farsnet3.0.db3')
        query = f"""
            SELECT sense.id, word.search_value, sense.synset, synset.pos, synset.semanticCategory, synset.example, synset.gloss
            FROM word
            JOIN sense ON word.id = sense.word
            JOIN synset ON sense.synset = synset.id
            WHERE word.search_value = '{word}'
        """
        df = pd.read_sql_query(query, conn)
        conn.close()
        return df
# 2. Identify Synsets with Multiple Senses
    @staticmethod
    def synsets_with_multiple_senses():
        conn = sqlite3.connect('farsnet3.0.db3')
        query = """
            SELECT synset, COUNT(*) as sense_count
            FROM sense
            GROUP BY synset
            HAVING sense_count > 1
        """
        df = pd.read_sql_query(query, conn)
        conn.close()
        return df
# 3. Retrieve Words with Their Most Common Sense
    # @staticmethod
    # def words_with_most_common_sense():
    #     conn = sqlite3.connect('farsnet3.0.db3')
    #     query = """
    #         SELECT word.search_value, sense.synset, COUNT(sense.synset) as frequency
    #         FROM word
    #         JOIN sense ON word.id = sense.word
    #         GROUP BY word.search_value, sense.synset
    #         ORDER BY word.search_value, frequency DESC
    #     """
    #     df = pd.read_sql_query(query, conn)
    #     conn.close()
    #     return df.groupby('word').first().reset_index()
    @staticmethod
    def words_with_most_common_sense():
        conn = sqlite3.connect('farsnet3.0.db3')
        query = """
            SELECT word.search_value as word, sense.synset, COUNT(sense.synset) as frequency
            FROM word
            JOIN sense ON word.id = sense.word
            GROUP BY word.search_value, sense.synset
            ORDER BY word.search_value, frequency DESC
        """
        df = pd.read_sql_query(query, conn)
        conn.close()
        # return df.groupby('word').first().reset_index()
        # 
        return df.groupby('word').apply(lambda x: x.nlargest(1, 'frequency')).reset_index(drop=True)

    
# 4. List Synsets and Their Corresponding Lexicon Information
    @staticmethod
    def synsets_with_lexicon_info():
        conn = sqlite3.connect('farsnet3.0.db3')
        query = """
            SELECT synset.id, synset.pos, synset.semanticCategory, synset.example, synset.gloss, word.search_value
            FROM synset
            JOIN sense ON synset.id = sense.synset
            JOIN word ON sense.word = word.id
        """
        df = pd.read_sql_query(query, conn)
        conn.close()
        return df
# 5. Extract Senses and Their Synsets for a Particular Part of Speech
    @staticmethod
    def senses_by_pos(pos):
        conn = sqlite3.connect('farsnet3.0.db3')
        query = f"""
            SELECT sense.id, sense.synset, synset.pos, word.search_value
            FROM sense
            JOIN synset ON sense.synset = synset.id
            JOIN word ON sense.word = word.id
            WHERE synset.pos = '{pos}'
        """
        df = pd.read_sql_query(query, conn)
        conn.close()
        return df
# 6. Determine the Distribution of Senses Across Different Parts of Speech
    @staticmethod
    def senses_distribution():
        conn = sqlite3.connect('farsnet3.0.db3')
        query = """
            SELECT synset.pos, COUNT(sense.id) as sense_count
            FROM sense
            JOIN synset ON sense.synset = synset.id
            GROUP BY synset.pos
        """
        df = pd.read_sql_query(query, conn)
        conn.close()
        return df
# 7. Identify Unique Senses for a Given Semantic Category
    @staticmethod
    def unique_senses_by_semantic_category(category):
        conn = sqlite3.connect('farsnet3.0.db3')
        query = f"""
            SELECT DISTINCT sense.id, sense.synset, word.search_value
            FROM sense
            JOIN synset ON sense.synset = synset.id
            JOIN word ON sense.word = word.id
            WHERE synset.semanticCategory = '{category}'
        """
        df = pd.read_sql_query(query, conn)
        conn.close()
        return df
# 8. Retrieve Examples for Synsets with a Specific Gloss Pattern
    @staticmethod
    def synsets_with_gloss_pattern(pattern):
        conn = sqlite3.connect('farsnet3.0.db3')
        query = f"""
            SELECT synset.id, synset.example, synset.gloss
            FROM synset
            WHERE synset.gloss LIKE '%{pattern}%'
        """
        df = pd.read_sql_query(query, conn)
        conn.close()
        return df
# 9. Find Synsets with No Direct Mapping and Their Glosses
    @staticmethod
    def synsets_with_no_mapping():
        conn = sqlite3.connect('farsnet3.0.db3')
        query = """
            SELECT id, gloss
            FROM synset
            WHERE noMapping = 1
        """
        df = pd.read_sql_query(query, conn)
        conn.close()
        return df

    # @classmethod
    # def get_all_synsets_for_all_words(cls):
    #     conn = sqlite3.connect('farsnet3.0.db3')
    #     query = """
    #         SELECT word.search_value as word, sense.id as sense_id, sense.synset, synset.pos, synset.semanticCategory, 
    #                synset.example, synset.gloss, word.pos as word_pos, word.avaInfo, word.defaultValue
    #         FROM word
    #         JOIN sense ON word.id = sense.word
    #         JOIN synset ON sense.synset = synset.id
    #     """
    #     df = pd.read_sql_query(query, conn)
    #     conn.close()

    #     # Group by word and create a list of synsets for each word
    #     result = {}
    #     for index, row in df.iterrows():
    #         word = row['word']
    #         sense_info = {
    #             'sense_id': row['sense_id'],
    #             'synset_id': row['synset'],
    #             'pos': row['pos'],
    #             'semanticCategory': row['semanticCategory'],
    #             'example': row['example'],
    #             'gloss': row['gloss'],
    #             'word_pos': row['word_pos'],
    #             'avaInfo': row['avaInfo'],
    #             'defaultValue': row['defaultValue']
    #         }
    #         if word not in result:
    #             result[word] = []
    #         result[word].append(sense_info)

    #     # Save the result as a JSON file
    #     with open('all_synsets_for_all_words.json', 'w', encoding='utf-8') as f:
    #         json.dump(result, f, ensure_ascii=False, indent=4)

    #     return result

    @staticmethod
    def get_all_senses_for_all_words():
        conn = sqlite3.connect('farsnet3.0.db3')
        query = """
            SELECT sense.id, word.search_value, sense.synset, synset.pos, synset.semanticCategory, 
                   synset.example, synset.gloss
            FROM word
            JOIN sense ON word.id = sense.word
            JOIN synset ON sense.synset = synset.id
            ORDER BY word.search_value
        """
        df = pd.read_sql_query(query, conn)
        conn.close()

        # Save the result as a CSV file
        df.to_csv('all_senses_for_all_words.csv', index=False, encoding='utf-8-sig')
        
        return df

    @classmethod
    def get_all_senses_for_words(cls, words_file):
        # Load words from CSV file
        words_df = pd.read_csv(words_file)
        words = words_df['word'].tolist()

        conn = sqlite3.connect('farsnet3.0.db3')
        result = {}

        for word in words:
            word_denormalized = cls.denormalize(word)
            query = f"""
                SELECT sense.id, word.search_value, sense.synset, synset.pos, synset.semanticCategory, 
                       synset.example, synset.gloss
                FROM word
                JOIN sense ON word.id = sense.word
                JOIN synset ON sense.synset = synset.id
                WHERE word.search_value = '{word_denormalized}'
            """
            df = pd.read_sql_query(query, conn)
            
            # Process the DataFrame and construct the desired JSON structure
            senses = []
            for _, row in df.iterrows():
                sense_info = {
                    "meaning": row['gloss'],
                    "example": row['example'],
                    "pos": row['pos'],
                    "semantic_category": row['semanticCategory'],
                    "sense_id": row['id'],
                    "synset_id": row['synset'],
                
                }
                senses.append(sense_info)
            
            result[word] = senses

        conn.close()

        # Save the result as a JSON file
        with open('senses_for_words.json', 'w', encoding='utf-8') as f:
            json.dump(result, f, ensure_ascii=False, indent=4)

        return result


In [61]:
# Instantiate the class
fars_graph = FarsGraph()

In [25]:
# Visualize the graph
fars_graph.visualize()

farsnet.html


In [31]:
# Find predecessors of a node
from pprint import pprint
pprint(list(fars_graph.find_pred('گذشته')))

[',تجربه',
 ',سابقه,پس\u200c\u200cزمينه,پيشينه',
 ',غيرجاري',
 ',پارسال,پار,پارينه',
 ',پريروز',
 ',پريشب',
 ',پيشتر,قبلاً,سابقاً,پيشاپيش',
 ',پس\u200cپريشب,پيش\u200cپريشب',
 ',پس\u200cپريروز,پيش\u200cپريروز']


In [12]:
# Find relations between two nodes
print(fars_graph.find_relations('گرم', 'سرد'))

None


In [33]:
# Get synsets by word
pprint(fars_graph.get_synsets_by_word('خوب', 'LIKE'))

[(131,
  'Adjective',
  'material',
  '--نامعلوم--:جنس خوبي دارد * --ازخودم--:يک غذاي درست\u200cودرمان خورديم *',
  '--نامعلوم--:ويژگي آن\u200cچه رضايت\u200cبخش و مطلوب است *',
  0,
  0),
 (139,
  'Adjective',
  'material',
  '--نامعلوم--:دارو نافع بود و بيمار خوب شد *',
  '--نامعلوم--:ويژگي آن\u200cچه  فايده دارد *',
  0,
  0),
 (7866,
  'Verb',
  'consumption',
  '--نامعلوم--:به پدر و مادر خود نيکي کنيد. تا جايي که مي\u200cتواني احسان و '
  'نيکوکاري کن. *',
  '--نامعلوم--:کار خير انجام دادن *',
  0,
  0),
 (8042,
  'Verb',
  'communication',
  '--نامعلوم--:بيخودي قضيه را بزرگ مي کرد، من از همه ماجرا خبر داشتم. *',
  '--نامعلوم--:مهم و يا بزرگ جلوه دادن کسي يا چيزي *',
  0,
  0),
 (8091,
  'Verb',
  'change',
  '--نامعلوم--:داروهايت را که سر وقت بخوري بهتر مي شوي. *',
  '--نامعلوم--:از حالت مريضي در آمدن *',
  0,
  0),
 (8495,
  'Verb',
  'body',
  '--نامعلوم--:اگر حالم خوب شود حتماً به زيارت آقا مي روم. * دهخدا:سرش برتافتم '
  'تا عافيت يافت/سر از من لاجرم بدبخت برتافت. *',
  '--نام

In [34]:
# Get synset relations by id
print(fars_graph.get_synset_relation_by_id(1))

       id        type                 synsetWords1  \
0    5286     Antonym                 داخلي, توکار   
1  143698  Related-to  بيروني, خارجي, روکار, بروني   
2  143699  Related-to  بيروني, خارجي, روکار, بروني   
3  143702  Related-to  بيروني, خارجي, روکار, بروني   

                  synsetWords2  synset  synset2 reverse_type  
0  بيروني, خارجي, روکار, بروني       2        1      Antonym  
1     نماي ساختمان, نما, روکار       1    29920   Related-to  
2                      سيم‌کشي       1    27736   Related-to  
3     پريز, کليد برق, پريز برق       1    35438   Related-to  


In [35]:
# Get all synsets
print(fars_graph.get_all_synsets())

          id        pos semanticCategory  \
0          1  Adjective          spatial   
1          2  Adjective          spatial   
2          3  Adjective       conceptual   
3          4  Adjective       conceptual   
4          5  Adjective       conceptual   
...      ...        ...              ...   
42248  51718       Noun          PROCESS   
42249  51719       Verb             body   
42250  51720       Verb         creation   
42251  51721       Noun         LOCATION   
42252  51722       Noun         LOCATION   

                                                 example  \
0                             --ازخودم--:سيم‌کشي روکار *   
1      --نامعلوم--:سيم‌کشي توکار * وب: سيستم لوله‌کشي...   
2      آب خنک هميشه مي چسبد*اينجا هواي خنک و دلچسبي دارد   
3                                آهن داغ*زغال هاي گداخته   
4      --نامعلوم--:انسان معمولا با دوستان صميمي درددل...   
...                                                  ...   
42248  --ازخودم--:براي رفع ابهام معنايي واژگان متن 

In [None]:
# # Instantiate the class
# fars_graph = FarsGraph()

# # Visualize the graph
# fars_graph.visualize()

# # Find predecessors of a node
# print(fars_graph.find_pred('سگ'))

# # Find relations between two nodes
# print(fars_graph.find_relations('سگ', 'گربه'))

# # Get synsets by word
# print(fars_graph.get_synsets_by_word('سگ', 'LIKE'))

# # Get synset relations by id
# print(fars_graph.get_synset_relation_by_id(1))

# # Get all synsets
# print(fars_graph.get_all_synsets())

# # Denormalize a token
# print(fars_graph.denormalize('سگ'))


#######################################################
# predecessors = list(fars_graph.find_pred('some_node'))
# print(predecessors)

# # Find relations between two nodes
# relations = fars_graph.find_relations('node1', 'node2')
# print(relations)

# # Get synsets by word
# synsets = FarsGraph.get_synsets_by_word('word', 'LIKE')
# print(synsets)

# # Get synset relation by ID
# synset_relations = FarsGraph.get_synset_relation_by_id(12345)
# print(synset_relations)

# # Get all synsets
# all_synsets = FarsGraph.get_all_synsets()
# print(all_synsets)


In [21]:
# # Instantiate the class
# fars_graph = FarsGraph()

In [28]:
import sqlite3

def inspect_schema():
    conn = sqlite3.connect('farsnet3.0.db3')
    cursor = conn.cursor()

    # Inspect word table
    cursor.execute("PRAGMA table_info(word)")
    word_schema = cursor.fetchall()

    # Inspect sense table
    cursor.execute("PRAGMA table_info(sense)")
    sense_schema = cursor.fetchall()

    # Inspect synset table
    cursor.execute("PRAGMA table_info(synset)")
    synset_schema = cursor.fetchall()

    conn.close()

    return word_schema, sense_schema, synset_schema

word_schema, sense_schema, synset_schema = inspect_schema()

print("Word Table Schema:", word_schema)
print("Sense Table Schema:", sense_schema)
print("Synset Table Schema:", synset_schema)


Word Table Schema: [(0, 'id', 'INTEGER', 1, None, 1), (1, 'pos', 'TEXT', 1, 'NULL', 0), (2, 'avaInfo', 'TEXT', 1, 'NULL', 0), (3, 'defaultValue', 'TEXT', 1, 'NULL', 0), (4, 'search_value', 'TEXT', 1, 'NULL', 0)]
Sense Table Schema: [(0, 'id', 'INTEGER', 1, None, 1), (1, 'seqId', 'TEXT', 1, 'NULL', 0), (2, 'value', 'TEXT', 1, 'NULL', 0), (3, 'word', 'INTEGER', 1, 'NULL', 0), (4, 'vtansivity', 'TEXT', 0, 'NULL', 0), (5, 'vactivity', 'TEXT', 0, 'NULL', 0), (6, 'vtype', 'TEXT', 0, 'NULL', 0), (7, 'synset', 'INTEGER', 0, 'NULL', 0), (8, 'vpastStem', 'TEXT', 0, 'NULL', 0), (9, 'vpresentStem', 'TEXT', 0, 'NULL', 0), (10, 'category', 'TEXT', 0, 'NULL', 0), (11, 'goupOrMokassar', 'TEXT', 0, 'NULL', 0), (12, 'nmofradGr', 'TEXT', 0, 'NULL', 0), (13, 'countableOrNotCountable', 'TEXT', 0, 'NULL', 0), (14, 'esmeZamir', 'TEXT', 0, 'NULL', 0), (15, 'adad', 'TEXT', 0, 'NULL', 0), (16, 'adverb_type_1', 'TEXT', 0, 'NULL', 0), (17, 'adverb_type_2', 'TEXT', 0, 'NULL', 0), (18, 'adj_pishin_vijegi', 'TEXT', 

In [62]:
# Find all senses of a word with examples and related information
all_senses = fars_graph.get_all_senses('شیر')
display(all_senses)

Unnamed: 0,id,search_value,synset,pos,semanticCategory,example,gloss
0,32617,شير,14005,Noun,BODY,غذاي اصلي کودکان تا 2 سالگي بايد شير مادر باشد,مايعي که از غده هاي پستاني انسان ماده ترشح مي ...
1,32618,شير,14014,Noun,LOCATION,--نامعلوم--:وارد برج اسد شده‌ايم *,--نامعلوم--:برج پنجم از برج هاي دوازده گانه، پ...
2,32619,شير,14012,Noun,GROUP,شيران دلاور عرصه هاي نبرد حق بر باطل,شخص شجاع ، دلاور و پهلوان
3,32620,شير,14006,Noun,FOOD,او براي پيدا کردن شير همه ي داروخانه ها را زير...,ماده اي خوراکي شامل شيري که آب آن را گرفته اند...
4,32621,شير,14007,Noun,ARTIFACT,آن شير را از روي قفسه بده تا براي بچه غذا درست...,قوطي حاوي شير خشک
5,32622,شير,14013,Noun,ARTIFACT,کاپيتان تيم در ابتداي مسابقه شير را براي تعيين...,سمتي از سکه که اسکچ، نشان يا طرحي گرافيکي روي ...
6,32623,شير,14015,Noun,BODY,حيوانات اگر دچار سوتغذيه باشند از شير دادن به ...,مايعي خوراکي که از پستان پستانداران ترشح مي ش...
7,32624,شير,11682,Noun,FOOD,--نامعلوم--:شير را گرم کن و بعد بخور *,--نامعلوم--:مايعي خوراکي که از گاو و گوسفند مي...
8,32625,شير,14011,Noun,SUBSTANCE,شيره ي درخت لباسش را کثيف کرد,مايعي سفيد که در ساقه ي بعضي از گياهان وجود دارد
9,32626,شير,14008,Noun,ARTIFACT,شير توي يخچال است,قوطي يا بطري حاوي شير گاو يا گوسفند


In [81]:
all_senses = fars_graph.get_all_senses_for_all_words()

In [82]:
grouped = all_senses.groupby('search_value').size().reset_index(name='frequency')
all_senses = all_senses.merge(grouped, on='search_value')
all_senses = all_senses.sort_values('frequency', ascending=False)
all_senses = all_senses.drop_duplicates('search_value')
all_senses = all_senses[all_senses['frequency'] > 5]
display(all_senses)
words = all_senses['search_value'].tolist()
print(words)

Unnamed: 0,id,search_value,synset,pos,semanticCategory,example,gloss,frequency
35811,30203,خط,12337,Noun,SHAPE,--نامعلوم--:خط راست. خط منحني *,--نامعلوم--:شکلي که از به دنبال هم قرار گرفتن ...,28
16144,49975,برداشتن,18239,Verb,change,سنگيني وزنه ها را از من برداشتند.,جدا کردن و دور کردن چيزي از کسي,25
52017,25615,سر,11887,Noun,LOCATION,--نامعلوم--:کمباين فقط سر گندمها را مي چيد. عن...,--نامعلوم--:بخش بالايي هر چيزي *,24
108094,143691,گرفتن,45211,Noun,ACT,--ازخودم--:سلب‌کردن وي از مقامش بايد توسط مدير...,--ساير--:کسي را از چيزي يا انجام کاري محروم يا...,23
29219,29292,جا,11879,Noun,LOCATION,او اشتباهاً جاي کس ديگري نشسته بود. ما جاههايم...,"فضايي که براي نشستن( در تئاتر, قطار, هواپيماو ...",20
...,...,...,...,...,...,...,...,...
28025,61936,توليد,26381,Noun,ARTIFACT,بازده اين پروژه ي پزشکي يک داروي ضد سرطان است,آنچه نتيجه ي توليد محصولي در حجم بالايي است,6
29465,24921,جام,14468,Noun,ARTIFACT,--نامعلوم--:کاسه اي پر از سوپ خوردم *,--نامعلوم--:ظرف گود از جنس سفال يا چيني که در ...,6
76069,34526,مجلس,13467,Noun,ARTIFACT,معترضين جلوي پارلمان تجمع کردند,ساختمان يا سالني که هيئت نمايندگان مردم در آن ...,6
28776,61076,تکرار,10638,Noun,ACT,"دوره ي درسها, قبل از امتحان ضروري است",مطالعه کردن مطلبي معمولاً به صورت تند و گذرا ج...,6


['خط', 'برداشتن', 'سر', 'گرفتن', 'جا', 'کشيدن', 'زدن', 'بار', 'کار', 'دست', 'دم', 'طرح', 'دوره', 'خوردن', 'بخش', 'راه', 'درجه', 'شير', 'پشت', 'بند', 'زبان', 'اب', 'چيز', 'ارام', 'دسته', 'انداختن', 'رسيدن', 'اثر', 'دنيا', 'سرويس', 'جز', 'گاز', 'ارتباط', 'پذيرفتن', 'رشته', 'ميدان', 'گذشتن', 'کرم', 'گل', 'جهان', 'نگهداشتن', 'حساب', 'بستن', 'واحد', 'پريدن', 'برگرداندن', 'خواندن', 'خواستن', 'ميزان', 'ردکردن', 'نمونه', 'پايه', 'شانه', 'مهر', 'بازي', 'ساختن', 'جمعکردن', 'ايستادن', 'پيوند', 'دل', 'نتيجه', 'خانه', 'مغز', 'گروه', 'کندن', 'سال', 'فهميدن', 'مثبت', 'شکستن', 'ساعت', 'سهم', 'برپاکردن', 'سايه', 'کف', 'بردن', 'کنترل', 'انقلاب', 'دور', 'زندگي', 'بزرگ', 'صورت', 'پرده', 'گشتن', 'رفتن', 'زير', 'زمين', 'سرباز', 'زمان', 'تار', 'روز', 'خير', 'نظر', 'پا', 'صحنه', 'پست', 'حال', 'امر', 'شاهد', 'دين', 'سياست', 'رابطه', 'حاشيه', 'روي', 'ريال', 'رشد', 'حکم', 'صافکردن', 'قرار', 'جامعه', 'بهوجوداوردن', 'کارکردن', 'مستقيم', 'سبک', 'عالم', 'دليل', 'پاککردن', 'عشق', 'دستي', 'مرکز', 'سطح', 'ماده', 'موضوع

In [83]:
# save all values in search_value column as a csv file
words = all_senses['search_value']
words.to_csv('words.csv', index=False, header=False)



In [82]:
# Identify synsets with multiple senses
multiple_senses = fars_graph.synsets_with_multiple_senses()
display(multiple_senses)

Unnamed: 0,synset,sense_count
0,,7208
1,1.0,4
2,2.0,2
3,4.0,2
4,5.0,9
...,...,...
25169,51715.0,2
25170,51716.0,3
25171,51718.0,3
25172,51721.0,2


In [None]:
all_synsets_for_all_words = fars_graph.get_all_synsets_for_all_words()
display(all_synsets_for_all_words)

In [55]:
# Retrieve words with their most common sense
common_sense_words = fars_graph.words_with_most_common_sense()
display(common_sense_words)

# Sort by frequency in descending order
sorted_common_sense_words = common_sense_words.sort_values(by='frequency', ascending=False)
display(sorted_common_sense_words)

  return df.groupby('word').apply(lambda x: x.nlargest(1, 'frequency')).reset_index(drop=True)


Unnamed: 0,word,synset,frequency
0,"""تغييريافتندرحجم""",7732.0,1
1,"""خلقکردنذهني""",9267.0,1
2,(ره),45149.0,1
3,(س),45143.0,1
4,(ص),45153.0,1
...,...,...,...
97216,گچکار,23477.0,1
97217,گچکاري,23478.0,1
97218,گچکاريکردن,8954.0,1
97219,گچکشيدن,8954.0,1


Unnamed: 0,word,synset,frequency
81957,وراثت,19159.0,2
39915,رفتوامدکردن,21997.0,2
42197,رويي,307.0,2
42876,زاييدن,9432.0,2
42198,روييدن,8642.0,2
...,...,...,...
29691,حيرون,,0
29692,حيروني,,0
76499,نسخهويرا,,0
76500,نسخهپرداز,,0


In [56]:
# List synsets and their corresponding lexicon information
synsets_lexicon = fars_graph.synsets_with_lexicon_info()
display(synsets_lexicon)


Unnamed: 0,id,pos,semanticCategory,example,gloss,search_value
0,41115,Adjective,material,--ازخودم--:پتوي آب‌ديده * --ازخودم--:ديوار نم‌...,عميد:ويژگي آن‌چه در آب افتاده و يا آب به خود ک...,ابديده
1,418,Adjective,material,تخم مرغ آب پز,ويژگي آنچه در آب و بدون روغن پخته شده است,ابپز
2,25976,Adjective,social,--نامعلوم--:خانواده هاي آبرومند اگر دچار مشکل ...,--نامعلوم--:آن که با آبرو زندگي مي کند و در نز...,ابرومند
3,931,Adjective,body,جانوران آبزي,ويژگي موجودي که در آب زندگي مي کند,ابزي
4,188,Adjective,body,زن باردار به بيمارستان رفت و وضع حمل کرد,ويژگي پستان دار ماده که در رحم خود جنين دارد,ابستن
...,...,...,...,...,...,...
110086,8180,Verb,competition,--نامعلوم--:ما در اين نبرد پيروز خواهيم شد. *,--نامعلوم--:غلبه کردن بر دشمن در جنگ و شکست دا...,شکستدادن
110087,29914,Noun,PERSON,--نامعلوم--:دندانپزشک عمومي که موفق به گذراندن...,--نامعلوم--:دندانپزشک متخصصي است که وظيفه تشخي...,لثهپزشک
110088,11806,Noun,GROUP,--نامعلوم--:هيئت‌منصفه به مجرم بودن متهم رأي د...,--نامعلوم--:جمعي از صاحبان رشته‌ها و طبقات شغل...,هييتژوري
110089,51721,Noun,LOCATION,ويکي پديا:آذربايجان غربي و شهرستان اروميه قطب ...,--ازخودم--:يکي از شهرستان‌هاي استان آذربايجان ...,اروميه


In [60]:
# Extract senses and their synsets for a particular part of speech
senses_pos = fars_graph.senses_by_pos('Noun')
display(senses_pos)

Unnamed: 0,id,synset,pos,search_value
0,24585,10054,Noun,1000000000
1,24586,12632,Noun,24ساعت
2,24587,12634,Noun,24ساعت
3,24588,12653,Noun,365روز
4,24589,12666,Noun,60دقيقه
...,...,...,...,...
64758,167806,50264,Noun,رکوردزني
64759,167809,29914,Noun,لثهپزشک
64760,167810,11806,Noun,هييتژوري
64761,167811,51721,Noun,اروميه


In [61]:
# Determine the distribution of senses across different parts of speech
senses_distribution = fars_graph.senses_distribution()
display(senses_distribution)

Unnamed: 0,pos,sense_count
0,Adjective,17648
1,Adverb,4693
2,Noun,64763
3,Verb,22987


In [64]:
# Identify unique senses for a given semantic category
unique_senses_category = fars_graph.unique_senses_by_semantic_category('material')
display(unique_senses_category)

Unnamed: 0,id,synset,search_value
0,13841,41115,ابديده
1,13842,418,ابپز
2,13847,1146,ابکي
3,13848,235,ابي
4,13851,202,ابي
...,...,...,...
1816,167504,1306,بيرمق
1817,167507,51617,رژلبي
1818,167508,51617,ماتيکي
1819,167546,51648,بههمپيچيده


In [73]:
# Retrieve examples for synsets with a specific gloss pattern
gloss_pattern = fars_graph.synsets_with_gloss_pattern('نامعلوم')
display(gloss_pattern)

Unnamed: 0,id,example,gloss
0,1,--ازخودم--:سيم‌کشي روکار *,--نامعلوم--:مربوط به سطح بيروني يا رويي چيزي *
1,2,--نامعلوم--:سيم‌کشي توکار * وب: سيستم لوله‌کشي...,--نامعلوم--:مربوط به داخل يا سطح زيرين چيزي *
2,5,--نامعلوم--:انسان معمولا با دوستان صميمي درددل...,--نامعلوم--:داراي رابطه نزديک و صميمانه *
3,6,--نامعلوم--:با رفتار سرد و بي احساسش همه را پک...,--نامعلوم--:بدون احساس و شور *
4,7,--نامعلوم--:کارهايتان را زمان ديرتري انجام دهيد *,--نامعلوم--:واقع در زماني پس از زمان مناسب يا ...
...,...,...,...
11482,51304,--نامعلوم--:پاراگلايدر يک وسيله پرنده تفريحي ا...,--نامعلوم--:وسيله‌اي که قادر به پرواز است. * -...
11483,51341,--ازخودم--:گاو حيواني نشخوارکننده است. * --نام...,--نامعلوم--:گروهي از چهارپايان که معدة چهارقسم...
11484,51489,--نامعلوم--:جمهوري از روياهايي بعضي از فيلسوفا...,--نامعلوم--:حکومتي که فردي در آن از طرف مردم و...
11485,51714,--نامعلوم--:عکس هاي جشن نامزدي بعد از رتوش بسي...,--نامعلوم--:دست کاري و اصلاح کردن عکس پس از ظه...


In [74]:
# Find synsets with no direct mapping and their glosses
no_mapping_synsets = fars_graph.synsets_with_no_mapping()
display(no_mapping_synsets)

Unnamed: 0,id,gloss
0,166,--نامعلوم--:ويژگي بليطي که براي دو سفر رفت و ب...
1,203,ويژگي زراعتي که با آب باران نمو کند و آن را آب...
2,233,ويژگي صفحه عکاسي اي که ظاهر و ثابت شده و درآن ...
3,283,ويژگي يکي از قطع هاي کتاب
4,320,قرار گرفته در قسمت بالايي بدن
...,...,...
11681,51718,--ازخودم--:ابهام زدايي از واژگان مبهم و داراي ...
11682,51719,سخن:خوردن مواد مقوي براي تقويت شدن *
11683,51720,سخن:نوشتن يا نقاشي کردن *
11684,51721,--ازخودم--:يکي از شهرستان‌هاي استان آذربايجان ...


In [76]:
# Identify unique senses for a given semantic category
unique_senses_category = fars_graph.unique_senses_by_semantic_category('body')
display(unique_senses_category)

Unnamed: 0,id,synset,search_value
0,13844,931,ابزي
1,13845,188,ابستن
2,13913,967,اميزشي
3,13933,1868,ابتر
4,14004,906,استثنايي
...,...,...,...
2452,167711,948,براماسيده
2453,167712,33457,خونپالا
2454,167767,51692,ابزيرپوست[کسي]افتادن
2455,167803,51719,تقويتکردن


In [77]:
# Retrieve examples for synsets with a specific gloss pattern
gloss_pattern = fars_graph.synsets_with_gloss_pattern('ازخودم')
display(gloss_pattern)

Unnamed: 0,id,example,gloss
0,58,--نامعلوم--:پارچه سبز * --نامعلوم--:برگ هاي سبز *,--ازخودم--:داراي رنگ سبز، رنگي ميان زرد و آبي *
1,93,--نامعلوم--:دوستم خوش‌بنيه است و به ندرت مريض...,--نامعلوم--:داراي قدرت جسماني بالا * --ازخودم-...
2,682,--نامعلوم--:قهرمان مغرور رقيب را جدي نگرفت و ش...,--ازخودم--:ويژگي آن‌که دچار غرور است و خود را ...
3,744,--نامعلوم--:او در شهر خود شخصيتي مطرود به شمار...,--ازخودم--:ويژگي آن‌که ديگران رهايش کرده يا او...
4,1709,--نامعلوم--:معدل بالاي او مويد تلاش خستگي‌ناپذ...,--ازخودم--:ويژگي کسي يا چيزي که صحت عملي و يا ...
...,...,...,...
2868,51708,وب: ببين که يار نامهربان و کم لطف در اين عشق ب...,--ازخودم--:فاقد مهر و محبت *
2869,51709,سخن:هم ز فرعون بهيمي دور شو / هم به ميغات آي و...,--ازخودم--:ويژگي آن‌چه مربوط به حيوان است که ا...
2870,51717,--ازخودم--:او با آرنج به من زد تا به او حالي ک...,--ازخودم--:به آرامي زدن *
2871,51718,--ازخودم--:براي رفع ابهام معنايي واژگان متن مو...,--ازخودم--:ابهام زدايي از واژگان مبهم و داراي ...


In [78]:
# Find synsets with no direct mapping and their glosses
no_mapping_synsets = fars_graph.synsets_with_no_mapping()
display(no_mapping_synsets)

Unnamed: 0,id,gloss
0,166,--نامعلوم--:ويژگي بليطي که براي دو سفر رفت و ب...
1,203,ويژگي زراعتي که با آب باران نمو کند و آن را آب...
2,233,ويژگي صفحه عکاسي اي که ظاهر و ثابت شده و درآن ...
3,283,ويژگي يکي از قطع هاي کتاب
4,320,قرار گرفته در قسمت بالايي بدن
...,...,...
11681,51718,--ازخودم--:ابهام زدايي از واژگان مبهم و داراي ...
11682,51719,سخن:خوردن مواد مقوي براي تقويت شدن *
11683,51720,سخن:نوشتن يا نقاشي کردن *
11684,51721,--ازخودم--:يکي از شهرستان‌هاي استان آذربايجان ...
