# കുടുംബ ബന്ധങ്ങളുടെ ഓന്റോളജി

ഈ ഉദാഹരണം [AI for Beginners Curriculum](http://github.com/microsoft/ai-for-beginners) എന്ന കോഴ്സിന്റെ ഭാഗമാണ്, കൂടാതെ ഇത് [ഈ ബ്ലോഗ് പോസ്റ്റ്](https://habr.com/post/270857/) നിന്നാണ് പ്രചോദനം ലഭിച്ചത്.

ഒരു കുടുംബത്തിലെ ആളുകൾ തമ്മിലുള്ള വ്യത്യസ്ത ബന്ധങ്ങൾ ഓർക്കുന്നത് എനിക്ക് എപ്പോഴും ബുദ്ധിമുട്ടാണ്. ഈ ഉദാഹരണത്തിൽ, കുടുംബ ബന്ധങ്ങൾ നിർവചിക്കുന്ന ഒരു ഓന്റോളജി, യഥാർത്ഥ വംശാവലി വൃക്ഷം എന്നിവ എടുത്ത്, എല്ലാ ബന്ധുക്കളെയും കണ്ടെത്താൻ സ്വയം നിർവചന പ്രക്രിയ എങ്ങനെ നടത്താമെന്ന് കാണിക്കും.

### വംശാവലി വൃക്ഷം നേടൽ

ഉദാഹരണമായി, [റോമാനോവ് സാർ കുടുംബം](https://en.wikipedia.org/wiki/House_of_Romanov) എന്ന വംശാവലി വൃക്ഷം എടുത്തിരിക്കുന്നു. കുടുംബ ബന്ധങ്ങൾ വിവരിക്കാൻ ഏറ്റവും സാധാരണമായ ഫോർമാറ്റ് [GEDCOM](https://en.wikipedia.org/wiki/GEDCOM) ആണ്. നാം റോമാനോവ് കുടുംബ വൃക്ഷം GEDCOM ഫോർമാറ്റിൽ എടുത്തിരിക്കുന്നു:


In [1]:
!head -15 data/tsars.ged

0 HEAD
1 CHAR UTF8
1 GEDC
2 VERS 5.5
0 @0@ INDI
1 NAME Mihail Fedorovich /Romanov/
1 SEX M
1 BIRT
2 DATE 1613
1 DEAT 
2 DATE 1645
1 FAMS @41@
0 @1@ INDI
1 NAME Evdokija Lukjanovna /Streshneva/
1 SEX F


GEDCOM ഫയൽ ഉപയോഗിക്കാൻ, നാം `python-gedcom` ലൈബ്രറി ഉപയോഗിക്കാം:


In [2]:
import sys
!{sys.executable} -m pip install python-gedcom

Collecting python-gedcom
  Downloading python_gedcom-1.0.0-py2.py3-none-any.whl (35 kB)
Installing collected packages: python-gedcom
Successfully installed python-gedcom-1.0.0


ഈ ലൈബ്രറി ഫയൽ പാഴ്സിംഗുമായി ബന്ധപ്പെട്ട ചില സാങ്കേതിക പ്രശ്നങ്ങൾ നീക്കം ചെയ്യുന്നു, പക്ഷേ ഇത് മരത്തിൽ ഉള്ള എല്ലാ വ്യക്തികളുടെയും കുടുംബങ്ങളുടെയും pretty low-level ആക്സസ് നമ്മുക്ക് നൽകുന്നു. ഫയൽ എങ്ങനെ പാഴ്സ് ചെയ്യാമെന്ന്, എല്ലാ വ്യക്തികളുടെ പട്ടിക എങ്ങനെ കാണിക്കാമെന്ന് ഇതാ:


In [3]:
from gedcom.parser import Parser
from gedcom.element.individual import IndividualElement
from gedcom.element.family import FamilyElement
g = Parser()
g.parse_file('data/tsars.ged')

In [4]:
d = g.get_element_dictionary()
[ (k,v.get_name()) for k,v in d.items() if isinstance(v,IndividualElement)]

[('@0@', ('Mihail Fedorovich', 'Romanov')),
 ('@1@', ('Evdokija Lukjanovna', 'Streshneva')),
 ('@2@', ('Aleksej Mihajlovich', 'Romanov')),
 ('@3@', ('Marija Ilinichna', 'Miloslavskaja')),
 ('@4@', ('Natalja Kirillovna', 'Naryshkina')),
 ('@5@', ('Marfa Matveevna', 'Apraksina')),
 ('@6@', ('Fedor Alekseevich', 'Romanov')),
 ('@7@', ('Sofja Aleksevna', 'Romanova')),
 ('@8@', ('Ivan V Alekseevich', 'Romanov')),
 ('@9@', ('Praskovja Fedorovna', 'Saltykova')),
 ('@10@', ('Ekaterina Ivanovna', 'Romanova')),
 ('@11@', ('Anna Ivanovna', 'Romanova')),
 ('@12@', ('Fridrih Vilgelm', 'Kurlandskij')),
 ('@13@', ('Karl Leopold', 'Meklenburg-Shverinskij')),
 ('@14@', ('Anna Leopoldovna', 'Meklenburg-Shverinskaja')),
 ('@15@', ('Anton Ulrih', 'Braunshvejg-Volfenbjuttelskij')),
 ('@16@', ('Ivan VI Antonovich', 'Braunshvejg-Volfenbjuttelskij')),
 ('@17@', ('Petr I Alekseevich', 'Romanov')),
 ('@18@', ('Evdokija Fedorovna', 'Lopuhina')),
 ('@19@', ('Ekaterina I Alekseevna', 'Mihajlova')),
 ('@20@', ('Ale

കുടുംബങ്ങളെക്കുറിച്ചുള്ള വിവരങ്ങൾ എങ്ങനെ ലഭിക്കാമെന്ന് ഇതാ. ശ്രദ്ധിക്കുക, ഇത് **ഐഡന്റിഫയർസിന്റെ** ഒരു പട്ടിക നൽകുന്നു, കൂടുതൽ വ്യക്തതക്കായി അവയെ പേരുകളായി മാറ്റേണ്ടതുണ്ട്:


In [5]:
d = g.get_element_dictionary()
[ (k,[x.get_value() for x in v.get_child_elements()]) for k,v in d.items() if isinstance(v,FamilyElement)]

[('@41@', ['@0@', '@1@', '@2@']),
 ('@42@', ['@2@', '@3@', '@6@', '@7@', '@8@']),
 ('@43@', ['@8@', '@9@', '@10@', '@11@']),
 ('@44@', ['@13@', '@10@', '@14@']),
 ('@45@', ['@15@', '@14@', '@16@']),
 ('@46@', ['@2@', '@4@', '@17@']),
 ('@47@', ['@17@', '@18@', '@20@']),
 ('@48@', ['@20@', '@21@', '@22@']),
 ('@49@', ['@17@', '@19@', '@23@', '@24@']),
 ('@50@', ['@25@', '@23@', '@26@']),
 ('@51@', ['@26@', '@27@', '@28@']),
 ('@52@', ['@28@', '@30@', '@31@', '@33@']),
 ('@53@', ['@33@', '@34@', '@35@']),
 ('@54@', ['@35@', '@36@', '@37@']),
 ('@55@', ['@37@', '@38@', '@39@'])]

### കുടുംബ ഓന്റോളജി നേടൽ

അടുത്തതായി, സെമാന്റിക് വെബ് ട്രിപ്പിളുകളായി നിർവചിച്ചിരിക്കുന്ന [കുടുംബ ഓന്റോളജി](https://raw.githubusercontent.com/blokhin/genealogical-trees/master/data/header.ttl) നോക്കാം. ഈ ഓന്റോളജി `isUncleOf`, `isCousinOf` തുടങ്ങിയ ബന്ധങ്ങൾ നിർവചിക്കുന്നു. ഈ ബന്ധങ്ങൾ എല്ലാം അടിസ്ഥാന പ്രെഡിക്കേറ്റുകളായ `isMotherOf`, `isFatherOf`, `isBrotherOf`, `isSisterOf` എന്നിവയുടെ അടിസ്ഥാനത്തിൽ നിർവചിച്ചിരിക്കുന്നു. ഓന്റോളജി ഉപയോഗിച്ച് എല്ലാ മറ്റ് ബന്ധങ്ങളും സ്വയം ന്യായീകരണം വഴി കണ്ടെത്താൻ നാം ഉപയോഗിക്കും.

ഇവിടെ `isAuntOf` പ്രോപ്പർട്ടിയുടെ ഒരു ഉദാഹരണം നൽകിയിരിക്കുന്നു, ഇത് `isSisterOf` ഉം `isParentOf` ഉം ചേർന്ന രൂപത്തിലാണ് നിർവചിച്ചിരിക്കുന്നത് (*അമ്മായിയമ്മയോ പിതാമഹിയമ്മയോ ഒരാളുടെ മാതാപിതാവിന്റെ സഹോദരിയാണ്*). 

```
fhkb:isAuntOf a owl:ObjectProperty ;
    rdfs:domain fhkb:Woman ;
    rdfs:range fhkb:Person ;
    owl:propertyChainAxiom ( fhkb:isSisterOf fhkb:isParentOf ) .
```


In [6]:
!head -20 data/onto.ttl

@prefix fhkb: <http://www.example.com/genealogy.owl#> .
@prefix owl: <http://www.w3.org/2002/07/owl#> .
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix xml: <http://www.w3.org/XML/1998/namespace> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

<http://www.example.com/genealogy.owl#> a owl:Ontology .

fhkb:DomainEntity a owl:Class .

fhkb:Man a owl:Class ;
    owl:equivalentClass [ a owl:Class ;
            owl:intersectionOf ( fhkb:Person [ a owl:Restriction ;
                        owl:onProperty fhkb:hasSex ;
                        owl:someValuesFrom fhkb:Male ] ) ] .

fhkb:Woman a owl:Class ;
    owl:equivalentClass [ a owl:Class ;
            owl:intersectionOf ( fhkb:Person [ a owl:Restriction ;


### നിഗമനത്തിനായി ഓന്റോളജി നിർമ്മാണം

സൗകര്യത്തിന്, നാം ഒരു ഓന്റോളജി ഫയൽ സൃഷ്ടിക്കും, അതിൽ ഫാമിലി ഓന്റോളജിയിൽ നിന്നുള്ള യഥാർത്ഥ നിയമങ്ങളും നമ്മുടെ GEDCOM ഫയലിലെ വ്യക്തികളെക്കുറിച്ചുള്ള വസ്തുതകളും ഉൾപ്പെടും. നാം GEDCOM ഫയൽ പരിശോധിച്ച് കുടുംബങ്ങളെയും വ്യക്തികളെയുംക്കുറിച്ചുള്ള വിവരങ്ങൾ എടുക്കുകയും അവ ട്രിപ്പ്ലറ്റുകളായി മാറ്റുകയും ചെയ്യും.


In [7]:
!cp data/onto.ttl .

gedcom_dict = g.get_element_dictionary()
individuals, marriages = {}, {}

def term2id(el):
    return "i" + el.get_pointer().replace('@', '').lower()

out = open("onto.ttl","a")

for k, v in gedcom_dict.items():
    if isinstance(v,IndividualElement):
        children, siblings = set(), set()
        idx = term2id(v)

        title = v.get_name()[0] + " " + v.get_name()[1]
        title = title.replace('"', '').replace('[', '').replace(']', '').replace('(', '').replace(')', '').strip()

        own_families = g.get_families(v, 'FAMS')
        for fam in own_families:
            children |= set(term2id(i) for i in g.get_family_members(fam, "CHIL"))

        parent_families = g.get_families(v, 'FAMC')
        if len(parent_families):
            for member in g.get_family_members(parent_families[0], "CHIL"): # NB adoptive families i.e len(parent_families)>1 are not considered (TODO?)
                if member.get_pointer() == v.get_pointer():
                    continue
                siblings.add(term2id(member))

        if idx in individuals:
            children |= individuals[idx].get('children', set())
            siblings |= individuals[idx].get('siblings', set())
        individuals[idx] = {'sex': v.get_gender().lower(), 'children': children, 'siblings': siblings, 'title': title}

    elif isinstance(v,FamilyElement):
        wife, husb, children = None, None, set()
        children = set(term2id(i) for i in g.get_family_members(v, "CHIL"))

        try:
            wife = g.get_family_members(v, "WIFE")[0]
            wife = term2id(wife)
            if wife in individuals: individuals[wife]['children'] |= children
            else: individuals[wife] = {'children': children}
        except IndexError: pass
        try:
            husb = g.get_family_members(v, "HUSB")[0]
            husb = term2id(husb)
            if husb in individuals: individuals[husb]['children'] |= children
            else: individuals[husb] = {'children': children}
        except IndexError: pass

        if wife and husb: marriages[wife + husb] = (term2id(v), wife, husb)

for idx, val in individuals.items():
    added_terms = ''
    if val['sex'] == 'f':
        parent_predicate, sibl_predicate = "isMotherOf", "isSisterOf"
    else:
        parent_predicate, sibl_predicate = "isFatherOf", "isBrotherOf"
    if len(val['children']):
        added_terms += " ;\n    fhkb:" + parent_predicate + " " + ", ".join(["fhkb:" + i for i in val['children']])
    if len(val['siblings']):
        added_terms += " ;\n    fhkb:" + sibl_predicate + " " + ", ".join(["fhkb:" + i for i in val['siblings']])
    out.write("fhkb:%s a owl:NamedIndividual, owl:Thing%s ;\n    rdfs:label \"%s\" .\n" % (idx, added_terms, val['title']))

for k, v in marriages.items():
    out.write("fhkb:%s a owl:NamedIndividual, owl:Thing ;\n    fhkb:hasFemalePartner fhkb:%s ;\n    fhkb:hasMalePartner fhkb:%s .\n" % v)

out.write("[] a owl:AllDifferent ;\n    owl:distinctMembers (")
for idx in individuals.keys():
    out.write("    fhkb:" + idx)
for k, v in marriages.items():
    out.write("    fhkb:" + v[0])
out.write("    ) .")
out.close()

In [8]:
!tail onto.ttl

    fhkb:hasFemalePartner fhkb:i34 ;
    fhkb:hasMalePartner fhkb:i33 .
fhkb:i54 a owl:NamedIndividual, owl:Thing ;
    fhkb:hasFemalePartner fhkb:i36 ;
    fhkb:hasMalePartner fhkb:i35 .
fhkb:i55 a owl:NamedIndividual, owl:Thing ;
    fhkb:hasFemalePartner fhkb:i38 ;
    fhkb:hasMalePartner fhkb:i37 .
[] a owl:AllDifferent ;
    owl:distinctMembers (    fhkb:i0    fhkb:i1    fhkb:i2    fhkb:i3    fhkb:i4    fhkb:i5    fhkb:i6    fhkb:i7    fhkb:i8    fhkb:i9    fhkb:i10    fhkb:i11    fhkb:i12    fhkb:i13    fhkb:i14    fhkb:i15    fhkb:i16    fhkb:i17    fhkb:i18    fhkb:i19    fhkb:i20    fhkb:i21    fhkb:i22    fhkb:i23    fhkb:i24    fhkb:i25    fhkb:i26    fhkb:i27    fhkb:i28    fhkb:i29    fhkb:i30    fhkb:i31    fhkb:i32    fhkb:i33    fhkb:i34    fhkb:i35    fhkb:i36    fhkb:i37    fhkb:i38    fhkb:i39    fhkb:i40    fhkb:i41    fhkb:i42    fhkb:i43    fhkb:i44    fhkb:i45    fhkb:i46    fhkb:i47    fhkb:i48    fhkb:i49    fhkb:i50    fhkb:i51    fhkb:i52    fhkb:i53    fhkb:

### നിർണയം നടത്തൽ

ഇപ്പോൾ നാം ഈ ഓന്റോളജി നിർണയത്തിനും ക്വറി ചെയ്യുന്നതിനും ഉപയോഗിക്കാൻ ആഗ്രഹിക്കുന്നു. RDF ഗ്രാഫ് വിവിധ ഫോർമാറ്റുകളിൽ വായിക്കാനും, അതിൽ ക്വറി ചെയ്യാനും തുടങ്ങിയവയ്ക്ക് [RDFLib](https://github.com/RDFLib) ലൈബ്രറി ഉപയോഗിക്കും.

തർക്കസഹജമായ നിർണയത്തിനായി, RDF ഗ്രാഫിന്റെ **ക്ലോഷർ** നിർമ്മിക്കാൻ അനുവദിക്കുന്ന [OWL-RL](https://github.com/RDFLib/OWL-RL) ലൈബ്രറി ഉപയോഗിക്കും, അതായത് നിർണയിക്കാവുന്ന എല്ലാ ആശയങ്ങളും ബന്ധങ്ങളും ചേർക്കുക.


In [10]:
!{sys.executable} -m pip install rdflib
!{sys.executable} -m pip install git+https://github.com/RDFLib/OWL-RL.git

Collecting git+https://github.com/RDFLib/OWL-RL.git
  Cloning https://github.com/RDFLib/OWL-RL.git to /tmp/pip-req-build-lbfzwi3m
  Running command git clone --filter=blob:none --quiet https://github.com/RDFLib/OWL-RL.git /tmp/pip-req-build-lbfzwi3m
  Resolved https://github.com/RDFLib/OWL-RL.git to commit a77e1791b88b54aace609bc6000aac14c7add4ff
  Preparing metadata (setup.py) ... [?25ldone


ഓന്റോളജി ഫയൽ തുറന്ന് അതിൽ എത്ര ട്രിപ്പ്ലെറ്റുകൾ ഉള്ളതായി കാണാം:


In [11]:
import rdflib
from owlrl import DeductiveClosure, OWLRL_Extension

g = rdflib.Graph()
g.parse("onto.ttl", format="turtle")

print("Triplets found:%d" % len(g))

Triplets found:669


ഇപ്പോൾ ക്ലോഷർ നിർമ്മിക്കാം, ട്രിപ്പ്ലെറ്റുകളുടെ എണ്ണം എങ്ങനെ വർദ്ധിക്കുന്നുവെന്ന് കാണാം:


In [12]:
DeductiveClosure(OWLRL_Extension).expand(g)
print("Triplets after inference:%d" % len(g))

Triplets after inference:4246


### ബന്ധുക്കളെക്കുറിച്ച് ചോദിക്കുന്നത്

ഇപ്പോൾ നാം ഗ്രാഫിൽ നിന്ന് ആളുകൾ തമ്മിലുള്ള വ്യത്യസ്ത ബന്ധങ്ങൾ പരിശോധിക്കാൻ കഴിയും. നാം **SPARQL** ഭാഷയും `query` മെത്തഡും ഉപയോഗിക്കാം. നമ്മുടെ ഉദാഹരണത്തിൽ, കുടുംബ വൃക്ഷത്തിലെ എല്ലാ **ചേച്ചിമാരെയും** നോക്കാം:


In [13]:
qres = g.query(
    """SELECT DISTINCT ?aname ?bname
       WHERE {
          ?a fhkb:isUncleOf ?b .
          ?a rdfs:label ?aname .
          ?b rdfs:label ?bname .
       }""")

for row in qres:
    print("%s is uncle of %s" % row)

Fedor Alekseevich Romanov is uncle of Ekaterina Ivanovna Romanova
Aleksandr I Pavlovich Romanov is uncle of Aleksandr II Nikolaevich Romanov
Fedor Alekseevich Romanov is uncle of Anna Ivanovna Romanova


വിവിധ മറ്റ് കുടുംബ ബന്ധങ്ങളുമായി പരീക്ഷണം നടത്താൻ മടിക്കേണ്ട. ഉദാഹരണത്തിന്, നിങ്ങൾക്ക് `isAncestorOf` ബന്ധം പരിശോധിക്കാം, ഇത് ഒരു വ്യക്തിയുടെ എല്ലാ പൂർവികരെയും പുനരാവർത്തിച്ച് നിർവചിക്കുന്നു.

അവസാനമായി, നമുക്ക് ശുചീകരണം നടത്താം!


In [14]:
!rm onto.ttl

---

<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:  
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
