# Automatic credibility assessment of popular science articles available online

## Module 1: Topic modelling

In [129]:
# Load dependencies

import numpy as np
import nltk
import re
import os
import codecs

from morfeusz import analyse
import gensim
import gensim.corpora as corpora


import matplotlib.pyplot as plt
import matplotlib as mpl
import pandas as pd
import numpy as np

# helper class for visualization purposes
class color:
   PURPLE = '\033[95m'
   CYAN = '\033[96m'
   DARKCYAN = '\033[36m'
   BLUE = '\033[94m'
   GREEN = '\033[92m'
   YELLOW = '\033[93m'
   RED = '\033[91m'
   BOLD = '\033[1m'
   UNDERLINE = '\033[4m'
   END = '\033[0m'

### Load polish tokenizer from NLTK

In [111]:
polish_tokenizer = nltk.data.load('tokenizers/punkt/polish.pickle')

### Load raw article texts

In [118]:
def raw_text_list(path_to_articles='articles'):
    articles = []
    labels = []

    for filename in os.listdir(path_to_articles):
        article = ""

        if not filename.startswith('.') and filename.endswith(".txt"): 
            # print(os.path.join(directory, filename))
            f = open(path_to_articles + "/" + filename)
            lines = f.readlines()
            article = " ".join(lines)
            labels.append(filename)
            articles.append(article)

    return articles, labels

# print first elements of 2 parallell lists from 2xN array (where N is the number of articles)

articles, labels = raw_text_list()

for i in range(0,7):
    print(articles[i][0:100] + '...')
    print(labels[i] + '\n')

 ﻿Loratadyna jest lekiem wprowadzonym na rynek w 1993 r. pod nazwą Claritine przez koncern Schering-...
29.txt

 ﻿Mięśniaki – najczęstsze łagodne guzy macicy Mięśniaki są to guzy łagodne, wywodzące się z włókien ...
15.txt

 Co roku zaleca się ludziom przyjmowanie szczepionki przeciw grypie, co ma oszczędzić im powtarzając...
114.txt

 Jednym z podstawowych elementów edukacji moich dietetycznych pacjentów jest nauczenie interpretowan...
100.txt

 Medycyna ludowa od dawna wykorzystuje lecznicze właściwości pestek dyni.
  Używa się ich, zarówno u...
128.txt

 Żywienie Optymalne zapewnia wszystkim, którzy je stosują, eliminowanie przyczyn chorób.
  Jest to j...
129.txt

 Ludzki organizm, głównie w wątrobie, sam wytwarza cholesterol, bo jest on nam potrzebny.
  W zdrowo...
101.txt



### Tokenization & stemming

In [123]:
def base_word(word):
    return analyse(word)[0][0][1]

def extract_words_from_string(s):
    return re.findall(re.compile('\w+'), s.lower())

def article_vocabulary_stemmed(article):
    '''
        'article' is of type string
    '''

    word_list = extract_words_from_string(article)
    article_vocabulary = []

    for w in word_list:
        try:
            a = base_word(w)
            article_vocabulary.append(a)
        except KeyError as e:
            pass

    return article_vocabulary

def data_lemmatized(articles):
    articles_lemmatized = []
    for article in articles:
        articles_lemmatized.append(article_vocabulary_stemmed(article))
        
    return articles_lemmatized


### Get the article vocabulary

In [120]:
articles_lemmatized = data_lemmatized(articles)
articles_lemmatized[:1]

[['loratadyna',
  'być',
  'lek',
  'wprowadzić',
  'na',
  'rynek',
  'w',
  'r',
  'pod',
  'nazwać',
  'claritine',
  'przez',
  'koncern',
  'schering',
  'plough',
  'europ',
  'ten',
  'popularny',
  'farmaceutyk',
  'o',
  'działanie',
  'przeciwalergiczny',
  'oraz',
  'przeciwhistaminowy',
  'w',
  'jak',
  'sposób',
  'dziać',
  'loratadyna',
  'loratadyna',
  'wykazywać',
  'selektywny',
  'antagonistyczny',
  'działanie',
  'na',
  'obwodowy',
  'receptor',
  'h1',
  'lek',
  'należeć',
  'stosować',
  'doustnie',
  'ponieważ',
  'dobrze',
  'oraz',
  'szybko',
  'wchłaniać',
  'się',
  'z',
  'przewód',
  'pokarmowy',
  'podczas',
  'pierwsze',
  'przejście',
  'przez',
  'wątroba',
  'być',
  'niemal',
  'całkowicie',
  'metabolizować',
  'przy',
  'udział',
  'cyp2d6',
  'oraz',
  'cyp3a4',
  'desloratadyna',
  'być',
  'główny',
  'metabolit',
  'czynny',
  'farmakologicznie',
  'odpowiedzialny',
  'za',
  'odpowiedni',
  'działanie',
  'lek',
  'wysoki',
  'stężenie',


### Term document frequency

In [121]:
id2word = corpora.Dictionary(articles_lemmatized)

articles_lem = articles_lemmatized

corpus = [id2word.doc2bow(article) for article in articles_lem]

import gensim.downloader as api
from gensim.sklearn_api import TfIdfTransformer
import pickle

model = TfIdfTransformer(id2word=id2word) # -- use for the first time
tfidf_corpus = model.fit_transform(corpus)
# model = picle.load(open('tfidf_medical_corpus.p', 'rb')) 
# pickle.dump(model, open('tfidf_medical_corpus.p', 'wb')) # -- use if model has already been pickled


# Use the model to show retrieved context

In [130]:
import numpy as np

n = 243 # first document's ID
imp = 5 # amount of the most important words for the document

def printParagraphWithContext(n=n,imp=imp):
    for i in range (n-5, n+5):
        indexes, scores = [list(a) for a in zip(*tfidf_corpus[i])]

        np_scores = np.array(scores) # transform scores to numpy array to use the sorting function
        idxs_most_important_words = np_scores.argsort()[-imp:] 

        context = ''
        for idx in reversed(idxs_most_important_words):
            context += (id2word[indexes[idx]] + ' ')

        print('\n')
        print(color.BOLD + context + color.END)
        print(articles[i][0:240] + '...')
        
printParagraphWithContext(n,imp)



[1mgrzybica pochwa drożdżak intymny candida [0m
 Grzybicę pochwy zwana także drożdżycą choć raz w życiu miała co czwarta kobieta.
  Rzadziej grzyby atakują miejsca intymne mężczyzn.
  Choroba może się rozwijać, mimo że dbamy o higienę intymną.
  Niestety, grzybica pochwy ma też tendencję...


[1mtłuszcz węglowodan energia glukoza żywienie [0m
 Genotyp człowieka został ukształtowany w czasach paleolitu, a nasi przodkowie żywili się jedynie tym, co upolowali, zebrali albo wygrzebali z ziemi, stąd podstawowym składnikiem ich pożywienia było mięso różnego rodzaju wraz z tłuszczem.
 ...


[1mrak chirurgiczny interwencja przeżywalność chemioterapia [0m
 Medycyna jest bardzo dumna z rygorystycznych metod badawczych stanowiących podstawę leczenia raka.
  Jeśli u kogoś zdiagnozowano raka, osoba ta z miejsca staje przed ogromnym naciskiem ze strony systemu ochrony zdrowia, który wymusza na ni...


[1mwodorowęglan pH sód łyżeczka cez [0m
 Termin ’’wysokie pH’’ oznacza "silnie alkaliczny

## Module 2: WordNet & Hyperonymy (meaning aggregates)

### plWordNet XML parser

In [3]:
import xml.etree.ElementTree as ET
import pickle

### Load WNet XML to the parser
tree = pickle.load(open('plwntree.dump', 'rb'))
PATH_TO_WN = 'plwntree.dump'

# For the first run -->

# tree = ET.parse('plwordnet-4.0.xml')
# pickle.dump(tree, open('plwntree.dump', 'w'))


### Load lexical unit <-> sysnet mapping in Python readable format
synunitmap = pickle.load(open('synunitmap.dump', 'rb'))

# for the first run -->

# synunitmap = synsetUnitMapping() # for the first run
# pickle.dump(synunitmap, open('synunitmap.dump', 'wb'))


root = tree.getroot()

# def synsetUnitMapping(root=root):
#     synsets = dict()
#     for child in root.iter():
#         if child.tag == "synset":
#             synset_id = child.attrib['id']
#             unit_list = list(child.findall("unit-id"))
#             synsets[synset_id] = [uid.text for uid in unit_list]
            
#     return synsets

# def printNFirstMappings(n=100, synunitmap=synunitmap):
#     from heapq import nlargest

#     for key in nlargest(10, synunitmap, key=synunitmap.get):
#         print(key, synunitmap[key])
    
# def wordFromId(word_id):
#     for child in root.findall('lexical-unit'):
#         if child.attrib['id'] == word_id:
#             return child.attrib['name']
#     raise ValueError("No such lexical unit ID in plWordNet")
                        
    
# def idFromWord(word):
#     for child in root.findall('lexical-unit'):
#         if child.attrib['name'] == word:
#             return child.attrib['id']
#     raise ValueError("No such lexical unit in plWordNet")
    

# def synsetsForWord(word='', synunitmap = synunitmap, word_id='', tagtype='name'):
#     ''' 
#     Find synset for a word (given by id or name).
#     The loop iterates through synset - lex. unit mapping.
#     '''
#     if tagtype == 'name':
#         word_id = idFromWord(word)
    
#     synsets = []
#     for s in synunitmap.keys():
#         if word_id in synunitmap[s]:
#             synsets.append(s)
    
#     return synsets


# def getHyponymsFromWord(word, synunitmap = synunitmap):
#     synsets_for_word = synsetsForWord(word=word)
#     hypo_synsets = []
    
#     for child in root.findall('synsetrelations'):
#         if child.attrib['relation'] in ['11', '211'] and child.attrib['parent'] in synsets_for_word:
#             hypo_synsets.append(child.attrib['child'])
    
#     hyponyms = []
#     for s in hypo_synsets:
#         hyponyms = list(set().union(hyponyms,synunitmap[s]))
    
#     return [wordFromId(word_id) for word_id in hyponyms]


In [106]:
getHyponymsFromWord('objaw chorobowy')

['ostry brzuch',
 'hiperprolaktynemia',
 'anhedonia',
 'zespół suchego oka',
 'abulia',
 'leukocytoza',
 'kulawizna',
 'upośledzenie',
 'ambitendencja',
 'objaw Aschaffenburga',
 'biegunka',
 'zmiana chorobowa',
 'alalia',
 'swędzenie',
 'wytrzeszcz złośliwy',
 'eozynofilia',
 'nosicielstwo',
 'autoskopia',
 'perseweracja',
 'wstrząs',
 'puchlina wodna',
 'rozwolnienie',
 'bielmo',
 'azoospermia',
 'entropium',
 'mioza',
 'niedokrwienie',
 'kwasica',
 'leukokoria',
 'wzdęcie',
 'nadciśnienie',
 'męczliwość',
 'bakteriomocz',
 'słowotok',
 'aura',
 'bezmocz',
 'ektropion',
 'odrętwienie',
 'paroksyzm',
 'światłowstręt',
 'inkoherencja',
 'wodogłowie',
 'afonia',
 'koprolalia',
 'ruptura',
 'gorączka',
 'pasma Meesa',
 'małopłytkowość',
 'schizofazja',
 'skąpomocz',
 'stawy Charcota',
 'leukopenia',
 'zawał',
 'ciągotka',
 'bakteriuria',
 'chloroza',
 'stan spastyczny',
 'objaw zwiastunowy',
 'chrypa',
 'majaczenie',
 'palpitacja',
 'bezwład',
 'hipertrofia',
 'oftalmoplegia',
 'skleroza

## Load sentences and visualize then in a window

In [17]:
import pickle

### Load

In [138]:
'''
    Load sentences as a list of dicts:
    [
        ...,
        { 'body': 'sentence body',
          'contextual_rate': 1,
          'uncontextual_rate': -1,
          'article_id': 10,
          'position_in_article': 3},
        ...
    ]
'''
SENTENCES = pickle.load(open('sentences_dict.dump', 'rb'))

### Visualize

In [166]:
LEFT_WINDOW_SIZE = 2
RIGHT_WINDOW_SIZE = 1

def is_inassessible(sent):
    return sent['uncontextual_rate'] == '-1'
        
def get_article(art_id, padding, sentences=SENTENCES):
    art = []
    for sent in sentences:
        if sent['article_id'] == art_id:
            art.append(sent['body'])
            
    return ['']*padding + art + ['']*padding
                
def getSentWithWindow(sent, lw=3, rw=1, sentences=SENTENCES):
    pos = sent['position_in_article']
    padding = max(lw, rw)
    begin = pos - lw + padding
    end = pos + rw + padding
    art = get_article(sent['article_id'], padding)
    res = [color.BOLD + s + color.END if art.index(s) + 1 - padding == pos else s for s in art[begin:end]]
    
    return res

def getContext(sent, sentences=SENTENCES):
    sent_with_window = getSentWithWindow(sent)
    only_context = []
    for s in sent_with_window:
        if '\033[1m' not in s:
            only_context.append(s)
    return only_context
    

### Get inassessable sentences

In [168]:
def getInassessibleSentences(sentences=sentences):
    inass = []
    for sent in sentences:
        if is_inassessible(sent):
            inass.append(sent)
    return inass

inassessible = getInassessibleSentences()

# Save context paragraphs in a corresponding directory

# for i, sent in enumerate(inassessible):
#     paragraph = " ".join(getSentWithWindow(sent)).replace('\033[1m', '').replace('\033[0m', '')
#     filename = str(i) + ".txt"
#     f = open( os.path.join('paragraphs', filename), 'w')
#     f.write(paragraph)

# Print paragraphs

for i, sent in enumerate(inassessible):
    context_window = getSentWithWindow(sent)
    for s in context_window:
        print(s)
    print('\n')

 Według autora pracy zamieszczonej na łamach pisma "Ultrasound", traktowanie tego badania jako głównego wskaźnika wad genetycznych skutkuje utratą wielu prawidłowych ciąż.
 Doktor Hylton Meire, autor publikacji, rozważa, czy badanie ultrasonograficzne jest aż tak wiarygodne, jak się powszechnie przyjmuje.
[1m Głównym przedmiotem wątpliwości naukowca jest brak danych naukowych na temat wykonywania pomiaru przezierności karku płodu jako rutynowego testu przesiewowego na obecność wad genetycznych, zwłaszcza zespołu Downa.[0m
 Badanie przezierności karku jest wykonywane podczas USG położniczego pomiędzy 10 a 14 tygodniem ciąży.


 Głównym przedmiotem wątpliwości naukowca jest brak danych naukowych na temat wykonywania pomiaru przezierności karku płodu jako rutynowego testu przesiewowego na obecność wad genetycznych, zwłaszcza zespołu Downa.
 Badanie przezierności karku jest wykonywane podczas USG położniczego pomiędzy 10 a 14 tygodniem ciąży.
[1m Mierzy się ilość płynu zbierającego się 

 Wszyscy skupiają się wyłącznie na szczepionkach, ponieważ autyzm często pokazuje się dopiero po rozpoczęciu rutynowego programu szczepień.
 Zdrowe dziecko do tego czasu wygląda na zdrowe.
[1m Rozmyślnie używam słowo „wygląda”.[0m
 Jak wskazałem w ostatnim biuletynie, że Kuba, która ma wskaźnik szczepień około 95% (jeden z najwyższych na świecie), wciąż ma bardzo mało przypadków autyzmu, w porównaniu z Europą czy USA.


 Na podstawie tych badań prof. Ruo Feng z Nanjing University, w 2000 opublikował takie wytyczne: „Komercyjne lub edukacyjne obrazowanie płodu przez USG powinno być ściśle eliminowane.
 USG do identyfikacji płci płodu i obrazowania położenia płodu powinno się ściśle eliminować.
[1m Dla najlepszej wczesnej ciąży unikać USG„.[0m
 Dr Feng mówi bardzo wyraźnie: unikać – to nie wyraz dwuznaczny! Książka Jima Westa The Chinese Human Studies nie jest dostępna na rynku.


 Dr Feng mówi bardzo wyraźnie: unikać – to nie wyraz dwuznaczny! Książka Jima Westa The Chinese Human St

 Czułam się, jakbym wracała z wojny, choć na wojnie nigdy nie byłam.
 Jakby zeszło ze mnie całe powietrze! Reakcje naszego organizmu na takie emocje są nieprzewidywalne, więc warto, by był ktoś kto poda rękę.
[1m Kto postawi nas do pionu! Na badanie nie trzeba się w żaden inny niż psychiczny sposób przygotowywać.[0m
 A potem przetrwać brutalny okres oczekiwania, który minimalnie wynosi 2 tygodnie.


 Jakby zeszło ze mnie całe powietrze! Reakcje naszego organizmu na takie emocje są nieprzewidywalne, więc warto, by był ktoś kto poda rękę.
 Kto postawi nas do pionu! Na badanie nie trzeba się w żaden inny niż psychiczny sposób przygotowywać.
[1m A potem przetrwać brutalny okres oczekiwania, który minimalnie wynosi 2 tygodnie.[0m
 Jeśli chcemy otrzymać wyniki szybciej można pokusić się o placówkę, która bada materiał metodą FISH-a, ale trzeba pamiętać, że nie każdą próbkę można tak badać.


 To oceni osoba przyjmująca od nas materiał.
 No i jest to już opcja płatna.
[1m Wyniki jednak m


 Sprawdź w naszej galerii, jakie są objawy cukrzycy.
 Jak się przed nią bronić? Zmianą stylu życia.
[1m W tym może ci pomóc aplikacja Asystent Zdrowego Żywienia, którą przygotowali eksperci IŻŻ.[0m
 Permanentne zmęczenie Cukrzyca to choroba metaboliczna, w przebiegu której we krwi utrzymuje się podwyższony poziom cukru.


 Permanentne zmęczenie Cukrzyca to choroba metaboliczna, w przebiegu której we krwi utrzymuje się podwyższony poziom cukru.
 Do niedawna lekarze wyróżniali dwa typy cukrzycy: 1 i 2.
[1m Pierwszy, gdy organizm niszczy komórki trzustki tak, że nie produkuje ona insuliny.[0m
 Drugi charakteryzujący się nie niedoborem insuliny, tylko brakiem wrażliwości komórek organizmu na jej działanie.


 Do niedawna lekarze wyróżniali dwa typy cukrzycy: 1 i 2.
 Pierwszy, gdy organizm niszczy komórki trzustki tak, że nie produkuje ona insuliny.
[1m Drugi charakteryzujący się nie niedoborem insuliny, tylko brakiem wrażliwości komórek organizmu na jej działanie.[0m
 Według najnows

 Pierwsze objawy HIV są zwykle niespecyficzne i mogą przypominać grypę lub zwykłe przeziębienie.


 Pierwsze objawy HIV są zwykle niespecyficzne i mogą przypominać grypę lub zwykłe przeziębienie.
 Jak rozpoznać pierwsze objawy HIV i AIDS? HIV to wirus upośledzenia odporności, który uszkadza układ immunologiczny człowieka.
[1m Po wniknięciu do organizmu atakuje pewne typy białych ciałek krwi.[0m
 W ten sposób powoli wyniszcza układ odpornościowy chorego.


 Po wniknięciu do organizmu atakuje pewne typy białych ciałek krwi.
 W ten sposób powoli wyniszcza układ odpornościowy chorego.
[1m W efekcie organizm staje się bezbronny nawet wobec pozornie niegroźnych infekcji, z którymi kiedyś radził sobie bez problemu.[0m
 Stan bezbronności immunologicznej organizmu to AIDS - zespół nabytego niedoboru odporności.


 W efekcie organizm staje się bezbronny nawet wobec pozornie niegroźnych infekcji, z którymi kiedyś radził sobie bez problemu.
 Stan bezbronności immunologicznej organizmu to AIDS 

 Uwaga: Jeśli dziecko źle się czuje po podaniu szczepionki, ma gorączkę lub inne poważnie niepożądane odczyny poszczepienne, koniecznie skontaktuj się z lekarzem.




[1m ﻿Nasza wiedza na temat leków przeciwbólowych jest powierzchowna, oparta na niedoskonałych źródłach informacji.[0m
 Właśnie z tego powodu możemy być dla siebie niebezpieczni, wybierając nieświadomie lek zgodnie z zasadą na dwoje babka wróżyła - mówi neurolog, dr n. med. Monika Białecka.


 Jak zatem korzystać z leków, żeby sobie nie szkodzić? Zarówno paracetamol jak i alkohol przetwarzane są w wątrobie przez te same enzymy.
 Jeśli zastosujemy preparat z paracetamolem, kiedy w naszym organizmie znajduje się jeszcze wysokie stężenie alkoholu, dodatkowo obciążamy wątrobę i możemy doprowadzić do jej uszkodzenia przez toksyczne metabolity leku.
[1m W tym wypadku lepiej byłoby sięgnąć po preparat np. z ibuprofenem.[0m
 Wiele osób podaje dzieciom leki przeciwbólowe przeznaczone wyłącznie dla dorosłych.


 W tym wypadku le

 W chromosomach znajdują się spiralnie zwinięte nici DNA, które są nośnikami kodu genetycznego dotyczącego budowy całego organizmu.


 Również matka, która jest nosicielką nieprawidłowych genów, choć sama zdrowa, może dziedziczną chorobę przekazać swemu potomstwu (tak jest m.in. w przypadku hemofilii, a także dystrofii mięśni Duchenne’a).
 Choroby genetyczne są przekazywane z pokolenia na pokolenie.
[1m Zawsze jednak musi być „ten pierwszy raz”.[0m
 U płodu schorzenie może powstać nagle, na skutek zaburzeń w mechanizmach przekazywania cech dziedzicznych.



 ﻿Na początek świetna wiadomość – nowoczesne leki całkowicie eliminują wirusowe zapalenie wątroby typu C.
[1m Co więcej, działają znacznie szybciej od obecnie stosowanych specyfików oraz nie mają skutków ubocznych.[0m
 Wirus niełatwy w wykryciu Wirusowe zapalenie wątroby typu C to cichy zabójca – wiele osób nie wie, że choruje, dopóki nie dozna uszkodzenia wątroby, co może potrwać wiele lat.


 Wirus niełatwy w wykryciu Wirusowe

 Pobrany w ten sposób materiał genetyczny można dokładnie ocenić i ostatecznie wykluczyć lub potwierdzić wadę.
 Badania te niosą jednak za sobą pewne ryzyko utraty ciąży.
[1m Nie należy ich więc robić, gdy prawdopodobieństwo wystąpienia wady jest minimalne.[0m
 Nieinwazyjne badania prenatalne: Test PAPP-A (połączony) - polega na ocenie stężenia białka PAPP-A oraz beta hCG.


 Nie należy ich więc robić, gdy prawdopodobieństwo wystąpienia wady jest minimalne.
 Nieinwazyjne badania prenatalne: Test PAPP-A (połączony) - polega na ocenie stężenia białka PAPP-A oraz beta hCG.
[1m Pozwala ocenić ryzyko wystąpienia zespołu Downa, zespołu Edwardsa i zespołu Patau.[0m
 Test przeprowadza się między 10. a 14. tygodniem ciąży.


 Nieinwazyjne badania prenatalne: Test PAPP-A (połączony) - polega na ocenie stężenia białka PAPP-A oraz beta hCG.
 Pozwala ocenić ryzyko wystąpienia zespołu Downa, zespołu Edwardsa i zespołu Patau.
[1m Test przeprowadza się między 10. a 14. tygodniem ciąży.[0m
 Do ba


 Wywar powinien się zaparzyć.
 Następnie przelej go do ciemnej buteleczki.
[1m Tak przyrządzonym wywarem przecieraj pęknięcia kącików ust jak najczęściej.[0m



 Niektóre związki zawarte w owocach i warzywach, a także algach, są fitoaktywne.
 Do takich substancji należą polifenole, które – mimo że w układzie pokarmowym nie ulegają trawieniu – korzystnie wpływają na funkcjonowanie organizmu, a tym samym na nasze zdrowie.
[1m Produkty żywnościowe zawierające te ważne dla ciała składniki często określane są mianem superżywności, czyli żywności, która leczy.[0m
 Zalety spożywania superżywności Warto na początku dodać, że mówiąc o superżywności, nie chodzi nam o suplementy wielowitaminowe czy wyciągi z egzotycznych roślin.


 Superżywność zawiera tak wiele ochronnych i zwiększających energię składników, że jedzenie ich przynosi większe korzyści niż zażywanie suplementów witaminowych.
 Najwspanialszą jej cechą jest naturalny bilans składników odżywczych, związków fitochemicznych i błonn

 Oznacza to, że u chorych z łagodnym lub umiarkowanym przebiegiem choroby, trwającym krócej niż 7-10 dni, można zastosować strategię czujnej obserwacji.
 Antybiotyk podaje się w przypadku nadkażenia bakteryjnego lub gdy objawy trwają powyżej 10 dni albo po pięciu dniach, gdy stan kliniczny chorego pogarsza się zamiast się poprawiać.
[1m „Najczęstsze błędy są takie same, jak w OZUŚ.[0m
 Leczenie jest również bardzo podobne jak w ostrym zapaleniu ucha środkowego.


 Antybiotyk podaje się w przypadku nadkażenia bakteryjnego lub gdy objawy trwają powyżej 10 dni albo po pięciu dniach, gdy stan kliniczny chorego pogarsza się zamiast się poprawiać.
 „Najczęstsze błędy są takie same, jak w OZUŚ.
[1m Leczenie jest również bardzo podobne jak w ostrym zapaleniu ucha środkowego.[0m
 Antybiotykiem z wyboru w leczeniu bakteryjnego OZNZ jest amoksycylina” — mówi dr hab. Piotr Albrecht.


 Nie zaleca się rutynowego stosowania antybiotyku w ostrym zapaleniu oskrzeli lub oskrzelików.
 Przy kaszlu pr

 Uszkodzenie flory bakteryjnej jelit skutkuje m.in. nieprawidłowym rytmem wypróżnień (zaparcia lub biegunki), nadmiernie cuchnącymi stolcami, wzdęciami i bólem brzucha, zaburzoną syntezą i wchłanianiem witamin (np. z grupy B) i minerałów, utratą energii do działania i aktywności fizycznej (również wskutek anemii), osłabieniem odporności organizmu - dzięki łatwiejszemu wnikaniu drobnoustrojów chorobotwórczych.
 Z uwagi na fakt, że układ pokarmowy jest systemem bardzo złożonym i wpływającym na pracę całego organizmu, wachlarz prawdopodobnych objawów niewłaściwej flory jelitowej jest ogromny i należy brać to pod uwagę w przypadku nie znalezienia innej przyczyny obserwowanych objawów.
[1m Dla odbudowy prawidłowej flory bakteryjnej kluczowym jest unikanie czynników ją uszkadzających wymieniony powyżej, a także odpowiednia dieta, wprowadzające te bakterie do układu pokarmowego i sprzyjająca ich rozwojowi.[0m
 Dlatego osobom z dysbakteriozą jelitową poleca się produkty mleczne takie jak kef

[1m Kobieta w głębi duszy musi czuć i być do tego przekonana.[0m
 Ona sama wie, co dla niej i jej rodziny jest najlepsze.


 20 lat temu było dostępnych 32 miliony dawek szczepionek, dzisiaj tylko w USA jest ich 135 mln.
 Głównym argumentem zwolenników szczepień jest ryzyko poważnych powikłań, które mogą spowodować śmierć, zwłaszcza u osób starszych i osób cierpiących na choroby przewlekłe.
[1m Co mówi na ten temat naukowiec Peter Doshi? „To nie jest prawdą.[0m
 Badania nad szczepieniami ludzi chorych nie stwierdziły spadku zgonów.


 Dla większości ludzi, a być może większości lekarzy, urzędnicy muszą tylko stwierdzić: szczepionki ratują życie.
 Takie założenie powinno być potwierdzone badaniami.
[1m Niestety, tak nie jest”.[0m
 Naukowiec potwierdza swój wywód australijskimi badaniami.


 „Rząd mówi, że każde dziecko w wieku powyżej sześciu miesięcy powinno być zaszczepione, a wiedzą dokładnie, że szczepionka zawiera dawkę rtęci, która jest toksyczna dla mózgu”, mówi Dr Blaylock

 Dodatkowo rozróżnianie witaminy C lewo i prawoskrętnej nie ma żadnego sensu.
 Rzeczywiście kwas askorbinowy może występować jeszcze jako kwas D-askorbinowy.
[1m Jednak nie jest on witaminą C.[0m
 Wynika to z tego, że inna struktura przestrzenna cząsteczki powoduje, że nie pasuje ona do enzymów, transporterów, receptorów białkowych itd.


 Jednak nie jest on witaminą C.
 Wynika to z tego, że inna struktura przestrzenna cząsteczki powoduje, że nie pasuje ona do enzymów, transporterów, receptorów białkowych itd.
[1m w naszym ciele (i przy okazji wszystkich innych istot żywych na tej planecie).[0m
 Przez to ma tylko ułamek aktywności witaminy C, głównie funkcje antyoksydacyjne – wolne rodniki reagują z kwasem askorbinowym niezależnie od jego struktury przestrzennej.


 Wynika to z tego, że inna struktura przestrzenna cząsteczki powoduje, że nie pasuje ona do enzymów, transporterów, receptorów białkowych itd.
 w naszym ciele (i przy okazji wszystkich innych istot żywych na tej planecie

 60-100 sztuk wyłuskanych pestek z dyni należy zjeść od razu jako jeden posiłek.
 Można je wymieszać z powidłami śliwkowymi.
[1m Po 2 godzinach użyć gorzkiej soli albo oleju rycynowego na przeczyszczenie.[0m
 Kurację powtórzyć jeszcze dwa razy w odstępie 8 dni od wydalenia głowy tasiemca.


 Można je wymieszać z powidłami śliwkowymi.
 Po 2 godzinach użyć gorzkiej soli albo oleju rycynowego na przeczyszczenie.
[1m Kurację powtórzyć jeszcze dwa razy w odstępie 8 dni od wydalenia głowy tasiemca.[0m
 60-80 łuskanych pestek dyni utrzeć w moździerzu z odrobiną wody i cukru.


 Kurację powtórzyć jeszcze dwa razy w odstępie 8 dni od wydalenia głowy tasiemca.
 60-80 łuskanych pestek dyni utrzeć w moździerzu z odrobiną wody i cukru.
[1m Z otrzymanej masy zrobić 3 kulki i zjeść je na czczo.[0m
 Po 5 godzinach wypić 1 łyżkę oliwy z oliwek.


 60-80 łuskanych pestek dyni utrzeć w moździerzu z odrobiną wody i cukru.
 Z otrzymanej masy zrobić 3 kulki i zjeść je na czczo.
[1m Po 5 godzinach wyp

 Pijemy z wierzchniej warstwy wody, ponieważ na dnie naczynia gromadzi się osad.
 Związki krzemu tworzą koloidy, które przyciągają zanieczyszczenia osadzające się na dnie.
[1m Kamienie kupujemy w sklepach ze zdrową żywnością.[0m
 Można je używać kilka miesięcy.


 Związki krzemu tworzą koloidy, które przyciągają zanieczyszczenia osadzające się na dnie.
 Kamienie kupujemy w sklepach ze zdrową żywnością.
[1m Można je używać kilka miesięcy.[0m



 Mleko matki jak antybiotyk Eksperci nie mają wątpliwości, że antybiotykooporność to jeden z najpoważniejszych problemów współczesności.
 Bakterie stały się oporne na działanie antybiotyków, przez co coraz trudniej z nimi walczyć.
[1m Określa się je mianem „superbakterii” i szacuje, że są przyczyną około 700 tysięcy zgonów rocznie na całym świecie.[0m
 Przełomowego odkrycia dokonali brytyjscy naukowcy z National Physical Laboratory w Londynie.


 Określa się je mianem „superbakterii” i szacuje, że są przyczyną około 700 tysięcy zgonów roczn



  Łódzcy naukowcy opracowali metodę termicznego niszczenia rozsianych komórek nowotworowych z użyciem nanozasobników ferromagnetyka.
 Dzięki tej metodzie możliwe będzie niszczenie tylko komórek rakowych, nie uszkadzając zdrowych komórek- poinformowała politechnika Łódzka.
[1m Przy zastosowaniu tej metody przepływające w układzie krwionośnym nanorurki odnajdują guza nowotworowego zawierającego zdegenerowane komórki i się do nich przyczepiają.[0m
 Napromieniowanie tkanki falą elektromagnetyczną powoduje nagrzanie komórek nowotworowych powyżej temperatury ich apoptozy wywołując nekrozę, czyli śmierć komórek - mówił PAP współtwórca rozwiązania prof. Zbigniew Kołaciński z Instytutu Mechatroniki i Systemów Informatycznych Politechniki Łódzkiej.


 Prof. Kołaciński podkreślił, że naukowcy zajmujący się nanotechnologią wychodzą naprzeciw niedoskonałościom obecnie stosowanych metod leczenia raka - leczenia chirurgicznego, w przypadku którego pacjenci zgłaszają się do lekarza zbyt późno, dla

 – Zamknij na chwilę oczy.


 – Unikaj zadymionych pomieszczeń.
 – Regularnie nawilżaj oczy, wkraplając kropelki potocznie nazywane sztucznymi łzami.
[1m – Zamknij na chwilę oczy.[0m




 Dziś krótki wpis o substancji przeciwbólowej z grupy niesteroidowych leków przeciwzapalnych (NLPZ) takiej jak metamizol.
[1m Jest ona sprzedawana pod handlową nazwą „Pyralgina„.[0m
 Do jego napisania zainspirował mnie jeden z Czytelników i komentatorów mojej strony.


 Jest ona sprzedawana pod handlową nazwą „Pyralgina„.
 Do jego napisania zainspirował mnie jeden z Czytelników i komentatorów mojej strony.
[1m Na całym świecie panuje opinia, że jest to lek bardzo szkodliwy, i że należy go absolutnie wycofać z obrotu.[0m
 W USA jest on nielegalny, czasami jest pokątnie importowany z Meksyku.


 Do jego napisania zainspirował mnie jeden z Czytelników i komentatorów mojej strony.
 Na całym świecie panuje opinia, że jest to lek bardzo szkodliwy, i że należy go absolutnie wycofać z obrotu.
[1m W USA 

 Wykazały one,  że 100 procent pacjentów z faza I i II poddanych terapii Gersona przeżyło, podczas gdy tylko 79 procent poddanych terapii konwencjonalnej.
[1m W odniesieniu do przypadków w III fazie raka (z przerzutami w bliskim regionie) liczby te przedstawiały się odpowiednio: 70 procent i 41 procent, zaś z faza IV (przerzuty w rejonach odległych) - 39 procent przy stosowaniu terapii Gersona i 6 procent w przypadku terapii konwencjonalnej.[0m
 Wielu naturalnych terapeutów raka twierdzi, że w ponad 90 procentach przypadków udało się im odnieść sukces w zahamowaniu rozwoju raka, a nawet cofnięciu się go, ale tylko wtedy, gdy pacjenci nie byli wcześniej poddani terapii konwencjonalnej.


 W odniesieniu do przypadków w III fazie raka (z przerzutami w bliskim regionie) liczby te przedstawiały się odpowiednio: 70 procent i 41 procent, zaś z faza IV (przerzuty w rejonach odległych) - 39 procent przy stosowaniu terapii Gersona i 6 procent w przypadku terapii konwencjonalnej.
 Wielu natural

[1m Działają drażniąco na jelita, wątrobę i żołądek.[0m
 Spożywanie dużej ilości produktów bogatych w karmel może ponadto przyczynić się do nadpobudliwości psychoruchowej i negatywnie wpływać na płodność.


 Antybiotyk może być naprawdę groźny.
 Antybiotyki do niedawna wydawały się lekarzom i pacjentom lekami niespecjalnie szkodliwymi.
[1m Może dlatego zażywaliśmy je na niemal każdą dolegliwość.[0m
 Kłam stereotypowi zadał właśnie prof. Andrey Morgun z Oregon State University, który zbadał, w jaki sposób na długotrwały kontakt z antybiotykiem reaguje tkanka jelita.


 Antybiotyki do niedawna wydawały się lekarzom i pacjentom lekami niespecjalnie szkodliwymi.
 Może dlatego zażywaliśmy je na niemal każdą dolegliwość.
[1m Kłam stereotypowi zadał właśnie prof. Andrey Morgun z Oregon State University, który zbadał, w jaki sposób na długotrwały kontakt z antybiotykiem reaguje tkanka jelita.[0m
 W tym celu profesor podał myszom koktajl najpopularniejszych antybiotyków stosowanych u ludz

 Dlaczego? ALEKSANDRA NIEDZWIECKI: Szczególna waga naszych badań w dziedzinie raka polega na tym, że skoncentrowaliśmy się na badaniach metastazy – czyli procesu, który jest najniebezpieczniejszym stadium raka.
[1m Co więcej, nasze badania nad kontrolą raka ukierunkowane są na biologiczną regulację tego procesu przy pomocy naturalnych substancji.[0m
 Kierunek ten okazał się właściwy i opracowaliśmy specyficzny zestaw naturalnych składników odżywczych, który jest skuteczny w kontroli głównych mechanizmów raka.


 To, że rozpad tkanki otaczającej komórki raka jest niezbędny do migracji komórek i inwazji do innych organów, było znane już wcześniej.
 Myśmy wykazali, że specyficzny zestaw mikroelementów* pozwala kontrolować ten proces w sposób naturalny.
[1m Nie ma obecnie żadnej metody wykazującej tak skuteczne kompleksowe działanie.[0m
 Chyba nie jest to zaskoczenie, że prasa milczy.


 Myśmy wykazali, że specyficzny zestaw mikroelementów* pozwala kontrolować ten proces w sposób natur

 Antybiotyki uratowały i jeszcze uratują życie wielu osób.
[1m Jednak powinniśmy pamiętać o zagrożeniach, jakie wynikają z nadmiernego lub zbędnego ich stosowania.[0m
 Stosuj antybiotyk przy specjalnych okazjach, gdy Twoje zdrowie lub życie będzie zagrożone.


 Jednak powinniśmy pamiętać o zagrożeniach, jakie wynikają z nadmiernego lub zbędnego ich stosowania.
 Stosuj antybiotyk przy specjalnych okazjach, gdy Twoje zdrowie lub życie będzie zagrożone.
[1m Wówczas będziesz w stanie wykorzystać jego możliwości bakteriobójcze.[0m
 Wiedząc jakie spustoszenie w Twoim organizmie wywołuje, po kuracji antybiotykowej przywróć prawidłową florę jelitową, by utrzymać zdrowie na długie lata.


 Wówczas będziesz w stanie wykorzystać jego możliwości bakteriobójcze.
 Wiedząc jakie spustoszenie w Twoim organizmie wywołuje, po kuracji antybiotykowej przywróć prawidłową florę jelitową, by utrzymać zdrowie na długie lata.
[1m Virago na wirusy zamiast antybiotyków>>   1)  Bakterie jelitowe i ich  wpływ

 Otyłością prostą nazywamy nadwagę związaną ze stosowania niewłaściwej diety.
 Badania naukowe przeprowadzone na terenie USA wykazały, że od 1977 roku ilość otyłych osób wzrosła w tym kraju o 31%.
[1m Paradoksem jest to, że spożycie tłuszczów zmalało o 11%, a liczba osób spożywających produkty spożywcze wysokoprzetworzone i wysokowęglowodanowe wzrosła z 19 do 76%.[0m
 Wyniki tych badań dowodzą, że przyczyny tycia nie są uwarunkowane ilością spożywanych kalorii ale rodzajem pożywienia.


 Dawny sposób odżywiania składał się głównie z pokarmów o tzw. niskim indeksie glikemicznym, nie powodującym gwałtownego wzrostu stężenia glukozy (cukru) i poziomu insuliny we krwi.
 Na początku XX wieku ilość otyłych ludzi była znikoma.
[1m Ciekawe jest to, że występuje ona na terenie USA wśród ludzi najuboższych, preferujących styl jedzenia w fast food.[0m
 Ludzie bardziej zamożni wracają do spożywania bardziej naturalnych produktów.


 Ciekawe jest to, że występuje ona na terenie USA wśród ludzi 



 Ostatnio o witaminie C w leczeniu raka zrobiło się głośno w 2014 roku, kiedy naukowcy z Bostonu (USA) w czasopiśmie "Science Translational Medicine" opublikowali wyniki swoich badań dotyczące terapii raka tą witaminą.
 Określili je jako imponujące - tak bardzo, że wezwali rząd USA do natychmiastowego sfinansowania dalszych testów i badań na dużej grupie pacjentów.
[1m Ich zapędy studzą nie tylko onkolodzy, lecz także inni badacze, którzy testowali przeciwnowotworowe właściwości witaminy C.[0m
 Ci ostatni ustalili, że u pacjentów z niektórymi typami nowotworów leczenie witaminą C zamiast pomóc, może zaszkodzić.


 Określili je jako imponujące - tak bardzo, że wezwali rząd USA do natychmiastowego sfinansowania dalszych testów i badań na dużej grupie pacjentów.
 Ich zapędy studzą nie tylko onkolodzy, lecz także inni badacze, którzy testowali przeciwnowotworowe właściwości witaminy C.
[1m Ci ostatni ustalili, że u pacjentów z niektórymi typami nowotworów leczenie witaminą C zamiast p

[1m Są to owoce, które warto uzwględnić w codziennej diecie dr Budwig.[0m



  Ciężkie niedotlenienie okołoporodowe dotyczy szacunkowo jednego na tysiąc noworodków.
 Ale o niewielkim niedotlenieniu okołoporodowym noworodka słyszymy zdecydowanie częściej - na porodówce mówi się o nim niemal tak często jak o żółtaczce fizjologicznej, którą stwierdza się u prawie połowy zdrowych dzieci.
[1m Przeczytaj, skąd się bierze niedotlenienie okołoporodowe, czym skutkuje i jak można mu zapobiec oraz w jaki sposób leczyć.[0m
 Niedotlenienie okołoporodowe noworodka to prawdziwa zmora przyszłych mam, które obawiają się, że mimo prawidłowo przebiegającej ciąży, maksymalnej troski o zdrowie swoje i dziecka, coś na finiszu może się skomplikować i w zaledwie kilka minut doprowadzić do tego, że noworodek nie urodzi w pełni zdrowy.


 Niedotlenienie okołoporodowe noworodka to prawdziwa zmora przyszłych mam, które obawiają się, że mimo prawidłowo przebiegającej ciąży, maksymalnej troski o zdrowie swoje i

[1m Nie przeprowadzono odpowiednich badań, ale faktem jest, że w wyniku przeszczepu kału od osoby otyłej "obdarowany" utył i odwrotnie.[0m
 Dlatego dziś tak starannie dobiera się dawców.


 A co z przeszczepem z innych wskazań, np. w leczeniu otyłości? Faktycznie, pojawiają się takie pomysły, ale to wciąż medycyna alternatywna.
 Nie przeprowadzono odpowiednich badań, ale faktem jest, że w wyniku przeszczepu kału od osoby otyłej "obdarowany" utył i odwrotnie.
[1m Dlatego dziś tak starannie dobiera się dawców.[0m
 Jak? Dawca musi być zdrowy, przejść szereg badań na obecność wirusów wątroby, pasożytów, HIV czy bakterii patogennych.


 Dlatego dziś tak starannie dobiera się dawców.
 Jak? Dawca musi być zdrowy, przejść szereg badań na obecność wirusów wątroby, pasożytów, HIV czy bakterii patogennych.
[1m Powinien prawidłowo ważyć, a im więcej pacjent o nim wie, tym lepiej.[0m
 Często dawcami są krewni.


 To pozwala uniknąć odrzutu? Przeszczep kału nie wiąże się z ryzykiem odrzutu, bo

[1m W jednym badaniu wykazano że dawka 1100 IU dziennie, wraz z wapniem, zmniejszyła ryzyka wystąpienia raka o 60% ( 32 , 33 ).[0m
 Depresja: Badania wykazały że witamina D powoduje łagodną redukcję nasilenia objawów u osób z depresją ( 34 ).


 Cukrzyca typu 1: W jednym z badań stwierdzono że dawka 2000 IU witaminy D dziennie u niemowląt zmniejsza ryzyko wystąpienia cukrzycy typu 1 o 78% ( 35 ).
 Śmiertelność: Niektóre badania wykazały że suplementacja witaminy D zmniejsza ryzyko śmierci podczas pobytu w szpitalach, badaniach i diagnozowaniu lekarskim co oznacza że może pomóc żyć dłużej.
[1m To jest tylko wierzchołek góry lodowej.[0m
 Niski poziom witaminy D są związane z różnego rodzaju chorobami i suplementacja wykazała liczne korzyści dla zdrowia.


 Jaka dawka witaminy D3 będzie właściwa? Jedynym pewnym sposobem żeby to ustalić jest zbadanie poziomu pochodnej witaminy D: 25(OH)D w krwi.
 Badanie zmierzy formę przechowywania witaminy D - 25(OH)D.
[1m Obecnie uważa się że stęże



 Biorezonans jest metodą wymyśloną na początku XX w, związaną z filozofią medycyny chińskiej, a w szczególności akupresurą.
[1m Według osób stosujących ten rodzaj terapii może ona pomóc na pasożyty, bakterie, boreliozę, a nawet uzależnienia.[0m
 Biorezonansu, który nie jest metodą naukową, nie należy mylić z rezonansem magnetycznym – sprawdzonym badaniem szeroko wykorzystywanym w medycynie do diagnostyki i umożliwiającym uzyskiwanie wewnętrznych obrazów ciała.


 Konieczne jest trzymanie dwóch metalowych końcówek, które podłączone są do aparatury, podczas gdy przez ciało człowieka przepuszczany jest prąd o różnych częstotliwościach (ale niskim natężeniu).
 Można w tym czasie odczuwać nieprzyjemne mrowienie w rękach lub rozdrażnienie.
[1m Całość może być dość czasochłonna – może trwać nawet do dwóch godzin.[0m
 Długość badania zależy od rozległości problemów zdrowotnych.


 Całość może być dość czasochłonna – może trwać nawet do dwóch godzin.
 Długość badania zależy od rozległości

 Na co dzień możesz używać żeli do higieny intymnej, które posiadają pH zbliżone do odczynu miejsc intymnych (5,2-5,5).
 Używaj osobnego ręcznika do higieny intymnej Do mycia okolic intymnych nie używaj myjek ani gąbek, ponieważ są siedliskiem grzybów i bakterii.
[1m Najlepiej, aby do wycierania okolic intymnych używać jednorazowych, papierowych ręczników.[0m
 Jeśli jednak nie masz takiej możliwości, użyj bawełnianego, ale przeznaczonego tylko do tego celu.


 Używaj osobnego ręcznika do higieny intymnej Do mycia okolic intymnych nie używaj myjek ani gąbek, ponieważ są siedliskiem grzybów i bakterii.
 Najlepiej, aby do wycierania okolic intymnych używać jednorazowych, papierowych ręczników.
[1m Jeśli jednak nie masz takiej możliwości, użyj bawełnianego, ale przeznaczonego tylko do tego celu.[0m
 Dbaj, by zawsze był suchy (grzyby bardzo szybko rozmnażają się w wilgoci).


 Najlepiej, aby do wycierania okolic intymnych używać jednorazowych, papierowych ręczników.
 Jeśli jednak nie ma

# Terms from the corpus

In [84]:
import csv

def createListOfTerms(filename='terms.csv'):
    with open(filename) as terms:
        list_of_terms = list()
        csv_terms = csv.reader(terms, delimiter='\t')
        for row in csv_terms:
            list_of_terms.append(row)
        return list_of_terms
            
list_of_terms = createListOfTerms()

In [134]:
hyperonym_candidates = [term[2] for term in list_of_terms] # lemmatized terms list

# sentences_stemmed_tokenized = []
# for sent in inassessible:
#     sentences_stemmed_tokenized.append(' '.join(tokenize_and_stem(sent['body'])))

def getSentencesContainingHyperonymCandidate(sentences, hyperonym_candidates):
    sentences_with_hyperonym = set()
    for sent in sentences:
        sent_stemmed = ' '.join(tokenize_and_stem(sent['body']))
        for h in hyperonym_candidates:
            if h in sent_stemmed:
                sentences_with_hyperonym.add((sent['body'], sent['article_id'], sent['position_in_article']))
         
    return sentences_with_hyperonym

def getExpressionWithRelatedSentences(sentences, list_of_expressions):
    '''
    {
        'article_id': id artykułu, z którego pochodzi zdanie, które zawiera dany hiperonim
        'expression': wyrażenie
        'index': indeks stringa ZLEMATYZOWANEGO zdania, na którym występuje wyrażenie hiperonimiczne
        'pos_in_article': pozycja zdania w artykule (które to zdanie z kolei)
    }
    '''
    hyperonyms_with_related_sentences =[]
    for sent in sentences:
        sent_stemmed = ' '.join(tokenize_and_stem(sent['body']))
        for h in hyperonym_candidates:
            try:
                hyperonyms_with_related_sentences.append({
                    'article_id': sent['article_id'], 
                    'pos_in_article': sent['position_in_article'],
                    'expression': h,
                    'index': sent_stemmed.index(h)})
            except ValueError:
                pass
    
    return hyperonyms_with_related_sentences


sentences_with_aggregates = getSentencesContainingHyperonymCandidate(inassessible, hyperonym_candidates)
hyp_with_sents = getHyperonymsWithRelatedSentences(inassessible, hyperonym_candidates)

# TODO
# 
# Z sentences_dict pobieramy
# otoczenie zdania, znowu lematyzujemy/tokenizujemy i wybieramy kandydatów na hiponimy. 
#
# Pobieramy hiponimy kandydatów na hiperonimy ze słowosieci (depth=2).
# Znajdujemy przecięcie zbiorów hipo-kandydatów i kandydatów na hipo.

In [135]:
print(len(sentences_with_aggregates))
print(len(inassessible))
# sent_with_aggregates_list = list(sentences_with_aggregates)
# sent_with_aggregates_list[100:200]
hyp_with_sents

2662
3035


[{'article_id': '40\n',
  'hyperonym': 'zespół Down',
  'index': 177,
  'pos_in_article': 5},
 {'article_id': '40\n', 'hyperonym': 'rak', 'index': 43, 'pos_in_article': 5},
 {'article_id': '40\n',
  'hyperonym': 'test',
  'index': 123,
  'pos_in_article': 5},
 {'article_id': '40\n', 'hyperonym': 'D', 'index': 184, 'pos_in_article': 5},
 {'article_id': '40\n',
  'hyperonym': 'zespół',
  'index': 177,
  'pos_in_article': 5},
 {'article_id': '40\n',
  'hyperonym': 'płód',
  'index': 104,
  'pos_in_article': 5},
 {'article_id': '40\n',
  'hyperonym': 'naukowiec',
  'index': 28,
  'pos_in_article': 5},
 {'article_id': '40\n', 'hyperonym': 'brak', 'index': 42, 'pos_in_article': 5},
 {'article_id': '40\n', 'hyperonym': 'dana', 'index': 47, 'pos_in_article': 5},
 {'article_id': '40\n',
  'hyperonym': 'obecność',
  'index': 143,
  'pos_in_article': 5},
 {'article_id': '40\n',
  'hyperonym': 'przezierność kark',
  'index': 86,
  'pos_in_article': 5},
 {'article_id': '40\n',
  'hyperonym': 'dziec