Skip to content

Commit

Permalink
Merge branch 'develop'
Browse files Browse the repository at this point in the history
  • Loading branch information
malakhovks committed Dec 11, 2019
2 parents 4e86ac8 + d996f9b commit 650ce10
Show file tree
Hide file tree
Showing 4 changed files with 51 additions and 57 deletions.
10 changes: 8 additions & 2 deletions CHANGELOG.md
Original file line number Diff line number Diff line change
@@ -1,8 +1,15 @@
## v1.0.5, 2019-12-11

### 🔴 Виправлення помилок
- Виправлено помилку при нумерації в тегах `<relup>`/`<reldown>` файлу `allterms.xml`.
Нумерація в тегах `<relup>`/`<reldown>` файлу `allterms.xml` починається з `0`.
- Виправлення `JavaScript` на клієнті згідно нової нумерації в тегах `<relup>`/`<reldown>`, `<sentpos>` файлу `allterms.xml`.

## v1.0.4, 2019-12-10

### 🔴 Виправлення помилок

- Виправленол помилку при нумерації речень в `allterms.xml`. Нумерація речень в `allterms.xml` починається з `0`.
- Виправлено помилку при нумерації речень в тегу `<sentpos>` файлу `allterms.xml`. Нумерація речень в тегу `<sentpos>` файлу `allterms.xml` починається з `0`.
Для індексації речень з використанням `spaCy` (в цій бібліотеці відсутня індексація речень) за основу використано [приклад](https://stackoverflow.com/questions/58197863/how-to-get-sentence-number-in-spacy):
```python
for sent_i, sent in enumerate(doc.sents):
Expand All @@ -19,7 +26,6 @@
<title>Конспект (EN) - v1.0.4</title>
```


## v1.0.3, 2019-10-31

### ⚠️ Зауваження
Expand Down
52 changes: 20 additions & 32 deletions ken.py
Original file line number Diff line number Diff line change
Expand Up @@ -695,12 +695,10 @@ def get_terms_list():
# already exists in one_word_terms_help_list
if chunk.root.lemma_ in one_word_terms_help_list:

relup_index = 0
reldown_index = 0
sent_pos_helper = []

for one_term in exporterms_element.findall('term'):
relup_index+=1
for relup_index, one_term in enumerate(exporterms_element.findall('term')):

if one_term.find('tname').text == chunk.root.lemma_:

for sent_pos in one_term.findall('sentpos'):
Expand All @@ -727,16 +725,14 @@ def get_terms_list():
if t.pos_ in ['NOUN']:
if t.lemma_ in one_word_terms_help_list:

relup_index = 0
reldown_index = 0
sent_pos_helper = []
if t.i == 0:
index_helper = chunk.start+1
else:
index_helper = chunk.start+2

for one_term in exporterms_element.findall('term'):
relup_index+=1
for relup_index, one_term in enumerate(exporterms_element.findall('term')):

if one_term.find('tname').text == t.lemma_:

for sent_pos in one_term.findall('sentpos'):
Expand Down Expand Up @@ -792,12 +788,10 @@ def get_terms_list():
# add relup/reldown
if chunk.root.lemma_ in one_word_terms_help_list:

relup_index = 0
reldown_index = 0
sent_pos_helper = []

for one_term in exporterms_element.findall('term'):
relup_index+=1
for relup_index, one_term in enumerate(exporterms_element.findall('term')):

if one_term.find('tname').text == chunk.root.lemma_:

for sent_pos in one_term.findall('sentpos'):
Expand All @@ -814,8 +808,8 @@ def get_terms_list():
new_sentpos_element.text = str(sentence_index) + '/' + str(chunk.start+2)
one_term.append(new_sentpos_element)

for two_term in exporterms_element.findall('term'):
reldown_index+=1
for reldown_index, two_term in enumerate(exporterms_element.findall('term')):

# if two_term.find('tname').text == chunk.lower_:
if two_term.find('tname').text == chunk.lemma_:
new_relup_element = ET.Element('relup')
Expand Down Expand Up @@ -864,13 +858,11 @@ def get_terms_list():
# append to <exporterms>
exporterms_element.append(new_term_element)

relup_index = 0
reldown_index = 0
for one_term in exporterms_element.findall('term'):
relup_index+=1
for relup_index, one_term in enumerate(exporterms_element.findall('term')):

if one_term.find('tname').text == chunk.root.lemma_:
for two_term in exporterms_element.findall('term'):
reldown_index+=1
for reldown_index, two_term in enumerate(exporterms_element.findall('term')):

# if two_term.find('tname').text == chunk.lower_:
if two_term.find('tname').text == chunk.lemma_:
new_relup_element = ET.Element('relup')
Expand All @@ -888,20 +880,18 @@ def get_terms_list():

if t.lemma_ in one_word_terms_help_list:

relup_index = 0
reldown_index = 0
sent_pos_helper = []
if t.i == 0:
index_helper = chunk.start+1
else:
index_helper = chunk.start+2


for one_term in exporterms_element.findall('term'):
relup_index+=1
for relup_index, one_term in enumerate(exporterms_element.findall('term')):

if one_term.find('tname').text == t.lemma_:
for two_term in exporterms_element.findall('term'):
reldown_index+=1
for reldown_index, two_term in enumerate(exporterms_element.findall('term')):

# if two_term.find('tname').text == chunk.lower_:
if two_term.find('tname').text == chunk.lemma_:

Expand All @@ -924,8 +914,6 @@ def get_terms_list():

# print('if t.lemma_ not in one_word_terms_help_list ----->>>>>>' + t.lemma_)

relup_index = 0
reldown_index = 0
sent_pos_helper = []

if t.i == 0:
Expand Down Expand Up @@ -961,11 +949,11 @@ def get_terms_list():
# append to <exporterms>
exporterms_element.append(new_term_element)

for one_term in exporterms_element.findall('term'):
relup_index+=1
for relup_index, one_term in enumerate(exporterms_element.findall('term')):

if one_term.find('tname').text == t.lemma_:
for two_term in exporterms_element.findall('term'):
reldown_index+=1
for reldown_index, two_term in enumerate(exporterms_element.findall('term')):

# if two_term.find('tname').text == chunk.lower_:
if two_term.find('tname').text == chunk.lemma_:

Expand Down
Loading

0 comments on commit 650ce10

Please sign in to comment.