Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Провести аналитику для атрибутов решения #2

Open
MrsBadger opened this issue Oct 12, 2018 · 3 comments
Assignees
Labels
priority/high High issue priority type/idea Abstract concept of something new
Projects

Comments

@MrsBadger
Copy link

MrsBadger commented Oct 12, 2018

Idea proposal

В чём заключается идея

Исследование необходимо для понимания структуры решения: какие у него существуют атрибуты (например: номер, судьи, заключение и т.п.) и особенности, отличающие его от других документов. Это позволит упростить дальнейшие работы с ними.

Возможное решение

Создание wiki с подробным описанием структуры решения.

Дополнительный контекст или ссылки на связанные с данной задачей issues

@MrsBadger MrsBadger added type/idea Abstract concept of something new priority/high High issue priority labels Oct 12, 2018
@MrsBadger MrsBadger added this to To do in Research via automation Oct 12, 2018
@Vasar007 Vasar007 added the invalid This doesn't seem right label Oct 13, 2018
@Vasar007
Copy link
Member

@MrsBadger, вообще ничего не понятно, что нужно сделать, из описания issue. Стоит уточнить и переписать.

@Vasar007 Vasar007 changed the title Провести аналитику для атрибутов решения. Провести аналитику для атрибутов решения Oct 13, 2018
@Vasar007 Vasar007 removed the invalid This doesn't seem right label Oct 16, 2018
@Vasar007
Copy link
Member

Принял новые правки.

@Sasha-BabyBird
Copy link

Выполненная работа отражена в соответствующей ветке.
beginnings_list.txt - список всех начальных частей документов, содержащих дату и город, если они нашлись.
resolutions_list.txt - список всех резолютивных частей документов.
endings_list.txt - список всех концовок документов, в них содержится информация о судьях.
raw_dates.txt - список всех дат в том виде, в котором они записаны в тексте документов.
formatted_dates.txt - список всех дат в отформатированном виде.
docs-words_stats.txt - статистика встречаемости ключевых слов, после которых следует резолютивная часть.
weird-docs_list.txt - список "странных" документов, странность которых заключается в необычном числе ключевых слов. Включает и единственный "битый" файл.
links_in_beginnings.txt - список ссылок на другие решения КС РФ, расположенных в начальных частях решений КС РФ, вместе с долей по отношению к общему числу ссылок в документе. Как правило, это означает, что в документе запрашивается или указывается разъяснение другого документа.
links_in_resolution.txt - список ссылок на другие решения КС РФ, расположенных в резолютивных частях решений КС РФ, вместе с долей по отношению к общему числу ссылок в документе.
links_positions_stats.txt - статистика по доле ссылок, находящихся в разных частях документа, а также по судьям - встречаемость списков судей, главных судей и т.д.
research_results.txt - список всех документов, разделённых на атрибуты.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
priority/high High issue priority type/idea Abstract concept of something new
Projects
Research
  
In progress
Development

No branches or pull requests

4 participants