Minerar os dados da proposta de cada candidato à presidente #4

llucasreis · 2018-09-03T12:43:18Z

As propostas de cada candidato estão disponíveis em um artigo web no site da globo. Deve-se minerar os dados de cada pdf dos candidatos e verificar a quantidade de citação de cada área (economia, saúde, tecnologia, etc).

To gather data to create a candidates' dataset, an algorithm was developed to acess all candidate's proposal. The pdf's files were saved to serve as a data provider along with the algorithm. See also: #4, #3

In order to create a candidate's dataset, it's necessary to collect/mining data about the candidates and then provide the data. This algorithm was developed only to provide the candidate's data to another code and then create the dataset. The algorithm is not completed yet, it's possible to have some changes. See also: #4, #3

llucasreis · 2018-09-21T03:18:20Z

update:

Verificar a possibilidade de utilizar TF/IDF para otimizar o grau de importância de cada candidato para cada área.

llucasreis · 2018-09-27T15:08:08Z

update:
A abordagem utilizando TF/IDF será realizado após a conclusão da issue #5

Add a new code to create a dataset for content-based filtering, The tf-idf's metrics was implemented to improve candidate's result. See also: #4

llucasreis · 2018-10-29T20:26:04Z

Situação final:

Dois algoritmos foram desenvolvidos a partir da mineração das propostas do candidato. O primeiro retorna o dicionário do candidato com base na contagem de termos das áreas citadas, e o segundo retorna o dicionário do candidato com a métrica TF/IDF.

Será feito uma algoritmo de recomendação que receberá os dados de data_provider.py e data_provider_2.py e irá fazer a filtragem baseada em conteúdo para recomendar candidatos.

llucasreis added the enhancement New feature or request label Sep 3, 2018

llucasreis added this to the setembro milestone Sep 3, 2018

llucasreis self-assigned this Sep 3, 2018

llucasreis mentioned this issue Sep 3, 2018

Desenvolver o primeiro Dataset + Filtragem Colaborativa #3

Closed

llucasreis mentioned this issue Sep 27, 2018

Aplicar a Filtragem Colaborativa a partir das avaliações de usuários #5

Closed

llucasreis modified the milestones: setembro, outubro Sep 27, 2018

llucasreis added a commit that referenced this issue Oct 29, 2018

feat: implement tf-idf's metrics

cf87b95

Add a new code to create a dataset for content-based filtering, The tf-idf's metrics was implemented to improve candidate's result. See also: #4

llucasreis closed this as completed Oct 29, 2018

llucasreis mentioned this issue Oct 29, 2018

Realizar a recomendação utilizando a filtragem baseada em conteúdo #7

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Minerar os dados da proposta de cada candidato à presidente #4

Minerar os dados da proposta de cada candidato à presidente #4

llucasreis commented Sep 3, 2018

llucasreis commented Sep 21, 2018 •

edited

Loading

llucasreis commented Sep 27, 2018

llucasreis commented Oct 29, 2018

Minerar os dados da proposta de cada candidato à presidente #4

Minerar os dados da proposta de cada candidato à presidente #4

Comments

llucasreis commented Sep 3, 2018

llucasreis commented Sep 21, 2018 • edited Loading

llucasreis commented Sep 27, 2018

llucasreis commented Oct 29, 2018

llucasreis commented Sep 21, 2018 •

edited

Loading