# **Minerando Dados - A maior comunidade de Data Science do Brasil**
www.minerandodados.com.br

# Dicionários com Léxicos

* Os léxicos são bancos de dados criados manualmente ou de forma automatizada.
* A vantagem dos léxicos é que você não precisa rotular dados para treinamento.
* A maior desvantagem é que os léxicos são limitados a idioma e tamanho da base de dados.
* Existem léxicos voltados para áreas específicas como: **Linguística, Psicologia, Direito**.
* Você pode criar um léxico para o seu projeto, caso necessário.

** SentilexPT **

* O SentilexPT é um léxico para o idioma Português que está disponivel para pesquisa e desenvolvimento.
* Este possui **6531** adjetivos com informações de polaridade, alvo do sentimento e método de atribuição de polaridade.
* Conheça o projeto no site oficial http://xldb.fc.ul.pt/wiki/SentiLex-PT01

** Análise de Sentimentos - Aplicações:**

* Descobrir o Humor da Web com relação a sua marca ou algum produto.
* Automatizar a classificação quanto a opiniões positivas ou negativas.
* Empresas de call centers estão usando Análise de Sentimentos para analisar ligações telefônicas entre atendentes e clientes.
* Políticos que querem em saber sobre o Humor da web sobre seus pronunciamentos ou acontecimentos que os envolve.

**Ler o arquivo de léxico**

In [1]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [2]:
sentilexpt = open('/content/drive/My Drive/data-science-do-zero/mineracao_textos_materiais_de_apoio/SentiLex-PT01/SentiLex-flex-PT01.txt','r')

** Construindo um Dicionário de Palavras e Polaridades**

In [3]:
dic_palavra_polaridade = {}
for i in sentilexpt.readlines():
    pos_ponto = i.find('.')            # obtem a posiçãodo caracter ponto
    palavra = (i[:pos_ponto])          # Pega a palavra
    pol_pos = i.find('POL')            # obtem a posição do inicio da string POL
    polaridade = (i[pol_pos+4:pol_pos+6]).replace(';','')         # obtem a polaridade da palavra
    dic_palavra_polaridade[palavra] = polaridade                  # atualiza o dicionario com a palavra a polaridade

**Imprimindo o dicionário construído**

In [4]:
print (dic_palavra_polaridade)

{'\ufeffabafada,abafado': '-1', 'abafadas,abafado': '-1', 'abafado,abafado': '-1', 'abafados,abafado': '-1', 'abafante,abafante': '-1', 'abafantes,abafante': '-1', 'abaixada,abaixado': '-1', 'abaixadas,abaixado': '-1', 'abaixado,abaixado': '-1', 'abaixados,abaixado': '-1', 'abalada,abalado': '-1', 'abaladas,abalado': '-1', 'abalado,abalado': '-1', 'abalados,abalado': '-1', 'abalizada,abalizado': '1', 'abalizadas,abalizado': '1', 'abalizado,abalizado': '1', 'abalizados,abalizado': '1', 'abandalhada,abandalhado': '-1', 'abandalhadas,abandalhado': '-1', 'abandalhado,abandalhado': '-1', 'abandalhados,abandalhado': '-1', 'abandonada,abandonado': '-1', 'abandonadas,abandonado': '-1', 'abandonado,abandonado': '-1', 'abandonados,abandonado': '-1', 'abarcante,abarcante': '-1', 'abarcantes,abarcante': '-1', 'abarrotada,abarrotado': '-1', 'abarrotadas,abarrotado': '-1', 'abarrotado,abarrotado': '-1', 'abarrotados,abarrotado': '-1', 'abastada,abastado': '1', 'abastadas,abastado': '1', 'abastado,ab

**Consultando a polaridade de algumas palavras**

In [5]:
print (dic_palavra_polaridade.get('abusivo'))

None


In [6]:
print (dic_palavra_polaridade.get('sorridente'))

None


In [7]:
print (dic_palavra_polaridade.get('liberal'))

None


## Processando Frases - Bases de Dados

In [8]:
def Score_sentimento(frase):
    frase = frase.lower()                     # coloca toda a frase em minusculo
    l_sentimento = []                         # cria uma lista vazia
    for p in frase.split():
        l_sentimento.append(int(dic_palavra_polaridade.get(p, 0)))      # para cada palavra obtem a polaridade
    print (l_sentimento)                                                # imprime a lista de polaridades
    score = sum(l_sentimento)                                           # soma todos os valores da lista
    if score > 0:
        return 'Positivo, Score:{}'.format(score)                       # se maior que 0 retorna 'positivo'
    elif score == 0:
        return 'Neutro, Score:{}'.format(score)                         # se igual a 0 retorna 'neutro'
    else:
        return 'Negativo, Score:{}'.format(score)                       # se menor que 0 retorna 'negativo'

** Usando a função Score_sentimento**

In [9]:
Score_sentimento('Eu estou muito feliz hoje, porém, triste com a politica')

[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]


'Neutro, Score:0'

In [10]:
dic_palavra_polaridade.get('feliz')

In [11]:
Score_sentimento('Estou Muito Feliz hoje,super animado com o trabalho novo! :)')

[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]


'Neutro, Score:0'

In [16]:
print(dic_palavra_polaridade.get('animado'))

None


In [13]:
Score_sentimento('Estou muito triste, desanimado com algumas coisas')

[0, 0, 0, 0, 0, 0, 0]


'Neutro, Score:0'

In [15]:
print(dic_palavra_polaridade.get('triste'))

None


# **Minerando Dados - A maior comunidade de Data Science do Brasil**
www.minerandodados.com.br