# **Dicionários com Léxicos**

* Os léxicos são bancos de dados criados manualmente ou de forma automatizada.
* A vantagem dos léxicos é que você não precisa rotular dados para treinamento.
* A maior desvantagem é que os léxicos são limitados a idioma e tamanho da base de dados.
* Existem léxicos voltados para áreas específicas como: **Linguística, Psicologia, Direito**.
* Você pode criar um léxico para o seu projeto, caso necessário.

**SentilexPT**

* O SentilexPT é um léxico para o idioma Português que está disponivel para pesquisa e desenvolvimento.
* Este possui **6531** adjetivos com informações de polaridade, alvo do sentimento e método de atribuição de polaridade.
* Conheça o projeto no site oficial http://xldb.fc.ul.pt/wiki/SentiLex-PT01

**Análise de Sentimentos - Aplicações:**

* Descobrir o Humor da Web com relação a sua marca ou algum produto.
* Automatizar a classificação quanto a opiniões positivas ou negativas.
* Empresas de call centers estão usando Análise de Sentimentos para analisar ligações telefônicas entre atendentes e clientes.
* Políticos que querem em saber sobre o Humor da web sobre seus pronunciamentos ou acontecimentos que os envolve.

**Ler o arquivo de léxico**

In [4]:
sentilexpt = open('SentiLex-lem-PT01.txt','r')

**Construindo um Dicionário de Palavras e Polaridades**

In [5]:
dic_palavra_polaridade = {}
for i in sentilexpt.readlines():
    pos_ponto = i.find('.')            # obtem a posiçãodo caracter ponto
    palavra = (i[:pos_ponto])          # Pega a palavra
    pol_pos = i.find('POL')            # obtem a posição do inicio da string POL
    polaridade = (i[pol_pos+4:pol_pos+6]).replace(';','')         # obtem a polaridade da palavra
    dic_palavra_polaridade[palavra] = polaridade                  # atualiza o dicionario com a palavra a polaridade

**Imprimindo o dicionário construído**

In [6]:
print (dic_palavra_polaridade)

{'\ufeffabafado': '-1', 'abafante': '-1', 'abaixado': '-1', 'abalado': '-1', 'abalizado': '1', 'abandalhado': '-1', 'abandonado': '-1', 'abarcante': '-1', 'abarrotado': '-1', 'abastado': '1', 'abastecido': '0', 'abatido': '-1', 'abelhudo': '-1', 'abençoado': '1', 'aberrante': '-1', 'aberrativo': '-1', 'aberto': '1', 'abespinhado': '-1', 'abestalhado': '-1', 'abilolado': '-1', 'abismado': '-1', 'abismal': '-1', 'abjecto': '-1', 'abjeto': '-1', 'abnegado': '1', 'abobado': '-1', 'abobalhado': '-1', 'abolicionista': '0', 'abolido': '-1', 'abominador': '-1', 'abominando': '-1', 'abominável': '-1', 'abonado': '1', 'abonatório': '1', 'abonecado': '0', 'aborígene': '-1', 'aborrecido': '-1', 'abortado': '-1', 'abraçado': '1', 'abrangente': '-1', 'abrangido': '-1', 'abrasileirado': '0', 'abrigado': '0', 'abrilhantado': '1', 'abrupto': '-1', 'abrutalhado': '-1', 'absentista': '-1', 'absolutista': '0', 'absoluto': '0', 'absolvido': '0', 'absorto': '-1', 'absorvente': '1', 'abstémico': '1', 'abstém

**Consultando a polaridade de algumas palavras**

In [7]:
print (dic_palavra_polaridade.get('abusivo'))

-1


In [8]:
print (dic_palavra_polaridade.get('sorridente'))

1


In [9]:
print (dic_palavra_polaridade.get('liberal'))

0


## **Processando Frases - Bases de Dados**

In [11]:
def Score_sentimento(frase):
    frase = frase.lower()                     # coloca toda a frase em minusculo
    l_sentimento = []                         # cria uma lista vazia
    for p in frase.split():
        l_sentimento.append(int(dic_palavra_polaridade.get(p, 0)))      # para cada palavra obtem a polaridade
    print (l_sentimento)                                                # imprime a lista de polaridades
    score = sum(l_sentimento)                                           # soma todos os valores da lista
    if score > 0:
        return 'Positivo, Score:{}'.format(score)                       # se maior que 0 retorna 'positivo'
    elif score == 0:
        return 'Neutro, Score:{}'.format(score)                         # se igual a 0 retorna 'neutro'
    else:
        return 'Negativo, Score:{}'.format(score)                       # se menor que 0 retorna 'negativo'

**Usando a função Score_sentimento**

In [12]:
Score_sentimento('Eu estou muito feliz hoje, porém, triste com a politica')

[0, 0, 0, 1, 0, 0, -1, 0, 0, 0]


'Neutro, Score:0'

In [13]:
dic_palavra_polaridade.get('feliz')

'1'

In [14]:
Score_sentimento('Estou Muito Feliz hoje,super animado com o trabalho novo! :)')

[0, 0, 1, 0, 1, 0, 0, 0, 0, 0]


'Positivo, Score:2'

In [15]:
dic_palavra_polaridade.get('animado')

'1'

In [16]:
Score_sentimento('Estou muito triste, desanimado com algumas coisas')

[0, 0, 0, -1, 0, 0, 0]


'Negativo, Score:-1'

In [None]:
dic_palavra_polaridade.get('triste')