In [None]:
!pip install nltk



In [None]:
import pandas as pd
from textblob import TextBlob
import nltk
from nltk.sentiment.vader import SentimentIntensityAnalyzer

# Carregando a planilha de feedback
feedback = pd.read_excel('//content/feedbacks.xlsx')

# Verificando os primeiros registros
print("Primeiros registros:")
print(feedback.head())

# Verificando nomes das colunas
print("\nNomes das colunas:")
print(feedback.columns)

# Preencheendo valores ausentes na coluna de resposta
feedback['Resposta'].fillna('', inplace=True)

# Função para limpar a coluna 'Resposta'
def clean_response(response):
    response = response.replace('\n', ' ').replace('!', '').replace('!!', '')
    return response.strip()

# Aplicando a limpeza na coluna 'Resposta'
feedback['Resposta'] = feedback['Resposta'].apply(clean_response)

# Função para verificar se um valor é numérico
def is_numeric(value):
    try:
        float(value)
        return True
    except ValueError:
        return False

# Baixar os recursos necessários do nltk
nltk.download('vader_lexicon')

# Inicializar o analisador de sentimentos
sid = SentimentIntensityAnalyzer()

# Listas de palavras-chave
positive_keywords = [
    'excelente', 'parabéns', 'parabens', 'muito bom', 'ótimo', 'otimo', 'bom',
    'adorei', 'gostei', 'fantástico', 'maravilhoso', 'perfeito', 'excepcional',
    'incrível', 'sensacional', 'excelente trabalho', 'muito satisfeito', 'determinada', 'Pró ativa'
]
negative_keywords = [
    'melhorar', 'mas', 'ruim', 'abaixo', 'péssimo', 'terrível', 'horrível',
    'não gostei', 'detestei', 'insatisfatório', 'decepcionante', 'fraco',
    'péssima qualidade', 'problema', 'dificuldade', 'insatisfação', 'não funciona',
    'inadequado'
]

# Função para analisar o sentimento baseado no valor e no texto
def analyze_sentiment(resposta):
    if is_numeric(resposta):
        valor = float(resposta)
        if valor >= 3:
            return 'Feedback Positivo'
        else:
            return 'Feedback Negativo'
    else:
        resposta_lower = resposta.lower()
        # Verificar palavras-chave para feedback positivo e negativo
        if any(kw in resposta_lower for kw in positive_keywords):
            return 'Feedback Positivo'
        if any(kw in resposta_lower for kw in negative_keywords):
            return 'Feedback Negativo'

        # Usar VADER para análise de sentimentos
        vader_sentiment = sid.polarity_scores(resposta)
        if vader_sentiment['compound'] >= 0.05:
            return 'Feedback Positivo'
        elif vader_sentiment['compound'] <= -0.05:
            return 'Feedback Negativo'

        # Usar TextBlob para análise de sentimentos
        try:
            blob = TextBlob(resposta)
            translated = blob.translate(to='en') if blob.detect_language() != 'en' else blob
            sentiment = translated.sentiment.polarity
            if sentiment > 0:
                return 'Feedback Positivo'
            else:
                return 'Feedback Negativo'
        except:
            # Se a tradução falhar, considerar como negativo
            return 'Feedback Negativo'

# Aplicar a análise de sentimento
feedback['Sentimento'] = feedback['Resposta'].apply(analyze_sentiment)

# Verificar os primeiros registros com a classificação de sentimento
print("Primeiros registros com classificação de sentimento:")
print(feedback.head())

# Salvar os resultados em um novo arquivo CSV
feedback.to_excel('/content/feedback_com_sentimento.xlsx', index=False)


Primeiros registros:
        Data                           Funcionario  \
0 2021-04-24  24985D0E-9EDF-443D-BF33-CE5CD150100B   
1 2021-04-24  24985D0E-9EDF-443D-BF33-CE5CD150100B   
2 2021-04-24  24985D0E-9EDF-443D-BF33-CE5CD150100B   
3 2021-04-24  24985D0E-9EDF-443D-BF33-CE5CD150100B   
4 2021-04-24  24985D0E-9EDF-443D-BF33-CE5CD150100B   

                                                Item  \
0  Feedback estatístico: Como estão as estatístic...   
1  Descreva os principais pontos a se destacar (b...   
2  Atua de maneira dinâmica e proativa, atendendo...   
3  Como você classifica a performance do funcioná...   
4                           Feedback comportamental:   

                                            Resposta  \
0  Está dentro das categorias , porém com VM abai...   
1  Melhorar na sondagem e usar mais técnica de fe...   
2                                               2.00   
3                                               3.00   
4   \n Aproveitar melhor cada cliente

[nltk_data] Downloading package vader_lexicon to /root/nltk_data...


Primeiros registros com classificação de sentimento:
        Data                           Funcionario  \
0 2021-04-24  24985D0E-9EDF-443D-BF33-CE5CD150100B   
1 2021-04-24  24985D0E-9EDF-443D-BF33-CE5CD150100B   
2 2021-04-24  24985D0E-9EDF-443D-BF33-CE5CD150100B   
3 2021-04-24  24985D0E-9EDF-443D-BF33-CE5CD150100B   
4 2021-04-24  24985D0E-9EDF-443D-BF33-CE5CD150100B   

                                                Item  \
0  Feedback estatístico: Como estão as estatístic...   
1  Descreva os principais pontos a se destacar (b...   
2  Atua de maneira dinâmica e proativa, atendendo...   
3  Como você classifica a performance do funcioná...   
4                           Feedback comportamental:   

                                            Resposta  \
0  Está dentro das categorias , porém com VM abai...   
1  Melhorar na sondagem e usar mais técnica de fe...   
2                                               2.00   
3                                               3.00   
4  Ap

In [None]:
feedback_analise = pd.read_excel('/content/feedback_com_sentimento.xlsx')
feedback_analise.head(60)

Unnamed: 0,Data,Funcionario,Item,Resposta,CLI_CODIGO,Sentimento
0,2021-04-24,24985D0E-9EDF-443D-BF33-CE5CD150100B,Feedback estatístico: Como estão as estatístic...,"Está dentro das categorias , porém com VM abai...",00D509DB-8BE0-4ACE-A5AD-5BF37386995B,Feedback Negativo
1,2021-04-24,24985D0E-9EDF-443D-BF33-CE5CD150100B,Descreva os principais pontos a se destacar (b...,Melhorar na sondagem e usar mais técnica de fe...,00D509DB-8BE0-4ACE-A5AD-5BF37386995B,Feedback Negativo
2,2021-04-24,24985D0E-9EDF-443D-BF33-CE5CD150100B,"Atua de maneira dinâmica e proativa, atendendo...",2.00,00D509DB-8BE0-4ACE-A5AD-5BF37386995B,Feedback Negativo
3,2021-04-24,24985D0E-9EDF-443D-BF33-CE5CD150100B,Como você classifica a performance do funcioná...,3.00,00D509DB-8BE0-4ACE-A5AD-5BF37386995B,Feedback Positivo
4,2021-04-24,24985D0E-9EDF-443D-BF33-CE5CD150100B,Feedback comportamental:,Aproveitar melhor cada cliente acrescentando m...,00D509DB-8BE0-4ACE-A5AD-5BF37386995B,Feedback Negativo
5,2021-04-24,24985D0E-9EDF-443D-BF33-CE5CD150100B,Considerando a meta de 40% de novos orçamentos...,2.00,00D509DB-8BE0-4ACE-A5AD-5BF37386995B,Feedback Negativo
6,2021-04-24,21A46DC1-490D-4077-9038-8BF460B71751,Feedback estatístico: Como estão as estatístic...,Em todas as estatísticas estão muito abaixo,00D509DB-8BE0-4ACE-A5AD-5BF37386995B,Feedback Negativo
7,2021-04-24,21A46DC1-490D-4077-9038-8BF460B71751,Descreva os principais pontos a se destacar (b...,Destaco o comprometimento e empenho em cada at...,00D509DB-8BE0-4ACE-A5AD-5BF37386995B,Feedback Negativo
8,2021-04-24,21A46DC1-490D-4077-9038-8BF460B71751,"Atua de maneira dinâmica e proativa, atendendo...",2.00,00D509DB-8BE0-4ACE-A5AD-5BF37386995B,Feedback Negativo
9,2021-04-24,21A46DC1-490D-4077-9038-8BF460B71751,Feedback comportamental:,Ser mais proativa e otimista Reclamar menos ...,00D509DB-8BE0-4ACE-A5AD-5BF37386995B,Feedback Negativo


Esta análise de sentimentos realiza várias operações de processamento de dados e análise de sentimentos em um conjunto de feedbacks. Aqui está uma explicação de cada parte do código:

1. Importação de bibliotecas:
   - O código importa as bibliotecas pandas, TextBlob, nltk e SentimentIntensityAnalyzer do pacote nltk. Essas bibliotecas são usadas para manipulação de dados, análise de texto e análise de sentimentos.

2. Carregamento dos dados:
   - O código carrega um arquivo CSV contendo feedbacks em um DataFrame usando a função read_csv do pandas.

3. Verificação dos dados:
   - O código imprime os primeiros registros e os nomes das colunas do DataFrame para verificar a estrutura e conteúdo dos dados.

4. Limpeza dos dados:
   - O código preenche valores ausentes na coluna 'Resposta' com uma string vazia e aplica uma função clean_response para limpar o texto das respostas, removendo caracteres indesejados.

5. Análise de sentimentos:
   - O código define listas de palavras-chave associadas a feedbacks positivos e negativos.
   - O código inicializa um analisador de sentimentos (SentimentIntensityAnalyzer) do pacote nltk.
   - O código define uma função analyze_sentiment que analisa o sentimento com base no valor numérico e no texto da resposta.

No geral, este código realiza a leitura e limpeza de feedbacks, bem como a análise de sentimentos com base no conteúdo das respostas e em possíveis valores numéricos associados aos feedbacks. Ele utiliza bibliotecas como pandas, nltk e TextBlob para realizar essas operações.

In [1]:
# Data wrangling
import pandas as pd

# Data visualization
import matplotlib.pyplot as plt

# Preprocessing
from sklearn.preprocessing import StandardScaler, PowerTransformer, OrdinalEncoder, OneHotEncoder

# Models
from lightgbm import LGBMClassifier
from sklearn.dummy import DummyClassifier
from sklearn.linear_model import LogisticRegression, LogisticRegressionCV
from sklearn.ensemble import RandomForestClassifier, GradientBoostingClassifier

# Models Pipelines
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline

# Model evaluation
from sklearn import metrics
from sklearn.model_selection import train_test_split, GridSearchCV

# Save model
import pickle

# Set output as pandas
from sklearn import set_config
set_config(transform_output="pandas")

Dask dataframe query planning is disabled because dask-expr is not installed.

You can install it with `pip install dask[dataframe]` or `conda install dask`.
This will raise in a future version.

