<a href="https://colab.research.google.com/github/Latamila/Latamila/blob/main/keras_TFIDF.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import tensorflow as tf

In [None]:
import numpy as np

In [None]:
from tensorflow.keras import layers

In [None]:
data = [
    'Paguei o upgrade de cabine,'
    'o e-mail avisando só veio tarde da noite de domingo,'
    'embarquei na manhã de segunda-feira e tanto os comissários de terra quanto os de bordo da LATAM'
    'não me avisaram de que meu lance havia sido contemplado,'
    'demonstrando desorganização. Foi a primeira e espero que seja a última vez.'
]

In [None]:
layer = layers.TextVectorization()

In [None]:
layer.adapt(data)

In [None]:
vectorized_text = layer(data)

In [None]:
print(vectorized_text)

tf.Tensor(
[[21 22 11  2 38 33 41 15 10 13  6 23  2 34 24 27  2 18  5 14  4 37  2 12
  19  4  2 39  6 28 26 40  2  3 25 29 30 16 36 35 31  7 20  5 32  3 17  7
   8  9]], shape=(1, 50), dtype=int64)


#Além disso, as camadas adaptáveis ​​sempre expõem uma opção para definir o estado diretamente por meio de argumentos do construtor ou atribuição de peso. 
#Se os valores de estado pretendidos são conhecidos no tempo de construção da camada, ou são calculadas fora da adapt() chamada, que pode ser ajustado, 
#sem depender de computação interna da camada. Por exemplo, se arquivos de vocabulário externo para os TextVectorization , StringLookup , 
#ou IntegerLookup camadas já existem, aqueles que podem ser carregados diretamente nas tabelas de pesquisa por meio de um caminho para o arquivo 
#de vocabulário em argumentos do construtor da camada.

#Aqui está um exemplo em que instanciar um StringLookup camada com vocabulário pré-computados:

In [None]:
vocab = ["a", "b", "c", "d"]
data = tf.constant([["a", "c", "d"], ["d", "z", "b"]])
layer = layers.StringLookup(vocabulary=vocab)
vectorized_data = layer(data)
print(vectorized_data)


tf.Tensor(
[[1 3 4]
 [4 0 2]], shape=(2, 3), dtype=int64)


In [None]:
#Codificação de recursos categóricos de string por meio de codificação one-hot
# Define some toy data
data = tf.constant([["a"], ["b"], ["c"], ["b"], ["c"], ["a"]])



In [None]:
print(data)

tf.Tensor(
[[b'a']
 [b'b']
 [b'c']
 [b'b']
 [b'c']
 [b'a']], shape=(6, 1), dtype=string)


In [None]:
# Use StringLookup to build an index of the feature values and encode output.

lookup = layers.StringLookup(output_mode="one_hot")
lookup.adapt(data)

In [None]:
test_data = tf.constant([["a"], ["b"], ["c"], ["d"], ["e"], [""]])


In [None]:
encoded_data = lookup(test_data)


In [None]:
print(encoded_data)

tf.Tensor(
[[0. 0. 0. 1.]
 [0. 0. 1. 0.]
 [0. 1. 0. 0.]
 [1. 0. 0. 0.]
 [1. 0. 0. 0.]
 [1. 0. 0. 0.]], shape=(6, 4), dtype=float32)


In [None]:
#Codificando texto como uma sequência de índices de token

# Define some text data to adapt the layer
adapt_data = tf.constant(
    ['Paguei o upgrade de cabine,'
    'o e-mail avisando só veio tarde da noite de domingo,'
    'embarquei na manhã de segunda-feira e tanto os comissários de terra quanto os de bordo da LATAM'
    'não me avisaram de que meu lance havia sido contemplado,'
    'demonstrando desorganização. Foi a primeira e espero que seja a última vez.'])

In [None]:
# Create a TextVectorization layer
text_vectorizer = layers.TextVectorization(output_mode="int")

In [None]:
# Index the vocabulary via `adapt()`
text_vectorizer.adapt(adapt_data)

In [None]:
print(adapt_data)

tf.Tensor([b'Paguei o upgrade de cabine,o e-mail avisando s\xc3\xb3 veio tarde da noite de domingo,embarquei na manh\xc3\xa3 de segunda-feira e tanto os comiss\xc3\xa1rios de terra quanto os de bordo da LATAMn\xc3\xa3o me avisaram de que meu lance havia sido contemplado,demonstrando desorganiza\xc3\xa7\xc3\xa3o. Foi a primeira e espero que seja a \xc3\xbaltima vez.'], shape=(1,), dtype=string)


In [None]:
# Try out the layer
print(
    "Encoded text:\n", text_vectorizer(["A melhor companhia que já voei"]).numpy(),
)

Encoded text:
 [[7 1 1 3 1 1]]


In [None]:
print(
    "Encoded text:\n", text_vectorizer(adapt_data).numpy(),
)

Encoded text:
 [[21 22 11  2 38 33 41 15 10 13  6 23  2 34 24 27  2 18  5 14  4 37  2 12
  19  4  2 39  6 28 26 40  2  3 25 29 30 16 36 35 31  7 20  5 32  3 17  7
   8  9]]


In [None]:
from sklearn.feature_extraction.text import CountVectorizer

In [None]:
import pandas as pd

In [None]:
#vamos ignorar os warnings emitidos pelo python
import warnings

In [None]:
warnings.filterwarnings('ignore')

In [None]:
from matplotlib import rc

In [None]:
#with open('C:/Users/Camila_Data_Science/Downloads/medallia_01a23fev.txt',
 #         encoding="utf8") as file:
 #   a = file.read()

In [None]:
from google.colab import files #https://nymarya.github.io/5-modos-de-carregar-arquivos-no-google-colab/

In [56]:
uploaded=files.upload()

Saving medallia_01a23fev.txt to medallia_01a23fev (3).txt


In [57]:
uploaded

{'medallia_01a23fev.txt': b'\xef\xbb\xbfPaguei o upgrade de cabine, o e-mail avisando s\xc3\xb3 veio tarde da noite de domingo, embarquei na manh\xc3\xa3 de segunda-feira e tanto os comiss\xc3\xa1rios de terra quanto os de bordo da LATAM n\xc3\xa3o me avisaram de que meu lance havia sido contemplado, demonstrando desorganiza\xc3\xa7\xc3\xa3o. Foi a primeira e espero que seja a \xc3\xbaltima vez.\r\n\t\r\n\r\n\t\r\n\r\n\t18/02/2022 02:14\r\n\t\xe2\x80\x93\r\n\tS\xc3\xa3o Paulo (GRU)\r\n\tJo\xc3\xa3o Pessoa\r\n\t\xe2\x80\x93\r\n\t\xe2\x80\x93\r\n\t\r\n\r\n\tComentario NPS\r\nPontualidade, gentileza dos comiss\xc3\xa1rios de bordo\r\n\t\r\n\r\n\t10/02/2022 14:21\r\n\t\xe2\x80\x93\r\n\tS\xc3\xa3o Paulo (GRU)\r\n\tJo\xc3\xa3o Pessoa\r\n\t\xe2\x80\x93\r\n\t\xe2\x80\x93\r\n\t\r\n\r\n\tComentario NPS\r\nPontualidade, tripula\xc3\xa7\xc3\xa3o atenciosa e Piloto interessado em informar os passageiros sobre clima,e outras curiosidades durante o v\xc3\xb4o\r\nMensaje empleado\r\nForneceu informa\x

In [58]:
vectorizer = CountVectorizer(lowercase = True, strip_accents= 'unicode')

In [65]:
vectorizer

CountVectorizer(strip_accents='unicode')

In [70]:
vectorizer.fit(uploaded)

CountVectorizer(strip_accents='unicode')

In [71]:
uploaded

{'medallia_01a23fev.txt': b'\xef\xbb\xbfPaguei o upgrade de cabine, o e-mail avisando s\xc3\xb3 veio tarde da noite de domingo, embarquei na manh\xc3\xa3 de segunda-feira e tanto os comiss\xc3\xa1rios de terra quanto os de bordo da LATAM n\xc3\xa3o me avisaram de que meu lance havia sido contemplado, demonstrando desorganiza\xc3\xa7\xc3\xa3o. Foi a primeira e espero que seja a \xc3\xbaltima vez.\r\n\t\r\n\r\n\t\r\n\r\n\t18/02/2022 02:14\r\n\t\xe2\x80\x93\r\n\tS\xc3\xa3o Paulo (GRU)\r\n\tJo\xc3\xa3o Pessoa\r\n\t\xe2\x80\x93\r\n\t\xe2\x80\x93\r\n\t\r\n\r\n\tComentario NPS\r\nPontualidade, gentileza dos comiss\xc3\xa1rios de bordo\r\n\t\r\n\r\n\t10/02/2022 14:21\r\n\t\xe2\x80\x93\r\n\tS\xc3\xa3o Paulo (GRU)\r\n\tJo\xc3\xa3o Pessoa\r\n\t\xe2\x80\x93\r\n\t\xe2\x80\x93\r\n\t\r\n\r\n\tComentario NPS\r\nPontualidade, tripula\xc3\xa7\xc3\xa3o atenciosa e Piloto interessado em informar os passageiros sobre clima,e outras curiosidades durante o v\xc3\xb4o\r\nMensaje empleado\r\nForneceu informa\x

In [72]:
vocabulario = vectorizer.vocabulary_

In [73]:
up_vetorizado = vectorizer.transform(uploaded).toarray()

In [63]:
up_vetorizado

array([[1, 1]])

In [74]:
from keras.models import Sequential

In [75]:
from keras.layers import Dense

In [76]:
from sklearn.model_selection import train_test_split

In [77]:
from sklearn.naive_bayes import GaussianNB

In [79]:
from keras.callbacks import ModelCheckpoint

In [80]:
from sklearn.metrics import confusion_matrix

In [81]:
%matplotlib inline

In [82]:
#Remove Special Charactors
import re

In [83]:
uploaded=files.upload()

Saving medallia_01a23fev.txt to medallia_01a23fev (4).txt


No caso, queremos retirar o caractere de nova linha, então fazemos: rstrip('\n')

Ele é um método de objetos do tipo String.
No caso, a variável que vai armazenar as strings, uma por uma, é a variável banda, então aplicamos nela o método:
banda.rstrip('\n')

Ela retorna a mesma string banda, mas sem os caracteres \n.
Veja como fica nosso código:


In [219]:
meu_arquivo = open('medallia_01a23fev (4).txt', 'r')
medalias = meu_arquivo.readlines()

In [220]:
for medalia in medalias:
    medalia = medalia.rstrip('\n')
    print(medalia)
meu_arquivo.close()

[1;30;43mA saída de streaming foi truncada nas últimas 5000 linhas.[0m
–        
São Paulo (CGH)
Brasília
–
–
Comentario NPS
Pontualidade e comissários de bordo cordiais.


04/02/2022 03:48
–        
Rio de Janeiro
Salvador Da Bahia
–
–
Comentario NPS
A forma ríspida e com tom de preconceito como um dos agentes de bordo me tratou. Apenas pelo fato de ser[blank] Sem contar que a mesma fez uma afirmação falsa: "PROIBIDO O CONSUMO DE BEBIDA ALCOÓLICA NO AVIÃO". Tomadas desligadas, 00 de interação visual dentro da aeronave.


03/02/2022 16:23
–        
Recife
São Paulo (GRU)
–
–
Comentario NPS
Vôo atrasado sem nenhuma explicação. Na chegada, quase perdendo nossa conexão, fomos deixados por último na ordem da saída da aeronave, mesmo tendo avisado os comissários no início do voo que tínhamos uma conexão muito apertada. Além disso, muitos passageiros usavam máscaras sem cobrir o nariz e o foi claramente ignorado pelos comissários, mesmo quando falando diretamente com tais passageiros. A om

Note que alteramos somente a variável temporária do LAÇO FOR, a banda.
Para alterarmos cada elemento da lista de strings bandas:

In [221]:
for index in range(len(medalias)):
    medalias[index] = medalias[index].rstrip('\n')
    medalias[index] = re.sub('[//:]','', medalias[index])
    medalias[index] = re.sub('[0-9]', '', medalias[index])
    
for i in range(len(medalias)):
  medalias[i] = medalias[i].lower() #converte todas as palavras para letras minusculas




In [222]:
meu_arquivo.close()

In [223]:
medalias

['\ufeffpaguei o upgrade de cabine, o e-mail avisando só veio tarde da noite de domingo, embarquei na manhã de segunda-feira e tanto os comissários de terra quanto os de bordo da latam não me avisaram de que meu lance havia sido contemplado, demonstrando desorganização. foi a primeira e espero que seja a última vez.',
 '\t',
 '',
 '\t',
 '',
 '\t ',
 '\t–',
 '\tsão paulo (gru)',
 '\tjoão pessoa',
 '\t–',
 '\t–',
 '\t',
 '',
 '\tcomentario nps',
 'pontualidade, gentileza dos comissários de bordo',
 '\t',
 '',
 '\t ',
 '\t–',
 '\tsão paulo (gru)',
 '\tjoão pessoa',
 '\t–',
 '\t–',
 '\t',
 '',
 '\tcomentario nps',
 'pontualidade, tripulação atenciosa e piloto interessado em informar os passageiros sobre clima,e outras curiosidades durante o vôo',
 'mensaje empleado',
 'forneceu informações durante o vôo de forma clara, audível,e outras curiosidades.percebe-se atenção ao passageiro.',
 '\t',
 '',
 '\t ',
 '\t–',
 '\tsão paulo (gru)',
 '\tjoão pessoa',
 '\t–',
 '\t–',
 '\t',
 '',
 '\tcoment

Consseguiiiiiiiiiiiiiiiiiii

In [177]:
import nltk

In [178]:
from nltk.stem import PorterStemmer

In [179]:
stemmer = PorterStemmer()

In [180]:
analyzer = CountVectorizer().build_analyzer()

In [181]:
def stemmed_words(doc):
  return (stemmer.stem(w) for w in analyzer(doc))

In [182]:
from nltk.tokenize import sent_tokenize

In [183]:
from nltk.tokenize import word_tokenize

In [184]:
nltk.download('wordnet')
nltk.download('punkt')

[nltk_data] Downloading package wordnet to /root/nltk_data...
[nltk_data]   Package wordnet is already up-to-date!
[nltk_data] Downloading package punkt to /root/nltk_data...
[nltk_data]   Package punkt is already up-to-date!


True

In [226]:
# Divide o texto em frases
b = nltk.sent_tokenize(str(medalias))

In [227]:
b

["['\\ufeffpaguei o upgrade de cabine, o e-mail avisando só veio tarde da noite de domingo, embarquei na manhã de segunda-feira e tanto os comissários de terra quanto os de bordo da latam não me avisaram de que meu lance havia sido contemplado, demonstrando desorganização.",
 'foi a primeira e espero que seja a última vez.',
 "', '\\t', '', '\\t', '', '\\t ', '\\t–', '\\tsão paulo (gru)', '\\tjoão pessoa', '\\t–', '\\t–', '\\t', '', '\\tcomentario nps', 'pontualidade, gentileza dos comissários de bordo', '\\t', '', '\\t ', '\\t–', '\\tsão paulo (gru)', '\\tjoão pessoa', '\\t–', '\\t–', '\\t', '', '\\tcomentario nps', 'pontualidade, tripulação atenciosa e piloto interessado em informar os passageiros sobre clima,e outras curiosidades durante o vôo', 'mensaje empleado', 'forneceu informações durante o vôo de forma clara, audível,e outras curiosidades.percebe-se atenção ao passageiro.",
 "', '\\t', '', '\\t ', '\\t–', '\\tsão paulo (gru)', '\\tjoão pessoa', '\\t–', '\\t–', '\\t', '', '\\t

In [228]:
for i in range (len(b)):
    b[i] = re.sub(r'W', ' ', b[i]) # troca tudo que não for uma palavra para um espaço

In [229]:
b

["['\\ufeffpaguei o upgrade de cabine, o e-mail avisando só veio tarde da noite de domingo, embarquei na manhã de segunda-feira e tanto os comissários de terra quanto os de bordo da latam não me avisaram de que meu lance havia sido contemplado, demonstrando desorganização.",
 'foi a primeira e espero que seja a última vez.',
 "', '\\t', '', '\\t', '', '\\t ', '\\t–', '\\tsão paulo (gru)', '\\tjoão pessoa', '\\t–', '\\t–', '\\t', '', '\\tcomentario nps', 'pontualidade, gentileza dos comissários de bordo', '\\t', '', '\\t ', '\\t–', '\\tsão paulo (gru)', '\\tjoão pessoa', '\\t–', '\\t–', '\\t', '', '\\tcomentario nps', 'pontualidade, tripulação atenciosa e piloto interessado em informar os passageiros sobre clima,e outras curiosidades durante o vôo', 'mensaje empleado', 'forneceu informações durante o vôo de forma clara, audível,e outras curiosidades.percebe-se atenção ao passageiro.",
 "', '\\t', '', '\\t ', '\\t–', '\\tsão paulo (gru)', '\\tjoão pessoa', '\\t–', '\\t–', '\\t', '', '\\t

In [230]:
# criando um histograma
dataset=b
word2count = {}
for data in dataset:
    words = nltk.word_tokenize(data)
    for word in words:
        if word not in word2count.keys():
            word2count[word] = 1
        else:
            word2count[word] += 1

In [231]:
print (word2count)

{'[': 7, "'\\ufeffpaguei": 1, 'o': 1326, 'upgrade': 22, 'de': 2318, 'cabine': 45, ',': 19428, 'e-mail': 7, 'avisando': 1, 'só': 83, 'veio': 14, 'tarde': 13, 'da': 771, 'noite': 17, 'domingo': 1, 'embarquei': 2, 'na': 409, 'manhã': 18, 'segunda-feira': 1, 'e': 2096, 'tanto': 29, 'os': 453, 'comissários': 242, 'terra': 24, 'quanto': 41, 'bordo': 347, 'latam': 253, 'não': 803, 'me': 251, 'avisaram': 4, 'que': 1324, 'meu': 162, 'lance': 2, 'havia': 51, 'sido': 26, 'contemplado': 1, 'demonstrando': 2, 'desorganização': 15, '.': 3083, 'foi': 406, 'a': 1671, 'primeira': 29, 'espero': 21, 'seja': 30, 'última': 19, 'vez': 53, "'": 14530, "'\\t": 1361, "''": 2951, "'\\t–": 1187, "'\\tsão": 232, 'paulo': 964, '(': 1135, 'gru': 638, ')': 1157, "'\\tjoão": 10, 'pessoa': 59, "'\\tcomentario": 360, 'nps': 1201, "'pontualidade": 97, 'gentileza': 23, 'dos': 246, 'tripulação': 312, 'atenciosa': 76, 'piloto': 29, 'interessado': 1, 'em': 474, 'informar': 3, 'passageiros': 255, 'sobre': 43, 'clima': 2, 'ou

 Realizamos a ordenação:  

In [232]:
# biblioteca para ordenação
import heapq


In [233]:
# ordena a lista para saber qual é a palavra que mais se repete
freq_words = heapq.nlargest(50,word2count, key=word2count.get)
print (freq_words)

[',', "'", '.', "''", "'–", 'de', 'e', 'a', "'\\t", "'comentario", 'o', 'que', 'nps', "'\\t–", ')', '(', 'paulo', 'não', 'da', "'são", 'com', 'no', 'gru', 'para', 'do', 'muito', '!', 'em', 'os', 'um', 'na', 'foi', 'voo', 'durante', "'\\tcomentario", 'el', 'uma', 'bordo', 'mais', 'empleado', 'as', 'embarque', 'vuelo', 'cgh', "'mensaje", 'tripulação', 'por', 'comment', "'sab", 'é']


In [235]:
# criando o IDF
import numpy as np 

In [236]:
word_idfs = {}
for word in freq_words:
    doc_count = 0 
    for data in dataset:
        if word in nltk.word_tokenize(data):
            doc_count += 1
    word_idfs[word] = np.log((len(dataset)/doc_count)+1)
    
print (word_idfs)

{',': 0.9309255694648815, "'": 1.1588776372037979, '.': 0.7557466287829542, "''": 1.4930497160992113, "'–": 1.825276652975343, 'de': 1.228239816174445, 'e': 1.2179733744878023, 'a': 1.4025477389049288, "'\\t": 2.5255957451121, "'comentario": 1.4884286672540055, 'o': 1.5110822836274846, 'que': 1.5860463610649693, 'nps': 1.5675645613385891, "'\\t–": 2.563084430852024, ')': 1.6236888252627724, '(': 1.6322436498547273, 'paulo': 1.7442645095752136, 'não': 1.8367192328258157, 'da': 1.8762161124641787, "'são": 1.9915988403427194, 'com': 1.8954028251360866, 'no': 1.9382718219093331, 'gru': 2.0438646671127283, 'para': 2.0609548798043815, 'do': 2.0472525779409927, 'muito': 2.1371397665990197, '!': 2.3398234381341645, 'em': 2.2583020830603724, 'os': 2.3276689163868247, 'um': 2.3521598786238958, 'na': 2.3903125459183197, 'foi': 2.3596511664673376, 'voo': 2.3546494399064413, 'durante': 2.3447359045182745, "'\\tcomentario": 2.605637563768334, 'el': 2.441292461055809, 'uma': 2.5255957451121, 'bordo':

In [237]:
# calculando a frequencia de cada palavra nos documentos

tf_matrix = {}

for word in freq_words:
    doc_tf = []
    for data in dataset:
        frequency = 0
        for w in nltk.word_tokenize(data):
            if w == word:
                frequency += 1
        tf_word = frequency/len(nltk.word_tokenize(data))
        doc_tf.append(tf_word)
    tf_matrix[word] = doc_tf

print (tf_matrix)

{',': [0.061224489795918366, 0.0, 0.2462686567164179, 0.2653061224489796, 0.05747126436781609, 0.11855670103092783, 0.2727272727272727, 0.23636363636363636, 0.034482758620689655, 0.18181818181818182, 0.034482758620689655, 0.07692307692307693, 0.21818181818181817, 0.23529411764705882, 0.11538461538461539, 0.10714285714285714, 0.26666666666666666, 0.2755102040816326, 0.0, 0.13333333333333333, 0.07692307692307693, 0.1951219512195122, 0.0, 0.0, 0.24545454545454545, 0.24074074074074073, 0.25, 0.0, 0.0, 0.0, 0.08695652173913043, 0.07407407407407407, 0.23529411764705882, 0.0, 0.1, 0.2727272727272727, 0.06666666666666667, 0.0625, 0.125, 0.1111111111111111, 0.2727272727272727, 0.2777777777777778, 0.28431372549019607, 0.2222222222222222, 0.0, 0.15, 0.0625, 0.13636363636363635, 0.0625, 0.15151515151515152, 0.047619047619047616, 0.05263157894736842, 0.1702127659574468, 0.0, 0.03225806451612903, 0.0, 0.0, 0.0, 0.11764705882352941, 0.2459016393442623, 0.18324607329842932, 0.0, 0.0, 0.0, 0.0, 0.08695

In [238]:
#Por fim devemos calcular o TF-IDF e colocar na matriz:  

# TF-IDF cálculo

tfidf_matrix = []

for word in tf_matrix.keys():
    tfidf = []
    for value in tf_matrix[word]:
        score = value * word_idfs[word]
        tfidf.append(score)
    tfidf_matrix.append(tfidf)
    
print (tfidf_matrix)

[[0.05699544302846213, 0.0, 0.22925778949508274, 0.2469802531233359, 0.053501469509475943, 0.11036746442109419, 0.2538887916722404, 0.22003695278260835, 0.03210088170568557, 0.16925919444816026, 0.03210088170568557, 0.07160965918960627, 0.20311103333779232, 0.21904131046232506, 0.1074144887844094, 0.09974202529980872, 0.24824681852396838, 0.2564794936280796, 0.0, 0.12412340926198419, 0.07160965918960627, 0.1816440135541232, 0.0, 0.0, 0.22849991250501636, 0.22411171116747144, 0.23273139236622037, 0.0, 0.0, 0.0, 0.08095004951868534, 0.06895744958999121, 0.21904131046232506, 0.0, 0.09309255694648816, 0.2538887916722404, 0.062061704630992094, 0.05818284809155509, 0.11636569618311018, 0.10343617438498683, 0.2538887916722404, 0.2585904359624671, 0.26467491680864275, 0.20687234876997365, 0.0, 0.1396388354197322, 0.05818284809155509, 0.1269443958361202, 0.05818284809155509, 0.14104932870680023, 0.04432978902213721, 0.048996082603414814, 0.15845541607912875, 0.0, 0.030029857079512307, 0.0, 0.0,

In [133]:
stem_count_vec = CountVectorizer(analyzer=stemmed_words)

In [134]:
from nltk.corpus import stopwords

In [136]:
b

['\ufeffpaguei o upgrade de cabine, o e-mail avisando só veio tarde da noite de domingo, embarquei na manhã de segunda-feira e tanto os comissários de terra quanto os de bordo da latam não me avisaram de que meu lance havia sido contemplado, demonstrando desorganização.',
 'foi a primeira e espero que seja a última vez.',
 '18/02/2022 02:14\n\t–\n\tsão paulo (gru)\n\tjoão pessoa\n\t–\n\t–\n\t\n\n\tcomentario nps\npontualidade, gentileza dos comissários de bordo\n\t\n\n\t10/02/2022 14:21\n\t–\n\tsão paulo (gru)\n\tjoão pessoa\n\t–\n\t–\n\t\n\n\tcomentario nps\npontualidade, tripulação atenciosa e piloto interessado em informar os passageiros sobre clima,e outras curiosidades durante o vôo\nmensaje empleado\nforneceu informações durante o vôo de forma clara, audível,e outras curiosidades.percebe-se atenção ao passageiro.',
 '12/02/2022 13:25\n\t–\n\tsão paulo (gru)\n\tjoão pessoa\n\t–\n\t–\n\t\n\n\tcomentario nps\npela pontualidade e a qualidade do voo, ótimo.',
 'o serviço prestado pela