# Análisis de Sentimientos de Comentarios de TripAdvisor

Se extrajeron comentarios sobre tres hoteles importantes de Lima Metropolitana para analizar las preferencias de los clientes

#### Instalar Librerías

In [None]:
install.packages("syuzhet")
install.packages("RColorBrewer")
install.packages("wordcloud")
install.packages("tm")

#### Activar las Librerías

In [None]:
library(syuzhet)
library(RColorBrewer)
library(wordcloud)
library(tm)

#### Cargar los Datos que se obtuvieron con Scraping

In [None]:
datos<-read.csv("TripAdvisor_Hoteles.csv", stringsAsFactors = F)
head(datos)

#### utilizamos la función 'get_nrc_sentiment' para realizar el conteo de palabras correspondientes a cada una de las emociones de Plutchick

In [None]:
matsent <- get_nrc_sentiment(datos$Review, lang="spanish")

In [None]:
barplot(colSums(prop.table(matsent[, 1:8])),
  col = brewer.pal(n = 8, name = "Set3"),
  main = "Distribución Porcentual de Frecuencias de Emociones")

In [None]:
barplot(colSums(prop.table(matsent[, 9:10])),
  col = brewer.pal(n = 8, name = "Set3"),
  main = "Distribución Porcentual de Términos Positivos y Negativos")

#### Calculamos un índice de Positividad del Comentario

In [None]:
matsent$Prop <- matsent$positive/(matsent$positive+matsent$negative)
head(matsent)

#### Unimos los dos DataFrames para tener la información completa

In [None]:
datos <- data.frame(datos,matsent)
head(datos)

#### Exportamos para generar reportes y otros análisis

In [None]:
write.csv(datos, "Hoteles_Clasificados.csv")

## Visualización de Wordcloud
#### Convertimos el tipo de Objeto de la Columna 'Review'

In [None]:
docs <- Corpus(VectorSource(datos[9]))

#### Removemos Stopwords o términos no relevantes

In [None]:
docs <- tm_map(docs, removeWords, stopwords("spanish"))

In [None]:
docs <- tm_map(docs, removeWords, c("hotel"))

#### Calculamos las frecuencias de cada Término

In [None]:
dtm <- DocumentTermMatrix(docs)
freq <- sort(colSums(as.matrix(dtm)), decreasing=TRUE)

#### Dibujamos el WordCloud

In [None]:
set.seed(2000)
wordcloud(names(freq), freq, min.freq=30, scale=c(4, .05), colors=brewer.pal(6, "Dark2"))