¿Cómo se anuncian los pisos? Un análisis de las palabras usadas

numeroteca edited this page Jul 31, 2017 · 7 revisions

Dificultad: MEDIA

METODOLOGÍA

Nube de palabras (timdream)

  1. Seleccionar la columna NAME del listing pertinente
  2. Crear un fichero de texto con el texto copiado
  3. Ir a https://timdream.org/wordcloud
  4. Seleccionar FILE y subir el fichero de texto
  5. Una vez generada la nube de palabras, pulsar sobre EDIT LIST y limpiar los datos (quitar palabras como "y", "el", "la"... o unir palabras con y sin tilde, etc.)
  6. Modificar el tema y la disposición de palabras al gusto

Porcentaje y número de palabras (R)

Si se desea ver numéricamente la frecuencia de las palabras, se puede usar el siguiente script de R:

avisos<- scan("INPUT.txt", what="character", sep="\n")`
avisos1 <- tolower(avisos)
avisos2 <- strsplit(avisos1, "\\W")
avisos3 <- unlist(avisos2)

freq<-table(avisos3)
freq1<-sort(freq, decreasing=TRUE)

percent<- round(100*(freq1/length(avisos)),3)
temple.sorted.table<-paste(names(freq1), freq1, percent, sep="\t")

cat("Word\tFREQ\tPERCENT", temple.sorted.table, file="OUTPUT.txt", sep="\n")

Aquí se verá la frecuencia absoluta de cada palabra y el porcentaje.

Número de palabras, bigramas y trigamas (Databasic.io)

Sube o copia-pega un archivo con todos los títulos de los anuncios (selecciona y copia esa columna en una hoja de cálculo) a la herramienta Wordcounter de Databasic.io https://databasic.io/en/wordcounter

You can’t perform that action at this time.
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session.
Press h to open a hovercard with more details.