# Scraping Estático de un sitio Web

En este caso, tenemos un ejemplo de cómo se extrae la información de una página web de venta de inmuebles

#### Instalar la Librería

In [None]:
install.packages("rvest")

#### Activarla

In [None]:
library(rvest)

#### Leer la página web con read_html()

In [None]:
web <- read_html("https://inmuebles.mercadolibre.com.mx/venta/_Desde_97_NoIndex_True")

#### Extraer el titular del aviso

In [None]:
Titular<-web %>% html_nodes(".ui-search-item__title.ui-search-item__group__element") %>% html_text()
Titular

#### Extraer la ubicación

In [None]:
Ubicacion<-web %>% html_nodes(".ui-search-item__group--location") %>% html_text()
Ubicacion

#### Extraer el precio de venta

In [None]:
Precio<-web %>% html_nodes(".price-tag-text-sr-only") %>% html_text()
Precio

#### Extraer el área y la cantidad de recámaras

In [None]:
Atr<-web %>% html_nodes(".ui-search-card-attributes__attribute") %>% html_text()
Atr

#### Separamos el área

In [None]:
Area<-Atr[(grepl('m²', Atr, fixed = TRUE)==TRUE)]
Area

#### Combinando los datos para exportar

In [None]:
base<-data.frame(Titular,Ubicacion,Area,Precio)

In [None]:
head(base)

In [None]:
write.csv(base, "inmuebles.csv")

#### Automatizamos la función para que haga una descarga en bloque y agregue cada iteración en un archivo

In [None]:
colec_precios<-function() {
  looping<-c("https://inmuebles.mercadolibre.com.mx/departamentos/venta/propiedades-individuales/estado-de-mexico/_NoIndex_True")
  for(i in 1:10) {tmp<-paste("https://inmuebles.mercadolibre.com.mx/departamentos/venta/propiedades-individuales/estado-de-mexico/_Desde_",i*48+1,"_NoIndex_True",sep="")
  looping<-c(looping,tmp)}
  tableout <- data.frame()
  for(i in looping){
  web <- i %>% read_html()
  Titular<-web %>% html_nodes(".ui-search-item__title.ui-search-item__group__element") %>% html_text()
  Ubicacion<-web %>% html_nodes(".ui-search-item__group--location") %>% html_text()
  Precio<-web %>% html_nodes(".price-tag-text-sr-only") %>% html_text()    
  Atr<-web %>% html_nodes(".ui-search-card-attributes__attribute") %>% html_text()    
  Area<-Atr[(grepl('m²', Atr, fixed = TRUE)==TRUE)]
  try(temp.tableout <- data.frame(Titular,Ubicacion,Area,Precio))
  write.table(temp.tableout,file="precios.txt",row.names=F,col.names=F,append=T,sep=",")}}

In [None]:
colec_precios()