## DISPONIBILIDAD DE SUELO URBANIZABLE

Como bien hemos comentado anteriormente a lo que la climatología se refiere, nos centraremos en analizar la disponibilidad de suelo urbanizable en los territorios de Cantabria y Andalucía. 

Por lo que con ésta última parte del proyecto, concluiremos en qué zona es la indicada para constituir la empresa de nuestro cliente, en base al precio medio y la disponibilidad de suelo urbanizable. 

Para la obtención de datos, hemos accedido al portal inmobiliario fotocasa, del cual hemos podido filtrar por zona los terrenos disponibles, así como sus precios. 

In [None]:
from selenium.webdriver.common.keys import Keys
from selenium import webdriver
import pandas as pd
import numpy as np
from selenium.webdriver.common.by import By
from bs4 import BeautifulSoup as bs4
import requests


## SUELO URBANIZABLE ANDALUCÍA

In [425]:
andalucia_precios = []
andalucia_metros_cuadrados = []

def obtener_soup(nombre_txt):
    with open(nombre_txt) as fp:
        return bs4(fp)

def obtener_precios_andalucia(soup):
    for precio in soup.select("span.re-CardPrice"):
        if not precio.text == "A consultar":
            andalucia_precios.append(precio.text)

def obtener_metros_cuadrados_andalucia_del_1_al_7(soup):
    for metro_cuadrado in soup.select("span.re-CardFeaturesWithIcons-feature-icon.re-CardFeaturesWithIcons-feature-icon--surface"):
        andalucia_metros_cuadrados.append(metro_cuadrado.text)

def obtener_metros_cuadrados_andalucia_del_8_al_10(soup):
    for metro_cuadrado in soup.select("li.re-CardFeatures-item.re-CardFeatures-feature"):
        andalucia_metros_cuadrados.append(metro_cuadrado.text)


for i in range(1, 8):
    soup = obtener_soup(f"andalucia_{i}.txt")

    obtener_precios_andalucia(soup)

    obtener_metros_cuadrados_andalucia_del_1_al_7(soup)

for i in range(8, 11):
    soup = obtener_soup(f"andalucia_{i}.txt")

    obtener_precios_andalucia(soup)

    obtener_metros_cuadrados_andalucia_del_8_al_10(soup)

andalucia_precios = [int(valor.replace(' €', '').replace('.', '')) for valor in andalucia_precios]
df_precios_andalucia = pd.DataFrame({ "precios_andalucia": andalucia_precios })
media_precios_andalucia = df_precios_andalucia.loc[:, "precios_andalucia"].mean()
print(media_precios_andalucia)

andalucia_metros_cuadrados = [int(valor.replace('m²', '')) for valor in andalucia_metros_cuadrados]
df_metros_cuadrados_andalucia = pd.DataFrame({ "metros_cuadrados_andalucia": andalucia_metros_cuadrados })
media_metros_cuadrados_andalucia = df_metros_cuadrados_andalucia.loc[:, "metros_cuadrados_andalucia"].mean()
print(media_metros_cuadrados_andalucia)

217746.0172413793
16782.324444444443


## SUELO URBANIZABLE CANTABRIA

Ahora bien, tras haber obtenido los datos de las 10 primera páginas del búscador de fotocasa filtrando por Andalucía, haremos lo mismo pero con Cantabria. 

In [426]:
cantabria_precios = []
cantabria_metros_cuadrados = []

def obtener_soup(nombre_txt):
    with open(nombre_txt) as fp:
        return bs4(fp)

def obtener_precios_cantabria(soup):
    for precio in soup.select("span.re-CardPrice"):
        if not precio.text == "A consultar":
            cantabria_precios.append(precio.text)

def obtener_metros_cuadrados_cantabria(soup):
    for metro_cuadrado in soup.select("li.re-CardFeatures-item.re-CardFeatures-feature"):
        cantabria_metros_cuadrados.append(metro_cuadrado.text)


for i in range(1, 11):
    soup = obtener_soup(f"cantabria_{i}.txt")

    obtener_precios_cantabria(soup)

    obtener_metros_cuadrados_cantabria(soup)


cantabria_precios = [int(valor.replace(' €', '').replace('.', '')) for valor in cantabria_precios]
df_precios_cantabria = pd.DataFrame({ "precios_cantabria": cantabria_precios })
media_precios_cantabria = df_precios_cantabria.loc[:, "precios_cantabria"].mean()
print(media_precios_cantabria)

cantabria_metros_cuadrados = [int(valor.replace('m²', '')) for valor in cantabria_metros_cuadrados]
df_metros_cuadrados_cantabria = pd.DataFrame({ "metros_cuadrados_cantabria": cantabria_metros_cuadrados })
media_metros_cuadrados_cantabria = df_metros_cuadrados_cantabria.loc[:, "metros_cuadrados_cantabria"].mean()
print(media_metros_cuadrados_cantabria)


3407443.8745980705
7902.942028985507
