In [38]:
from bs4 import BeautifulSoup
import requests

def votos2int(nvotos):
    """Convierte a entero una cadena que tiene un número que usa el "." como separador de miles
    
    Args:
        nvotos: cadena que representa un número de votos
        
    Returns:
        int: Número de votos representado por la cadena
    """
    
    return int(nvotos.replace(".",""))


def circunscripcion(nombre, url):
    """Extrae la información relativa a una circunscripción

    Para una circunscripción genera un diccionario con todos los datos extraidos de la circunscripcións

    Args:
        nombre (str): Nombre de la circunscripción para procesar.
        url (str): URL con los datos de la circusncripción.

    Returns:
        dict: Diccionario con los siguientes datos:
            circunscripcion: Nombre de la circunscripción
            url: URL de la web de la que se han extraido los datos
            escaños: número de escaños que se reparten en la circunscripción
            votosTotales: Número total de votos contados
            abstención: Abstenciones
            votosNulos: Número de votos nulos
            votosEnBlanco: Número de votos en blanco
            resultados: Lista con la distribución de los votos. Cada elemento de la lista es un diccionario con:
                partido: Nombre del partido político
                votos: número de votos obtenidos
                diputados: número de diputados conseguido
     Raises:
        NameError: La petición web a la URL ha provocado un error. Devuelve el código de error.
    """
    
    # Realizamos la petición a la web
    req = requests.get(url)

    # Comprobamos que la petición nos devuelve un Status Code = 200
    statusCode = req.status_code
    if statusCode == 200:
        # Pasamos el contenido HTML de la web a un objeto BeautifulSoup()
        html = BeautifulSoup(req.text, 'lxml')

        # Extracción del resumen de votos
        
        # Guardamos las filas de la tabla
        tablaResumenVotos = html.select("#TVRESUMEN tbody > tr")
               
        # Guardamos los datos de cada fila
        totalVotos = tablaResumenVotos[0].find('td').text;
        abstencion = tablaResumenVotos[1].find('td').text;
        nulos = tablaResumenVotos[2].find('td').text;
        blanco = tablaResumenVotos[3].find('td').text;
        
        
        # Extracción de la información por partidos
        partidos = html.select("tbody th.siglas15")
        votos= html.select("td.vots.s15")
        diputados= html.select("td.dip.s15")
        encanyos = html.select("#grafact span.numelegir")
        partidoVoto = []
        for i,p in enumerate(partidos):
            if len(p.text)>0:
                partidoVoto.append({'partido': p.text,
                                    'votos': votos2int(votos[i].text),
                                    'diputados': int(diputados[i].text or 0)
                                   })
        return {
            "circunscripcion": nombre,
            "url": url,
            "votosTotales": votos2int(totalVotos),
            "abstención": votos2int(abstencion),
            "votosNulos": votos2int(nulos),
            "votosEnBlanco": votos2int(blanco),
            "escaños": encanyos[0].text,
            "resultados": partidoVoto
        }
    else:
        raise NameError("Error Url request: " + statusCode)
        
# Test
circunscripcion("Madrid","http://resultados2016.infoelecciones.es/99CO/DCO12289CI.htm")

{'abstención': 1199269,
 'circunscripcion': 'Madrid',
 'escaños': '36',
 'resultados': [{'diputados': 15, 'partido': 'PP', 'votos': 1315847},
  {'diputados': 8, 'partido': 'PODEMOS-IU-EQUO-CLIAS', 'votos': 729870},
  {'diputados': 7, 'partido': 'PSOE', 'votos': 674825},
  {'diputados': 6, 'partido': "C's", 'votos': 610391},
  {'diputados': 0, 'partido': 'PACMA', 'votos': 38918},
  {'diputados': 0, 'partido': 'VOX', 'votos': 16608},
  {'diputados': 0, 'partido': 'UPyD', 'votos': 15011},
  {'diputados': 0, 'partido': 'RECORTES CERO-GRUPO VERDE', 'votos': 7301},
  {'diputados': 0, 'partido': 'FE de las JONS', 'votos': 3922},
  {'diputados': 0, 'partido': 'PCPE', 'votos': 3522},
  {'diputados': 0, 'partido': 'PH', 'votos': 2243},
  {'diputados': 0, 'partido': 'P-LIB', 'votos': 1234},
  {'diputados': 0, 'partido': 'SAIn', 'votos': 986}],
 'url': 'http://resultados2016.infoelecciones.es/99CO/DCO12289CI.htm',
 'votosEnBlanco': 17994,
 'votosNulos': 23598,
 'votosTotales': 3462270}

In [39]:
from bs4 import BeautifulSoup
import requests

urlInicial = "http://resultados2016.infoelecciones.es/99CO/DCO99999TO.htm?lang=es"
urlBase = "http://resultados2016.infoelecciones.es/99CO/"

def recorrecircunscripciones (urlOrigen, urlBase):
    """Busca todas las circunscripciones y agrega los resultados obtenidos por cada circunscripción.
    
    Ignora los distritos: por ejemplo, Las Palmas se compone de Gran Canaria, Lanzarote y Tenerife.
    Estos resultados son ignorados y solo se guardan los de la circunscripción
    que las aglutina (en este caso, Las Palmas)
    
    Args:
        urlOrigen: URL desde la que se va a partir la búsqueda. Contiene un menú del que se extraerán las circunscripciones
        urlBase: URL a partir de la cual se componen las rutas a la información de las circunscripciones
    
    Returns:
        list: Una lista con la información agregada de cada una de las circunscripciones
    Raises:
        NameError: La petición web a la URL ha provocado un error. Devuelve el código de error.
    """

    # Realizamos la petición a la web
    req = requests.get(urlOrigen)

    # Comprobamos que la petición nos devuelve un Status Code = 200
    statusCode = req.status_code
    if statusCode == 200:
        # Pasamos el contenido HTML de la web a un objeto BeautifulSoup()
        html = BeautifulSoup(req.text, 'lxml')
        listaMunicipios= html.select("#b10_2 li.lici > a")
        resultadosTotales =[]
        for m in listaMunicipios:
            print("Procesando "+m.text)
            resultadosTotales.append(circunscripcion(m.text, urlBase+m['href']))
    
        return resultadosTotales
    else:
        raise NameError("Error Url request: " + statusCode)
 
# Test
recorrecircunscripciones(urlInicial, urlBase)

Procesando A Coruña
Procesando Albacete
Procesando Alicante / Alacant
Procesando Almería
Procesando Araba / Álava
Procesando Asturias
Procesando Ávila
Procesando Badajoz
Procesando Barcelona
Procesando Bizkaia
Procesando Burgos
Procesando Cáceres
Procesando Cádiz
Procesando Cantabria
Procesando Castellón / Castelló
Procesando Ceuta
Procesando Ciudad Real
Procesando Córdoba
Procesando Cuenca
Procesando Gipuzkoa
Procesando Girona
Procesando Granada
Procesando Guadalajara
Procesando Huelva
Procesando Huesca
Procesando Illes Balears
Procesando Jaén
Procesando La Rioja
Procesando Las Palmas
Procesando León
Procesando Lleida
Procesando Lugo
Procesando Madrid
Procesando Málaga
Procesando Melilla
Procesando Murcia
Procesando Navarra
Procesando Ourense
Procesando Palencia
Procesando Pontevedra
Procesando Salamanca
Procesando Santa Cruz de Tenerife
Procesando Segovia
Procesando Sevilla
Procesando Soria
Procesando Tarragona
Procesando Teruel
Procesando Toledo
Procesando Valencia / València
Proces

[{'abstención': 288819,
  'circunscripcion': 'A Coruña',
  'escaños': '8',
  'resultados': [{'diputados': 4, 'partido': 'PP', 'votos': 255390},
   {'diputados': 2, 'partido': 'PODEMOS-EN MAREA-ANOVA-EU', 'votos': 147109},
   {'diputados': 2, 'partido': 'PSdeG-PSOE', 'votos': 138959},
   {'diputados': 0, 'partido': "C's", 'votos': 59863},
   {'diputados': 0, 'partido': 'BNG-NÓS', 'votos': 19199},
   {'diputados': 0, 'partido': 'PACMA', 'votos': 6725},
   {'diputados': 0, 'partido': 'RECORTES CERO-GRUPO VERDE', 'votos': 1542},
   {'diputados': 0, 'partido': 'VOX', 'votos': 1008},
   {'diputados': 0, 'partido': 'PCPE', 'votos': 743},
   {'diputados': 0, 'partido': 'SAIn', 'votos': 376}],
  'url': 'http://resultados2016.infoelecciones.es/99CO/DCO11159CI.htm',
  'votosEnBlanco': 6651,
  'votosNulos': 7671,
  'votosTotales': 645236},
 {'abstención': 82323,
  'circunscripcion': 'Albacete',
  'escaños': '4',
  'resultados': [{'diputados': 2, 'partido': 'PP', 'votos': 89564},
   {'diputados': 1

In [40]:
from pprint import pprint

# Creamos un archivo con la lista de resultados en un json.
with open('resultados.json', 'wt') as out:
    pprint(recorrecircunscripciones(urlInicial, urlBase), stream=out)

Procesando A Coruña
Procesando Albacete
Procesando Alicante / Alacant
Procesando Almería
Procesando Araba / Álava
Procesando Asturias
Procesando Ávila
Procesando Badajoz
Procesando Barcelona
Procesando Bizkaia
Procesando Burgos
Procesando Cáceres
Procesando Cádiz
Procesando Cantabria
Procesando Castellón / Castelló
Procesando Ceuta
Procesando Ciudad Real
Procesando Córdoba
Procesando Cuenca
Procesando Gipuzkoa
Procesando Girona
Procesando Granada
Procesando Guadalajara
Procesando Huelva
Procesando Huesca
Procesando Illes Balears
Procesando Jaén
Procesando La Rioja
Procesando Las Palmas
Procesando León
Procesando Lleida
Procesando Lugo
Procesando Madrid
Procesando Málaga
Procesando Melilla
Procesando Murcia
Procesando Navarra
Procesando Ourense
Procesando Palencia
Procesando Pontevedra
Procesando Salamanca
Procesando Santa Cruz de Tenerife
Procesando Segovia
Procesando Sevilla
Procesando Soria
Procesando Tarragona
Procesando Teruel
Procesando Toledo
Procesando Valencia / València
Proces