In [174]:
import requests
import pandas as pd
from bs4 import BeautifulSoup
import re
from IPython.display import display, clear_output

In [180]:
pd.options.display.max_colwidth = 500
pd.options.display.max_columns = 500

In [55]:
LISTING = 'https://www.pilcomayo.net/calidaddeaguas'
PHPSESSID = '***************'

In [185]:
def make_indices():
    response = requests.get(LISTING)
    html = BeautifulSoup(response.text, 'html.parser')

    def make_indice(tabla):

        return pd.DataFrame([[tabla, a.get_text()] + re.findall('(?<=\=)[^\&$]*', a['data-vars']) for a in html.select(f'#{tabla} td a.modal-ajax')], columns=['tipo', 'lugar', 'rela_syspubl01', 'id_syscali01'])

    indice = pd.concat([make_indice(tipo) for tipo in ['mensuales', 'semestrales']])
    
    return indice

In [186]:
indice = make_indices()

In [187]:
indice

Unnamed: 0,tipo,lugar,rela_syspubl01,id_syscali01
0,mensuales,Tarapaya,16,5
1,mensuales,El Puente,9,3
2,mensuales,Palca Grande,5,4
3,mensuales,Colavi - Canutillos,63,668
4,mensuales,Tacobamba - Agua arriba confluencia Pilcomayo - Tacobamba,297,670
5,mensuales,Pilcomayo - Agua arriba confluencia Pilcomayo - Tacobamba,296,669
6,mensuales,Villamontes,6,2
7,mensuales,Misión La Paz,3,1
0,semestrales,Potosí - Naciente río La Ribera,41,16
1,semestrales,Liviara,26,27


In [81]:
def get_puntos():
    
    cookies = {
        'PHPSESSID': PHPSESSID,
    }

    data = {
        'rela_syspubl01': '272',
        'id_syscali01': '364',
    }

    response = requests.post('https://www.pilcomayo.net/modulos/reportes/calidad_aguas/php/ver_calidad_aguas_preview_v2.php', cookies=cookies, data=data)
    puntos = pd.DataFrame([re.findall('\'([^\']*)\'', punto) for punto in re.findall('mostrar_puntos_calidad_aguas\([^\)]*\)', response.text)], columns=['latitud', 'longitud', 'id_syscali01'])
    
    return puntos

In [79]:
puntos = get_puntos()

In [80]:
puntos

Unnamed: 0,latitud,longitud,id_syscali01
0,-22.3792,-62.5189,1
1,-21.2794,-63.4546,2
2,-21.2396,-65.2091,3
3,-20.7421,-65.2414,4
4,-19.4719,-65.7936,5
...,...,...,...
859,-21.2579,-63.5121,1296
860,-22.3781,-62.5186,1297
861,-25.2641,-57.7243,1298
862,-25.7884,-58.0215,1299


In [172]:
def get_punto(id_syscali01):
    
    cookies = {
        'PHPSESSID': PHPSESSID,
    }

    params = {
        'id_syscali01': id_syscali01,
    }

    response = requests.get('https://www.pilcomayo.net/modulos/reportes/calidad_aguas/php/ver_calidad_agua_reporte.php', params=params, cookies=cookies)
    html = BeautifulSoup(response.text, 'html.parser')
    return html

In [109]:
def unroll_table(table, columns):
    return [[field.get_text() for field in row.select('td')] for row in table.select('tr')[1:] if len(row.select('td')) == columns]

In [134]:
def parse_tabla_punto(t):
    data = {}
    for row in t:
        data[row[0].strip()] = row[1]
        data[row[2].strip()] = row[3]
    return data

In [170]:
def parse_lugar(html):
    table = html.select('table')[0]
    t = unroll_table(table, 4)
    return parse_tabla_punto(t)

In [163]:
def parse_tabla_mediciones(t):
    data = {}
    for row in t:
        data[f'{row[0].strip()} ({row[1].strip()})'] = row[2].strip()
    return data

In [158]:
def parse_mediciones(table):
    t = unroll_table(table, 4)[1:]
    return parse_tabla_mediciones(t)

In [160]:
def parse_titulo_mediciones(table):
    return table.select('th')[0].get_text()

In [169]:
def parse_punto(html):
    mediciones = parse_lugar(html)
    for table in html.select('table')[1:]:
        mediciones.update(parse_mediciones(table))
    return mediciones

In [183]:
data = []

In [184]:
for i, punto in puntos.iterrows():
    clear_output(wait=True)
    print(i)
    html = get_punto(punto['id_syscali01'])
    mediciones = parse_punto(html)
    data.append({**punto.to_dict(), **mediciones})

863


In [189]:
df = pd.DataFrame(data)

In [194]:
df

Unnamed: 0,latitud,longitud,id_syscali01,Latitud:,Longitud:,Río:,Altura,Fecha de Muestreo,Hora de Muestreo,Velocidad media,Caudal,Campaña,Responsable,Conductividad específica (T ref. 25°C) (uS/cm),Oxígeno disuelto (mg/l O2),pH (u pH),Sólidos disueltos totales (mg/l),Sólidos suspendidos totales (mg/l),Sólidos totales (mg/l),Temperatura (C),Calcio disuelto (mg/l Ca),Calcio total (mg/l Ca),Dureza total (mg/l CaCO3),Magnesio disuelto (mg/l Mg),Magnesio total (mg/l Mg),Potasio disuelto (mg/l K),Potasio total (mg/l K),Sodio disuelto (mg/l Na),Sodio total (mg/l Na),Demanda bioquímica de oxígeno (mg/l O2),Demanda química de oxígeno (mg/l O2),Arsenico disuelto (ug/l As),Arsenico total (ug/l As),Cadmio disuelto (ug/l Cd),Cadmio total (ug/l Cd),Cobre disuelto (ug/l Cu),Cobre total (ug/l Cu),Cromo disuelto (ug/l Cr),Cromo total (ug/l Cr),Hierro disuelto (ug/l Fe),Hierro total (ug/l Fe),Manganeso disuelto (ug/l Mn),Manganeso total (ug/l Mn),Mercurio disuelto (ug/l Hg),Mercurio total (ug/l Hg),Niquel disuelto (ug/l Ni),Niquel total (ug/l Ni),Plata disuelto (ug/l Ag),Plata total (ug/l Ag),Plomo disuelto (ug/l Pb),Plomo total (ug/l Pb),Zinc disuelto (ug/l Zn),Zinc total (ug/l Zn),Arsenico suspensión (mg/kg As),Cadmio suspensión (mg/kg Cd),Cobre suspensión (mg/kg Cu),Cromo suspensión (mg/kg Cr),Hierro suspensión (mg/kg Fe),Manganeso suspensión (mg/kg Mn),Niquel suspensión (mg/kg Ni),Plomo suspensión (mg/kg Pb),Zinc en suspensión (mg/kg Zn),Turbiedad (UNT),Plata suspensión (mg/kg Ag),Mercurio suspensión (mg/kg Hg),pH (mV) (mV),Salinidad (Sal),Saturación de oxígeno (%),Alcalinidad total (mg/l CaCO3),Cloruros (mg/l Cl -),Sulfatos (mg/l SO4=),Fósforo disuelto (mg/l PO4),Fósforo total (mg/l PO4),Nitrato (mg/l NO3),Nitrito (mg/l NO2),Nitrógeno amoniacal (mg/l NH4),Nitrógeno total Kjeldahl (mg/l N),Carbono organico disuelto (mg/l),Coliformes fecales (en NMP) (NMP/100 ml),Coliformes totales (en NMP) (NMP/100 ml),Cianuros libre (mg/l CN-),Fenoles (mg/l C6H6O),Sulfuros (mg/l S=),Aerobios mesófilos totales (en UFC) (UFC/100 ml),Coliformes fecales (en UFC) (UFC/100 ml),Coliformes totales (en UFC) (UFC/100 ml),Cianuros libre (CN-),Sulfuros (S=),Cianuros (mg/l CN-),Color (u PtCo),Boro disuelto (ug/l B),Boro total (ug/l B),Selenio disuelto (ug/l Se),Selenio total (ug/l Se),Hidrocarburos totales (mg/l),Boro suspensión (mg/kg B),Selenio suspensión (mg/kg Se),Cobre total (Cu),Cromo disuelto (Cr),Cromo total (Cr),Hierro disuelto (Fe),Hierro total (Fe),Manganeso disuelto (Mn),Manganeso total (Mn),Mercurio disuelto (Hg),Mercurio total (Hg),Niquel disuelto (Ni),Niquel total (Ni),Plata disuelto (Ag),Plata total (Ag),Plomo disuelto (Pb),Plomo total (Pb),Selenio disuelto (Se),Selenio total (Se),Zinc disuelto (Zn),Zinc total (Zn),Fenoles (C6H6O),Aerobios mesófilos totales (en UFC) (UFC/ml),Hidrocarburos totales (),Cadmio total (Cd),Cobre disuelto (Cu),Fósforo total (PO4),Arsenico total (As),Boro disuelto (B),Boro total (B),Cadmio disuelto (Cd),Demanda bioquímica de oxígeno (O2),Demanda química de oxígeno (O2),Arsenico disuelto (As),Magnesio total (Mg),Potasio disuelto (K),Sodio disuelto (Na),Sulfatos (SO4=),Nitrato (NO3),Nitrito (NO2),Nitrógeno amoniacal (NH4),Fósforo disuelto (PO4),Alcalinidad Fenolftaleina (mg/l CaCO3),Turbiedad (NTU),Bismuto disuelto (ug/l Bi),Bismuto total (ug/l Bi),Talio disuelto (ug/l Tl),Talio total (ug/l Tl),Bismuto suspensión (mg/kg Bi),Talio en suspensión (mg/kg Tl),Presión Parcial (mm Hg),Resistividad (Ohm.cm),Bismuto total (Bi),Talio disuelto (Tl),Talio total (Tl),Bismuto disuelto (Bi),Aerobios mesófilos totales (en NMP) (NMP/100 ml),Cianuros (CN-),Coliformes totales (en UFC) (),Coliformes totales (en NMP) (),Alcalinidad total (CaCO3),Dureza total (CaCO3),Magnesio disuelto (Mg),Potasio total (K),Sodio total (Na),Nitrógeno total Kjeldahl (N),Aerobios mesófilos totales (en UFC) (),Coliformes fecales (en NMP) (),Coliformes fecales (en UFC) (),pH en laboratorio (u pH),Sólidos sedimentables (ml/l),Calcio disuelto (Ca),Calcio total (Ca),Cloruros (Cl -),Carbono orgánico total (mg/l)
0,-22.3792,-62.5189,1,"22º 22' 45.1""","62º31 8.2""",Pilcomayo,238 msnm,26-04-2007,08:05 Hs,1.027 m/s,124 m3/s,Abril 2007,Unidad de Medio Ambiente,709,6.32,7.81,486,504,990,17.7,60.1,63,270,21,26.9,3.2,8.53,48.3,58.7,27,63,2.3,17,< 0.2,1.6,1.2,26,1.1,58,250,33000,11.3,539,< 0.08,< 0.08,2.8,32,< 0.08,< 0.08,< 0.08,59,3.3,89,29.17,3.17,49.21,112.90,64980.16,1047.02,57.94,110.71,170.04,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
1,-21.2794,-63.4546,2,"21º 16' 45.9""","63º27 16.7""",Pilcomayo,431 msnm,27-04-2007,10:00 Hs,0.441 m/s,113 m3/s,Abril 2007,Unidad de Medio Ambiente,804,5.89,8.23,566,150,774,21,52.3,55.11,240,22,24.3,3.34,4.38,59.6,75.8,11,25,2.8,7.3,0.3,0.2,1.5,5.6,1.7,8.3,390,5200,8.8,115,< 0.08,< 0.08,3.6,7,< 0.08,< 0.08,2.7,5.6,,,30.00,,27.33,44.00,32066.67,708.00,22.67,15.07,,134,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
2,-21.2396,-65.2091,3,"21º 14' 22.6""","65º12 32.6""",San Juan del Oro,2339 msnm,28-04-2007,10:05 Hs,0.829 m/s,9 m3/s,Abril 2007,Unidad de Medio Ambiente,1346,6.44,8.23,1100,59,1200,12.9,141,155,610,60,63,4.78,7.64,73.7,84.5,22.8,7,3,4.9,< 0.2,< 0.08,1.3,7.2,2,2.7,470,20000,11.8,66,< 0.08,< 0.08,5,7.8,< 0.08,< 0.08,< 0.08,3,9.9,12,32.20,,100.00,11.86,331016.95,918.64,47.46,,35.59,51.7,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
3,-20.7421,-65.2414,4,"20º 44' 31.7""","65º14 29.0""",Tumusla,2336 msnm,28-04-2007,13:00 Hs,0.55 m/s,8 m3/s,Abril 2007,Unidad de Medio Ambiente,1285,5.63,8.31,1000,270,1500,16.8,99.1,154,700,86.3,91,5.33,9.1,55.9,67.9,40.35,46,3.2,7.6,< 0.2,0.35,0.9,9.1,2.4,17,340,11000,94,317,< 0.08,< 0.08,5.6,16.2,< 0.08,< 0.08,< 0.08,8.5,3.2,38.4,16.30,1.30,30.37,54.07,39481.48,825.93,39.26,11.74,130.37,362,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
4,-19.4719,-65.7936,5,"19º 28' 18.9""","65º 47' 36.8""",Tarapaya,3341 msnm,29-04-2007,10:30 Hs,0.74 m/s,2 m3/s,Abril 2007,Unidad de Medio Ambiente,813,4.77,6.72,620,150,800,13.2,91.5,103,310,10,13.4,5.59,8.31,34,42.9,81,21,18.2,170,14.7,20,7.5,122,0.4,4.2,3000,20000,950,1200,< 0.08,< 0.08,13.3,18.2,< 0.08,1.2,< 0.08,49,4300,5700,1012.00,35.33,763.33,25.33,113333.33,1666.67,32.67,289.40,9333.33,196,8.00,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
859,-21.2579,-63.5121,1296,"21° 15' 28.614""","63° 30' 43.572""",Pilcomayo,377 msnm,07-08-2022,07:55 Hs,SIN DATOS,SIN DATOS,Agosto 2022,Unidad de Monitoreo y Centro de Datos,1408,8.7,8.58,954,18,972,20.6,104.7,106.7,469.3,49.8,53.1,8,8.9,137,161,17.7,47.5,< 10,< 10,< 5,< 5,< 10,< 10,< 5,< 5,51,709,< 10,60,< 10,< 10,< 5,< 5,< 10,< 10,< 10,< 10,32,81,,,,,36555.56,3333.33,,,2722.22,,,,-99.2,0.7,101.3,112.7,176.2,362,0.06,0.18,12.1,3.8,,0.18,,930,23000,,0.068,< 1,61000,,,,,,98,847,911,< 10,< 10,,3555.56,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,25.1,25.6,29,< 10,< 10,< 10,,,200.6,710,,,,,,,,,,,,,,,,,,,,,,,
860,-22.3781,-62.5186,1297,"22° 22' 41.22""","62° 31' 6.93""",Pilcomayo,261 msnm,18-08-2022,11:25 Hs,SIN DATOS,SIN DATOS,Agosto 2022,Unidad de Monitoreo y Centro de Datos,1472,9.38,8.23,1063,2266,3358,16.7,111.8,226,477.4,47.5,102.5,7.6,15.3,149,228,16.2,50,< 10,18,< 5,< 5,< 10,20,< 5,46,69,32709,27,566,< 10,< 10,< 5,23,< 10,21,< 10,< 10,42,150,7.94,,8.83,20.30,14404.24,237.86,10.15,,47.66,,9.27,,-80.1,0.7,98.4,107.1,201.2,303.2,0.03,0.12,12.2,,,1.23,,430,2400,,0.048,< 1,73000,,,,,,5.5,856,923,< 10,< 10,,29.57,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,18.65,647,< 10,< 10,< 10,< 10,,,201,679,,,,,,,,,,,,,,,,,,,,,,,
861,-25.2641,-57.7243,1298,"25° 15' 50.814""","57° 43' 27.666""",Pilcomayo,61 msnm,25-08-2022,08:30 Hs,SIN DATOS,SIN DATOS,Agosto 2022,Unidad de Monitoreo y Centro de Datos,2820,4.51,7.67,,,,21,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,-46,1.5,50.7,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,4.19,,,,,,,104.5,354.5,,,,,,,,,,,,,,,,,,,,,,,
862,-25.7884,-58.0215,1299,"25° 47' 18.078""","58° 1' 17.31""",Montelindo,63 msnm,25-08-2022,16:35 Hs,SIN DATOS,SIN DATOS,Agosto 2022,Unidad de Monitoreo y Centro de Datos,4020,,8.4,,,,21.3,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,-89,2.1,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,10.3,,,,,,,,248,,,,,,,,,,,,,,,,,,,,,,,


In [195]:
df.to_csv('data/mediciones.csv', index=False)