## Unir tablas
Cuando diseñamos todo un sistema de base de datos utilizando buenos principios de diseño, como la normalización, es necesario separar diferentes aspectos de la información en tablas normalizadas. En tal caso, a menudo requerimos el uso de joins para recuperar datos de múltiples tablas en una sola consulta SELECT. Dos tablas pueden unirse mediante un único operador de unión, pero el resultado puede volver a unirse con otras tablas. Debe existir una columna igual o similar entre las tablas que se unen.

Para conectar tablas en una consulta, se utiliza una sentencia **JOIN ... ON**. Hay diferentes tipos de uniones en SQLite:

- INNER JOIN (o a veces llamado simple join)
- LEFT OUTER JOIN (o a veces llamado LEFT JOIN)
- CROSS JOIN

El RIGHT OUTER JOIN y el FULL OUTER JOIN no están soportados en SQLite.

In [5]:
!pip install ipython-sql sqlalchemy pgspecial "cloud-sql-python-connector[pg8000]" psycopg2-binary

Collecting psycopg2-binary
  Downloading psycopg2_binary-2.9.3-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (3.0 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m3.0/3.0 MB[0m [31m49.3 MB/s[0m eta [36m0:00:00[0ma [36m0:00:01[0m
[0mInstalling collected packages: psycopg2-binary
[0mSuccessfully installed psycopg2-binary-2.9.3
[0m

In [None]:
%load_ext sql
%config SqlMagic.style = '_DEPRECATED_DEFAULT'

## Conectar con la base de datos dada de demo.db3

In [3]:
%sql sqlite:///data/demo.db3

Si no recuerda las tablas de los datos de la demostración, siempre puede utilizar el siguiente comando para consultarlas.

In [4]:
%sql SELECT name FROM sqlite_master WHERE type='table'

 * sqlite:///data/demo.db3
Done.


name
rch
hru
sub
sed
watershed_daily
watershed_monthly
watershed_yearly
channel_dimension
hru_info
sub_info


## INNER JOIN
El INNER JOIN nos permite fusionar dos tablas. Pero si vamos a fusionar tablas, tenemos que definir un punto en común entre las dos para que los registros de ambas tablas se alineen. Necesitamos definir uno o más campos que tengan en común y unirlos.

<div align="center" id="contents">
<img src = "https://www.w3schools.com/sql/img_innerjoin.gif" width="20%" height="20%">
</div>
<br>

### Comprobar las columnas comunes
Aquí tomamos como ejemplo las tablas de rch y sub. Hay tres columnas comunes de RCH/SUB, YR y MO.

In [5]:
%sql SELECT * From rch LIMIT 3

 * sqlite:///data/demo.db3
Done.


RCH,YR,MO,FLOW_INcms,FLOW_OUTcms,EVAPcms,TLOSScms,SED_INtons,SED_OUTtons,SEDCONCmg_kg,ORGN_INkg,ORGN_OUTkg,ORGP_INkg,ORGP_OUTkg,NO3_INkg,NO3_OUTkg,NH4_INkg,NH4_OUTkg,NO2_INkg,NO2_OUTkg,MINP_INkg,MINP_OUTkg,CHLA_INkg,CHLA_OUTkg,CBOD_INkg,CBOD_OUTkg,DISOX_INkg,DISOX_OUTkg,SOLPST_INmg,SOLPST_OUTmg,SORPST_INmg,SORPST_OUTmg,REACTPSTmg,VOLPSTmg,SETTLPSTmg,RESUSP_PSTmg,DIFFUSEPSTmg,REACBEDPSTmg,BURYPSTmg,BED_PSTmg,BACTP_OUTct,BACTLP_OUTct,CMETAL_1kg,CMETAL_2kg,CMETAL_3kg,TOT_Nkg,TOT_Pkg,NO3ConcMg_l,WTMPdegc
1,1981,1,146.34376525878906,146.2524871826172,0.09128088504076,0.0,2.332046165065549e-07,61619.46484375,155.3719024658203,0.0160862877964973,0.0,0.0482588782906532,0.0,362.0486755371094,361.8135070800781,203.620849609375,421.1837768554688,0.0,23.0184326171875,0.0161072444170713,0.0,1.1839052307949238e-11,0.0,0.0,0.0,5627225.0,5623486.5,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,806.0157470703125,0.0,0.0,0.0
2,1981,1,96.22569274902344,96.18285369873048,0.0428212843835353,0.0,1.6426764659627224e-07,0.0,0.0,0.0136315366253256,0.0,0.0408946201205253,0.0,315.6005249023437,315.4579772949219,0.0,127.00502014160156,0.0,0.0,0.0136560499668121,0.0,4.136972177163251e-16,0.0,0.0,0.0,3757606.5,3698301.5,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,442.4630126953125,0.0,0.0,0.0
3,1981,1,11.952718734741213,11.861368179321287,0.0913518294692039,0.0,2.0325823868461162e-07,2.0325823868461162e-07,6.595060941805286e-09,0.0114662880077958,0.0,0.0343988612294197,0.0091180382296442,48.2963752746582,47.93150329589844,0.0,62.467620849609375,0.0,0.0,0.0114851053804159,0.0,5.941028783295818e-14,0.0,0.0,0.0,360979.90625,456115.90625,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,110.3991241455078,0.0091180382296442,0.0,0.0


In [6]:
%sql SELECT * From sub LIMIT 3

 * sqlite:///data/demo.db3
Done.


SUB,YR,MO,PRECIPmm,SNOMELTmm,PETmm,ETmm,SWmm,PERCmm,SURQmm,GW_Qmm,WYLDmm,SYLDt_ha,ORGNkg_ha,ORGPkg_ha,NSURQkg_ha,SOLPkg_ha,SEDPkg_ha,LAT_Q_mm,LATNO3kg_h,GWNO3kg_ha,CHOLAmic_L,CBODU_mg_L,DOXQ_mg_L,TNO3kg_ha,QTILEmm,TVAPkg_ha
1,1981,1,35.60198974609375,0.0,3.7207436561584473,0.2496423572301864,10.79859447479248,0.0,2.3795111701474525e-05,0.0537296123802661,0.2988955080509186,3.4497936191729694e-13,2.37964208338326e-08,2.37964208338326e-08,2.37964208338326e-08,2.37964208338326e-08,4.75928416676652e-08,0.0078118653036653,0.0,1.5622873661413905e-07,0.0,0.0,0.0,0.0,0.0,0.0
2,1981,1,108.60607147216795,0.0,3.4504077434539795,0.4572055637836456,56.32500457763672,0.0,1.7237898646271788e-05,28.57205009460449,32.59342956542969,2.0773781187009152e-13,1.7238855676282583e-08,1.7238855676282583e-08,1.7238855676282583e-08,1.7238855676282583e-08,3.4477711352565166e-08,0.0339314937591552,1.6220961697399616e-05,0.0003828798071481,0.0,0.0,0.0,0.0,0.0,0.0
3,1981,1,149.30836486816406,0.0,10.566324234008787,6.027106285095215,71.0020980834961,0.0,2.4236529498011805e-05,3.9627554416656494,5.274456977844238,3.348758173971761e-13,1.8891142872234923e-08,1.8891142872234923e-08,1.8891142872234923e-08,1.8891142872234923e-08,3.7782285744469846e-08,0.0079149268567562,3.722414703588584e-06,7.582882244605571e-05,0.0,0.0,0.0,0.0,0.0,0.0


## Hacer un inner join
La sintaxis del INNER JOIN en SQLite es

    SELECT columnas
    FROM tabla1
    INNER JOIN tabla2
    ON tabla1.columna = tabla2.columna;

Join en RCH/SUB, YR y MO.

Nota: Al seleccionar las columnas comunes, hay que asignar claramente un nombre de tabla. Si los nombres de las columnas o de las tablas son demasiado largos, podemos utilizar alias para darles nombres cortos.

In [7]:
%%sql sqlite://
SELECT RCH, rch.YR, rch.MO, FLOW_INcms, FLOW_OUTcms, PRECIPmm, PETmm
FROM rch INNER JOIN sub
ON rch.RCH = sub.SUB and rch.YR=sub.YR and rch.MO=sub.MO
LIMIT 5

Done.


RCH,YR,MO,FLOW_INcms,FLOW_OUTcms,PRECIPmm,PETmm
1,1981,1,146.34376525878906,146.2524871826172,35.60198974609375,3.7207436561584473
2,1981,1,96.22569274902344,96.18285369873048,108.60607147216795,3.4504077434539795
3,1981,1,11.952718734741213,11.861368179321287,149.30836486816406,10.566324234008787
4,1981,1,49.48649215698242,49.40651321411133,108.60604858398438,10.674993515014648
5,1981,1,274.0668029785156,272.10601806640625,201.311279296875,27.179243087768555


## LEFT JOIN
Al igual que la cláusula INNER JOIN, la cláusula LEFT JOIN es una cláusula opcional de la sentencia SELECT. La cláusula LEFT JOIN se utiliza para consultar datos de varias tablas correlacionadas. Este tipo de unión devuelve todas las filas de la tabla LEFT especificada en la condición ON y sólo aquellas filas de la otra tabla en las que los campos unidos son iguales (se cumple la condición de unión).

<div align="center" id="contents">
<img src = "https://www.w3schools.com/sql/img_leftjoin.gif" width="20%" height="20%">
</div>
<br>


La sintaxis del LEFT OUTER JOIN de SQLite es

    SELECT columnas
    FROM tabla1
    LEFT [OUTER] JOIN tabla2
    ON tabla1.columna = tabla2.columna;



In [10]:
%%sql sqlite://
SELECT RCH, rch.YR, rch.MO, FLOW_INcms, FLOW_OUTcms, PRECIPmm, PETmm
FROM rch LEFT JOIN sub
ON rch.RCH = sub.SUB and rch.YR=sub.YR and rch.MO=sub.MO
LIMIT 5

Done.


RCH,YR,MO,FLOW_INcms,FLOW_OUTcms,PRECIPmm,PETmm
1,1981,1,146.34376525878906,146.2524871826172,35.60198974609375,3.7207436561584473
2,1981,1,96.22569274902344,96.18285369873048,108.60607147216795,3.4504077434539795
3,1981,1,11.952718734741213,11.861368179321287,149.30836486816406,10.566324234008787
4,1981,1,49.48649215698242,49.40651321411133,108.60604858398438,10.674993515014648
5,1981,1,274.0668029785156,272.10601806640625,201.311279296875,27.179243087768555


## CROSS JOIN
Otro tipo de unión se llama SQLite CROSS JOIN. Este tipo de unión devuelve un conjunto de resultados combinados con cada fila de la primera tabla que coincide con cada fila de la segunda tabla. También se denomina producto cartesiano.

<div align="center" id="contents">
<img src = "https://www.sqlshack.com/wp-content/uploads/2020/02/sql-cross-join-working-principle-1.png" width="40%" height="40%">
</div>
<br>

La sintaxis del CROSS JOIN de SQLite es

    SELECT columnas
    FROM tabla1
    CROSS JOIN tabla2;

In [11]:
%%sql sqlite://
SELECT RCH, rch.YR, rch.MO, FLOW_INcms, FLOW_OUTcms, PRECIPmm, PETmm
FROM rch
CROSS JOIN sub
LIMIT 5

Done.


RCH,YR,MO,FLOW_INcms,FLOW_OUTcms,PRECIPmm,PETmm
1,1981,1,146.34376525878906,146.2524871826172,35.60198974609375,3.7207436561584473
1,1981,1,146.34376525878906,146.2524871826172,108.60607147216795,3.4504077434539795
1,1981,1,146.34376525878906,146.2524871826172,149.30836486816406,10.566324234008787
1,1981,1,146.34376525878906,146.2524871826172,108.60604858398438,10.674993515014648
1,1981,1,146.34376525878906,146.2524871826172,201.311279296875,27.179243087768555


## Consulta de varias tablas mediante JOIN
Las bases de datos relacionales pueden ser bastante complejas en cuanto a las relaciones entre tablas. A veces, tenemos que requerir información de más de dos tablas.

Podemos utilizar la siguiente sintaxis para unir varias tablas:

SELECT columnas
FROM tabla1
INNER JOIN tabla2 ON tabla1.columna = tabla2.columna
INNER JOIN tabla3 ON tabla1.columna = tabla3.columna
...
INNER JOIN tablen ON tabla1.columna = tablen.columna;

No hay límite de número máximo de tablas que se pueden unir según el propio SQL. Sin embargo, la mayoría de los SGBD tienen sus propios límites. Debería consultar la documentación de su SGBD en aplicaciones prácticas. Además, la consulta se ralentizará considerablemente si se unen demasiadas tablas (por ejemplo, 4 o más tablas).

### Resumen
En este cuaderno hemos practicado los tres principales tipos de join en SQLite: INNER, LEFT y CROSS joins. Las uniones nos permiten tomar datos dispersos en varias tablas y unirlos en algo más significativo y descriptivo. Podemos tomar dos o más tablas y unirlas en una tabla más grande que tenga más contexto. Además, el uso de alias nos permite cambiar el nombre de las columnas o las tablas sobre la marcha.



## Técnicas avanzadas de consulta de CASE y subconsulta
La expresión CASE de SQLite evalúa una lista de condiciones y devuelve una expresión basada en el resultado de la evaluación. La expresión CASE es similar a la sentencia IF-THEN-ELSE de otros lenguajes de programación. Puede utilizar la sentencia CASE en cualquier cláusula o sentencia que acepte una expresión válida. Por ejemplo, puede utilizar la sentencia CASE en cláusulas como WHERE, ORDER BY, HAVING, IN, SELECT y sentencias como SELECT, UPDATE y DELETE. Para más información, consulte http://www.sqlitetutorial.net/sqlite-case/.

Una subconsulta, en pocas palabras, es una consulta escrita como parte de una sentencia mayor. Piense en ella como una sentencia SELECT dentro de otra. El resultado de la SELECT interna puede utilizarse en la consulta externa.

En este cuaderno, hemos juntado estas dos técnicas de consulta para calcular la escorrentía estacional a partir de los datos año-mes en la tabla de rch.

In [12]:
%load_ext sql

The sql extension is already loaded. To reload it, use:
  %reload_ext sql


## Comprobar la tabla rch
Podemos comprobar que la tabla rch contiene datos de series temporales con el año y el mes para cada tramo del río. Por lo tanto, es natural calcular algunas estadísticas estacionales.

In [13]:
%sql SELECT * From rch LIMIT 3

 * sqlite:///data/demo.db3
Done.


RCH,YR,MO,FLOW_INcms,FLOW_OUTcms,EVAPcms,TLOSScms,SED_INtons,SED_OUTtons,SEDCONCmg_kg,ORGN_INkg,ORGN_OUTkg,ORGP_INkg,ORGP_OUTkg,NO3_INkg,NO3_OUTkg,NH4_INkg,NH4_OUTkg,NO2_INkg,NO2_OUTkg,MINP_INkg,MINP_OUTkg,CHLA_INkg,CHLA_OUTkg,CBOD_INkg,CBOD_OUTkg,DISOX_INkg,DISOX_OUTkg,SOLPST_INmg,SOLPST_OUTmg,SORPST_INmg,SORPST_OUTmg,REACTPSTmg,VOLPSTmg,SETTLPSTmg,RESUSP_PSTmg,DIFFUSEPSTmg,REACBEDPSTmg,BURYPSTmg,BED_PSTmg,BACTP_OUTct,BACTLP_OUTct,CMETAL_1kg,CMETAL_2kg,CMETAL_3kg,TOT_Nkg,TOT_Pkg,NO3ConcMg_l,WTMPdegc
1,1981,1,146.34376525878906,146.2524871826172,0.09128088504076,0.0,2.332046165065549e-07,61619.46484375,155.3719024658203,0.0160862877964973,0.0,0.0482588782906532,0.0,362.0486755371094,361.8135070800781,203.620849609375,421.1837768554688,0.0,23.0184326171875,0.0161072444170713,0.0,1.1839052307949238e-11,0.0,0.0,0.0,5627225.0,5623486.5,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,806.0157470703125,0.0,0.0,0.0
2,1981,1,96.22569274902344,96.18285369873048,0.0428212843835353,0.0,1.6426764659627224e-07,0.0,0.0,0.0136315366253256,0.0,0.0408946201205253,0.0,315.6005249023437,315.4579772949219,0.0,127.00502014160156,0.0,0.0,0.0136560499668121,0.0,4.136972177163251e-16,0.0,0.0,0.0,3757606.5,3698301.5,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,442.4630126953125,0.0,0.0,0.0
3,1981,1,11.952718734741213,11.861368179321287,0.0913518294692039,0.0,2.0325823868461162e-07,2.0325823868461162e-07,6.595060941805286e-09,0.0114662880077958,0.0,0.0343988612294197,0.0091180382296442,48.2963752746582,47.93150329589844,0.0,62.467620849609375,0.0,0.0,0.0114851053804159,0.0,5.941028783295818e-14,0.0,0.0,0.0,360979.90625,456115.90625,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,110.3991241455078,0.0091180382296442,0.0,0.0


### Calcular la escorrentía estacional
Hay dos pasos clave:

    (1) utilizar el CASE y la subconsulta para convertir los meses en estaciones con nombre;
    (2) calcular la media estacional con funciones agregadas en grupos.

Además, también utilizamos otra palabra clave de filtro de **BETWEEN** para abarcar los meses en estaciones.

In [22]:
%%sql sqlite://
SELECT RCH, YR, 
CASE 
    WHEN (MO) BETWEEN 3 AND 5 THEN 'MAM'   
    WHEN (MO) BETWEEN 6 and 8 THEN 'JJA'
    WHEN (MO) BETWEEN 9 and 11 THEN 'SON'
    ELSE 'DJF' 
END Quarter,
FLOW_OUTcms
from rch
LIMIT 10

Done.


RCH,YR,Quarter,FLOW_OUTcms
1,1981,DJF,146.2524871826172
2,1981,DJF,96.18285369873048
3,1981,DJF,11.861368179321287
4,1981,DJF,49.40651321411133
5,1981,DJF,272.10601806640625
6,1981,DJF,486.3185729980469
7,1981,DJF,23.289026260375977
8,1981,DJF,214.28143310546875
9,1981,DJF,193.4912109375
10,1981,DJF,53.8569450378418


In [14]:
%%sql sqlite://
SELECT RCH, Quarter, AVG(FLOW_OUTcms) as Runoff
FROM(
SELECT RCH, YR, 
CASE 
    WHEN (MO) BETWEEN 3 AND 5 THEN 'MAM'   
    WHEN (MO) BETWEEN 6 and 8 THEN 'JJA'
    WHEN (MO) BETWEEN 9 and 11 THEN 'SON'
    ELSE 'DJF' 
END Quarter,
FLOW_OUTcms
from rch)
GROUP BY RCH, Quarter

Done.


RCH,Quarter,Runoff
1,DJF,99.20499053531223
1,JJA,1405.262297990587
1,MAM,559.7469320191277
1,SON,454.73798531426326
2,DJF,56.328539085388186
2,JJA,773.6642798105876
2,MAM,203.2428277624978
2,SON,297.9343263414171
3,DJF,32.838328109847176
3,JJA,166.31038238737318


## Resumen
A veces, podemos necesitar construir requerimientos complicados que van más allá de una unión de tablas o una consulta SELECT básica. Por ejemplo, podríamos necesitar escribir una consulta que utilice los resultados de otras consultas como entradas (es decir, SUBQUERY). O podríamos necesitar reclasificar valores numéricos en categorías antes de contarlos (es decir, CASE).

En este cuaderno, hemos explorado una colección de funciones y opciones SQL esenciales para resolver problemas más complejos. Ahora podemos añadir subconsultas en varios lugares para proporcionar un control más fino sobre el filtrado o el preprocesamiento de datos antes de analizarlos en una consulta principal.

## Uso de las vistas para simplificar las consultas
Uno de los aspectos más bonitos del modelo de datos relacional y de SQL es que el resultado de una consulta es también una tabla, una relación para ser más exactos. Puede consistir en una sola columna o una sola fila, pero no deja de ser una tabla. Una vista es una consulta que puede utilizarse como una tabla. Una vista puede considerarse como una tabla virtual que no contiene datos. Sólo contienen una consulta. Cada vez que se accede a una vista, se ejecuta la consulta subyacente y los resultados devueltos pueden utilizarse como si constituyeran una tabla real.

Hay varias razones para utilizar las vistas. Creo que la razón más importante es que somos perezosos y no queremos escribir las mismas sentencias de consulta largas y complicadas cada vez :) Estoy bromeando. Sin embargo, ten en cuenta el principio de programación DRY: No te repitas. Evitar la repetición ahorra tiempo y evita errores innecesarios. Esta es una de las razones por las que guardamos las consultas como vistas de base de datos reutilizables.

Las vistas SQLite se crean utilizando la sentencia CREATE VIEW. Las vistas SQLite pueden crearse a partir de una sola tabla, de varias tablas o de otra vista. La siguiente es la sintaxis básica de CREATE VIEW:

    CREATE [TEMP | TEMPORARY] VIEW nombre_vista COMO
    SELECT columna1, columna2.....
    FROM nombre_tabla
    WHERE [condición];

La vista SQLite es de sólo lectura. Esto significa que no puedes utilizar las sentencias INSERT, DELETE y UPDATE para actualizar los datos de las tablas base a través de la vista.

In [15]:
%load_ext sql

The sql extension is already loaded. To reload it, use:
  %reload_ext sql


## Simplificación de las consultas con vistas
En algunos pasos anteriores, utilizamos CASE y Subquery para calcular la escorrentía estacional a partir de la tabla de rch. Aquí utilizamos una vista para simplificar el cálculo.

### Recordemos cómo calcular las escorrentías de la temporada

In [16]:
%%sql sqlite://
SELECT RCH, Quarter, AVG(FLOW_OUTcms) as Runoff
FROM(
SELECT RCH, YR, 
CASE 
    WHEN (MO) BETWEEN 3 AND 5 THEN 'MAM'   
    WHEN (MO) BETWEEN 6 and 8 THEN 'JJA'
    WHEN (MO) BETWEEN 9 and 11 THEN 'SON'
    ELSE 'DJF' 
END Quarter,
FLOW_OUTcms
from rch)
GROUP BY RCH, Quarter
LIMIT 5

Done.


RCH,Quarter,Runoff
1,DJF,99.20499053531223
1,JJA,1405.262297990587
1,MAM,559.7469320191277
1,SON,454.73798531426326
2,DJF,56.328539085388186


## Creación de una vista

In [25]:
%%sql sqlite://
CREATE VIEW RCH_VW AS SELECT RCH, YR, 
CASE 
    WHEN (MO) BETWEEN 3 AND 5 THEN 'MAM'   
    WHEN (MO) BETWEEN 6 and 8 THEN 'JJA'
    WHEN (MO) BETWEEN 9 and 11 THEN 'SON'
    ELSE 'DJF' 
END Quarter,
FLOW_OUTcms
from rch

Done.


[]

Vamos a consultar la vista RCH_VW

In [26]:
%%sql sqlite://
SELECT * 
FROM RCH_VW 
LIMIT 5

Done.


RCH,YR,Quarter,FLOW_OUTcms
1,1981,DJF,146.2524871826172
2,1981,DJF,96.18285369873048
3,1981,DJF,11.861368179321287
4,1981,DJF,49.40651321411133
5,1981,DJF,272.10601806640625


## Recalcular las escorrentías estacionales con vistas
Los códigos realmente se acortan.

In [27]:
%%sql sqlite://
SELECT RCH, Quarter, AVG(FLOW_OUTcms) as Runoff
FROM RCH_VW
GROUP BY RCH, Quarter
LIMIT 5

Done.


RCH,Quarter,Runoff
1,DJF,99.20499053531223
1,JJA,1405.262297990587
1,MAM,559.7469320191277
1,SON,454.73798531426326
2,DJF,56.328539085388186


## Borrar vistas
Es bastante fácil borrar las vistas. Sólo tienes que llamarlas de la siguiente manera.

In [23]:
%sql DROP VIEW RCH_VW

 * sqlite:///data/demo.db3
Done.


[]

## Resumen
Las vistas son tablas virtuales que no contienen datos, sólo sentencias SQL. Estas sentencias se ejecutan cada vez que se accede a la vista. Dado que las vistas se crean dinámicamente a medida que se accede a ellas y los datos de las mismas están siempre frescos y actualizados, tienen algunas ventajas sobre la creación de subtablas a partir de una tabla. Los datos de las subtablas son estáticos y pueden estar desactualizados.

Una vista es útil en algunos casos:

- En primer lugar, las vistas proporcionan una capa de abstracción sobre las tablas. Puede añadir y eliminar las columnas de la vista sin tocar el esquema de las tablas subyacentes.
- En segundo lugar, puede utilizar las vistas para encapsular consultas complejas con uniones para simplificar el acceso a los datos.

## Tratamiento de los valores nulos
Los datos de ejemplo en las tablas del demo.db3 mostradas anteriormente son todos precisos y completos. Cada fila tiene un valor para cada atributo. Sin embargo, los datos reales no suelen ser tan limpios y ordenados. A menudo encontrará valores NULL en algunas tablas.

Los nulos en una base de datos pueden causar algunos dolores de cabeza. Además, las descripciones de los estándares SQL sobre cómo manejar los NULL parecen ambiguas. No está claro en los documentos de las normas cómo deben manejarse exactamente los NULL en todas las circunstancias.

A veces, podemos evitar los NULL estableciendo la restricción NOT NULL cuando creamos una tabla. Sin embargo, conviene tener en cuenta que hacer que los campos sean NOT NULL no siempre funciona y podría crear más dolores de cabeza de los que cura. No todos los valores de null significan que hay un problema con los datos.

SQLite NULL es el término utilizado para representar un valor ausente. Un valor NULL en una tabla es un valor en un campo que parece estar en blanco. Sin embargo, un valor NULL no debe pensarse simplemente como 0 (cero) o una cadena vacía como ' '. Es un valor de como vacío o indefinido.

A continuación revisaremos:

    Cómo ELIMINAR una tabla IF EXISTS
    Cómo CREAR una nueva tabla a partir de una tabla existente
    Cómo ACTUALIZAR una tabla con una condición WHERE
    Cómo CONTAR valores NULL con IS NULL
    Cómo dar valores NULL por defecto con la función COALESCE de SQLite

In [28]:
%load_ext sql

The sql extension is already loaded. To reload it, use:
  %reload_ext sql


## Crear una tabla con valores NULL a partir de una tabla existente
Tome la tabla de watershed_yearly como ejemplo.

En primer lugar, haga una copia de seguridad de la tabla

    La sentencia SQLite CREATE TABLE AS se utiliza para crear una tabla a partir de una tabla existente copiando las columnas de la misma.

In [29]:
%%sql sqlite://
DROP TABLE  IF EXISTS watershed_yearly_bk;
CREATE TABLE watershed_yearly_bk AS SELECT * FROM watershed_yearly

Done.
Done.


[]

Comprueba rápidamente la tabla de copias de seguridad

In [30]:
%%sql sqlite://
SELECT YR, PREC_mm 
FROM watershed_yearly_bk
LIMIT 3

Done.


YR,PREC_mm
1981,895.6051025390625
1982,884.670654296875
1983,816.6605224609375


## En segundo lugar, hacer algunos valores como NULLs
La consulta UPDATE de SQLite se utiliza para modificar los registros existentes en una tabla. Puede utilizar la cláusula WHERE con la consulta UPDATE para actualizar las filas seleccionadas, de lo contrario se actualizarán todas las filas.

In [31]:
%%sql sqlite://
UPDATE watershed_yearly_bk
SET PREC_mm = NULL
WHERE
    PREC_mm < 850.0

18 rows affected.


[]

## Encontrar NULLs
Los valores nulos no se pueden determinar con un =. Tenemos que utilizar las sentencias IS NULL o IS NOT NULL para identificar los valores nulos. Por lo tanto, para obtener todos los registros sin profundidad de nieve registrada, podríamos ejecutar esta consulta.

In [32]:
%%sql sqlite://
SELECT  YR, PREC_mm
FROM watershed_yearly_bk
WHERE PREC_mm IS NULL

Done.


YR,PREC_mm
1983,
1985,
1986,
1990,
1994,
1995,
1996,
1997,
1998,
1999,


El recuento de años con NULLs

In [33]:
%%sql sqlite://
SELECT  COUNT(YR) AS MISSING
FROM watershed_yearly_bk
WHERE PREC_mm IS NULL

Done.


MISSING
18


Es correcto el número de filas que actualizamos.

## Manejar los NULLs
Los NULL pueden ser ambiguos y molestos, ya que se identifican de forma diferente según las fuentes de datos. Los datos pueden tener valores NULL por varias razones, como observaciones que no se registraron y corrupción de datos.

In [41]:
%%sql sqlite://
SELECT  YR, PREC_mm
FROM watershed_yearly_bk

Done.


YR,PREC_mm
1981,895.6051025390625
1982,884.670654296875
1983,
1984,867.5743408203125
1985,
1986,
1987,1007.8944702148438
1988,895.8466186523438
1989,930.10546875
1990,


### En general, hay dos estrategias principales para manejar los NULL durante la sesión de consulta y NO cambiar los datos originales de la tabla.

#### No utilizar filas con valores NULL
Esta estrategia es bastante sencilla, ya que siempre podemos filtrar los datos con una condición WHERE IS NOT NULL. Sin embargo, en la práctica, los datos se utilizarían en absoluto, si la proporción de NULLs es demasiado alta.

In [34]:
%%sql sqlite://
SELECT  YR, PREC_mm
FROM watershed_yearly_bk
WHERE PREC_mm IS NOT NULL

Done.


YR,PREC_mm
1981,895.6051025390625
1982,884.670654296875
1984,867.5743408203125
1987,1007.8944702148438
1988,895.8466186523438
1989,930.10546875
1991,984.4703369140624
1992,907.9463500976562
1993,1057.7733154296875
2005,855.0092163085938


Calcula los recuentos de NULLs, NOt_NULLs y el total. Tenga en cuenta que la función COUNT negará los valores NULL.

In [36]:
%%sql sqlite://
SELECT SUM(CASE 
           WHEN PREC_mm IS NULL 
           THEN 1 else 0 END
          ) COUNT_NULLs,
       COUNT(PREC_mm) COUNT_NOT_NULLs,
       COUNT(YR) AS TOTAL
From watershed_yearly_bk

Done.


COUNT_NULLs,COUNT_NOT_NULLs,TOTAL
18,12,30


## Sustituir los valores nulos por valores razonables***
Se recomienda comprobar primero el documento de la base de datos para asegurarse de que las columnas anulables (columnas que pueden tener valores nulos) tienen documentado lo que significa un valor nulo desde el punto de vista del negocio antes de sustituir los valores NULL por valores sensibles.

SQLite proporciona una forma más elegante de manejar los valores NULL. Se trata de utilizar la función COALESCE() que acepta dos o más argumentos y devuelve el primer argumento no nulo en un valor por defecto especificado si es nulo. Si todos los argumentos son NULL, la función COALESCE devuelve NULL.

A continuación se ilustra la sintaxis de la función COALESCE:

    COALESCE(parámetro1, parámetro2, ...);

Aquí queremos que todos los NULL de PREC_mm sean tratados como la media climatológica de los NO NULL.

### Calcular la media de los NON-NULLs

In [37]:
%%sql sqlite://
SELECT avg(PREC_mm)
From watershed_yearly_bk

Done.


avg(PREC_mm)
936.1221313476562


Sustituir los NULLs por la media anterior de NON-NULLs

In [40]:
%%sql sqlite://
SELECT YR, COALESCE(PREC_mm, avg(PREC_mm) over ()) as Precipitation
From watershed_yearly_bk

Done.


YR,Precipitation
1981,895.6051025390625
1982,884.670654296875
1983,936.1221313476562
1984,867.5743408203125
1985,936.1221313476562
1986,936.1221313476562
1987,1007.8944702148438
1988,895.8466186523438
1989,930.10546875
1990,936.1221313476562


## Resumen
Tratar con valores NULL es una tarea complicada. Sería mejor obtener la ayuda de expertos en la materia o saber muy bien para qué se presentan los valores NULL.