## Actividad V- Conexión a BD

**Consigna**

1. Deberán generar una instancia de conexión a Base de datos preferiblemente PostgreSQL donde deberá existir el dataset elegido para el proyecto.

2. Se deben realizar consultas SQL desde el lenguaje Python utilizando las librerías (psycopg2 o sqlalchemy) y quedar evidenciadas en el archivo .ipynb que se entregue.

**Desarrollo**

1. Me interesa conocer el comportamiento de la popularidad de ventas de vehículos eléctricos, en éste caso se evalúan datos del Estado de Washington en Estados Unidos.

Seleccioné el siguiente Dataset para la actividad.
Este Dataset muestra los Vehículos de Batería Eléctrica (BEVs) y Vehículos Eléctricos Híbridos (PHEVs), registrados actualmente en el Departamento de Licencias del Estado de Washington (DOL). Metadata Actualizada: March 16, 2024 URL: https://catalog.data.gov/dataset/electric-vehicle-population-data




In [1]:
import pandas as pd
import numpy as np
from sqlalchemy import create_engine
import psycopg2

**Leemos datos con Pandas primero para compararlo después cuando se carguen mediante la base de datos en PostgreSQL**

In [2]:
Dataset = pd.read_csv("https://raw.githubusercontent.com/Fab-RG/Bootcamp-DS/main/Actividad%202/Electric_Vehicle_Population_Data.csv", sep=",")
Dataset.head()

Unnamed: 0,VIN (1-10),County,City,State,Postal Code,Model Year,Make,Model,Electric Vehicle Type,Clean Alternative Fuel Vehicle (CAFV) Eligibility,Electric Range,Base MSRP,Legislative District,DOL Vehicle ID,Vehicle Location,Electric Utility,2020 Census Tract
0,5YJYGDEE1L,King,Seattle,WA,98122.0,2020,TESLA,MODEL Y,Battery Electric Vehicle (BEV),Clean Alternative Fuel Vehicle Eligible,291,0,37.0,125701579,POINT (-122.30839 47.610365),CITY OF SEATTLE - (WA)|CITY OF TACOMA - (WA),53033010000.0
1,7SAYGDEE9P,Snohomish,Bothell,WA,98021.0,2023,TESLA,MODEL Y,Battery Electric Vehicle (BEV),Eligibility unknown as battery range has not b...,0,0,1.0,244285107,POINT (-122.179458 47.802589),PUGET SOUND ENERGY INC,53061050000.0
2,5YJSA1E4XK,King,Seattle,WA,98109.0,2019,TESLA,MODEL S,Battery Electric Vehicle (BEV),Clean Alternative Fuel Vehicle Eligible,270,0,36.0,156773144,POINT (-122.34848 47.632405),CITY OF SEATTLE - (WA)|CITY OF TACOMA - (WA),53033010000.0
3,5YJSA1E27G,King,Issaquah,WA,98027.0,2016,TESLA,MODEL S,Battery Electric Vehicle (BEV),Clean Alternative Fuel Vehicle Eligible,210,0,5.0,165103011,POINT (-122.03646 47.534065),PUGET SOUND ENERGY INC||CITY OF TACOMA - (WA),53033030000.0
4,5YJYGDEE5M,Kitsap,Suquamish,WA,98392.0,2021,TESLA,MODEL Y,Battery Electric Vehicle (BEV),Eligibility unknown as battery range has not b...,0,0,23.0,205138552,POINT (-122.55717 47.733415),PUGET SOUND ENERGY INC,53035940000.0


### Creamos base de datos en PostgreSQL

```SQL
CREATE TABLE Electric_Vehicle_Population_Data(
    VIN_1_10 VARCHAR(20),
    County VARCHAR(50),
    City VARCHAR(50),
    State VARCHAR(2),
    Postal_Code INT,
    Model_Year SMALLINT,
    Make VARCHAR(50),
    Model VARCHAR(50),
    Electric_Vehicle_Type VARCHAR(50),
    Clean_Alternative_Fuel_Vehicle_CAFV_Eligibility VARCHAR(60),
    Electric_Range SMALLINT,
    Base_MSRP INT,
    Legislative_District SMALLINT,
    DOL_Vehicle_ID INT,
    Vehicle_Location VARCHAR(50),
    Electric_Utility VARCHAR(120),
    Census_Tract_2020 BIGINT
);
```

#### Se genera archivo de texto para leer la contraseña de la base de datos

In [3]:
ruta="D:/Study/Bootcamp Data Science BIT/Clases/Tutorías/Clase 12. 16-04-2024/"
with open(ruta+'password.txt','r') as f:
    pwd= f.read()

#### Se indican credenciales para crear conexión con la base de datos mediante sqlalchemy

In [4]:
from sqlalchemy import create_engine
hostname = 'localhost'
database = 'Project_DS_BIT'
username = 'postgres'
pwd = pwd
port_id = '5432'

#### Se establece conexión con la base de datos

In [5]:
engine = create_engine(f"postgresql://{username}:{pwd}@localhost:{port_id}/{database}")
engine

Engine(postgresql://postgres:***@localhost:5432/Project_DS_BIT)

#### Se indica estructura para obtener Dataframe de la base de datos

In [6]:
from sqlalchemy import text                                        
def runQuery(sql):                                                 
    result = engine.connect().execute((text(sql)))                 
    return pd.DataFrame(result.fetchall(), columns=result.keys())

#### Se lee Dataframe desde la base de datos PostgreSQL para gestionar y realizar consultas

In [7]:
datos = """
SELECT * FROM electric_vehicle_population_data
"""
runQuery(datos)

Unnamed: 0,vin_1_10,county,city,state,postal_code,model_year,make,model,electric_vehicle_type,clean_alternative_fuel_vehicle_cafv_eligibility,electric_range,base_msrp,legislative_district,dol_vehicle_id,vehicle_location,electric_utility,census_tract_2020
0,1C4JJXR63P,King,Tukwila,WA,98188.0,2023,JEEP,WRANGLER,Plug-in Hybrid Electric Vehicle (PHEV),Not eligible due to low battery range,21,0,11.0,238084297,POINT (-122.29179 47.43473),PUGET SOUND ENERGY INC||CITY OF TACOMA - (WA),5.303303e+10
1,1FTVW1EL3P,King,Federal Way,WA,98023.0,2023,FORD,F-150,Battery Electric Vehicle (BEV),Eligibility unknown as battery range has not b...,0,0,30.0,259687921,POINT (-122.36363 47.30675),PUGET SOUND ENERGY INC||CITY OF TACOMA - (WA),5.303303e+10
2,7SAYGDEE7P,Thurston,Olympia,WA,98506.0,2023,TESLA,MODEL Y,Battery Electric Vehicle (BEV),Eligibility unknown as battery range has not b...,0,0,22.0,251107874,POINT (-122.8874781 47.0519573),PUGET SOUND ENERGY INC,5.306701e+10
3,5YJ3E1EC6N,King,Shoreline,WA,98133.0,2022,TESLA,MODEL 3,Battery Electric Vehicle (BEV),Eligibility unknown as battery range has not b...,0,0,32.0,209713906,POINT (-122.34584 47.76726),CITY OF SEATTLE - (WA)|CITY OF TACOMA - (WA),5.303302e+10
4,1N4AZ0CPXE,King,Issaquah,WA,98027.0,2014,NISSAN,LEAF,Battery Electric Vehicle (BEV),Clean Alternative Fuel Vehicle Eligible,84,0,41.0,113136768,POINT (-122.03646 47.534065),PUGET SOUND ENERGY INC||CITY OF TACOMA - (WA),5.303302e+10
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
177861,WDDVP9AB4E,King,Bellevue,WA,98006.0,2014,MERCEDES-BENZ,B-CLASS,Battery Electric Vehicle (BEV),Clean Alternative Fuel Vehicle Eligible,87,0,41.0,121113408,POINT (-122.16937 47.571015),PUGET SOUND ENERGY INC||CITY OF TACOMA - (WA),5.303302e+10
177862,KM8KNDAF2P,King,Seattle,WA,98115.0,2023,HYUNDAI,IONIQ 5,Battery Electric Vehicle (BEV),Eligibility unknown as battery range has not b...,0,0,46.0,229604931,POINT (-122.3185 47.67949),CITY OF SEATTLE - (WA)|CITY OF TACOMA - (WA),5.303300e+10
177863,7SAYGDEE3P,King,Bellevue,WA,98005.0,2023,TESLA,MODEL Y,Battery Electric Vehicle (BEV),Eligibility unknown as battery range has not b...,0,0,41.0,236675442,POINT (-122.16085 47.624515),PUGET SOUND ENERGY INC||CITY OF TACOMA - (WA),5.303302e+10
177864,7SAYGDEE0P,King,Seattle,WA,98107.0,2023,TESLA,MODEL Y,Battery Electric Vehicle (BEV),Eligibility unknown as battery range has not b...,0,0,36.0,261447455,POINT (-122.37815 47.66866),CITY OF SEATTLE - (WA)|CITY OF TACOMA - (WA),5.303300e+10


### Consultas sobre la base de datos

**1. ¿En qué año se registró la mayor cantidad de vehículos eléctricos?**

In [9]:
count_model = """
SELECT model_year, count(*) 
FROM electric_vehicle_population_data evpd 
GROUP BY model_year
ORDER BY count(*) DESC
"""
runQuery(count_model)

Unnamed: 0,model_year,count
0,2023,57587
1,2022,27776
2,2021,19132
3,2018,14323
4,2020,11768
5,2019,10940
6,2017,8562
7,2024,7080
8,2016,5483
9,2015,4844


**Respuesta**: Se evidencia que durante los últimos cuatro años, aumentó el registro de vehículos eléctricos cada año, respecto al anterior. En el año 2023 se evidenció la mayor cantidad de vehículos eléctricos registrados, aumentando más del doble la cantidad registrada el año anterior.

**Recomendación**: Para obtener la repuesta a la pregunta anterior, se recomienda tener en cuenta los datos de los últimos cinco años especialmente, debido a que fueron los años donde más se registraron vehículos eléctricos en el Estado de Washington en Estados Unidos.

**2. ¿Cuál es la marca de vehículos eléctricos que más se registró en los últimos cuatro años?**

In [10]:
count_make = """
SELECT make, model_year, count(*)
FROM electric_vehicle_population_data evpd 
GROUP BY make, model_year  
ORDER BY count(*) DESC
"""
runQuery(count_make)

Unnamed: 0,make,model_year,count
0,TESLA,2023,28650
1,TESLA,2022,13751
2,TESLA,2021,11118
3,TESLA,2018,7915
4,TESLA,2020,7094
...,...,...,...
247,FORD,1998,1
248,TOYOTA,2003,1
249,ROLLS ROYCE,2024,1
250,BENTLEY,2021,1


**Respuesta:** Se evidencia que Tesla fue la marca de vehículos eléctricos que más se registró en los últimos cuatro años. 

**Recomendación**: Tener en cuenta que en el cálculo numérico, se evidencia el valor máximo de cantidad de vehículos y el año que sucedió por cada marca. 

**3. ¿Cuál es la ciudad donde se registraron la mayor cantidad de vehículos eléctricos?**

In [11]:
count_city = """
SELECT city, count(*) 
FROM electric_vehicle_population_data evpd 
GROUP BY city
ORDER BY count(*) DESC
LIMIT 20
"""
runQuery(count_city)

Unnamed: 0,city,count
0,Seattle,29447
1,Bellevue,8931
2,Redmond,6478
3,Vancouver,6193
4,Bothell,5863
5,Kirkland,5362
6,Sammamish,5280
7,Renton,4980
8,Olympia,4299
9,Tacoma,3722


**Respuesta:** Se evidencia que la ciudad de Seattle, es donde se han registrado la mayor cantidad de vehículos eléctricos del Estado de Washington, EEUU.

**Recomendación:** En el cálculo numérico, se tuvieron en cuenta todos los datos desde el primer año registrado y se podrá continuar obteniendo la información en el futuro.

**4. ¿Diferencia entre la cantidad de vehículos de batería eléctrica (BEV) y los Vehículos Eléctricos Híbridos (PHEVs)?**

In [12]:
count_evt = """
SELECT electric_vehicle_type, count(*)
FROM electric_vehicle_population_data evpd 
GROUP BY electric_vehicle_type
ORDER BY count(*) DESC
"""
runQuery(count_evt)

Unnamed: 0,electric_vehicle_type,count
0,Battery Electric Vehicle (BEV),139210
1,Plug-in Hybrid Electric Vehicle (PHEV),38656


In [13]:
diferencia = """
SELECT MAX(count)-MIN(count) AS diferencia
FROM(
	SELECT electric_vehicle_type, count(*)
	FROM electric_vehicle_population_data evpd 
	GROUP BY electric_vehicle_type
	ORDER BY count(*) DESC
) AS COUNT_EVT
"""
runQuery(diferencia)

Unnamed: 0,diferencia
0,100554


**Respuesta:** Se evidencia que los vehículos que tienen solo Batería Eléctrica son la mayoría con 139210 registros y triplican la cantidad de vehículos Híbridos con una diferencia de 100554 vehículos.

**Recomendación:** Para éste caso, todos los datos se tuvieron en cuenta para el cálculo. Además, está claro que los vehículos híbridos también son considerados en la categoría de vehículos eléctricos.

**5. ¿Cuál es el vehículo con mayor autonomía de utilización de su batería?**

In [14]:
autonomia = """
SELECT make, model, electric_range
FROM electric_vehicle_population_data evpd 
GROUP BY make, model, electric_range
ORDER BY electric_range DESC
LIMIT 30
"""
runQuery(autonomia)

Unnamed: 0,make,model,electric_range
0,TESLA,MODEL S,337
1,TESLA,MODEL S,330
2,TESLA,MODEL 3,322
3,TESLA,MODEL 3,308
4,TESLA,MODEL X,293
5,TESLA,MODEL Y,291
6,TESLA,MODEL X,289
7,TESLA,MODEL S,270
8,TESLA,MODEL 3,266
9,TESLA,MODEL S,265


**Respuesta:** En general, la marca Tesla tiene los vehículos eléctricos con mayor autonomía por millas, entre los cuales se evidencia el modelo S con 337 millas como el vehículo con mayor autonomía.

**Recomendación:** Tener en cuenta que existen diferentes vehículos con la misma marca y modelo, pero con diferente autonomía. 

**Se elimina engine para terminar la conexión con la base de datos**

In [15]:
del engine