# INFORME - Introducción a PostgreSQL y Python

**Realizado por Juan Aguirre y Andrés España**

------------------------------------------------------------------------------------------------------------------------------

# PRIMERA PARTE (REALIZACION DE CONSULTAS EN PgAdmin)

I) Crear la tabla nombrada: employees y explicar que tarea realiza la consulta realizada y mostrar en pantalla la tabla: 

In [None]:
CREATE TABLE employees
   ( employee_id INTEGER
   , first_name VARCHAR(20)
   , last_name VARCHAR(25)
   , email VARCHAR(25)
   , phone_number VARCHAR(20)
   , hire_date DATE
   , job_id VARCHAR(10)
   , salary NUMERIC(8,2)
   , commission_pct NUMERIC(2,2)
   , manager_id INTEGER
   , department_id INTEGER
   ) ;
CREATE UNIQUE INDEX emp_emp_id_pk
         ON employees (employee_id) ;
ALTER TABLE employees ADD
   PRIMARY KEY (employee_id);

In [None]:
SELECT * FROM employees LIMIT 10;
SELECT count(1) FROM employees;

![image.png](attachment:image.png)

Con la consulta **`CREATE TABLE`** creamos una tabla llamada "employees" en la base de datos.
**`CREATE UNIQUE INDEX` emp_emp_id_pk ON employees (employee_id)** Crea un índice único llamado "emp_emp_id_pk" en la columna "employee_id" de la tabla "employees". Un índice del cual no puede haber duplicados en la columna especificada, en este caso, "employee_id". Y la consulta **`ALTER TABLE employees ADD PRIMARY KEY` (employee_id)** agrega una restricción de clave primaria a la columna "employee_id" en la tabla "employees". Esto asegura la unicidad de los valores en esa columna y proporciona una forma única de identificar cada fila en la tabla.

------------------------------------------------------------------------------------------------------------------------------

II) Crear la tabla courses con las siguientes columnas:

- course_id - integer y primary key

- course_name - valores alfanuméricos o de cadena de hasta 60 caracteres

- course_author - nombre del autor de hasta 40 caracteres

- course_status - published, draft, inactive.

- course_published_dt - valor de tipo fecha.

In [None]:
CREATE TABLE courses 

   ( course_id SERIAL PRIMARY KEY 

   , course_name VARCHAR(60) 

   , course_author VARCHAR(40) 

   , course_status VARCHAR(25) 

   , course_published_dt DATE 

   ); 

![image-2.png](attachment:image-2.png)

Se realiza la consulta que genera la tabla con sus respectivas casillas.

------------------------------------------------------------------------------------------------------------------------------

III) Insertar datos

Inserte los datos en courses utilizando los datos proporcionados. Asegúrese de que el id es generado por el sistema. No olvide refrescar la información de la base de datos.

![tableforexercise_python.png](attachment:tableforexercise_python.png)

In [None]:
insert into courses ( 

    course_name, course_author, course_status, course_published_dt 

) VALUES 

    ('Programming using Python', 'Bob Dillon', 'published', '2020-09-30'), 

    ('Data Engineering using Python', 'Bob Dillon', 'published', '2020-07-15'), 

    ('Data Engineering using Scala', 'Elvis Presley', 'draft', null ), 

    ('Programming using Scala', 'Elvin Presley', 'published', '2020-05-12'), 

    ('Programming using Java', 'Mike Jack', 'inactive', '2020-08-10'), 

    ('Web Applications - Python Flask', 'Bob Dillon', 'inactive', '2020-07-20'), 

    ('Web Applications - Java Spring', 'Mike Jack', 'draft', null), 

    ('Pipelines Orchestration - Python', 'Bob Dillon', 'draft', null), 

    ('Streaming Pipelines - Python', 'Bob Dillon', 'published', '2020-10-05'), 

    ('Web Applications - Scala Play', 'Elvis Presley', 'inactive', '2020-09-30'), 

    ('Web Applications - Python Django', 'Bob Dillon', 'published', '2020-06-23'), 

    ('Server Automation - Ansible', 'Uncle Sam', 'published', '2020-07-05'); 

![image.png](attachment:image.png)

**`INSERT INTO`** se utilizan para insertar datos específicos en la tabla "courses" en función de los valores (`VALUES`) proporcionados en cada instrucción. Cada instrucción **`INSERT INTO`** crea una nueva fila en la tabla con los valores correspondientes para cada columna.

------------------------------------------------------------------------------------------------------------------------------

IV) Borre todos los cursos que no estén en modo borrador ni publicados. Proporcione la sentencia de borrado como respuesta para este ejercicio en el Jupyter Book. Para validar, obtenga el recuento de todos los cursos publicados por autor y asegúrese de que la salida está ordenada en forma descendente por recuento.

In [None]:
DELETE FROM courses 

WHERE course_status NOT IN ('draft', 'published'); 

SELECT course_author, COUNT(*) AS course_count 

FROM courses 

WHERE course_status = 'published' 

GROUP BY course_author 

ORDER BY course_count DESC; 

![image.png](attachment:image.png)

Con la consulta **`DELETE FROM courses WHERE course_status NOT IN ('draft', 'published')`** borramos todas las filas de la tabla "courses" que no tengan un estado de curso igual a "draft" o "published".
Luego **`SELECT course_author, COUNT(*) AS course_count FROM courses WHERE course_status = 'published' GROUP BY course_author ORDER BY course_count DESC`** Hacemos un recuento de los cursos publicados por autor en la tabla "courses". Seleccionamos la columna "course_author" y utilizamos la función COUNT(*) para contar el número de cursos publicados por cada autor. La cláusula WHERE filtra solo los cursos con estado "published". Luego, se agrupa por "course_author" utilizando la cláusula GROUP BY y se ordena el resultado en orden descendente según el recuento de cursos utilizando la cláusula ORDER BY

------------------------------------------------------------------------------------------------------------------------------

V) Crear la base de datos users:

In [None]:
CREATE TABLE users(
    user_id SERIAL PRIMARY KEY,
    user_first_name VARCHAR(30),
    user_last_name VARCHAR(30),
    user_email_id VARCHAR(50),
    user_gender VARCHAR(1),
    user_unique_id VARCHAR(15),
    user_phone_no VARCHAR(20),
    user_dob DATE,
    created_ts TIMESTAMP
)

Inserte los siguientes valores

In [None]:
insert into users (
    user_first_name, user_last_name, user_email_id, user_gender, 
    user_unique_id, user_phone_no, user_dob, created_ts
) VALUES
    ('Giuseppe', 'Bode', 'gbode0@imgur.com', 'M', '88833-8759', 
     '+86 (764) 443-1967', '1973-05-31', '2018-04-15 12:13:38'),
    ('Lexy', 'Gisbey', 'lgisbey1@mail.ru', 'F', '262501-029', 
     '+86 (751) 160-3742', '2003-05-31', '2020-12-29 06:44:09'),
    ('Karel', 'Claringbold', 'kclaringbold2@yale.edu', 'F', '391-33-2823', 
     '+62 (445) 471-2682', '1985-11-28', '2018-11-19 00:04:08'),
    ('Marv', 'Tanswill', 'mtanswill3@dedecms.com', 'F', '1195413-80', 
     '+62 (497) 736-6802', '1998-05-24', '2018-11-19 16:29:43'),
    ('Gertie', 'Espinoza', 'gespinoza4@nationalgeographic.com', 'M', '471-24-6869', 
     '+249 (687) 506-2960', '1997-10-30', '2020-01-25 21:31:10'),
    ('Saleem', 'Danneil', 'sdanneil5@guardian.co.uk', 'F', '192374-933', 
     '+63 (810) 321-0331', '1992-03-08', '2020-11-07 19:01:14'),
    ('Rickert', 'O''Shiels', 'roshiels6@wikispaces.com', 'M', '749-27-47-52', 
     '+86 (184) 759-3933', '1972-11-01', '2018-03-20 10:53:24'),
    ('Cybil', 'Lissimore', 'clissimore7@pinterest.com', 'M', '461-75-4198', 
     '+54 (613) 939-6976', '1978-03-03', '2019-12-09 14:08:30'),
    ('Melita', 'Rimington', 'mrimington8@mozilla.org', 'F', '892-36-676-2', 
     '+48 (322) 829-8638', '1995-12-15', '2018-04-03 04:21:33'),
    ('Benetta', 'Nana', 'bnana9@google.com', 'M', '197-54-1646', 
     '+420 (934) 611-0020', '1971-12-07', '2018-10-17 21:02:51'),
    ('Gregorius', 'Gullane', 'ggullanea@prnewswire.com', 'F', '232-55-52-58', 
     '+62 (780) 859-1578', '1973-09-18', '2020-01-14 23:38:53'),
    ('Una', 'Glayzer', 'uglayzerb@pinterest.com', 'M', '898-84-336-6', 
     '+380 (840) 437-3981', '1983-05-26', '2019-09-17 03:24:21'),
    ('Jamie', 'Vosper', 'jvosperc@umich.edu', 'M', '247-95-68-44', 
     '+81 (205) 723-1942', '1972-03-18', '2020-07-23 16:39:33'),
    ('Calley', 'Tilson', 'ctilsond@issuu.com', 'F', '415-48-894-3', 
     '+229 (698) 777-4904', '1987-06-12', '2020-06-05 12:10:50'),
    ('Peadar', 'Gregorowicz', 'pgregorowicze@omniture.com', 'M', '403-39-5-869', 
     '+7 (267) 853-3262', '1996-09-21', '2018-05-29 23:51:31'),
    ('Jeanie', 'Webling', 'jweblingf@booking.com', 'F', '399-83-05-03', 
     '+351 (684) 413-0550', '1994-12-27', '2018-02-09 01:31:11'),
    ('Yankee', 'Jelf', 'yjelfg@wufoo.com', 'F', '607-99-0411', 
     '+1 (864) 112-7432', '1988-11-13', '2019-09-16 16:09:12'),
    ('Blair', 'Aumerle', 'baumerleh@toplist.cz', 'F', '430-01-578-5', 
     '+7 (393) 232-1860', '1979-11-09', '2018-10-28 19:25:35'),
    ('Pavlov', 'Steljes', 'psteljesi@macromedia.com', 'F', '571-09-6181', 
     '+598 (877) 881-3236', '1991-06-24', '2020-09-18 05:34:31'),
    ('Darn', 'Hadeke', 'dhadekej@last.fm', 'M', '478-32-02-87', 
     '+370 (347) 110-4270', '1984-09-04', '2018-02-10 12:56:00'),
    ('Wendell', 'Spanton', 'wspantonk@de.vu', 'F', null, 
     '+84 (301) 762-1316', '1973-07-24', '2018-01-30 01:20:11'),
    ('Carlo', 'Yearby', 'cyearbyl@comcast.net', 'F', null, 
     '+55 (288) 623-4067', '1974-11-11', '2018-06-24 03:18:40'),
    ('Sheila', 'Evitts', 'sevittsm@webmd.com', null, '830-40-5287',
     null, '1977-03-01', '2020-07-20 09:59:41'),
    ('Sianna', 'Lowdham', 'slowdhamn@stanford.edu', null, '778-0845', 
     null, '1985-12-23', '2018-06-29 02:42:49'),
    ('Phylys', 'Aslie', 'paslieo@qq.com', 'M', '368-44-4478', 
     '+86 (765) 152-8654', '1984-03-22', '2019-10-01 01:34:28')

![image.png](attachment:image.png)

Hemos creado una nueva tabla con las consultas anteriormente explicadas.

------------------------------------------------------------------------------------------------------------------------------

VI) Obtenga el número de usuarios creados por año. Utilice la tabla de usuarios para este ejercicio.

- La salida debe contener el año de 4 dígitos y el recuento.

- Use funciones específicas de fecha para obtener el año usando created_ts.

- Asegúrese de definir alias a las columnas como created_year y user_count respectivamente.

- Los datos deben ordenarse de forma ascendente por created_year.

- Cuando ejecutes la consulta usando el entorno Jupyter, puede que tenga decimales para los enteros. Por lo tanto, puede mostrar los resultados incluso con decimales.

![outputexercisevii_python.png](attachment:outputexercisevii_python.png)

In [None]:
SELECT DATE_PART('year', created_ts) AS created_year, COUNT(*)::INTEGER AS user_count 

FROM users 

GROUP BY created_year 

ORDER BY created_year ASC; 

-**`SELECT DATE_PART('year', created_ts) AS created_year`**: La función DATE_PART se utiliza para extraer la parte del año de la columna "created_ts", que representa la fecha de creación de cada usuario. El alias "created_year" se asigna al resultado de esta función.

-**`COUNT(*)::INTEGER AS user_count`**: Utilizamos la función `COUNT(*)` para contar el número de registros en cada grupo (es decir, el número de usuarios en cada año). El operador `::INTEGER` se utiliza para asegurarse de que el resultado sea tratado como un número entero. El alias "user_count" se asigna al resultado de esta función.

-**`GROUP BY created_year`**: Utilizamos la cláusula `GROUP BY` para agrupar los datos por el año de creación. Esto nos permite obtener el número de usuarios por cada año.

-**`ORDER BY created_year ASC`**: Utilizamos la cláusula `ORDER BY` para ordenar los resultados de forma ascendente según el año de creación. Esto significa que los años se mostrarán en orden creciente.

------------------------------------------------------------------------------------------------------------------------------

VII) Obtenga los días de nacimiento de todos los usuarios nacidos en el mes May.

- Utilice la tabla users para este ejercicio.

- La salida debe contener user_id, user_dob, user_email_id y user_day_of_birth.

- Utilice funciones específicas de fecha para obtener el mes utilizando user_dob.

- user_day_of_birth debe ser un día completo con el primer carácter en mayúsculas, por ejemplo Tuesday.

- Los datos deben ordenarse por día dentro del mes May.

![maybirths_exercise.png](attachment:maybirths_exercise.png)

In [None]:
SELECT  

    user_id,  

    user_dob,  

    user_email_id,  

    TO_CHAR(user_dob, 'FMDay') AS user_day_of_birth 

FROM  

    users 

WHERE  

    EXTRACT(MONTH FROM user_dob) = 5 

ORDER BY  

    EXTRACT(DAY FROM user_dob); 
 

-**`SELECT user_id, user_dob, user_email_id, TO_CHAR(user_dob, 'FMDay') AS user_day_of_birth`**: Se seleccionan las columnas `user_id`, `user_dob`, y `user_email_id` de la tabla `users`. La función `TO_CHAR` se utiliza para formatear la columna `user_dob` en un formato específico, en este caso, `'FMDay'`, que muestra el día completo de la semana con la primera letra en mayúscula. El resultado se asigna al alias `user_day_of_birth`.

-**`WHERE EXTRACT(MONTH FROM user_dob) = 5`**: Se utiliza la función `EXTRACT` para extraer el mes de la columna `user_dob` y se compara con el valor `5`, que representa el mes de mayo. Esto filtra los registros para obtener solo aquellos usuarios que nacieron en `Mayo`.

-**`ORDER BY EXTRACT(DAY FROM user_dob)`**: Se utiliza la cláusula `ORDER BY` para ordenar los resultados por el día dentro del mes de mayo. La función `EXTRACT` se utiliza nuevamente para extraer el día de la columna `user_dob`. Finalmente muestra los datos deseados.

------------------------------------------------------------------------------------------------------------------------------

VIII) Obtenga los nombres e ids de correo electrónico de los usuarios añadidos en el año 2019.

- Utilice la tabla users para este ejercicio.

- La salida debe contener user_id, user_name, user_email_id, created_ts, created_year.

- Utilice funciones específicas de fecha para obtener el año utilizando created_ts.

- user_name es una columna derivada de concatenar user_first_name y user_last_name con un espacio en medio.

- user_name debe tener valores en mayúsculas.

- Los datos deben ordenarse en forma ascendente por user_name

![usernameorder_exercise.png](attachment:usernameorder_exercise.png)

In [None]:
SELECT  

    user_id,  

    CONCAT(UPPER(user_first_name), ' ', UPPER(user_last_name)) AS user_name, 

    user_email_id, 

    created_ts, 

    EXTRACT(YEAR FROM created_ts) AS created_year 

FROM users 

WHERE EXTRACT(YEAR FROM created_ts) = 2019 

ORDER BY user_name ASC; 

-**`SELECT user_id, CONCAT(UPPER(user_first_name), ' ', UPPER(user_last_name)) AS user_name, user_email_id, created_ts, EXTRACT(YEAR FROM created_ts) AS created_year`**: Se seleccionan varias columnas de la tabla users. Para el campo user_name, se utiliza la función `CONCAT` para unir el nombre y el apellido del usuario con un espacio en medio. La función `UPPER` se utiliza para convertir los valores a mayúsculas. La columna created_year se obtiene utilizando la función `EXTRACT` para extraer el año de la columna created_ts.
 
-**`WHERE EXTRACT(YEAR FROM created_ts) = 2019`**: Se utiliza la función `EXTRACT` para extraer el año de la columna created_ts y se compara con el valor 2019. Esto filtra los registros para obtener solo aquellos usuarios que fueron añadidos en el año `2019`.

-**`ORDER BY user_name ASC`**: Se utiliza la cláusula `ORDER BY` para ordenar los resultados en forma ascendente por el campo user_name. Esto significa que los nombres de usuario estarán ordenados alfabéticamente en orden ascendente.

La consulta nos dará una tabla con los nombres e ids de correo electrónico de los usuarios que fueron añadidos en el año 2019. Además, incluye la fecha y hora en que fueron añadidos, así como el año de creación. Los datos estarán ordenados alfabéticamente por el nombre de usuario.

------------------------------------------------------------------------------------------------------------------------------

IX) Obtenga el número de usuarios por género. Utilice la tabla de users para este ejercicio.

- La salida debe contener el gender y user_count.

- Para los hombres la salida debe mostrar Male y para las mujeres la salida debe mostrar Female.

- Si no se especifica el sexo, se mostrará Not Specified

- Los datos deben ordenarse en forma descendente por user_count.

![outputexercisex_python.png](attachment:outputexercisex_python.png)

In [None]:
SELECT  

    CASE  

        WHEN user_gender = 'M' THEN 'Male' 

        WHEN user_gender = 'F' THEN 'Female' 

        ELSE 'Not Specified' 

    END AS user_gender, 

    COUNT(*) AS user_count 

FROM users 

GROUP BY user_gender 

ORDER BY user_count DESC; 

-**`SELECT CASE WHEN user_gender = 'M' THEN 'Male' WHEN user_gender = 'F' THEN 'Female' ELSE 'Not Specified' END AS user_gender, COUNT(*) AS user_count`**: Se utiliza la cláusula `CASE` para realizar una condición en base al valor de la columna user_gender. Si el valor es 'M', se muestra 'Male', si es 'F', se muestra 'Female', y en caso contrario, se muestra 'Not Specified'. La función `COUNT(*)` se utiliza para contar el número de usuarios que cumplen con cada condición.

-**`GROUP BY user_gender`**: Se utiliza la cláusula `GROUP BY` para agrupar los datos por el campo user_gender. Esto permite realizar el conteo de usuarios por género.

-**`ORDER BY user_count DESC`**: Se utiliza la cláusula `ORDER BY` para ordenar los resultados en forma descendente por el campo user_count. Esto significa que los géneros con mayor cantidad de usuarios aparecerán en primer lugar.


------------------------------------------------------------------------------------------------------------------------------

X) Obtenga los 4 últimos dígitos de los ids únicos.

- Utilice la tabla users para este ejercicio.

- El resultado debe contener user_id, user_unique_id y user_unique_id_last4.

- Los identificadores únicos son null o not null.

- Los identificadores únicos contienen números y guiones y son de diferente longitud.

- Necesitamos obtener los últimos 4 dígitos descartando los guiones sólo cuando el número de dígitos es al menos 9.

- Si el identificador único es nulo, debe mostrarse Not Specified.

- Después de descartar los guiones, si el identificador único tiene menos de 9 dígitos, debe mostrar Invalid Unique Id.

- Los datos deben ordenarse por user_id. Es posible que aparezca None o null para aquellos identificadores de usuario en los que no haya un identificador único para user_unique_id.

In [None]:
SELECT  

    user_id, 

    user_unique_id, 

    CASE 

        WHEN user_unique_id IS NULL THEN 'Not Specified' 

        WHEN LENGTH(REPLACE(user_unique_id, '-', '')) < 9 THEN 'Invalid Unique Id' 

        ELSE SUBSTRING(REPLACE(user_unique_id, '-', ''),6) 

    END AS user_unique_id_last4 

FROM users 

ORDER BY user_id; 

-**`SELECT user_id, user_unique_id, CASE WHEN user_unique_id IS NULL THEN 'Not Specified' WHEN LENGTH(REPLACE(user_unique_id, '-', '')) < 9 THEN 'Invalid Unique Id' ELSE SUBSTRING(REPLACE(user_unique_id, '-', ''),6) END AS user_unique_id_last4`**: Se seleccionan las columnas user_id y user_unique_id de la tabla users. Luego, se utiliza una cláusula CASE para realizar diferentes condiciones:
Si el user_unique_id es NULL, se muestra 'Not Specified'.
Si el número de dígitos en el user_unique_id, después de eliminar los guiones con la función REPLACE, es menor a 9, se muestra 'Invalid Unique Id'.
En caso contrario, se utiliza la función SUBSTRING para obtener los últimos 4 dígitos del user_unique_id después de eliminar los guiones con la función REPLACE.

-**`ORDER BY user_id`**: Se utiliza la cláusula ORDER BY para ordenar los resultados por el campo user_id. Esto asegura que los datos se mostrarán en orden ascendente según el user_id.

------------------------------------------------------------------------------------------------------------------------------

XI) Obtenga el recuento de usuarios en función del código de país.

- Utilice la tabla users para este ejercicio.

- La salida debe contener el código de país y el recuento.

- No debe haber ningún + en el código de país. Sólo debe contener dígitos.

- Los datos deben ordenarse como números por código de país.

- Debemos descartar user_phone_no con valores null.

![usercountexercisexiii_python.png](attachment:usercountexercisexiii_python.png)

In [None]:
SELECT 
  SUBSTRING(user_phone_no, 2, POSITION(' ' IN user_phone_no)-2) AS country_code,
  COUNT(*) AS count
FROM users
WHERE user_phone_no IS NOT NULL AND user_phone_no != ''
GROUP BY country_code
ORDER BY CAST(SUBSTRING(user_phone_no, 2, POSITION(' ' IN user_phone_no)-2) AS INTEGER);

-**`SELECT SUBSTRING(user_phone_no, 2, POSITION(' ' IN user_phone_no)-2) AS country_code, COUNT(*) AS count`**: Se selecciona una subcadena del campo user_phone_no para obtener el código de país. La función `SUBSTRING` se utiliza para obtener una porción específica de la cadena. Se toma desde el segundo carácter hasta la posición del espacio en blanco menos 2. Luego, se utiliza la función `COUNT` para contar el número de registros correspondientes al código de país. Se le asigna el alias "count" a esta columna.

-**`WHERE user_phone_no IS NOT NULL AND user_phone_no != ''`**: Se aplica una condición para excluir los registros en los que el user_phone_no sea NULL o una cadena vacía. Esto asegura que solo se consideren los usuarios que tienen un número de teléfono válido.

-**`GROUP BY country_code`**: Se utiliza la cláusula` GROUP BY` para agrupar los resultados por el campo country_code, es decir, por código de país.

-**`ORDER BY CAST(SUBSTRING(user_phone_no, 2, POSITION(' ' IN user_phone_no)-2) AS INTEGER)`**: Se utiliza la cláusula `ORDER BY` para ordenar los resultados. Se convierte el código de país a un valor numérico utilizando la función `CAST`, lo que permite ordenar los códigos de país como números en orden ascendente

------------------------------------------------------------------------------------------------------------------------------

# SEGUNDA PARTE (BASES DE DATOS Y PYTHON)

**5)**  Para el ejercicio numero #5, utilizamos multiples librerias como lo son:

- `pandas`
- `sqlalchemy`
- `plotly`
- `psycopg2`

Lo primero que se hizo fue importar los datos de **`Cardano`** a un libro en Excel, para posteriomente convertirlo en un documento con formato .csv.

Posterior a esto, utilizamos **pandas** y **psycopg2** para poder utilizar la tabla e importarla a nuestra base de datos, con el nombre de [Cardano].

In [7]:
import pandas as pd
df_CAR = pd.read_csv(r"C:\Users\hugoagp\Desktop\asadsdas\cardano.csv")
df_CAR.head()

Unnamed: 0,Date,Open,High,Low,Close,Adj Close,Volume
0,2017-10-01,0.021678,0.032226,0.017354,0.024969,0.024969,50068700.0
1,2017-10-02,0.024607,0.030088,0.019969,0.025932,0.025932,57641300.0
2,2017-10-03,0.025757,0.027425,0.02069,0.020816,0.020816,16997800.0
3,2017-10-04,0.020864,0.022806,0.020864,0.021931,0.021931,9000050.0
4,2017-10-05,0.021951,0.022154,0.020859,0.021489,0.021489,5562510.0


Para evitar problemas de sintaxis, renombramos los encabezados de columna a todo minuscula y poniendo __ en los espacios en blanco.

In [2]:
df_CAR = df_CAR.rename({'Date': 'date', 
               'Open': 'open', 
               'High': 'high', 
               'Low': 'low', 
               'Close': 'close', 
               'Adj Close': 'adj_close', 
               'Volume': 'volume'}, axis=1)
df_CAR.head()

Unnamed: 0,date,open,high,low,close,adj_close,volume
0,2017-10-01,0.021678,0.032226,0.017354,0.024969,0.024969,50068700.0
1,2017-10-02,0.024607,0.030088,0.019969,0.025932,0.025932,57641300.0
2,2017-10-03,0.025757,0.027425,0.02069,0.020816,0.020816,16997800.0
3,2017-10-04,0.020864,0.022806,0.020864,0.021931,0.021931,9000050.0
4,2017-10-05,0.021951,0.022154,0.020859,0.021489,0.021489,5562510.0


Finalmente, aqui importamos la tabla a nuestra base de datos, importandola con el nombre 'Cardano' y usando la libreria de **`sqlalchemy`**.

In [3]:
from sqlalchemy import create_engine
engine = create_engine('postgresql://postgres:W3cFDofhZ3s8mQcJFviL@containers-us-west-69.railway.app:7373/railway')
df_CAR.to_sql('cardano', engine, if_exists = 'replace', index=False, method='multi')

1475

```{eval-rst}
.. note::

   Nos aseguramos que la base de datos tenga la tabla ya importada.

.. 
```


In [4]:
import psycopg2
connection = psycopg2.connect(user="postgres",
                                  password="W3cFDofhZ3s8mQcJFviL",
                                  host="containers-us-west-69.railway.app",
                                  port="7373",
                                  database="railway")
cursor = connection.cursor()
cursor.execute("SELECT * from cardano;")
close = cursor.fetchall()
CAR_sql = pd.DataFrame(close)
display(CAR_sql.head())

cursor.execute("SELECT column_name FROM information_schema.columns WHERE table_name='cardano';")
CAR_names = cursor.fetchall()
display(CAR_names)

print("Operation done successfully")
connection.close()

Unnamed: 0,0,1,2,3,4,5,6
0,2017-10-01,0.021678,0.032226,0.017354,0.024969,0.024969,50068700.0
1,2017-10-02,0.024607,0.030088,0.019969,0.025932,0.025932,57641300.0
2,2017-10-03,0.025757,0.027425,0.02069,0.020816,0.020816,16997800.0
3,2017-10-04,0.020864,0.022806,0.020864,0.021931,0.021931,9000050.0
4,2017-10-05,0.021951,0.022154,0.020859,0.021489,0.021489,5562510.0


[('date',),
 ('open',),
 ('high',),
 ('low',),
 ('close',),
 ('adj_close',),
 ('volume',)]

Operation done successfully


En este paso ordenamos los datos acorde a la fecha en orden ascendente.

In [5]:
names_list = [name[0] for name in CAR_names]
CAR_sql.columns = names_list 
CAR_sql = CAR_sql.sort_values(by = "date")
CAR_sql.head()

Unnamed: 0,date,open,high,low,close,adj_close,volume
0,2017-10-01,0.021678,0.032226,0.017354,0.024969,0.024969,50068700.0
1,2017-10-02,0.024607,0.030088,0.019969,0.025932,0.025932,57641300.0
2,2017-10-03,0.025757,0.027425,0.02069,0.020816,0.020816,16997800.0
3,2017-10-04,0.020864,0.022806,0.020864,0.021931,0.021931,9000050.0
4,2017-10-05,0.021951,0.022154,0.020859,0.021489,0.021489,5562510.0


Finalmente, utilizando **plotly**, hacemos un grafico de velas (Candlestick) para poder visualizar las alzas, los bajos y el volumen que ha tenido Cardano en los años de 2018 a 2021.

In [None]:
import plotly.graph_objects as go

fig = go.Figure(data=[go.Candlestick(x = CAR_sql.date,
                                     open = CAR_sql.open, 
                                     high = CAR_sql.high,
                                     low = CAR_sql.low, 
                                     close = CAR_sql.close)
                     ])
fig.update_layout(
    title="Cardano USD (CAR-USD)",
    xaxis_title="Day",
    yaxis_title="CAR-USD",
    font=dict(
        family="Courier New, monospace",
        size=12,
        color="RebeccaPurple"
    )
)
fig.update_layout(xaxis_rangeslider_visible=False)

```{note}
:class: dropdown
**El grafico solo se puede ver en caso tal que descargue el documento .csv y lo ajuste en la direccion al principio del documento, aqui abajo hay un .png de la grafica**
```

![newplot.png](attachment:newplot.png)

_`Cardano` es una criptomoneda que fue lanzada en 2017 y experimento un crecimiento significativo desde entonces. Parece ser que durante el periodo que se le lanzó tuvo un gran impacto, pues en sus primeros meses como vemos en la grafica, `Cardano` tuvo una gran alza en los precios con respecto al `USD`, luego se mantuvo estable y en la epoca post-pandemia podemos ver que experimentó diversos movimientos en su precio, como esa gran alza que se puede observar a partir del mes Junio del 2021 aproximadamente._

![muchas-gracias.jpg](attachment:muchas-gracias.jpg)