# Plataforma de seguimiento de datos COVID-19 para Colombia

## Universidad Sergio Arboleda

- Leyder Jesus Pacheco  - juan.sierra01@correo.usa.edu.co
- Luis Felipe Velasquez  - luis.velasquez01@correo.usa.edu.co
- Juan Sebastian Sierra  - juan.sierra01@correo.usa.edu.co

Para la primera entrega se requiere una aplicación que extraiga los datos actualizados de COVID-19 en
Colombia de Internet y los guarde en una base de datos. Estos datos posteriormente se deberán representar
de forma selectiva mediante tortas, gráficos de dos dimensiones y diagramas de barras.

### 1.1 Paquetes

Información de los paquetes importados y utilizados

- numpy
- matplotlib
- pandas

In [1]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import sqlite3 as db
from sqlite3 import Error

## 1. Extracción de los datos actualizados de COVID-19 en Colombia de Internet

Para extraer los datos de los casos de COVID-19 en Colombia se utiliza la base de datos abiertos de colombia [datos.gov.co](https://www.datos.gov.co/Salud-y-Protecci-n-Social/Casos-positivos-de-COVID-19-en-Colombia/gt2j-8ykr/data) mediante la API Socrata Open Data para obtener los datos en formato .csv

In [None]:
# Ejecutar celda una sola vez
# direccion URL de Open data
url = "https://www.datos.gov.co/api/views/gt2j-8ykr/rows.csv?accessType=DOWNLOAD"

data = pd.read_csv(url, low_memory=False)
#data.to_csv("datasets/pruebacovid.csv")
#prueba descarga de datos

## 2. Almacenamiento de datos en una base de datos

para el almacenamiento se usar el motor de base de datos por defecto sqlite, con el paquete sqlite3.

In [2]:
#metodo para conectar a la base de datos
def connect_database(name):
    conn = None
    try:
        conn = db.connect(name)
        print(db.version)
        return conn
    except Error as e:
        print(e)

In [3]:
def close_db(conn):
    conn.commit()
    conn.close()

In [4]:
#metodo para guardar la informacion descargada
def save_data(data, table, conn):
    data.to_sql(table, conn, if_exists='replace')

In [5]:
# constantes
database = 'datasets/covid.db'
table = 'covid_table'
conn = connect_database(database)
c = conn.cursor()

2.6.0


In [None]:
#Guardar los datos descargados
#Ejecutar una sola vez
pd.to_sql(table, conn, if_exists='replace')

In [9]:
# ejemplo de una consulta
data = pd.read_sql(f"SELECT * FROM {table}", conn)
data.head()

Unnamed: 0,index,ID de caso,Fecha de notificación,Código DIVIPOLA,Ciudad de ubicación,Departamento o Distrito,atención,Edad,Sexo,Tipo,...,FIS,Fecha de muerte,Fecha diagnostico,Fecha recuperado,fecha reporte web,Tipo recuperación,Codigo departamento,Codigo pais,Pertenencia etnica,Nombre grupo etnico
0,0,1,2020-03-02T00:00:00.000,11001,Bogotá D.C.,Bogotá D.C.,Recuperado,19,F,Importado,...,2020-02-27T00:00:00.000,,2020-03-06T00:00:00.000,2020-03-13T00:00:00.000,2020-03-06T00:00:00.000,PCR,11,380.0,Otro,
1,1,2,2020-03-06T00:00:00.000,76111,Guadalajara de Buga,Valle del Cauca,Recuperado,34,M,Importado,...,2020-03-04T00:00:00.000,,2020-03-09T00:00:00.000,2020-03-19T00:00:00.000,2020-03-09T00:00:00.000,PCR,76,724.0,Negro,
2,2,3,2020-03-07T00:00:00.000,5001,Medellín,Antioquia,Recuperado,50,F,Importado,...,2020-02-29T00:00:00.000,,2020-03-09T00:00:00.000,2020-03-15T00:00:00.000,2020-03-09T00:00:00.000,PCR,5,724.0,Otro,
3,3,4,2020-03-09T00:00:00.000,5001,Medellín,Antioquia,Recuperado,55,M,Relacionado,...,2020-03-06T00:00:00.000,,2020-03-11T00:00:00.000,2020-03-26T00:00:00.000,2020-03-11T00:00:00.000,PCR,5,,Otro,
4,4,5,2020-03-09T00:00:00.000,5001,Medellín,Antioquia,Recuperado,25,M,Relacionado,...,2020-03-08T00:00:00.000,,2020-03-11T00:00:00.000,2020-03-23T00:00:00.000,2020-03-11T00:00:00.000,PCR,5,,Otro,
