___

<a href='https://pandas.pydata.org/docs/reference/io.html'> <img src='https://www.python.org/static/img/python-logo.png' /></a>

___

# Data Input y Output

Este notebook es el código de referencia para obtener entradas y salidas, con Pandas se pueden leer una variedad de tipos de archivos usando sus métodos pd.read_. Echemos un vistazo a los tipos de datos más comunes:

In [5]:
import numpy as np
import pandas as pd

## CSV

### CSV Input

In [8]:
df = pd.read_csv('ejemplo')
df

Unnamed: 0,a,b,c,d
0,0,1,2,3
1,4,5,6,7
2,8,9,10,11
3,12,13,14,15


In [9]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


### CSV Output

In [10]:
df.to_csv('ejemplo',index=False)

## Excel
Pandas puede leer y escribir archivos de Excel, tener en cuenta que esto solo importa datos. No son fórmulas o imágenes, tener imágenes o macros puede hacer que este método read_excel se bloquee.

### Excel Input

In [11]:
# Usamos openpyxl en engine, para abrir archivos .xlsx
pd.read_excel('Excel_Ejemplo.xlsx',sheet_name='Sheet1', engine='openpyxl')

Unnamed: 0.1,Unnamed: 0,a,b,c,d
0,0,0,1,2,3
1,1,4,5,6,7
2,2,8,9,10,11
3,3,12,13,14,15


### Excel Output

In [12]:
df.to_excel('Excel_Ejemplo.xlsx',sheet_name='Sheet1')

## HTML

Es posible que se deba instalar htmllib5, lxml y BeautifulSoup4. En la terminal / símbolo del sistema, ejecute:

    conda install lxml
    conda install html5lib
    conda install BeautifulSoup4

Luego reiniciar Jupyter Notebook.
(o user pip install si no se está usando Anaconda Distribution)

Pandas puede leer las pestañas de las tablas en html. Por ejemplo:

In [13]:
!pip install lxml

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


In [14]:
!pip install html5lib

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


In [15]:
!pip install BeautifulSoup4

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


### HTML Input

La función read_html de Pandas leerá tablas de una página web y devolverá una lista de objetos DataFrame:


In [16]:
df = pd.read_html('https://en.wikipedia.org/wiki/Lima')

In [17]:
len(df)

18

In [18]:
df[1]

Unnamed: 0_level_0,"Climate data for Lima (Jorge Chávez International Airport) 1961–1990, extremes 1960–present","Climate data for Lima (Jorge Chávez International Airport) 1961–1990, extremes 1960–present","Climate data for Lima (Jorge Chávez International Airport) 1961–1990, extremes 1960–present","Climate data for Lima (Jorge Chávez International Airport) 1961–1990, extremes 1960–present","Climate data for Lima (Jorge Chávez International Airport) 1961–1990, extremes 1960–present","Climate data for Lima (Jorge Chávez International Airport) 1961–1990, extremes 1960–present","Climate data for Lima (Jorge Chávez International Airport) 1961–1990, extremes 1960–present","Climate data for Lima (Jorge Chávez International Airport) 1961–1990, extremes 1960–present","Climate data for Lima (Jorge Chávez International Airport) 1961–1990, extremes 1960–present","Climate data for Lima (Jorge Chávez International Airport) 1961–1990, extremes 1960–present","Climate data for Lima (Jorge Chávez International Airport) 1961–1990, extremes 1960–present","Climate data for Lima (Jorge Chávez International Airport) 1961–1990, extremes 1960–present","Climate data for Lima (Jorge Chávez International Airport) 1961–1990, extremes 1960–present","Climate data for Lima (Jorge Chávez International Airport) 1961–1990, extremes 1960–present"
Unnamed: 0_level_1,Month,Jan,Feb,Mar,Apr,May,Jun,Jul,Aug,Sep,Oct,Nov,Dec,Year
0,Record high °C (°F),32.7(90.9),32.5(90.5),33.4(92.1),31.6(88.9),30.3(86.5),30.0(86.0),28.3(82.9),29.0(84.2),28.0(82.4),25.2(77.4),29.0(84.2),30.4(86.7),33.4(92.1)
1,Average high °C (°F),26.1(79.0),26.8(80.2),26.3(79.3),24.5(76.1),22.0(71.6),20.1(68.2),19.1(66.4),18.8(65.8),19.1(66.4),20.3(68.5),22.1(71.8),24.4(75.9),22.5(72.5)
2,Daily mean °C (°F),22.1(71.8),22.7(72.9),22.2(72.0),20.6(69.1),18.8(65.8),17.5(63.5),16.7(62.1),16.2(61.2),16.4(61.5),17.3(63.1),18.7(65.7),20.7(69.3),19.2(66.6)
3,Average low °C (°F),19.4(66.9),19.8(67.6),19.5(67.1),17.9(64.2),16.4(61.5),15.6(60.1),15.2(59.4),14.9(58.8),14.9(58.8),15.5(59.9),16.6(61.9),18.2(64.8),17.2(63.0)
4,Record low °C (°F),12.0(53.6),15.0(59.0),11.0(51.8),10.0(50.0),8.0(46.4),10.0(50.0),8.9(48.0),10.0(50.0),12.5(54.5),11.0(51.8),11.1(52.0),13.9(57.0),8.0(46.4)
5,Average precipitation mm (inches),0.8(0.03),0.4(0.02),0.4(0.02),0.1(0.00),0.3(0.01),0.7(0.03),1.0(0.04),1.5(0.06),0.7(0.03),0.2(0.01),0.1(0.00),0.2(0.01),6.4(0.25)
6,Average precipitation days (≥ 0.1 mm),0.7,0.7,0.7,0.3,1.1,2.3,3.0,4.1,3.1,1.2,0.4,0.5,18.2
7,Average relative humidity (%),81.6,82.1,82.7,85.0,85.1,85.1,84.8,84.8,85.5,83.5,82.1,81.5,82.8
8,Mean monthly sunshine hours,179.1,169.0,139.2,184.0,116.4,50.6,28.6,32.3,37.3,65.3,89.0,139.2,1230
9,"Source 1: Deutscher Wetterdienst,[51] Meteo Cl...","Source 1: Deutscher Wetterdienst,[51] Meteo Cl...","Source 1: Deutscher Wetterdienst,[51] Meteo Cl...","Source 1: Deutscher Wetterdienst,[51] Meteo Cl...","Source 1: Deutscher Wetterdienst,[51] Meteo Cl...","Source 1: Deutscher Wetterdienst,[51] Meteo Cl...","Source 1: Deutscher Wetterdienst,[51] Meteo Cl...","Source 1: Deutscher Wetterdienst,[51] Meteo Cl...","Source 1: Deutscher Wetterdienst,[51] Meteo Cl...","Source 1: Deutscher Wetterdienst,[51] Meteo Cl...","Source 1: Deutscher Wetterdienst,[51] Meteo Cl...","Source 1: Deutscher Wetterdienst,[51] Meteo Cl...","Source 1: Deutscher Wetterdienst,[51] Meteo Cl...","Source 1: Deutscher Wetterdienst,[51] Meteo Cl..."


____

_____
_____
# SQL (Opcional)



El módulo pandas.io.sql proporciona una colección de envoltorios de consultas para facilitar la recuperación de datos y reducir la dependencia de la API específica de DB. SQLAlchemy proporciona la abstracción de la base de datos si está instalada. Además, necesitará una biblioteca de controladores para su base de datos. Ejemplos de estos controladores son psycopg2 para PostgreSQL o pymysql para MySQL. Para SQLite, esto se incluye en la biblioteca estándar de Python de forma predeterminada. Puedes encontrar una descripción general de los controladores compatibles para cada dialecto SQL en los documentos de SQLAlchemy.

Si SQLAlchemy no está instalado, solo se proporciona un respaldo para sqlite (y para mysql para compatibilidad con versiones anteriores, pero esto está en desuso y se eliminará en una versión futura). Este modo requiere un adaptador de base de datos de Python que respete la DB-API de Python.

Las funciones clave son:

* read_sql_table(table_name, con[, schema, ...])	
    * Leer SQL tabla de base de datos en un DataFrame.
* read_sql_query(sql, con[, index_col, ...])	
    * Leer la consulta SQL en un DataFrame.
* read_sql(sql, con[, index_col, ...])	
    * Leer la consulta SQL o la tabla de la base de datos en un DataFrame.
* DataFrame.to_sql(name, con[, flavor, ...])	
    * Escribir los registros almacenados en un DataFrame en una base de datos SQL.

In [19]:
from sqlalchemy import create_engine

In [20]:
engine = create_engine('sqlite:///:memory:')

In [21]:
df.to_sql('data', engine)

AttributeError: ignored

In [None]:
sql_df = pd.read_sql('data',con=engine)

In [None]:
sql_df

Unnamed: 0,index,a,b,c,d
0,0,0,1,2,3
1,1,4,5,6,7
2,2,8,9,10,11
3,3,12,13,14,15


# Buen trabajo!