# Lectura de datos

Poder crear un DataFrame o una Serie manualmente es útil. Pero, la mayoría de las veces, en realidad no estaremos creando nuestros propios datos manualmente. En cambio, estaremos trabajando con datos que ya existen.

Los datos pueden almacenarse en cualquiera de una serie de formas y formatos diferentes. Por mucho, el más básico de estos es el humilde archivo CSV. Cuando abres un archivo CSV, obtienes algo que se ve así:

Producto A,Producto B,Producto C,
<br>
30,21,9,
<br>
35,34,1,
<br>
41,11,11

Usaremos la función pd.read_csv() para leer los datos en un DataFrame. Esto se hace de la siguiente manera:

In [23]:
import pandas as pd

df = pd.read_csv(r"..\2_pandas\data\googleplaystore.csv")
print(df.head(10))

                                                 App        Category  Rating  \
0     Photo Editor & Candy Camera & Grid & ScrapBook  ART_AND_DESIGN     4.1   
1                                Coloring book moana  ART_AND_DESIGN     3.9   
2  U Launcher Lite – FREE Live Cool Themes, Hide ...  ART_AND_DESIGN     4.7   
3                              Sketch - Draw & Paint  ART_AND_DESIGN     4.5   
4              Pixel Draw - Number Art Coloring Book  ART_AND_DESIGN     4.3   
5                         Paper flowers instructions  ART_AND_DESIGN     4.4   
6            Smoke Effect Photo Maker - Smoke Editor  ART_AND_DESIGN     3.8   
7                                   Infinite Painter  ART_AND_DESIGN     4.1   
8                               Garden Coloring Book  ART_AND_DESIGN     4.4   
9                      Kids Paint Free - Drawing Fun  ART_AND_DESIGN     4.7   

  Reviews  Size     Installs  Type Price Content Rating  \
0     159   19M      10,000+  Free     0       Everyone   
1

In [20]:
print(df.dtypes)
print(df.columns)

App                object
Category           object
Rating            float64
Reviews            object
Size               object
Installs           object
Type               object
Price              object
Content Rating     object
Genres             object
Last Updated       object
Current Ver        object
Android Ver        object
dtype: object
Index(['App', 'Category', 'Rating', 'Reviews', 'Size', 'Installs', 'Type',
       'Price', 'Content Rating', 'Genres', 'Last Updated', 'Current Ver',
       'Android Ver'],
      dtype='object')


Si recordamos podemos usar el parametro **dtype** para decidir como leer los datos

In [27]:
df = pd.read_csv(r"..\2_pandas\data\googleplaystore.csv", dtype=str)
print(df.dtypes)

### tambien se puede especificar una columna:
df = pd.read_csv(r"..\2_pandas\data\googleplaystore.csv", dtype={'Rating':str})
print(df.dtypes)

App               object
Category          object
Rating            object
Reviews           object
Size              object
Installs          object
Type              object
Price             object
Content Rating    object
Genres            object
Last Updated      object
Current Ver       object
Android Ver       object
dtype: object
App               object
Category          object
Rating            object
Reviews           object
Size              object
Installs          object
Type              object
Price             object
Content Rating    object
Genres            object
Last Updated      object
Current Ver       object
Android Ver       object
dtype: object


## lectura sql

Con pandas tambien se puede realizar una consulta sql y que como resultado te traiga los datos a un df.

Un ejemplo de como leer datos de sqlite3, es el siguiente:

In [None]:
import sqlite3

conn = sqlite3.connect("database.sqlite")

query = '''
SELECT *
FROM my_tabla
'''
df = pd.read_sql_query(query, con=conn)

conn.close()

> Nota: No siempre se pueden leer datos de una base de datos con esa connecion, dependera del tipo de base que sea, el anterior es de sqlite, aqui otro usando postgresql:

In [None]:
import psycopg2

conn = psycopg2.connect(host='localhost', database='my_data', port='5566', user='postgres', password='postgres')

query = '''
SELECT *
FROM my_tabla
'''
df = pd.read_sql_query(query, con=conn)

conn.close()