# Ejemplo de base de datos en archivo csv

Para este ejemplo vamos a usar la base de datos [IRIS](https://archive.ics.uci.edu/ml/datasets/iris) que es una base de datos de plantas.

![iris.jpg](attachment:iris.jpg)

Esta base contiene información de tres tipos de plantas y sus características.
Por conveniencia, la base de datos está en el directorio *data/* y consta de dos archivos: iris.names e iris.data. El primero contiene información relevante de la base de datos (meta-data) y el segundo contiene los datos. En el archivo de meta-datos podemos encontrar información acerca de cada una de las columnas de la base. Por ejemplo la primer columna en iris.data guarda los valores de el *sepal length*, la segunda columna *sepal width*, etc.

El segundo archivo (iris.data) consiste en filas (una por registro), y columnas. Las columnas guardan los atributos de cada registro. A contunuación usaremos la librería pandas de python para leer la base de datos.

In [14]:
import pandas as pd # Importar la librería de pandas.

In [15]:
# Leer la base de datos y guardarla en un data frame.
# Como el archivo csv no tiene header utilizamos header=None.
db = pd.read_csv("data/iris.data", header=None) 

In [16]:
# Mostrar los primeros 5 registros con la función head().
db.head()

Unnamed: 0,0,1,2,3,4
0,5.1,3.5,1.4,0.2,Iris-setosa
1,4.9,3.0,1.4,0.2,Iris-setosa
2,4.7,3.2,1.3,0.2,Iris-setosa
3,4.6,3.1,1.5,0.2,Iris-setosa
4,5.0,3.6,1.4,0.2,Iris-setosa


In [17]:
# Obtner las dimensoines de la base. (renglones, columnas)
db.shape

(150, 5)

In [18]:
# Insertar un registro.
db.loc[len(db.index)] = [2.0, 2.0, 2.0, 2.0, "new-plant-type"]

# Mostrar el resultado.
db.tail()

Unnamed: 0,0,1,2,3,4
146,6.3,2.5,5.0,1.9,Iris-virginica
147,6.5,3.0,5.2,2.0,Iris-virginica
148,6.2,3.4,5.4,2.3,Iris-virginica
149,5.9,3.0,5.1,1.8,Iris-virginica
150,2.0,2.0,2.0,2.0,new-plant-type


In [19]:
# Borrar el último registro.
db.drop(150, inplace=True)

# Mostrar el resultado de la base de datos.
db.tail()

Unnamed: 0,0,1,2,3,4
145,6.7,3.0,5.2,2.3,Iris-virginica
146,6.3,2.5,5.0,1.9,Iris-virginica
147,6.5,3.0,5.2,2.0,Iris-virginica
148,6.2,3.4,5.4,2.3,Iris-virginica
149,5.9,3.0,5.1,1.8,Iris-virginica


In [20]:
# Modificar un valor para un renglón.
# dataframe.at[index,'column-name']='new value'
# en caso de que la columna fuera de string se pone "1", es decir con comillas.
db.at[149,1] = 300

db.tail()

Unnamed: 0,0,1,2,3,4
145,6.7,3.0,5.2,2.3,Iris-virginica
146,6.3,2.5,5.0,1.9,Iris-virginica
147,6.5,3.0,5.2,2.0,Iris-virginica
148,6.2,3.4,5.4,2.3,Iris-virginica
149,5.9,300.0,5.1,1.8,Iris-virginica


In [21]:
# Guardar la base de datos en un archivo csv.
#index=False, header=False para que no guarde el index y el header.
db.to_csv("data/modified_db.csv", index=False, header=False)