# **Importación de conjuntos de datos**

## Objetivos

Al finalizar esta practica, serás capaz de:

- Adquirir datos de diversas maneras.
- Obtener información valiosa utilizando la biblioteca **`Pandas`**.

## Tabla de contenidos

¡Prepárate para explorar los datos como un profesional! Aquí tienes los pasos que seguiremos:

1. Adquisición de Datos
2. Información básica del conjunto de datos

---

¡Ahora es tu turno de comenzar la aventura con **Pandas**! 🚀


# **Adquisición de datos**

Un conjunto de datos es, por lo general, un archivo que contiene información almacenada en uno de varios formatos. Entre los formatos más comunes están: **.csv**, **.json**, **.xlsx**, entre otros. Este conjunto de datos puede estar ubicado en diferentes lugares, como tu computadora local, un servidor, un sitio web o incluso en almacenamiento en la nube. 🌐

Para analizar datos en un notebook de Python, necesitas primero traer el conjunto de datos al entorno del notebook. En esta sección, aprenderás cómo cargar un conjunto de datos en tu **Jupyter Notebook**. 💻

Como ejemplo, utilizaremos el conjunto de datos **Automobile Data**, que está disponible en línea en formato CSV (valores separados por comas). Este será nuestro recurso para practicar cómo leer datos.

### Detalles del conjunto de datos:

- **Fuente de datos**: [Conjunto de datos de automóviles](https://drive.google.com/file/d/1wSJnxg2b86VQGZ-cgt-PJyj4TsZ5djJ9/view?usp=sharing)  
- **Tipo de datos**: CSV  

La biblioteca **Pandas** es una herramienta muy popular y extremadamente útil que te permitirá leer diversos conjuntos de datos y convertirlos en un marco de datos (data frame). ¡No te preocupes! Las plataformas de Jupyter Notebook ya tienen **Pandas** integrado, así que solo necesitas importarlo para comenzar. 🚀

¡Manos a la obra! 🛠️

# Nota sobre instalación de bibliotecas

Si estás utilizando este notebook en un entorno donde no están instaladas las bibliotecas necesarias o si necesitas versiones específicas, puedes instalar las bibliotecas manualmente. Solo necesitas descomentar las líneas a continuación y ejecutarlas:

```python

Descomenta estas líneas si necesitas instalar versiones específicas de las bibliotecas:


In [None]:
# ! mamba install pandas==1.3.3 -y
# ! mamba install numpy=1.21.2 -y

In [None]:
# Importar la biblioteca pandas para manipulación y análisis de datos
import pandas as pd

# Importa la biblioteca numpy para operaciones matemáticas y manejo de arreglos
import numpy as np

## Lectura de Datos

Utilizamos la función `pandas.read_csv()` para leer archivos CSV. En esta practica, que se ejecuta en **Google Colab**, puedes descargar directamente el conjunto de datos desde una URL o trabajar con Google Drive.

El código proporcionado a continuación te permite descargar el conjunto de datos y guardarlo localmente en el entorno de Colab. 🚀


In [1]:
# Importamos la biblioteca necesaria
import requests

def download_data_from_drive(url, filename):
    """
    Descarga un archivo desde Google Drive y lo guarda localmente en el entorno de Colab.

    Parámetros:
    - url (str): URL de Google Drive del archivo a descargar.
    - filename (str): Nombre con el que se guardará el archivo localmente.
    """
    try:
        # Extrae el ID del archivo de la URL
        file_id = url.split('/d/')[1].split('/')[0]
        download_url = f'https://drive.google.com/uc?export=download&id={file_id}'

        # Realiza la solicitud GET para descargar el archivo
        response = requests.get(download_url)

        # Verifica si la respuesta fue exitosa
        if response.status_code == 200:
            with open(filename, 'wb') as file:
                file.write(response.content)
            print(f"Archivo descargado y guardado como {filename}")
        else:
            print(f"Error al descargar el archivo. Código de estado: {response.status_code}")

    except Exception as e:
        print(f"Se produjo un error: {e}")

# URL del archivo en Google Drive
file_url = "https://drive.google.com/file/d/1wSJnxg2b86VQGZ-cgt-PJyj4TsZ5djJ9/view?usp=drive_link"
# Nombre del archivo a guardar localmente
filename = "automobile_data.csv"

# Llamamos a la función para descargar el archivo
download_data_from_drive(file_url, filename)

Archivo descargado y guardado como automobile_data.csv


Utiliza el método de **Pandas** `read_csv()` para cargar los datos en un **dataframe**.

In [4]:
# Importamos la biblioteca pandas para manipular y analizar los datos
import pandas as pd

# Cargamos el archivo CSV en un dataframe usando el método 'read_csv' de pandas
df = pd.read_csv('automobile_data.csv')

Después de leer el conjunto de datos, podemos usar el método `data_frame.head(n)` para ver las primeras n filas del **dataframe**, donde n es un número entero. A diferencia de `data_frame.head(n)`, el método `data_frame.tail(n)` te mostrará las últimas n filas del **dataframe**.

In [5]:
# Mostramos las primeras 5 filas del dataframe
df.head(5)

Unnamed: 0,3,?,alfa-romero,gas,std,two,convertible,rwd,front,88.6,...,130,mpfi,3.47,2.68,9.0,111,5000,21,27,13495
0,3,?,alfa-romero,gas,std,two,convertible,rwd,front,88.6,...,130,mpfi,3.47,2.68,9.0,111,5000,21,27,16500
1,1,?,alfa-romero,gas,std,two,hatchback,rwd,front,94.5,...,152,mpfi,2.68,3.47,9.0,154,5000,19,26,16500
2,2,164,audi,gas,std,four,sedan,fwd,front,99.8,...,109,mpfi,3.19,3.4,10.0,102,5500,24,30,13950
3,2,164,audi,gas,std,four,sedan,4wd,front,99.4,...,136,mpfi,3.19,3.4,8.0,115,5500,18,22,17450
4,2,?,audi,gas,std,two,sedan,fwd,front,99.8,...,136,mpfi,3.19,3.4,8.5,110,5500,19,25,15250


In [6]:
# Mostramos las últimas 5 filas del dataframe
df.tail(5)

Unnamed: 0,3,?,alfa-romero,gas,std,two,convertible,rwd,front,88.6,...,130,mpfi,3.47,2.68,9.0,111,5000,21,27,13495
199,-1,95,volvo,gas,std,four,sedan,rwd,front,109.1,...,141,mpfi,3.78,3.15,9.5,114,5400,23,28,16845
200,-1,95,volvo,gas,turbo,four,sedan,rwd,front,109.1,...,141,mpfi,3.78,3.15,8.7,160,5300,19,25,19045
201,-1,95,volvo,gas,std,four,sedan,rwd,front,109.1,...,173,mpfi,3.58,2.87,8.8,134,5500,18,23,21485
202,-1,95,volvo,diesel,turbo,four,sedan,rwd,front,109.1,...,145,idi,3.01,3.4,23.0,106,4800,26,27,22470
203,-1,95,volvo,gas,turbo,four,sedan,rwd,front,109.1,...,141,mpfi,3.78,3.15,9.5,114,5400,19,25,22625


## **Agregar encabezados**

Echa un vistazo al conjunto de datos. **`Pandas`** automáticamente asigna encabezados con enteros que comienzan desde 0.

Para describir mejor los datos, puedes agregar un encabezado personalizado. Esta información está disponible en: [Automobile Dataset](https://archive.ics.uci.edu/ml/datasets/Automobile).

Por lo tanto, debes agregar los encabezados manualmente.

Primero, creamos una lista llamada "***headers***" que contenga todos los nombres de las columnas en el orden correspondiente. Luego, usa `dataframe.columns = headers` para reemplazar los encabezados predeterminados con la lista que creamos.

In [7]:
# Lista con los nombres de las columnas (encabezados)
headers = ["símbolo", "pérdidas-normalizadas", "marca", "tipo-de-combustible", "aspiración",
           "número-de-puertas", "estilo-de-carrocería", "ruedas-de-tracción", "ubicación-del-motor",
           "distancia-eje", "longitud", "anchura", "altura", "peso-en-vacío",
           "tipo-de-motor", "número-de-cilindros", "tamaño-del-motor", "sistema-de-combustible",
           "diámetro", "carrera", "relación-de-compresión", "caballos-de-fuerza", "rpm-pico",
           "mpg-ciudad", "mpg-carretera", "precio"]

# Reemplazamos los encabezados del dataframe con la lista creada
df.columns = headers

# Mostramos las primeras filas del dataframe para verificar los cambios
df.head()

Unnamed: 0,símbolo,pérdidas-normalizadas,marca,tipo-de-combustible,aspiración,número-de-puertas,estilo-de-carrocería,ruedas-de-tracción,ubicación-del-motor,distancia-eje,...,tamaño-del-motor,sistema-de-combustible,diámetro,carrera,relación-de-compresión,caballos-de-fuerza,rpm-pico,mpg-ciudad,mpg-carretera,precio
0,3,?,alfa-romero,gas,std,two,convertible,rwd,front,88.6,...,130,mpfi,3.47,2.68,9.0,111,5000,21,27,16500
1,1,?,alfa-romero,gas,std,two,hatchback,rwd,front,94.5,...,152,mpfi,2.68,3.47,9.0,154,5000,19,26,16500
2,2,164,audi,gas,std,four,sedan,fwd,front,99.8,...,109,mpfi,3.19,3.4,10.0,102,5500,24,30,13950
3,2,164,audi,gas,std,four,sedan,4wd,front,99.4,...,136,mpfi,3.19,3.4,8.0,115,5500,18,22,17450
4,2,?,audi,gas,std,two,sedan,fwd,front,99.8,...,136,mpfi,3.19,3.4,8.5,110,5500,19,25,15250


También puedes ver las primeras 10 entradas del **dataframe** actualizado y notar que los encabezados se han actualizado correctamente.

In [8]:
# Mostramos las primeras 10 filas del dataframe actualizado
df.head(10)

Unnamed: 0,símbolo,pérdidas-normalizadas,marca,tipo-de-combustible,aspiración,número-de-puertas,estilo-de-carrocería,ruedas-de-tracción,ubicación-del-motor,distancia-eje,...,tamaño-del-motor,sistema-de-combustible,diámetro,carrera,relación-de-compresión,caballos-de-fuerza,rpm-pico,mpg-ciudad,mpg-carretera,precio
0,3,?,alfa-romero,gas,std,two,convertible,rwd,front,88.6,...,130,mpfi,3.47,2.68,9.0,111,5000,21,27,16500
1,1,?,alfa-romero,gas,std,two,hatchback,rwd,front,94.5,...,152,mpfi,2.68,3.47,9.0,154,5000,19,26,16500
2,2,164,audi,gas,std,four,sedan,fwd,front,99.8,...,109,mpfi,3.19,3.4,10.0,102,5500,24,30,13950
3,2,164,audi,gas,std,four,sedan,4wd,front,99.4,...,136,mpfi,3.19,3.4,8.0,115,5500,18,22,17450
4,2,?,audi,gas,std,two,sedan,fwd,front,99.8,...,136,mpfi,3.19,3.4,8.5,110,5500,19,25,15250
5,1,158,audi,gas,std,four,sedan,fwd,front,105.8,...,136,mpfi,3.19,3.4,8.5,110,5500,19,25,17710
6,1,?,audi,gas,std,four,wagon,fwd,front,105.8,...,136,mpfi,3.19,3.4,8.5,110,5500,19,25,18920
7,1,158,audi,gas,turbo,four,sedan,fwd,front,105.8,...,131,mpfi,3.13,3.4,8.3,140,5500,17,20,23875
8,0,?,audi,gas,turbo,two,hatchback,4wd,front,99.5,...,131,mpfi,3.13,3.4,7.0,160,5500,16,22,?
9,2,192,bmw,gas,std,two,sedan,rwd,front,101.2,...,108,mpfi,3.5,2.8,8.8,101,5800,23,29,16430


Ahora, necesitamos reemplazar el símbolo "?" por NaN para que el método `dropna()` pueda eliminar los valores faltantes.

In [9]:
# Reemplazamos los símbolos "?" por NaN
df.replace("?", float("nan"), inplace=True)

# Verificamos si el reemplazo fue exitoso mostrando las primeras filas
df.head()

Unnamed: 0,símbolo,pérdidas-normalizadas,marca,tipo-de-combustible,aspiración,número-de-puertas,estilo-de-carrocería,ruedas-de-tracción,ubicación-del-motor,distancia-eje,...,tamaño-del-motor,sistema-de-combustible,diámetro,carrera,relación-de-compresión,caballos-de-fuerza,rpm-pico,mpg-ciudad,mpg-carretera,precio
0,3,,alfa-romero,gas,std,two,convertible,rwd,front,88.6,...,130,mpfi,3.47,2.68,9.0,111,5000,21,27,16500
1,1,,alfa-romero,gas,std,two,hatchback,rwd,front,94.5,...,152,mpfi,2.68,3.47,9.0,154,5000,19,26,16500
2,2,164.0,audi,gas,std,four,sedan,fwd,front,99.8,...,109,mpfi,3.19,3.4,10.0,102,5500,24,30,13950
3,2,164.0,audi,gas,std,four,sedan,4wd,front,99.4,...,136,mpfi,3.19,3.4,8.0,115,5500,18,22,17450
4,2,,audi,gas,std,two,sedan,fwd,front,99.8,...,136,mpfi,3.19,3.4,8.5,110,5500,19,25,15250


Puedes eliminar los valores faltantes de la columna "price" de la siguiente manera:

In [10]:
# Eliminamos las filas con valores faltantes en la columna "price"
df.dropna(subset=["precio"], inplace=True)

# Verificamos si las filas con valores faltantes fueron eliminadas
df.head()

Unnamed: 0,símbolo,pérdidas-normalizadas,marca,tipo-de-combustible,aspiración,número-de-puertas,estilo-de-carrocería,ruedas-de-tracción,ubicación-del-motor,distancia-eje,...,tamaño-del-motor,sistema-de-combustible,diámetro,carrera,relación-de-compresión,caballos-de-fuerza,rpm-pico,mpg-ciudad,mpg-carretera,precio
0,3,,alfa-romero,gas,std,two,convertible,rwd,front,88.6,...,130,mpfi,3.47,2.68,9.0,111,5000,21,27,16500
1,1,,alfa-romero,gas,std,two,hatchback,rwd,front,94.5,...,152,mpfi,2.68,3.47,9.0,154,5000,19,26,16500
2,2,164.0,audi,gas,std,four,sedan,fwd,front,99.8,...,109,mpfi,3.19,3.4,10.0,102,5500,24,30,13950
3,2,164.0,audi,gas,std,four,sedan,4wd,front,99.4,...,136,mpfi,3.19,3.4,8.0,115,5500,18,22,17450
4,2,,audi,gas,std,two,sedan,fwd,front,99.8,...,136,mpfi,3.19,3.4,8.5,110,5500,19,25,15250


In [11]:
# Eliminamos las filas donde la columna "price" tiene valores NaN
df.dropna(subset=["precio"], axis=0, inplace=True)

# Verificamos si el dataframe se ha actualizado correctamente
df.head()

Unnamed: 0,símbolo,pérdidas-normalizadas,marca,tipo-de-combustible,aspiración,número-de-puertas,estilo-de-carrocería,ruedas-de-tracción,ubicación-del-motor,distancia-eje,...,tamaño-del-motor,sistema-de-combustible,diámetro,carrera,relación-de-compresión,caballos-de-fuerza,rpm-pico,mpg-ciudad,mpg-carretera,precio
0,3,,alfa-romero,gas,std,two,convertible,rwd,front,88.6,...,130,mpfi,3.47,2.68,9.0,111,5000,21,27,16500
1,1,,alfa-romero,gas,std,two,hatchback,rwd,front,94.5,...,152,mpfi,2.68,3.47,9.0,154,5000,19,26,16500
2,2,164.0,audi,gas,std,four,sedan,fwd,front,99.8,...,109,mpfi,3.19,3.4,10.0,102,5500,24,30,13950
3,2,164.0,audi,gas,std,four,sedan,4wd,front,99.4,...,136,mpfi,3.19,3.4,8.0,115,5500,18,22,17450
4,2,,audi,gas,std,two,sedan,fwd,front,99.8,...,136,mpfi,3.19,3.4,8.5,110,5500,19,25,15250


Aquí, `axis=0` significa que se eliminarán las filas completas donde se encuentre un valor **NaN** en la columna 'price'.

Ahora, has leído exitosamente el conjunto de datos sin procesar y agregado los encabezados correctos al **dataframe**.

Encontrar los nombres de las columnas del **dataframe**.


In [12]:
# Obtenemos y mostramos los nombres de las columnas del dataframe
df.columns

Index(['símbolo', 'pérdidas-normalizadas', 'marca', 'tipo-de-combustible',
       'aspiración', 'número-de-puertas', 'estilo-de-carrocería',
       'ruedas-de-tracción', 'ubicación-del-motor', 'distancia-eje',
       'longitud', 'anchura', 'altura', 'peso-en-vacío', 'tipo-de-motor',
       'número-de-cilindros', 'tamaño-del-motor', 'sistema-de-combustible',
       'diámetro', 'carrera', 'relación-de-compresión', 'caballos-de-fuerza',
       'rpm-pico', 'mpg-ciudad', 'mpg-carretera', 'precio'],
      dtype='object')

## Guardar conjunto de datos

De manera similar, **Pandas** te permite guardar el conjunto de datos en formato CSV. Usando el método `dataframe.to_csv()`, puedes especificar la ruta y el nombre del archivo dentro de los paréntesis.

Por ejemplo, si guardas el **dataframe** `df` como `automobile.csv` en tu máquina local, puedes utilizar la siguiente sintaxis, donde `index=False` significa que los nombres de las filas no se escribirán.

In [14]:
# Guardamos el dataframe como un archivo CSV sin los nombres de las filas
df.to_csv('automobiles.csv', index=False)

## Leer/Guardar Otros Formatos de Datos

También puedes leer y guardar otros formatos de archivo. Puedes usar funciones similares a `pd.read_csv()` y `df.to_csv()` para otros formatos de datos. Las funciones se enumeran en la siguiente tabla:

| Formato de Datos | Leer | Guardar |
|------------------|------|---------|
| csv              | `pd.read_csv()` | `df.to_csv()` |
| json             | `pd.read_json()` | `df.to_json()` |
| excel            | `pd.read_excel()` | `df.to_excel()` |
| hdf              | `pd.read_hdf()` | `df.to_hdf()` |
| sql              | `pd.read_sql()` | `df.to_sql()` |
| ...              | ...  | ... |


## Información básica del conjunto de datos

Después de cargar los datos en el **dataframe** de `Pandas`, es momento de explorar el conjunto de datos.

Existen varias formas de obtener información esencial sobre los datos que te ayudarán a comprenderlos mejor.

## Tipos de Datos

Los datos tienen una variedad de tipos.

Los principales tipos almacenados en los **dataframes** de Pandas son: **object**, **float**, **int**, **bool** y **datetime**. Para aprender mejor sobre cada atributo, siempre debes conocer el tipo de dato de cada columna. En Pandas:

Devuelve una serie con el tipo de dato de cada columna.
`df.dtypes`

In [15]:
# Obtenemos y mostramos los tipos de datos de cada columna
df.dtypes

Unnamed: 0,0
símbolo,int64
pérdidas-normalizadas,object
marca,object
tipo-de-combustible,object
aspiración,object
número-de-puertas,object
estilo-de-carrocería,object
ruedas-de-tracción,object
ubicación-del-motor,object
distancia-eje,float64


Como se muestra anteriormente, puedes observar claramente que el tipo de dato de "símbolo" y "peso-en-vacío" es `int64`, "pérdidas-normalizadas" es `object`, y "distancia-eje" es `float64`, entre otros.

Estos tipos de datos pueden cambiarse; aprenderás cómo hacerlo en un módulo posterior.

## Describe

Si deseas obtener un resumen estadístico de cada columna, como el conteo, el valor medio de la columna, la desviación estándar de la columna, etc., utiliza el método `describe`:

In [16]:
# Obtenemos un resumen estadístico de cada columna
df.describe()

Unnamed: 0,símbolo,distancia-eje,longitud,anchura,altura,peso-en-vacío,tamaño-del-motor,relación-de-compresión,mpg-ciudad,mpg-carretera
count,200.0,200.0,200.0,200.0,200.0,200.0,200.0,200.0,200.0,200.0
mean,0.83,98.848,174.228,65.898,53.7915,2555.705,126.86,10.1701,25.2,30.705
std,1.248557,6.038261,12.347132,2.102904,2.428449,518.594552,41.650501,4.014163,6.432487,6.827227
min,-2.0,86.6,141.1,60.3,47.8,1488.0,61.0,7.0,13.0,16.0
25%,0.0,94.5,166.675,64.175,52.0,2163.0,97.75,8.575,19.0,25.0
50%,1.0,97.0,173.2,65.5,54.1,2414.0,119.5,9.0,24.0,30.0
75%,2.0,102.4,183.5,66.675,55.525,2928.25,142.0,9.4,30.0,34.0
max,3.0,120.9,208.1,72.0,59.8,4066.0,326.0,23.0,49.0,54.0


Este método proporcionará varias estadísticas resumen, excluyendo los valores `NaN` (No es un Número).

Esto muestra el resumen estadístico de todas las columnas de tipo numérico ( **int , float** ).

Por ejemplo, el atributo "símbolo" tiene 205 registros, el valor promedio de esta columna es 0.83, la desviación estándar es 1.24, el valor mínimo es -2, el percentil 25 es 0, el percentil 50 es 1, el percentil 75 es 2 y el valor máximo es 3.

Sin embargo, ¿qué sucede si también deseas revisar todas las columnas, incluidas aquellas de tipo object ?

Puedes agregar un argumento `include = "all"` dentro de los paréntesis. Inténtalo nuevamente.

In [17]:
# Obtenemos un resumen estadístico de todas las columnas, incluidas las de tipo "object"
df.describe(include="all")

Unnamed: 0,símbolo,pérdidas-normalizadas,marca,tipo-de-combustible,aspiración,número-de-puertas,estilo-de-carrocería,ruedas-de-tracción,ubicación-del-motor,distancia-eje,...,tamaño-del-motor,sistema-de-combustible,diámetro,carrera,relación-de-compresión,caballos-de-fuerza,rpm-pico,mpg-ciudad,mpg-carretera,precio
count,200.0,164.0,200,200,200,198,200,200,200,200.0,...,200.0,200,196.0,196.0,200.0,198.0,198.0,200.0,200.0,200.0
unique,,51.0,22,2,2,2,5,3,2,,...,,8,38.0,36.0,,58.0,22.0,,,185.0
top,,161.0,toyota,gas,std,four,sedan,fwd,front,,...,,mpfi,3.62,3.4,,68.0,5500.0,,,16500.0
freq,,11.0,32,180,164,113,94,118,197,,...,,91,23.0,19.0,,19.0,36.0,,,2.0
mean,0.83,,,,,,,,,98.848,...,126.86,,,,10.1701,,,25.2,30.705,
std,1.248557,,,,,,,,,6.038261,...,41.650501,,,,4.014163,,,6.432487,6.827227,
min,-2.0,,,,,,,,,86.6,...,61.0,,,,7.0,,,13.0,16.0,
25%,0.0,,,,,,,,,94.5,...,97.75,,,,8.575,,,19.0,25.0,
50%,1.0,,,,,,,,,97.0,...,119.5,,,,9.0,,,24.0,30.0,
75%,2.0,,,,,,,,,102.4,...,142.0,,,,9.4,,,30.0,34.0,


Ahora proporciona el resumen estadístico de todas las columnas, incluidas las de tipo **object**.

Podemos ver cuántos valores únicos hay, cuál es el valor más frecuente y la frecuencia de ese valor en las columnas de tipo **object**.

Algunos valores en la tabla anterior muestran "NaN". Esos números no están disponibles para un tipo de columna en particular.

Podemos seleccionar las columnas de un **dataframe** indicando el nombre de cada columna. Por ejemplo, puedes seleccionar las tres columnas de la siguiente manera:

```python
dataframe[['column 1', 'column 2', 'column 3']]
```

In [18]:
# Seleccionar las columnas 'longitud' y 'relación-de-compresión' y obtener un resumen estadístico
df[['longitud', 'relación-de-compresión']].describe()

Unnamed: 0,longitud,relación-de-compresión
count,200.0,200.0
mean,174.228,10.1701
std,12.347132,4.014163
min,141.1,7.0
25%,166.675,8.575
50%,173.2,9.0
75%,183.5,9.4
max,208.1,23.0


### Información

También puedes usar otro método para revisar tu conjunto de datos:
### `info`

Proporciona un resumen conciso de tu **dataframe**.

Este método imprime información sobre el **dataframe**, incluyendo el tipo de índice, las columnas, los valores no nulos y el uso de

In [19]:
# Obtener información general sobre el dataframe
df.info()

<class 'pandas.core.frame.DataFrame'>
Index: 200 entries, 0 to 203
Data columns (total 26 columns):
 #   Column                  Non-Null Count  Dtype  
---  ------                  --------------  -----  
 0   símbolo                 200 non-null    int64  
 1   pérdidas-normalizadas   164 non-null    object 
 2   marca                   200 non-null    object 
 3   tipo-de-combustible     200 non-null    object 
 4   aspiración              200 non-null    object 
 5   número-de-puertas       198 non-null    object 
 6   estilo-de-carrocería    200 non-null    object 
 7   ruedas-de-tracción      200 non-null    object 
 8   ubicación-del-motor     200 non-null    object 
 9   distancia-eje           200 non-null    float64
 10  longitud                200 non-null    float64
 11  anchura                 200 non-null    float64
 12  altura                  200 non-null    float64
 13  peso-en-vacío           200 non-null    int64  
 14  tipo-de-motor           200 non-null    object 

¡Excelente! Ha completado el cuaderno de Introducción. 🎉