# **¡Manos a la obra!**

**Ejercicio práctico: Importación de un conjunto de datos**

En este ejercicio, tendrás la oportunidad de poner en práctica el proceso de carga y análisis inicial de un conjunto de datos. Se te proporcionará un conjunto fascinante sobre **"[Precios de portátiles](https://drive.google.com/file/d/1jlWEFdS80NtsR_OGDUNmQBam39dLYHbo/view?usp=sharing)"**, donde descubrirás cómo trabajar con datos reales y sacar conclusiones valiosas desde el principio.


# **Objetivos**

Al completar esta practica, serás capaz de:

- Importar un conjunto de datos desde un archivo CSV a un DataFrame de Pandas.  
- Desarrollar algunas ideas y análisis básicos sobre el conjunto de datos.  


# **Bibliotecas requeridas**

Para esta practica, utilizaremos las siguientes bibliotecas:

- [`pandas`](https://pandas.pydata.org/) para la manipulación y gestión de los datos.  
- [`numpy`](https://numpy.org/) para realizar operaciones matemáticas.  


### **Importación de bibliotecas necesarias**

In [14]:
# Importación de bibliotecas esenciales
import pandas as pd  # Manipulación y análisis de datos
import numpy as np  # Operaciones matemáticas y manejo de arreglos

# Configuración opcional para mejorar la visualización de datos en Pandas
pd.set_option("display.max_columns", None)  # Mostrar todas las columnas en la salida
pd.set_option("display.float_format", "{:.2f}".format)  # Formato de números con dos decimales

### **Descarga del conjunto de datos**

El conjunto de datos que utilizaremos está disponible en el siguiente enlace:  

*([Datos precios portatiles](https://drive.google.com/file/d/1jlWEFdS80NtsR_OGDUNmQBam39dLYHbo/view?usp=drive_link))*

Las siguientes funciones descargarán el conjunto de datos en tu navegador:


In [15]:
# Importación de la biblioteca requests para descargar archivos desde una URL
import requests

def descargar_datos(url, nombre_archivo):
    """
    Descarga un archivo desde una URL y lo guarda con el nombre especificado.

    Parámetros:
    url (str): Enlace al archivo a descargar.
    nombre_archivo (str): Nombre con el que se guardará el archivo localmente.

    Retorno:
    None
    """
    # Realiza la solicitud GET para obtener el archivo
    respuesta = requests.get(url)

    # Verifica si la solicitud fue exitosa (código de estado 200)
    if respuesta.status_code == 200:
        # Guarda el contenido del archivo descargado
        with open(nombre_archivo, "wb") as archivo:
            archivo.write(respuesta.content)
        print(f"Archivo descargado correctamente: {nombre_archivo}")
    else:
        print(f"Error al descargar el archivo. Código de estado: {respuesta.status_code}")

# Definición de la ruta donde se almacenará el archivo descargado
ruta_archivo = "datos_precios_portatiles.csv"

# URL del archivo
url_dataset = "https://drive.google.com/file/d/1jlWEFdS80NtsR_OGDUNmQBam39dLYHbo/view"

# Llamada a la función para descargar el archivo
descargar_datos(url_dataset, ruta_archivo)

Archivo descargado correctamente: datos_precios_portatiles.csv


In [16]:
# Cargar el conjunto de datos directamente desde la URL de Google Drive
url = "https://drive.google.com/uc?id=1jlWEFdS80NtsR_OGDUNmQBam39dLYHbo"

# Usar pandas para leer el archivo CSV desde la URL
df = pd.read_csv(url)

# Mostrar las primeras filas del DataFrame para verificar la carga correcta
df.head()

Unnamed: 0,Acer,4,IPS Panel,2,1,5,35.56,1.6,8,256,1.6.1,978
0,Dell,3,Full HD,1,1,3,39.624,2.0,4,256,2.2,634
1,Dell,3,Full HD,1,1,7,39.624,2.7,8,256,2.2,946
2,Dell,4,IPS Panel,2,1,5,33.782,1.6,8,128,1.22,1244
3,HP,4,Full HD,2,1,7,39.624,1.8,8,256,1.91,837
4,Dell,3,Full HD,1,1,5,39.624,1.6,8,256,2.2,1016


### **Tarea n.° 1**
Cargar el conjunto de datos en un DataFrame de pandas llamado **'df'**.  
Imprimir las primeras 5 entradas del conjunto de datos para confirmar que se ha cargado correctamente.



In [8]:
# Escribe el código a continuación y presiona Shift+Enter para ejecutarlo.

<details><summary>Clic aqui para ver la solucion</summary>

```python
# Cargar el conjunto de datos en un DataFrame de pandas llamado 'df'
df = pd.read_csv(url)  # Carga el archivo CSV sin usar una fila de encabezado

# Imprimir las primeras 5 filas del DataFrame para confirmar que el archivo se ha cargado correctamente
print(df.head())  # Muestra las primeras 5 filas del DataFrame
```
</details>

### **Tarea n.° 2**  
Agregar los encabezados al DataFrame.  
Los encabezados para el conjunto de datos, en orden, son:  
**"Fabricante", "Categoría", "Pantalla", "GPU", "SO", "Núcleo_CPU", "Tamaño_Pantalla_pulgadas", "Frecuencia_CPU", "RAM_GB", "Almacenamiento_GB_SSD", "Peso_kg", "Precio".**  

Confirma la inserción de los encabezados imprimiendo las primeras 10 filas del conjunto de datos.

In [11]:
# Escribe el código a continuación y presiona Shift+Enter para ejecutarlo.


<details><summary>Clic aqui para ver la solucion</summary>

```python
# Agregar los encabezados al DataFrame
encabezados = [
    "Fabricante", "Categoría", "Pantalla", "GPU", "SO", "Núcleo_CPU",
    "Tamaño_Pantalla_pulgadas", "Frecuencia_CPU", "RAM_GB", "Almacenamiento_GB_SSD",
    "Peso_kg", "Precio"
]

df.columns = encabezados  # Asigna los encabezados al DataFrame

# Imprimir las primeras 10 filas del DataFrame para confirmar que los encabezados fueron insertados correctamente
print(df.head(10))  # Muestra las primeras 10 filas del DataFrame
```
</details>

### **Tarea n.° 3**  
Reemplazar los valores `'?'` con `NaN`.  
Reemplaza las entradas que contienen `'?'` en el conjunto de datos con el valor `NaN`, que proviene del paquete **Numpy**.

In [18]:
# Escribe el código a continuación y presiona Shift+Enter para ejecutarlo.


<details><summary>Clic aqui para ver la solucion</summary>

```python
# Reemplazar los valores '?' con NaN en el DataFrame
df.replace('?', np.nan, inplace=True)  # Reemplaza los valores '?' con NaN

# Imprimir las primeras 5 filas del DataFrame para confirmar la operación
print(df.head())  # Muestra las primeras 5 filas del DataFrame después del reemplazo
```
</details>

### **Tarea n.° 4**  
Imprimir los tipos de datos de las columnas del DataFrame.  
Toma nota de los tipos de datos de las diferentes columnas del conjunto de datos.


In [19]:
# Escribe el código a continuación y presiona Shift+Enter para ejecutarlo.



Acer          object
4              int64
IPS Panel     object
2              int64
1              int64
5              int64
35.56         object
1.6          float64
8              int64
256            int64
1.6.1         object
978            int64
dtype: object


<details><summary>Clic aqui para ver la solucion</summary>

```python
# Imprimir los tipos de datos de las columnas del DataFrame
print(df.dtypes)  # Muestra los tipos de datos de cada columna del DataFrame
```
</details>

### **Tarea n.° 5**  
Imprimir la descripción estadística del conjunto de datos, incluyendo la de los tipos de datos 'objeto'.


In [21]:
# Escribe el código a continuación y presiona Shift+Enter para ejecutarlo.


<details><summary>Clic aqui para ver la solucion</summary>

```python
# Imprimir la descripción estadística del DataFrame, incluyendo los tipos de datos 'objeto'
print(df.describe(include='all'))  # Muestra la descripción estadística para todos los tipos de datos
```
</details>

### **Tarea n.° 6**  
Imprimir la información general del conjunto de datos.


In [23]:
# Escribe el código a continuación y presiona Shift+Enter para ejecutarlo.


<details><summary>Clic aqui para ver la solucion</summary>

```python
# Imprimir la información general del DataFrame
print(df.info())  # Muestra un resumen de la información del DataFrame, incluyendo tipos de datos y valores no nulos
```
</details>

**¡Felicidades!** 🎉

Ha completado la practica con éxito.







"*La educación es el arma más poderosa que puedes usar para cambiar el mundo*" - **Nelson Mandela** 🚀😊