### Ejercicio 1 

PASO 1: Importacion de base de datos y conexion

In [22]:
import pandas as pd
import numpy as np
from sqlalchemy import create_engine

# Configuraci√≥n de la conexi√≥n a MySQL
usuario = 'root'  # Reemplaza con tu usuario
contrase√±a = '12345'  # Reemplaza con tu contrase√±a
host = 'localhost:3306'  # O la direcci√≥n de tu servidor MySQL
base_de_datos = 'world'  # Reemplaza con el nombre de tu base de datos

# Crear la cadena de conexi√≥n
cadena_conexion = f'mysql+pymysql://{usuario}:{contrase√±a}@{host}/{base_de_datos}'

# Crear el motor de conexi√≥n
motor = create_engine(cadena_conexion)

# Consulta SQL para obtener los datos
consulta = "SELECT * FROM country"  # Reemplaza con tu tabla real

# Cargar datos en un DataFrame
df = pd.read_sql(consulta, motor)

# Mostrar las primeras filas
df.head()

Unnamed: 0,Code,Name,Continent,Region,SurfaceArea,IndepYear,Population,LifeExpectancy,GNP,GNPOld,LocalName,GovernmentForm,HeadOfState,Capital,Code2
0,ABW,Aruba,North America,Caribbean,193.0,,103000,78.4,828.0,793.0,Aruba,Nonmetropolitan Territory of The Netherlands,Beatrix,129.0,AW
1,AFG,Afghanistan,Asia,Southern and Central Asia,652090.0,1919.0,22720000,45.9,5976.0,,Afganistan/Afqanestan,Islamic Emirate,Mohammad Omar,1.0,AF
2,AGO,Angola,Africa,Central Africa,1246700.0,1975.0,12878000,38.3,6648.0,7984.0,Angola,Republic,Jos√© Eduardo dos Santos,56.0,AO
3,AIA,Anguilla,North America,Caribbean,96.0,,8000,76.1,63.2,,Anguilla,Dependent Territory of the UK,Elisabeth II,62.0,AI
4,ALB,Albania,Europe,Southern Europe,28748.0,1912.0,3401200,71.6,3205.0,2500.0,Shqip√´ria,Republic,Rexhep Mejdani,34.0,AL


### 1.1 Comprovacion de datos 

In [27]:
# 1. An√°lisis inicial de valores nulos
print("=== Valores nulos por columna ===")
print(df.isnull().sum())

# 2. Porcentaje de valores nulos por columna
print("\n=== Porcentaje de valores nulos ===")
print((df.isnull().sum() / len(df)) * 100)

# 3. Verificaci√≥n de duplicados completos
print("\n=== Filas duplicadas exactas ===")
print("N√∫mero de duplicados exactos:", df.duplicated().sum())

# 4. Verificaci√≥n de duplicados en columnas clave (Code y Name)
print("\n=== Duplicados en columnas clave ===")
print("Pa√≠ses con mismo Code:", df.duplicated(subset=['Code']).sum())
print("Pa√≠ses con mismo Name:", df.duplicated(subset=['Name']).sum())

# 5. Mostrar algunas filas con valores nulos para inspecci√≥n
print("\n=== Ejemplo de filas con valores nulos ===")
print(df[df.isnull().any(axis=1)].head())

=== Valores nulos por columna ===
Code               0
Name               0
Continent          0
Region             0
SurfaceArea        0
IndepYear         47
Population         0
LifeExpectancy    17
GNP                0
GNPOld            61
LocalName          0
GovernmentForm     0
HeadOfState        1
Capital            7
Code2              0
dtype: int64

=== Porcentaje de valores nulos ===
Code               0.000000
Name               0.000000
Continent          0.000000
Region             0.000000
SurfaceArea        0.000000
IndepYear         19.665272
Population         0.000000
LifeExpectancy     7.112971
GNP                0.000000
GNPOld            25.523013
LocalName          0.000000
GovernmentForm     0.000000
HeadOfState        0.418410
Capital            2.928870
Code2              0.000000
dtype: float64

=== Filas duplicadas exactas ===
N√∫mero de duplicados exactos: 0

=== Duplicados en columnas clave ===
Pa√≠ses con mismo Code: 0
Pa√≠ses con mismo Name: 0

=== Ejem

### Limpieza de datos

In [28]:
import pandas as pd
from sqlalchemy import create_engine

# Configuraci√≥n de la conexi√≥n a MySQL
usuario = 'root'  # Reemplaza con tu usuario
contrase√±a = '12345'  # Reemplaza con tu contrase√±a
host = 'localhost:3306'  # O la direcci√≥n de tu servidor MySQL
base_de_datos = 'world'  # Reemplaza con el nombre de tu base de datos

# 2. Crear la conexi√≥n (esto debe ejecutarse siempre primero)
engine = create_engine(f'mysql+pymysql://{usuario}:{contrase√±a}@{host}/{base_de_datos}')

# 3. Cargar datos
df = pd.read_sql('SELECT * FROM country', engine)

# 4. Limpieza b√°sica
df_limpio = df.dropna()

# 5. Verificaci√≥n
print(f"Filas originales: {len(df)}")
print(f"Filas limpias: {len(df_limpio)}")

# 6. Exportar a NUEVA tabla (se crear√° autom√°ticamente)
try:
    df_limpio.to_sql('country_sin_nulos', engine, if_exists='replace', index=False)
    print("Tabla 'country_sin_nulos' creada exitosamente en MySQL!")
except Exception as e:
    print(f"Error al exportar: {e}")

Filas originales: 239
Filas limpias: 167
Tabla 'country_sin_nulos' creada exitosamente en MySQL!


### Ejercicio 2

In [60]:
# Importaci√≥n de librer√≠as
import requests
import pandas as pd
from sqlalchemy import create_engine

print("‚úÖ Librer√≠as importadas correctamente")

‚úÖ Librer√≠as importadas correctamente


### 1. Configuracion de conexion de bases de datos

In [61]:
# Configuraci√≥n de la base de datos
config_mysql = {
    'usuario': 'root',        # Cambiar por tu usuario
    'contrase√±a': '12345',    # Cambiar por tu contrase√±a
    'host': 'localhost',      # Servidor de la base de datos
    'puerto': '3306',         # Puerto de MySQL
    'base_de_datos': 'world'  # Nombre de la base de datos
}

# Crear cadena de conexi√≥n
cadena_conexion = f"mysql+pymysql://{config_mysql['usuario']}:{config_mysql['contrase√±a']}@{config_mysql['host']}:{config_mysql['puerto']}/{config_mysql['base_de_datos']}"

print("‚öôÔ∏è Configuraci√≥n de MySQL completada")
print(f"Cadena de conexi√≥n: {cadena_conexion[:20]}...") 

‚öôÔ∏è Configuraci√≥n de MySQL completada
Cadena de conexi√≥n: mysql+pymysql://root...


### 2. Obtencion de datos de la api

In [62]:
# Funci√≥n para obtener datos de pa√≠ses
def obtener_datos_paises():
    url = "https://countriesnow.space/api/v0.1/countries"
    try:
        print("üåç Conectando a la API de pa√≠ses...")
        respuesta = requests.get(url)
        respuesta.raise_for_status()  # Verificar errores HTTP
        print("‚úÖ Datos obtenidos correctamente de la API")
        return respuesta.json().get('data', [])
    except Exception as e:
        print(f"‚ùå Error al obtener datos: {e}")
        return None

# Ejecutar la funci√≥n
datos_paises = obtener_datos_paises()

# Mostrar cantidad de pa√≠ses obtenidos
if datos_paises:
    print(f"üìä Total de pa√≠ses recibidos: {len(datos_paises)}")
    print("\nEjemplo del primer pa√≠s:")
    print({k: datos_paises[0][k] for k in list(datos_paises[0].keys())[:3]})

üåç Conectando a la API de pa√≠ses...
‚úÖ Datos obtenidos correctamente de la API
üìä Total de pa√≠ses recibidos: 227

Ejemplo del primer pa√≠s:
{'iso2': 'AF', 'iso3': 'AFG', 'country': 'Afghanistan'}


### 3. Limpieza de datos

In [63]:
if datos_paises:
    # Procesamiento de TODOS los datos (eliminamos el [:5])
    print("\nüßπ Iniciando limpieza de datos para TODOS los pa√≠ses...")
    
    datos_procesados = []
    for pais in datos_paises:
        datos = {
            'nombre': pais.get('country', 'Desconocido'),
            'capital': pais.get('capital', 'Desconocido'),
            'iso2': pais.get('iso2', None),
            'iso3': pais.get('iso3', None),
            'poblacion': pais.get('population', 0),
            'continente': pais.get('continent', 'Desconocido')
        }
        datos_procesados.append(datos)
    
    # Convertir a DataFrame
    df = pd.DataFrame(datos_procesados)
    
    # Eliminar filas con valores nulos en campos clave
    df_limpio = df.dropna(subset=['nombre', 'capital', 'continente'])
    
    print("\nüîç Muestra de datos limpios (de todos los pa√≠ses):")
    display(df_limpio.head())
    print(f"\nüìù Total de pa√≠ses despu√©s de limpieza: {len(df_limpio)}")
else:
    print("No hay datos para limpiar")


üßπ Iniciando limpieza de datos para TODOS los pa√≠ses...

üîç Muestra de datos limpios (de todos los pa√≠ses):


Unnamed: 0,nombre,capital,iso2,iso3,poblacion,continente
0,Afghanistan,Desconocido,AF,AFG,0,Desconocido
1,Albania,Desconocido,AL,ALB,0,Desconocido
2,Algeria,Desconocido,DZ,DZA,0,Desconocido
3,Andorra,Desconocido,AD,AND,0,Desconocido
4,Angola,Desconocido,AO,AGO,0,Desconocido



üìù Total de pa√≠ses despu√©s de limpieza: 227


### 4.Transformacion de datos 

In [64]:
if 'df_limpio' in locals() and not df_limpio.empty:
    print("\nüîÑ Iniciando transformaci√≥n de datos...")
    
    # Clasificaci√≥n por poblaci√≥n
    bins = [0, 1000000, 10000000, 50000000, 100000000, float('inf')]
    labels = ['Muy peque√±a', 'Peque√±a', 'Mediana', 'Grande', 'Muy grande']
    
    df_limpio['tamano_poblacion'] = pd.cut(
        df_limpio['poblacion'],
        bins=bins,
        labels=labels
    )
    
    print("\nüìä Distribuci√≥n por tama√±o de poblaci√≥n:")
    print(df_limpio['tamano_poblacion'].value_counts())
    
    print("\nüîç Muestra de datos transformados:")
    display(df_limpio.head())
else:
    print("No hay datos para transformar")


üîÑ Iniciando transformaci√≥n de datos...

üìä Distribuci√≥n por tama√±o de poblaci√≥n:
tamano_poblacion
Muy peque√±a    0
Peque√±a        0
Mediana        0
Grande         0
Muy grande     0
Name: count, dtype: int64

üîç Muestra de datos transformados:


Unnamed: 0,nombre,capital,iso2,iso3,poblacion,continente,tamano_poblacion
0,Afghanistan,Desconocido,AF,AFG,0,Desconocido,
1,Albania,Desconocido,AL,ALB,0,Desconocido,
2,Algeria,Desconocido,DZ,DZA,0,Desconocido,
3,Andorra,Desconocido,AD,AND,0,Desconocido,
4,Angola,Desconocido,AO,AGO,0,Desconocido,


### 5. Exportacion de datos 

In [58]:
if 'df_limpio' in locals() and not df_limpio.empty:
    try:
        print("\nüíæ Conectando a MySQL para exportar datos...")
        engine = create_engine(cadena_conexion)
        
        # Verificar conexi√≥n
        with engine.connect() as conn:
            print("‚úÖ Conexi√≥n a MySQL exitosa")
        
        # Exportar datos
        df_limpio.to_sql(
            name='paises_api_limpios',
            con=engine,
            if_exists='replace',
            index=False
        )
        
        print(f"üíæ Datos exportados correctamente a la tabla 'paises_api_limpios'")
        print(f"üìå Total de registros exportados: {len(df_limpio)}")
        
    except Exception as e:
        print(f"‚ùå Error al exportar a MySQL: {e}")
else:
    print("No hay datos para exportar")


üíæ Conectando a MySQL para exportar datos...
‚úÖ Conexi√≥n a MySQL exitosa
üíæ Datos exportados correctamente a la tabla 'paises_api_limpios'
üìå Total de registros exportados: 227


In [41]:
import requests
import pandas as pd
from sqlalchemy import create_engine

# 1. Configuraci√≥n de la conexi√≥n a MySQL
config_mysql = {
    'usuario': 'root',        
    'contrase√±a': '12345',    
    'host': 'localhost',      
    'puerto': '3306',        
    'base_de_datos': 'world' 
}

# 2. Funci√≥n para obtener datos de la API
def obtener_datos_paises():
    url = "https://countriesnow.space/api/v0.1/countries"
    try:
        respuesta = requests.get(url)
        respuesta.raise_for_status()
        return respuesta.json().get('data', [])
    except requests.exceptions.RequestException as e:
        print(f"Error al obtener datos: {e}")
        return None

# Obtener los datos
datos_paises = obtener_datos_paises()

if datos_paises:
    # 3. Procesamiento de datos
    datos_procesados = []
    
    for pais in datos_paises:
        datos = {
            'nombre': pais.get('country', 'Desconocido'),
            'capital': pais.get('capital', 'Desconocido'),
            'iso2': pais.get('iso2', None),
            'iso3': pais.get('iso3', None),
            'poblacion': pais.get('population', 0),
            'continente': pais.get('continent', 'Desconocido')
        }
        datos_procesados.append(datos)
    
    df = pd.DataFrame(datos_procesados)
    df_limpio = df.dropna(subset=['nombre', 'capital', 'continente'])
    
    # 4. Conexi√≥n a MySQL 
    try:
        # Crear cadena de conexi√≥n 
        cadena_conexion = f"mysql+pymysql://{config_mysql['usuario']}:{config_mysql['contrase√±a']}@{config_mysql['host']}:{config_mysql['puerto']}/{config_mysql['base_de_datos']}"
        
        engine = create_engine(cadena_conexion)
        
        with engine.connect() as conn:
            print("¬°Conexi√≥n a MySQL exitosa!")
        
        # 5. Exportar datos
        df_limpio.to_sql(
            'paises_api_alternativa', 
            engine, 
            if_exists='replace', 
            index=False
        )
        
        print("\n¬°Datos exportados correctamente a MySQL!")
        print(f"Tabla 'paises_api_alternativa' creada en la base de datos '{config_mysql['base_de_datos']}'")
        print(f"Total de pa√≠ses exportados: {len(df_limpio)}")
        
    except Exception as e:
        print(f"\nError al conectar/exportar a MySQL: {e}")
        print("Verifica lo siguiente:")
        print(f"- Usuario: {config_mysql['usuario']}")
        print(f"- Contrase√±a: {'*' * len(config_mysql['contrase√±a'])}")
        print(f"- Host: {config_mysql['host']}")
        print(f"- Puerto: {config_mysql['puerto']}")
        print(f"- Base de datos: {config_mysql['base_de_datos']}")
        print("\n¬øEst√° corriendo el servidor MySQL? ¬øTienes los privilegios adecuados?")
else:
    print("No se pudieron obtener datos de la API para procesar")

¬°Conexi√≥n a MySQL exitosa!

¬°Datos exportados correctamente a MySQL!
Tabla 'paises_api_alternativa' creada en la base de datos 'world'
Total de pa√≠ses exportados: 227
