# Análisis de Datos con Pandas y JSON

### Instrucciones

1. **Preparación del Entorno**
- Asegúrate de tener instalado Pandas en tu entorno de trabajo.
- Instala la biblioteca requests para realizar solicitudes HTTP.
2. **Obtener los Datos**
- Realiza una solicitud HTTP a la API de OpenWeatherMap para obtener datos de clima en formato JSON.
- Carga los datos en un DataFrame de Pandas.
- Muestra las primeras 10 filas del DataFrame para confirmar que los datos se han cargado correctamente.
3. **Exploración Inicial de los Datos**
- Muestra las últimas 5 filas del DataFrame.
- Utiliza el método info() para obtener información general sobre el DataFrame, incluyendo el número de entradas, nombres de las columnas, tipos de datos y memoria utilizada.
- Genera estadísticas descriptivas del DataFrame utilizando el método describe().
4. **Inspección de los Datos**
- Inspecciona los tipos de datos de cada columna utilizando el atributo dtypes.
- Cuenta los valores únicos en la columna weather utilizando el método value_counts().
- Muestra todos los valores únicos en la columna city utilizando el método unique().
5. **Filtrado de Datos**
- Filtra el DataFrame para mostrar solo las filas donde la temperatura (temp) sea mayor a 20 grados Celsius.
- Filtra el DataFrame para mostrar solo las filas donde la humedad (humidity) sea menor a 50%.
- Utilizando el método query(), filtra el DataFrame para mostrar las filas donde la ciudad sea London y la temperatura sea menor a 15 grados Celsius.
6. **Slicing de Datos**
- Selecciona y muestra solo las columnas city y temp del DataFrame.
- Utilizando loc[], selecciona y muestra las filas de la 5 a la 10 (inclusive) y las columnas city y weather.
- Utilizando iloc[], selecciona y muestra las primeras 5 filas y las primeras 3 columnas del DataFrame.


In [2]:
import pandas as pd
import requests as r

In [9]:
import pandas as pd
import requests

# Función para obtener datos de clima desde la API de OpenWeatherMap
def fetch_weather_data(api_key, city_name):
    """
    Realiza una solicitud a la API de OpenWeatherMap para obtener datos de clima de una ciudad específica.
    
    Parámetros:
    - api_key: str, clave de API de OpenWeatherMap
    - city_name: str, nombre de la ciudad
    
    Retorna:
    - dict, datos JSON de la API si la solicitud es exitosa
    """
    url = f"http://api.openweathermap.org/data/2.5/weather?q={city_name}&appid={api_key}&units=metric"
    try:
        response = requests.get(url)
        response.raise_for_status()  # Verifica si hay errores en la solicitud
        return response.json()
    except requests.exceptions.RequestException as e:
        print(f"Error en la solicitud: {e}")
        return None

# Parámetros de la API
api_key = 'aed55495265f763ee97da745cfd4992a'  # Reemplaza con tu clave de API de OpenWeatherMap
city_name = 'Asuncion'  # Cambia esto para consultar otra ciudad

# Obtener los datos de clima de la API
data = fetch_weather_data(api_key, city_name)

# Convertir los datos JSON a un DataFrame de Pandas, si la solicitud fue exitosa
if data:
    df = pd.json_normalize(data)

    # Paso 1: Exploración Inicial de los Datos
    print("Primeras 10 filas del DataFrame:")
    print(df.head(10))

    print("\nÚltimas 5 filas del DataFrame:")
    print(df.tail(5))

    print("\nInformación del DataFrame:")
    df.info()

    print("\nEstadísticas descriptivas del DataFrame:")
    print(df.describe())

    # Paso 2: Inspección de los Datos
    print("\nTipos de datos de las columnas:")
    print(df.dtypes)

    # Obtener valores de clima en la columna 'weather'
    if 'weather' in df.columns and df['weather'].notnull().any():
        weather_main = df['weather'][0][0].get('main') if df['weather'][0] else "No data"
        print(f"\nTipo de clima (weather.main): {weather_main}")
    else:
        print("\nLa columna 'weather' no contiene datos válidos.")

    print("\nValores únicos en la columna 'name' (nombre de la ciudad):")
    print(df['name'].unique())

    # Paso 3: Filtrado de Datos
    # Convertir las columnas relevantes a tipo float si es necesario
    df['main.temp'] = df['main.temp'].astype(float)
    df['main.humidity'] = df['main.humidity'].astype(float)

    # Filtrar por temperatura > 20 °C
    temp_mayor_20 = df[df['main.temp'] > 20]
    print("\nFilas donde la temperatura es mayor a 20 grados Celsius:")
    print(temp_mayor_20)

    # Filtrar por humedad < 50%
    humedad_menor_50 = df[df['main.humidity'] < 50]
    print("\nFilas donde la humedad es menor a 50%:")
    print(humedad_menor_50)

    # Paso 4: Slicing de Datos
    # Seleccionar solo las columnas 'name' y 'main.temp'
    city_temp = df[['name', 'main.temp']]
    print("\nColumnas 'city' y 'temp':")
    print(city_temp)

    # Usar loc para seleccionar filas y columnas específicas
    loc_result = df.loc[0:5, ['name', 'weather']]
    print("\nFilas 5 a 10 y columnas 'name' y 'weather' usando loc:")
    print(loc_result)

    # Usar iloc para seleccionar filas y columnas por índice
    iloc_result = df.iloc[0:5, 0:3]
    print("\nPrimeras 5 filas y primeras 3 columnas usando iloc:")
    print(iloc_result)
else:
    print("No se pudieron obtener datos de la API.")

Primeras 10 filas del DataFrame:
                                             weather      base  visibility  \
0  [{'id': 701, 'main': 'Mist', 'description': 'm...  stations        5000   

           dt  timezone       id      name  cod  coord.lon  coord.lat  ...  \
0  1728595926    -10800  3439389  Asunción  200   -57.6359   -25.3007  ...   

   main.grnd_level  wind.speed  wind.deg  wind.gust  clouds.all  sys.type  \
0              999        2.68       194       4.02         100         2   

    sys.id  sys.country  sys.sunrise  sys.sunset  
0  2091488           PY   1728552030  1728597241  

[1 rows x 27 columns]

Últimas 5 filas del DataFrame:
                                             weather      base  visibility  \
0  [{'id': 701, 'main': 'Mist', 'description': 'm...  stations        5000   

           dt  timezone       id      name  cod  coord.lon  coord.lat  ...  \
0  1728595926    -10800  3439389  Asunción  200   -57.6359   -25.3007  ...   

   main.grnd_level  wind.sp

In [10]:
import pandas as pd
import requests

# Función para obtener datos de clima desde la API de OpenWeatherMap
def fetch_weather_data(api_key, city_name):
    """
    Realiza una solicitud a la API de OpenWeatherMap para obtener datos de clima de una ciudad específica.
    
    Parámetros:
    - api_key: str, clave de API de OpenWeatherMap
    - city_name: str, nombre de la ciudad
    
    Retorna:
    - dict, datos JSON de la API si la solicitud es exitosa
    """
    url = f"http://api.openweathermap.org/data/2.5/weather?q={city_name}&appid={api_key}&units=metric"
    try:
        response = requests.get(url)
        response.raise_for_status()
        return response.json()
    except requests.exceptions.RequestException as e:
        print(f"Error en la solicitud: {e}")
        return None

# Parámetros de la API
api_key = 'aed55495265f763ee97da745cfd4992a'  # Reemplaza con tu clave de API de OpenWeatherMap
city_name = 'Asuncion'  # Cambia esto para consultar otra ciudad

# Obtener los datos de clima de la API
data = fetch_weather_data(api_key, city_name)

# Convertir los datos JSON a un DataFrame de Pandas, si la solicitud fue exitosa
if data:
    df = pd.json_normalize(data)

    # Separador y título de la salida
    print("\n========== Exploración Inicial del DataFrame ==========")
    print("Primeras 10 filas:")
    print(df.head(10))
    print("\nÚltimas 5 filas:")
    print(df.tail(5))

    print("\n========== Información del DataFrame ==========")
    df.info()

    print("\n========== Estadísticas Descriptivas ==========")
    print(df.describe())

    # Inspección de tipos de datos
    print("\n========== Tipos de Datos en el DataFrame ==========")
    print(df.dtypes)

    # Obtener valores de clima en la columna 'weather'
    print("\n========== Información de Clima ==========")
    if 'weather' in df.columns and df['weather'].notnull().any():
        weather_main = df['weather'][0][0].get('main') if df['weather'][0] else "No data"
        print(f"Condición Climática Principal: {weather_main}")
    else:
        print("La columna 'weather' no contiene datos válidos.")

    # Mostrar el nombre de la ciudad
    print("\n========== Ciudad en los Datos ==========")
    print(f"Ciudad: {df['name'].unique()[0]}")

    # Filtrado de Datos
    print("\n========== Filtrado de Datos ==========")
    df['main.temp'] = df['main.temp'].astype(float)
    df['main.humidity'] = df['main.humidity'].astype(float)

    # Filtrar por temperatura > 20 °C
    print("\nFilas donde la temperatura es mayor a 20 grados Celsius:")
    temp_mayor_20 = df[df['main.temp'] > 20]
    print(temp_mayor_20[['name', 'main.temp']])

    # Filtrar por humedad < 50%
    print("\nFilas donde la humedad es menor a 50%:")
    humedad_menor_50 = df[df['main.humidity'] < 50]
    print(humedad_menor_50[['name', 'main.humidity']])

    # Slicing de Datos
    print("\n========== Slicing de Datos ==========")
    city_temp = df[['name', 'main.temp']]
    print("\nColumnas 'city' y 'temp':")
    print(city_temp)

    # Usar loc para seleccionar filas y columnas específicas
    loc_result = df.loc[0:5, ['name', 'weather']]
    print("\nFilas 5 a 10 y columnas 'name' y 'weather' usando loc:")
    print(loc_result)

    # Usar iloc para seleccionar filas y columnas por índice
    iloc_result = df.iloc[0:5, 0:3]
    print("\nPrimeras 5 filas y primeras 3 columnas usando iloc:")
    print(iloc_result)
else:
    print("No se pudieron obtener datos de la API.")


Primeras 10 filas:
                                             weather      base  visibility  \
0  [{'id': 701, 'main': 'Mist', 'description': 'm...  stations        5000   

           dt  timezone       id      name  cod  coord.lon  coord.lat  ...  \
0  1728595926    -10800  3439389  Asunción  200   -57.6359   -25.3007  ...   

   main.grnd_level  wind.speed  wind.deg  wind.gust  clouds.all  sys.type  \
0              999        2.68       194       4.02         100         2   

    sys.id  sys.country  sys.sunrise  sys.sunset  
0  2091488           PY   1728552030  1728597241  

[1 rows x 27 columns]

Últimas 5 filas:
                                             weather      base  visibility  \
0  [{'id': 701, 'main': 'Mist', 'description': 'm...  stations        5000   

           dt  timezone       id      name  cod  coord.lon  coord.lat  ...  \
0  1728595926    -10800  3439389  Asunción  200   -57.6359   -25.3007  ...   

   main.grnd_level  wind.speed  wind.deg  wind.gust  c

In [13]:
import requests
import pandas as pd
import json

# 🔑 Tu API Key de OpenWeatherMap (reemplaza con la tuya)
api_key = "aed55495265f763ee97da745cfd4992a"
city_name = "Asunción"  # Cambia el nombre de la ciudad aquí

# 🔗 URL de la API
url = f"http://api.openweathermap.org/data/2.5/weather?q={city_name}&appid={api_key}&units=metric"

# 📥 Función para consumir los datos de la API
def fetch_data_from_api(url):
    """
    Realiza una solicitud a la API y retorna los datos en formato JSON.
    """
    try:
        response = requests.get(url)
        response.raise_for_status()
        return response.json()
    except requests.exceptions.RequestException as e:
        print(f"Error en la solicitud: {e}")
        return None

# 📄 Claves principales en los datos JSON (para exploración inicial)
def show_json_keys(data):
    """
    Muestra las claves principales en los datos JSON obtenidos.
    """
    print("Claves principales en los datos JSON:")
    print(data.keys(), "\n")

# 🧹 Función para preparar y limpiar los datos
def prepare_weather_data(json_data):
    """
    Convierte los datos JSON en un DataFrame limpio.
    """
    # Seleccionamos solo los datos relevantes
    main_data = {
        "temperature": json_data['main']['temp'],
        "feels_like": json_data['main']['feels_like'],
        "temp_min": json_data['main']['temp_min'],
        "temp_max": json_data['main']['temp_max'],
        "pressure": json_data['main']['pressure'],
        "humidity": json_data['main']['humidity'],
        "wind_speed": json_data['wind']['speed'],
        "wind_deg": json_data['wind']['deg'],
        "weather_main": json_data['weather'][0]['main'],
        "weather_description": json_data['weather'][0]['description']
    }
    return pd.DataFrame([main_data])

# 📊 Exploración de los datos en el DataFrame
def explore_dataframe(df, city_name):
    """
    Muestra una vista previa y estadísticas básicas del DataFrame.
    """
    print(f"Datos del clima actual en {city_name}:\n")
    display(df.head())  # Muestra el DataFrame en formato bonito si estás en Jupyter
    print("\nResumen de estadísticas:")
    print(df.describe())
    print("\nTipos de datos:")
    print(df.dtypes)

# Ejecutar todo el flujo
# 1️⃣ Obtener los datos de la API
json_data = fetch_data_from_api(url)

if json_data:
    # 2️⃣ Mostrar las claves principales
    show_json_keys(json_data)

    # 3️⃣ Preparar y limpiar los datos
    df = prepare_weather_data(json_data)

    # 4️⃣ Explorar el DataFrame
    explore_dataframe(df, city_name)
else:
    print("No se pudieron obtener datos de la API.")


Claves principales en los datos JSON:
dict_keys(['coord', 'weather', 'base', 'main', 'visibility', 'wind', 'clouds', 'dt', 'sys', 'timezone', 'id', 'name', 'cod']) 

Datos del clima actual en Asunción:



Unnamed: 0,temperature,feels_like,temp_min,temp_max,pressure,humidity,wind_speed,wind_deg,weather_main,weather_description
0,18.48,18.97,18.47,18.83,1009,99,2.06,210,Clouds,overcast clouds



Resumen de estadísticas:
       temperature  feels_like  temp_min  temp_max  pressure  humidity  \
count         1.00        1.00      1.00      1.00       1.0       1.0   
mean         18.48       18.97     18.47     18.83    1009.0      99.0   
std            NaN         NaN       NaN       NaN       NaN       NaN   
min          18.48       18.97     18.47     18.83    1009.0      99.0   
25%          18.48       18.97     18.47     18.83    1009.0      99.0   
50%          18.48       18.97     18.47     18.83    1009.0      99.0   
75%          18.48       18.97     18.47     18.83    1009.0      99.0   
max          18.48       18.97     18.47     18.83    1009.0      99.0   

       wind_speed  wind_deg  
count        1.00       1.0  
mean         2.06     210.0  
std           NaN       NaN  
min          2.06     210.0  
25%          2.06     210.0  
50%          2.06     210.0  
75%          2.06     210.0  
max          2.06     210.0  

Tipos de datos:
temperature         