# Cargar Datos desde Múltiples Fuentes y Visualización con Matplotlib
Este notebook muestra cómo cargar datos desde CSV, Excel, JSON y SQL con pandas, y cómo visualizarlos con matplotlib. Incluye comentarios detallados y explicaciones de las gráficas.

In [1]:
# Importamos las bibliotecas necesarias
import pandas as pd
import sqlite3
from io import StringIO
import matplotlib.pyplot as plt

## Cargar datos desde CSV simulado

In [2]:
csv_data = '''nombre,edad,ciudad
Ana,23,Loja
Luis,35,Quito
Carla,29,Guayaquil'''

df_csv = pd.read_csv(StringIO(csv_data))
df_csv

Unnamed: 0,nombre,edad,ciudad
0,Ana,23,Loja
1,Luis,35,Quito
2,Carla,29,Guayaquil


## Cargar datos desde un archivo Excel

In [3]:
df_csv.to_excel("datos_excel.xls", index=False)
df_xls = pd.read_excel("datos_excel.xls")
df_xls

ValueError: No engine for filetype: 'xls'

## Cargar datos desde un archivo JSON

In [None]:
json_data = '''[
  {"nombre": "Mario", "edad": 40, "ciudad": "Cuenca"},
  {"nombre": "Lucía", "edad": 28, "ciudad": "Ambato"}
]'''

df_json = pd.read_json(StringIO(json_data))
df_json

## Cargar datos desde una base de datos SQLite

In [None]:
conn = sqlite3.connect(":memory:")
df_csv.to_sql("clientes", conn, index=False, if_exists="replace")
df_sql = pd.read_sql("SELECT * FROM clientes", conn)
df_sql

## Análisis y visualización de los datos combinados

In [None]:
df_todos = pd.concat([df_csv, df_xls, df_json, df_sql], ignore_index=True)
df_todos.head()

In [None]:
plt.figure(figsize=(8, 5))
plt.hist(df_todos['edad'], bins=5, color='skyblue', edgecolor='black')
plt.title('Distribución de edades', fontsize=14)
plt.xlabel('Edad')
plt.ylabel('Número de personas')
plt.grid(True)
plt.tight_layout()
plt.show()

In [None]:
conteo_ciudades = df_todos['ciudad'].value_counts()
plt.figure(figsize=(8, 5))
conteo_ciudades.plot(kind='bar', color='lightgreen', edgecolor='black')
plt.title('Número de personas por ciudad', fontsize=14)
plt.xlabel('Ciudad')
plt.ylabel('Cantidad')
plt.xticks(rotation=45)
plt.grid(axis='y')
plt.tight_layout()
plt.show()

In [None]:
promedio_edades = df_todos.groupby('ciudad')['edad'].mean()
plt.figure(figsize=(8, 5))
promedio_edades.plot(kind='bar', color='salmon', edgecolor='black')
plt.title('Edad promedio por ciudad', fontsize=14)
plt.xlabel('Ciudad')
plt.ylabel('Edad promedio')
plt.xticks(rotation=45)
plt.grid(axis='y')
plt.tight_layout()
plt.show()