##Ejercicio 1: Análisis de Datos de Transacciones Financieras
Descripción:

Tienes un conjunto de datos de transacciones financieras que incluye información sobre el usuario, la cantidad, la fecha, el tipo de transacción (depósito o retiro) y el saldo final.

Tareas:

Cargar el conjunto de datos en un DataFrame de Pandas.

Convertir la columna de fecha a un objeto datetime.

Cree una nueva columna que calcule el saldo diario.

Agrupar los datos por usuario y calcular el saldo promedio diario, la cantidad total de depósitos y retiros.

Cree un gráfico de líneas que muestre la evolución del saldo promedio diario para los 5 usuarios con más transacciones.

Cree un gráfico de barras que compare el total de depósitos y retiros para los 5 usuarios con más transacciones.

In [None]:
import pandas as pd
import seaborn as sns
import datetime

dataframe = pd.DataFrame({
    "usuario": ["Maria", "Pedro", "Juan", "José", "Lucas", "Marina"],
    "cantidad": [100, 50, 200, 50, 30, 100],
    "fecha": ["2023-10-05", "2023-10-06", "2023-10-07", "2023-10-08", "2023-10-09", "2023-10-10"],
    "tipo": ["retiro", "retiro", "retiro", "retiro", "retiro", "retiro"],
    "saldo_final": [1000, 950, 1150, 1100, 1400, 1300]
})

dataframe["fecha"] = pd.to_datetime(dataframe["fecha"], format='%Y-%m-%d')

dataframe["saldo_diario"] = dataframe["saldo_final"] - dataframe["cantidad"]

print(f"Saldo promedio diario: {dataframe['saldo_diario'].mean()} $")

cantidad_depositos = (dataframe['tipo'] == 'deposito').sum()
cantidad_retiros = (dataframe['tipo'] == 'retiro').sum()

print(f"Cantidad total de depósitos: {cantidad_depositos} y retiros: {cantidad_retiros}")

sns.lineplot(x="usuario", y="cantidad", data=dataframe)
##sns.barplot(x="usuario", y="cantidad", data=dataframe)

## Ejercicio 2: Análisis de Datos de Sensor IoT
Descripción:

Tienes un dataset de un sensor IoT que mide la temperatura, la humedad y la calidad del aire en diferentes ubicaciones cada hora.

Tareas:

Cargar el conjunto de datos en un DataFrame de Pandas.

Convertir la columna de fecha y hora a un objeto datetime.

Remuestrear los datos para obtener promedios diarios de temperatura, humedad y calidad del aire.

Cree un gráfico de líneas para cada métrica (temperatura, humedad, calidad del aire) mostrando las tendencias diarias.

Usar un gráfico de evaluación (heatmap) para mostrar las correlaciones entre las diferentes métricas.

Cree un gráfico de dispersión con regresión que muestre la relación entre la temperatura y la humedad.

In [None]:
import pandas as pd
import seaborn as sns

dataframe = pd.read_csv("ex2.csv")
dataframe["fecha"] = pd.to_datetime(dataframe["fecha"], format='%Y-%m-%d')

sns.lineplot(y="temperatura", x="fecha", data=dataframe)
sns.lineplot(y="humedad", x="fecha", data=dataframe)
sns.lineplot(y="calidad_aire", x="fecha", data=dataframe)

## Ejercicio 3: Análisis de Sentimiento de Comentarios de Clientes

### Descripción:

Tienes un conjunto de datos de comentarios de clientes sobre productos, que incluye el comentario, la calificación del producto y la fecha del comentario.

### Tareas:

Cargar el conjunto de datos en un DataFrame de Pandas.

Utilizar una biblioteca de procesamiento de lenguaje natural (NLP) para calcular el sentimiento de cada comentario (positivo, negativo, neutro).

Agrupar los datos por mes y calcular la cantidad promedio de comentarios positivos, negativos y neutros.

Cree un gráfico de líneas que muestre la tendencia mensual de cada tipo de sentimiento.

Cree un gráfico de barras que muestre la distribución de sentimientos para productos con calificación alta (4-5 estrellas) y baja (1-2 estrellas).

Crea una nube de palabras (nube de palabras) para los comentarios positivos y negativos.

In [None]:
import pandas as pd
import seaborn as sns
from textblob import TextBlob

dataframe = pd.read_csv('ex3.csv')


## Ejercicio 4: Análisis de Datos de Redes Sociales

### Descripción:

Tienes un conjunto de datos de publicaciones en redes sociales que incluye el usuario, la fecha, el texto de la publicación, el número de me gusta y compartidos.

### Tareas:

Cargar el conjunto de datos en un DataFrame de Pandas.

Convertir la columna de fecha a un objeto datetime.

Cree una nueva columna que calcule la longitud del texto de la publicación.

Agrupar los datos por usuario y calcular el promedio de me gusta, compartidos y longitud del texto de la publicación.

Cree un gráfico de dispersión que muestre la relación entre la longitud del texto y el número de me gusta.

Crea un gráfico de barras que muestre el promedio de me gusta y compartidos por usuario para los 10 usuarios más activos.

Usar un gráfico de violín para mostrar la distribución del número de me gusta por la longitud del texto de la publicación.

In [None]:
import pandas as pd
import seaborn as sns

df = pd.read_csv('ex4.csv')

df['fecha'] = pd.to_datetime(df['fecha'])



<class 'pandas.core.series.Series'>


#Ejercicio 5: Análisis de Datos de Comercio Electrónico

##Descripción:

Tienes un conjunto de datos de un sitio web de comercio electrónico que incluye información sobre productos, usuarios, transacciones y reseñas.

##Tareas:

* Cargar los datasets de productos, usuarios, transacciones y reseñas en DataFrames de Pandas.

* Unir los conjuntos de datos relevantes para crear una vista completa de las transacciones, incluyendo información del producto, usuario y reseña.

* Calcular la tasa de conversión (proporción de visitas que resultan en compras) por categoría de producto.

* Cree un gráfico de barras que muestre la tasa de conversión por categoría de producto.

* Calcular la calificación promedio de los productos y la distribución de calificaciones.

* Cree un gráfico de líneas que muestre la tendencia de las ventas mensuales.

* Cree un gráfico de cajas para comparar la distribución de precios de productos entre las diferentes categorías.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# Datos ficticios
productos_data = {
    'producto_id': [1, 2, 3, 4, 5],
    'nombre': ['Producto A', 'Producto B', 'Producto C', 'Producto D', 'Producto E'],
    'categoria': ['Electrónica', 'Electrónica', 'Ropa', 'Ropa', 'Hogar'],
    'precio': [100, 150, 50, 75, 200]
}

usuarios_data = {
    'usuario_id': [1, 2, 3, 4, 5],
    'nombre': ['Usuario 1', 'Usuario 2', 'Usuario 3', 'Usuario 4', 'Usuario 5'],
    'edad': [25, 34, 22, 45, 33]
}

transacciones_data = {
    'transaccion_id': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
    'usuario_id': [1, 2, 1, 3, 4, 5, 2, 3, 1, 5],
    'producto_id': [1, 2, 3, 1, 4, 5, 2, 3, 4, 5],
    'tipo_transaccion': ['compra', 'visita', 'compra', 'visita', 'compra', 'visita', 'compra', 'visita', 'compra', 'compra'],
    'fecha': pd.date_range(start='2023-01-01', periods=10, freq='M')
}

reseñas_data = {
    'reseña_id': [1, 2, 3, 4, 5],
    'transaccion_id': [1, 3, 5, 9, 10],
    'calificacion': [5, 4, 3, 4, 5],
    'comentario': ['Excelente', 'Bueno', 'Regular', 'Bueno', 'Excelente']
}

productos_df = pd.DataFrame(productos_data)
usuarios_df = pd.DataFrame(usuarios_data)
transacciones_df = pd.DataFrame(transacciones_data)
reseñas_df = pd.DataFrame(reseñas_data)

transacciones_completas_df = transacciones_df.merge(productos_df, on='producto_id', how='left') \
                                             .merge(usuarios_df, on='usuario_id', how='left') \
                                             .merge(reseñas_df, on='transaccion_id', how='left')

visitas_df = transacciones_df[transacciones_df['tipo_transaccion'] == 'visita']
compras_df = transacciones_df[transacciones_df['tipo_transaccion'] == 'compra']

visitas_por_categoria = visitas_df.merge(productos_df, on='producto_id')['categoria'].value_counts()
compras_por_categoria = compras_df.merge(productos_df, on='producto_id')['categoria'].value_counts()

tasa_conversion_por_categoria = (compras_por_categoria / visitas_por_categoria).fillna(0)

tasa_conversion_por_categoria.plot(kind='bar', figsize=(10, 6))
plt.title('Tasa de Conversión por Categoría de Producto')
plt.xlabel('Categoría')
plt.ylabel('Tasa de Conversión')
plt.show()

distribucion_calificaciones = reseñas_df['calificacion'].value_counts().sort_index()

compras_df = transacciones_df[transacciones_df['tipo_transaccion'] == 'compra']
ventas_mensuales = compras_df.set_index('fecha').resample('M').size()

ventas_mensuales.plot(kind='line', figsize=(10, 6))
plt.title('Tendencia de Ventas Mensuales')
plt.xlabel('Mes')
plt.ylabel('Número de Ventas')
plt.show()

productos_df.boxplot(column='precio', by='categoria', figsize=(12, 8))
plt.title('Distribución de Precios por Categoría de Producto')
plt.suptitle('')
plt.xlabel('Categoría')
plt.ylabel('Precio')
plt.xticks(rotation=90)
plt.show()
