# Esta tarea consiste en la elaboración de un informe de Power BI, aprovechando las capacidades analíticas de Python. Se utilizarán los scripts de Python creados previamente en la Tarea 1 para generar visualizaciones personalizadas con las bibliotecas Seaborn y Matplotlib. Estas visualizaciones serán integradas en el informe de Power BI para ofrecer una comprensión más profunda de la capacidad del lenguaje de programación en la herramienta Power BI.

# Lo primero que debo hacer es la conexión entre PowerBi y Python:
* EN PowerBI: Archivo/opciones y seguridad/opciones/creación de scripts de Python. Aparece una página opciones de script de Python.  
* Reviso que las dos rutas seán las correctas tanto del directorio de Python como del IDE.  
* Hago el cambio de la ruta de Python ya que no estoy utilizando la ruta por defecto.  
# Creación de un script de Python:
* Comprobar primero de que los scripts funcionan correctamente en Python antes de intentar llevarlo a PowerBI.  
* Ejecuto el script para crear el Dataset en PowerBI.

In [6]:
from sqlalchemy import create_engine

conexion = create_engine('mysql+mysqlconnector://root:151108@localhost/operations')

tablas_db = ['transactions', 'companies', 'users', 'products','product_transaction']
df = {}

for tabla in tablas_db:
    query = f'SELECT * FROM {tabla}'
    df[tabla] = pd.read_sql(query, conexion)

conexion.dispose()
transactions_df = df['transactions']
companies_df = df['companies']
users_df = df['users']
products_df = df['products']
product_transactions_df = df['product_transaction']


# En este punto reviso los que los datos se hayan cargado correctamente en PowerBI y es cuando me doy cuenta de que tengo un problema pues los decimales no los toma correctamente porque Python utiliza . y PowerBI , por lo que decido crear una columna para amount en el DataFrame transactions_df y otra para price en el DataFrame de products_df y así poder trabajar y obtener los mismos número que en Python.

# ---NIVEL 1---
# Ejercicio 1: Una variable Numérica.

![E1.png](attachment:E1.png)

In [None]:
# El código siguiente, que crea un dataframe y quita las filas duplicadas, siempre se ejecuta y actúa como un preámbulo del script: 

# dataset = pandas.DataFrame(amount)
# dataset = dataset.drop_duplicates()

import matplotlib.pyplot as plt
import seaborn as sns

sns.histplot(data=dataset['amount'], kde=True)
plt.xlabel('Importe de Transacción')
plt.ylabel('Cantidad de Transacciones')
plt.title('Vista de Importe de Transacciones')
plt.show()


# Ejercicio 2: Dos variables Numéricas.

![E2.png](attachment:E2.png)

In [None]:
# El código siguiente, que crea un dataframe y quita las filas duplicadas, siempre se ejecuta y actúa como un preámbulo del script: 

# dataset = pandas.DataFrame(amount, user_id)
# dataset = dataset.drop_duplicates()

import matplotlib.pyplot as plt
transacciones_filtradas_por_user_id = dataset[dataset['user_id'] > 265]
colors = ['green' if amount > 400 else 'blue' for amount in transacciones_filtradas_por_user_id['amount']]
plt.figure(figsize=(14, 8))
plt.scatter(x=transacciones_filtradas_por_user_id['user_id'], y=transacciones_filtradas_por_user_id['amount'], c=colors)
plt.xlabel('ID de Usuario')
plt.ylabel('Importe')
plt.title('Compras hechas por usuarios con ID mayor a 265')
plt.grid()
if not transacciones_filtradas_por_user_id['user_id'].empty:
    plt.xticks(range(transacciones_filtradas_por_user_id['user_id'].min(), transacciones_filtradas_por_user_id['user_id'].max() + 1, 1), rotation=80)
plt.show()


# Ejercicio 3: Una variable Categórica.

![E3.png](attachment:E3.png)

In [None]:
# El código siguiente, que crea un dataframe y quita las filas duplicadas, siempre se ejecuta y actúa como un preámbulo del script: 

# dataset = pandas.DataFrame(country, id)
# dataset = dataset.drop_duplicates()

import matplotlib.pyplot as plt
usuarios_por_pais = dataset.groupby('country')['id'].count()

plt.figure(figsize=(14, 8))
usuarios_por_pais.plot(kind='pie', autopct='%1.1f%%', startangle=80)
plt.ylabel('')  
plt.title('Distribución de Usuarios registrados por País')
plt.axis('equal') 
plt.legend(title='País')
plt.show()

# Ejercicio 4: Una variable categórica y una numérica.

![E4.png](attachment:E4.png)

In [None]:
# El código siguiente, que crea un dataframe y quita las filas duplicadas, siempre se ejecuta y actúa como un preámbulo del script: 

# dataset = pandas.DataFrame(country, company_id, amount)
# dataset = dataset.drop_duplicates()

import matplotlib.pyplot as plt
ventas_por_pais = dataset.groupby('country')['amount'].sum()
ventas_por_pais = ventas_por_pais.sort_values(ascending=False)
print(ventas_por_pais)
colores = ['red' if valor < 5000 else '#66b3ff' for valor in ventas_por_pais]
plt.figure(figsize=(16, 8))
ventas_por_pais.plot(kind='bar', color=colores)
plt.xlabel('País')
plt.ylabel('Ventas Totales')
plt.title('Ventas Totales por País')
plt.xticks(rotation=80)  
plt.show()

# Ejercicio 5: Dos variables categóricas.

![E5.png](attachment:E5.png)

In [None]:
# El código siguiente, que crea un dataframe y quita las filas duplicadas, siempre se ejecuta y actúa como un preámbulo del script: 

# dataset = pandas.DataFrame(country, company_id, declined)
# dataset = dataset.drop_duplicates()

import matplotlib.pyplot as plt
rechazadas_por_pais = dataset.groupby('country')['declined'].sum()
colores_r = ['#ff9999' if valor > 5 else '#66b3ff' for valor in rechazadas_por_pais]
plt.figure(figsize=(12, 8))
rechazadas_por_pais.plot(kind='bar', color=colores_r)
plt.xlabel('País')
plt.ylabel('Transacciones Rechazadas')
plt.title('Transacciones Rechazadas por País')
plt.xticks(rotation=45)  
plt.axhline(y=5, color='black', linestyle=':')  
plt.show()


# Ejercicio 6: Tres variables.

![E6.png](attachment:E6.png)

In [None]:
# El código siguiente, que crea un dataframe y quita las filas duplicadas, siempre se ejecuta y actúa como un preámbulo del script: 

# dataset = pandas.DataFrame(company_id, country, declined, id)
# dataset = dataset.drop_duplicates()

import matplotlib.pyplot as plt
import numpy as np
ventas_por_pais = dataset.groupby('country')['id'].count()
rechazadas_por_pais = dataset.groupby('country')['declined'].sum()
labels = ventas_por_pais.index
transacciones_totales = ventas_por_pais.values
transacciones_rechazadas = rechazadas_por_pais.values
bar_width = 0.35
x = np.arange(len(labels))
plt.figure(figsize=(16, 8))
plt.bar(x - bar_width/2, transacciones_totales, width=bar_width, label='Transacciones Totales', color='#66b3ff')
plt.bar(x + bar_width/2, transacciones_rechazadas, width=bar_width, label='Transacciones Rechazadas', color='#ff9999')
plt.xlabel('País')
plt.ylabel('Total de Transacciones')
plt.title('Transacciones Totales y Rechazadas por País')
plt.axhline(y=10, color='black', linestyle='--')  
plt.xticks(x, labels, rotation=45)
plt.legend()
plt.show()

# Ejercicio 7: Graficar un Pairplot.

![E7.png](attachment:E7.png)

In [None]:
# El código siguiente, que crea un dataframe y quita las filas duplicadas, siempre se ejecuta y actúa como un preámbulo del script: 

# dataset = pandas.DataFrame(declined, price, weight)
# dataset = dataset.drop_duplicates()

import matplotlib.pyplot as plt
import seaborn as sns
sns.pairplot(dataset, vars=['declined','price', 'weight'],diag_kind = 'kde', kind='reg')
plt.show()

# ---NIVEL 2---
# Ejercicio 1: Correlación de todas las variable numéricas.

![E1.png](attachment:E1.png)

In [None]:
# El código siguiente, que crea un dataframe y quita las filas duplicadas, siempre se ejecuta y actúa como un preámbulo del script: 

# dataset = pandas.DataFrame(amount, declined, user_id, price, weight)
# dataset = dataset.drop_duplicates()

import matplotlib.pyplot as plt
import seaborn as sns
selected_columns = ['amount','declined','user_id','price','weight']
df_selected = dataset [selected_columns]
correlation_matrix = df_selected.corr()
plt.figure(figsize=(10, 7))

sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', vmin=-1, vmax=1, center=0)

plt.title('Matríz de Correlación')

plt.show()

# Ejercicio 2: Joinplot.

![E2.png](attachment:E2.png)

In [None]:
# El código siguiente, que crea un dataframe y quita las filas duplicadas, siempre se ejecuta y actúa como un preámbulo del script: 

# dataset = pandas.DataFrame(price, weight)
# dataset = dataset.drop_duplicates()

import matplotlib.pyplot as plt
import seaborn as sns
sns.jointplot(x='weight', y='price', data=dataset)
plt.xlabel('Peso')
plt.ylabel('Precio')
plt.show()

# ---NIVEL 3---
# Ejercicio 1: Violinplot combinado con Scatter.

![E1.png](attachment:E1.png)

In [None]:
# El código siguiente, que crea un dataframe y quita las filas duplicadas, siempre se ejecuta y actúa como un preámbulo del script: 

# dataset = pandas.DataFrame(undefined, undefined.1, undefined.2)
# dataset = dataset.drop_duplicates()

import matplotlib.pyplot as plt
import seaborn as sns
fig, ax = plt.subplots(figsize=(12, 6))

ax_violin = fig.add_axes([0.1, 0.1, 0.4, 0.8])  # [left, bottom, width, height]
sns.violinplot(data=dataset, y='price', ax=ax_violin)
ax_violin.set_title('Dispersión de Precios')

ax_scatter = fig.add_axes([0.6, 0.1, 0.35, 0.8])  # [left, bottom, width, height]
sns.scatterplot(data=dataset, x='price', y='weight', ax=ax_scatter)
ax_scatter.set_title('Precio vs Peso de los Productos')

plt.show()

# Ejercicio 2: FacetGrid.

![E2.png](attachment:E2.png)

In [None]:
# El código siguiente, que crea un dataframe y quita las filas duplicadas, siempre se ejecuta y actúa como un preámbulo del script: 

# dataset = pandas.DataFrame(country, declined, id)
# dataset = dataset.drop_duplicates()

import matplotlib.pyplot as plt
import seaborn as sns
g = sns.FacetGrid(dataset, col='country', col_wrap=3)
g.map(plt.hist, 'declined')  # Agregado el punto entre transactions_df y 'declined'

plt.show()