In [None]:
# import matplotlib.pyplot as plt

# def plot_line_chart(x, y, title=None, x_label=None, y_label=None):
#     """
#     Parámetros:
#     - x: array-like. Valores para el eje x del gráfico.
#     - y: array-like. Valores para el eje y del gráfico.
#     - title: str, opcional. Título del gráfico.
#     - x_label: str, opcional. Etiqueta del eje x.
#     - y_label: str, opcional. Etiqueta del eje y.

#     Retorna:
#     - None. Muestra el gráfico de líneas.
#     """
#     plt.figure(figsize=(10, 6))
#     plt.plot(x, y, marker='o', linestyle='-', color='b')
#     plt.title(title)
#     plt.xlabel(x_label)
#     plt.ylabel(y_label)
#     plt.grid(True)
#     plt.show()


In [None]:
# x_values = [1, 2, 3, 4, 5]
# y_values = [10, 15, 12, 18, 20]

# plot_line_chart(x_values, y_values, title='Evolución de ventas', x_label='Tiempo', y_label='Ventas')


In [None]:
import numpy as np

def calculate_statistics(data):
    """
    Calcula estadísticas descriptivas como la media, la mediana y la desviación estándar.

    Parámetros:
    - data: array-like. Datos para los cuales se calcularán las estadísticas.

    Retorna:
    - dict. Un diccionario que contiene las estadísticas calculadas.
    """
    statistics = {
        'mean': np.mean(data),
        'median': np.median(data),
        'std': np.std(data)
    }
    return statistics


In [None]:
data = [2, 4, 6, 8, 10]

stats = calculate_statistics(data)
print(stats)


In [None]:
import numpy as np
import matplotlib.pyplot as plt

def plot_decision_boundary(model, X, y):
    """
    Genera un gráfico para visualizar los límites de decisión de un modelo de clasificación en un espacio de características bidimensional.

    Parámetros:
    - model: Modelo de clasificación entrenado.
    - X: Array-like de shape (n_samples, 2). Características del conjunto de datos.
    - y: Array-like de shape (n_samples,). Etiquetas del conjunto de datos.

    Retorna:
    - None. Muestra el gráfico de los límites de decisión.
    """
    # Definir el rango de valores para los ejes x e y
    x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
    y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1

    # Generar una malla de puntos en el espacio de características
    xx, yy = np.meshgrid(np.arange(x_min, x_max, 0.1),
                         np.arange(y_min, y_max, 0.1))

    # Predecir las etiquetas para los puntos de la malla
    Z = model.predict(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)

    # Crear el gráfico de los límites de decisión
    plt.contourf(xx, yy, Z, alpha=0.8)
    plt.scatter(X[:, 0], X[:, 1], c=y, edgecolors='k')
    plt.xlabel('Feature 1')
    plt.ylabel('Feature 2')
    plt.title('Decision Boundary')

    # Mostrar el gráfico
    plt.show()


In [None]:
from sklearn.datasets import make_classification
from sklearn.linear_model import LogisticRegression

# Generar datos de ejemplo
X, y = make_classification(n_samples=100, n_features=2, n_informative=2, n_redundant=0, random_state=42)

# Entrenar un modelo de regresión logística
model = LogisticRegression()
model.fit(X, y)

# Generar el gráfico de los límites de decisión
plot_decision_boundary(model, X, y)


In [None]:
import streamlit as st
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.metrics import confusion_matrix, roc_curve, precision_recall_curve, auc

def visualize_results(y_true, y_pred):
    # Matriz de confusión
    cm = confusion_matrix(y_true, y_pred)
    cm_df = pd.DataFrame(cm, index=['No Response', 'Response'], columns=['No Response (Predicted)', 'Response (Predicted)'])
    
    # Curva ROC
    fpr, tpr, _ = roc_curve(y_true, y_pred)
    roc_auc = auc(fpr, tpr)
    
    # Curva de precisión y recuperación
    precision, recall, _ = precision_recall_curve(y_true, y_pred)
    pr_auc = auc(recall, precision)
    
    # Configurar el estilo de las gráficas
    sns.set(font_scale=1.2)
    
    # Mostrar la matriz de confusión
    st.subheader('Matriz de Confusión')
    st.dataframe(cm_df)
    
    # Mostrar la curva ROC
    st.subheader('Curva ROC')
    plt.figure(figsize=(8, 6))
    plt.plot(fpr, tpr, color='blue', label='ROC curve (area = %0.2f)' % roc_auc)
    plt.plot([0, 1], [0, 1], color='red', linestyle='--')
    plt.xlim([0.0, 1.0])
    plt.ylim([0.0, 1.05])
    plt.xlabel('False Positive Rate')
    plt.ylabel('True Positive Rate')
    plt.title('Receiver Operating Characteristic')
    plt.legend(loc="lower right")
    st.pyplot()
    
    # Mostrar la curva de precisión y recuperación
    st.subheader('Curva de Precisión y Recuperación')
    plt.figure(figsize=(8, 6))
    plt.plot(recall, precision, color='blue', label='Precision-Recall curve (area = %0.2f)' % pr_auc)
    plt.xlim([0.0, 1.0])
    plt.ylim([0.0, 1.05])
    plt.xlabel('Recall')
    plt.ylabel('Precision')
    plt.title('Precision-Recall Curve')
    plt.legend(loc="lower right")
    st.pyplot()

# Ejemplo de uso
y_true = [0, 1, 0, 1, 0]
y_pred = [0, 1, 1, 1, 0]
visualize_results(y_true, y_pred)


In [None]:
import streamlit as st
import pandas as pd
import matplotlib.pyplot as plt

def visualize_groupby(data, group_col, agg_col, agg_func):
    # Realizar el groupby
    grouped_data = data.groupby(group_col)[agg_col].agg(agg_func).reset_index()

    # Crear el gráfico
    fig, ax = plt.subplots()
    ax.bar(grouped_data[group_col], grouped_data[agg_col])
    ax.set_xlabel(group_col)
    ax.set_ylabel(agg_col)

    # Mostrar el gráfico en Streamlit
    st.pyplot(fig)

# Ejemplo de uso
data = pd.DataFrame({
    'Category': ['A', 'A', 'B', 'B', 'C', 'C'],
    'Value': [10, 15, 5, 8, 12, 9]
})

# Llamar a la función para visualizar el groupby
visualize_groupby(data, 'Category', 'Value', 'sum')


# en esta función, visualize_groupby toma los siguientes parámetros:

# data: El DataFrame que contiene los datos.
# group_col: El nombre de la columna por la cual realizar el groupby.
# agg_col: El nombre de la columna a la cual aplicar la función de agregación.
# agg_func: La función de agregación a aplicar (por ejemplo, 'sum', 'mean', 'count', etc.).
# Dentro de la función, se realiza el groupby utilizando data.groupby(group_col)[agg_col].agg(agg_func).reset_index() para obtener los resultados agregados.

# Luego, se crea un gráfico de barras utilizando matplotlib.pyplot.bar() con los datos del groupby. Los nombres de las categorías se establecen en el eje x y los valores agregados se establecen en el eje y.

# Finalmente, se utiliza st.pyplot() para mostrar el gráfico en la interfaz de Streamlit.