Desarrollar una aplicación en Python utilizando el paradigma de programación orientada a objetos y las librerías de pandas, numpy, matplotlib, datetime y folium.

La aplicación a desarrollar permitirá procesar y analizar los datos de ventas de una empresa. Para ello, se debe definir una clase llamada "DatosVentas", que reciba como parámetro la ruta de un archivo CSV con los datos de ventas y que tenga un método llamado "procesar_datos" para agregar columnas al DataFrame de pandas con el mes y el año de la venta.
Posteriormente, se debe definir una clase llamada "AnalizadorVentas" que reciba como parámetro una instancia de la clase "DatosVentas" y que tenga tres métodos: "obtener_ventas_totales", "obtener_ventas_promedio_por_mes" y "obtener_productos_mas_vendidos". Estos métodos deberán devolver la suma total de las ventas, las ventas promedio por mes y los productos más vendidos, respectivamente.
Por último, se debe definir una clase llamada "VisualizadorVentas" que reciba como parámetro una instancia de la clase "DatosVentas" y que tenga cuatro métodos: "graficar_ventas_totales", "graficar_ventas_promedio_por_mes", "graficar_productos_mas_vendidos" y "graficar_mapa_ventas". Estos métodos deberán graficar la información obtenida en los métodos de la clase "AnalizadorVentas" y mostrar un mapa de calor con las ventas por país.

VER LAS COLUMNAS DE LOS FICHERO
#print(escritor_csv.fieldnames)

In [1]:
import csv
import random
import datetime

# Generar datos de ventas ficticios con listas
productos = ['Producto 1', 'Producto 2', 'Producto 3']
paises = ['País 1', 'País 2', 'País 3']
ventas = []
for i in range(1000):
    #se genera un diccionario con los datos y los valores de mes y dias
    venta = {}
    venta['Fecha'] = datetime.date(2022, random.randint(1, 12), 
                                   random.randint(1, 28))
    venta['Producto'] = random.choice(productos)
    venta['País'] = random.choice(paises)
    venta['Ventas'] = random.randint(100, 10000)
    ventas.append(venta)

# Escribir los datos en un archivo CSV
with open('datos_ventas.csv', mode='w', newline='') as archivo_csv:
    #crea los atributos de las columnas
    nombres_columnas = ['Fecha', 'Producto', 'País', 'Ventas']
    #crea el objeto archivo_csv y agrega sus columnas
    escritor_csv = csv.DictWriter(archivo_csv, fieldnames=nombres_columnas)
    #escribe los atributos de la tabla en el fichero
    escritor_csv.writeheader()
    
    for venta in ventas:
        #writeheader: escribimos los valores en 
        # las filas de la tabla
        escritor_csv.writerow(venta)


Clase DatosVentas:
inicializar: Método constructor que inicializa la instancia de la clase, toma como argumento la ruta del archivo CSV de ventas y carga los datos en un objeto DataFrame de pandas.
procesar_datos: Este método procesa los datos de ventas y agrega dos nuevas columnas al objeto DataFrame: una columna para el mes de la venta y otra para el año de la venta.
obtener_datos: Retorna el objeto DataFrame con los datos de ventas.

In [2]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import datetime as dt
import folium

class DatosVentas:
    def __init__(self, ruta_archivo):
        #sep= separador de campos o columnas
        self.datos = pd.read_csv(ruta_archivo, sep=",", encoding='')

    def procesar_datos(self):
        # convertimos la columna en objeto de fecha para hacer calculos
        self.datos['Fecha'] = pd.to_datetime(self.datos['Fecha'])
        #usamos de fecha el mes
        self.datos['Mes'] = self.datos['Fecha'].dt.month
        #usamos de fecha el año
        self.datos['Año'] = self.datos['Fecha'].dt.year
        
    def obtener_datos(self):
        return self.datos
        

        


IMPORTANTE: DEBES CARGAR "PROCESAR_DATOS" PARA QUE LAS OTRAS CLASES
Y METODOS FUNCIONEN BIEN

In [3]:
ventas_lunes= DatosVentas('datos_ventas.csv')
ventas_martes= DatosVentas('datos_ventas.csv')

#acceder a todos los atributos del dataframe
#print(ventas_martes.datos)

#obtener los datos sin el mes y año del dataframe
#ventas_lunes.obtener_datos()

#agregamos los nuevos campos de mes y año 
# con el metodo procesar_datos y mostramos el nuevo dataframe
ventas_lunes.procesar_datos()
#ventas_lunes.datos


Clase AnalizadorVentas:
inicializar: Método constructor que inicializa la instancia de la clase, toma como argumento un objeto de la clase DatosVentas.
obtener_ventas_totales: Retorna la suma total de las ventas.
obtener_ventas_promedio_por_mes: Retorna un objeto DataFrame que contiene el promedio de ventas por mes y año.
obtener_productos_mas_vendidos: Retorna un objeto DataFrame que contiene los n (el usuario debe indicar el valor de n) productos más vendidos.

In [4]:
class AnalizadorVentas:
    def __init__(self, datos_ventas):
        #accede al dataframe con sus atributos con (.datos)
        self.datos = datos_ventas.datos
        
    def obtener_ventas_totales(self):
        #accede al campo ventas y suma
        return self.datos['Ventas'].sum()
        
    def obtener_ventas_promedio_por_mes(self):
        #del dataframe self.datos agrupa los nuevos campos (año, mes)
        # y pone la media (por grupos) ->Idx Año  Mes   Ventas
        #                                0  2021  Ene  1000.00
        return self.datos.groupby(['Año', 'Mes'])['Ventas'].mean(
        ).reset_index() #reset index: crea una secuencia numerica 
                        #con indices para usarla con funciones
        
    def obtener_productos_mas_vendidos(self, n):
        #agrupa por productos, suma los grupos de los productos y 
        # selecciona los productos que tienen mas ventas 
        return self.datos.groupby('Producto')['Ventas'].sum(
        ).nlargest(n).reset_index()

In [5]:
#toma como argumento un objeto de la clase DatosVentas
analizador_v= AnalizadorVentas(ventas_lunes)

#Retorna la suma total de las ventas
#analizador_v.obtener_ventas_totales()

#Retorna un objeto DataFrame que contiene el promedio de 
# ventas por mes y año.
#analizador_v.obtener_ventas_promedio_por_mes()

#Retorna un objeto DataFrame que contiene los n (los numero 
#de fila por indice con el productos más vendidos, que se 
# muestra de forma descendente, es decir, del producto mas vendido
# al menos vendido.
analizador_v.obtener_productos_mas_vendidos(2)

Unnamed: 0,Producto,Ventas
0,Producto 2,1766810
1,Producto 1,1636550



Clase VisualizadorVentas:
init: Método constructor que inicializa la instancia de la clase, toma como argumento un objeto de la clase DatosVentas.
graficar_ventas_totales: crea la evolución temporal de las ventas.
graficar_ventas_promedio_por_mes:  gráfica que muestra el promedio de ventas por mes y año.
graficar_productos_mas_vendidos: gráfica que muestra los n productos más vendidos.
graficar_mapa_ventas: gráfica que muestra un mapa de calor de las ventas por país.

RECUERDA QUE PUEDES ACCEDER A LAS VARIABLES LOCALES DE UNA CLASE CREANDO UNA FUNCION QUE TE DEVUELVA EL VALOR DE LA VARIABLE 

In [6]:
class VisualizadorVentas:
    def __init__(self, datos_ventas):
        #datos_ventas.datos hace referencia a los datos del dataframe de 
        #la clase  padre
        self.datos_ventas = datos_ventas.datos

    def graficar_ventas_totales1(self):
        #agrupa la suma de ventas por fecha y el resultado lo almacena
        #en el "grafico de linea" del metodo plot de la libreria pandas
        self.datos_ventas.groupby(["Fecha"])["Ventas"].sum().reset_index(
        ).plot(x="Fecha", y="Ventas", 
                    kind="line", xlabel="Fecha", ylabel="Ventas"
                    , title="Ventas totales por fecha")
        
    def graficar_ventas_totales2(self):
        #del objeto dataframe datos_ventas agrupamos por fecha y sumamos
        #las ventas para crear otro dataframe con esos nuevos datos que 
        #se guarda en datos_por_fecha para usarlo en el otro "grafico de linea"
        datos_por_fecha = self.datos_ventas.groupby(["Fecha"])["Ventas"].sum(
        ).reset_index()

        #del nuevo dataframe datos_por_fecha usamos los campos Fecha(X), 
        # Ventas(Y) para ponerlos en los parametros del metodo
        plt.plot(datos_por_fecha.Fecha, datos_por_fecha.Ventas, color='GREY', 
                 marker='*',linestyle='--') #marker y linestyle son los puntos y lineas del grafico
        
        #Damos formato al grafico
        plt.title('Ventas totales por fecha')
        plt.xlabel('Fecha')
        plt.ylabel('Ventas')
        plt.show()

    def graficar_ventas_totales3(self):
        #hace lo mismo que el metodo anterior
        datos_por_fecha = self.datos_ventas.groupby(["Fecha"])["Ventas"].sum(
        ).reset_index()

        plt.plot(datos_por_fecha.Fecha, datos_por_fecha.Ventas, color='green', 
                 marker='o')
        plt.title('"Ventas totales por fecha"')
        plt.xlabel('Fecha')
        plt.ylabel('Ventas')
        plt.show()
        
    def graficar_ventas_promedio_por_mes(self):
        #agrupa los campos año y mes y los une con la media de ventas 
        ventas_por_mes = self.datos_ventas.groupby(['Año', 
        'Mes'])['Ventas'].mean().reset_index()

        #ponemos en x mes y y en ventas
        plt.plot(ventas_por_mes['Mes'], ventas_por_mes['Ventas'])
        
        plt.title('Ventas promedio por mes')
        
        plt.xlabel('Mes')
        
        plt.ylabel('Ventas')
        
        plt.show()
        
    def graficar_productos_mas_vendidos(self, n):
        #agrupamos, sumamos las ventas y guardamos los datos de producto 
        # ventas de mayor a menor (nlargest -segun la fila que ponga usuario-)
        productos_mas_vendidos = self.datos_ventas.groupby('Producto')[
            'Ventas'].sum().nlargest(n).reset_index()
        
        #bar: gráfico de barras eje x y y
        plt.bar(productos_mas_vendidos['Producto'], productos_mas_vendidos[
            'Ventas'])
        
        #muestra el parametro de n
        plt.title('Los {} productos más vendidos'.format(n))
        plt.xlabel('Producto')
        plt.ylabel('Ventas')
        plt.show()
        
    def graficar_mapa_ventas(self):
        #Agrupa los datos de ventas por país y suma las ventas para cada país.
        datos_por_pais = self.datos_ventas.groupby('País')['Ventas'
        ].sum().reset_index()

        #	    País	Ventas     <--datos_por_pais
        #    0	País 1	1617287
        #    1	País 2	1627373
        #    2	País 3	1640510
        
        #crea la matriz de esta manera, accede al dataframe y accede a 
        #la columna ventas
        data = np.array([datos_por_pais.Ventas]) 

        #La función plt.subplots() crea una figura y uno o varios ejes. 
        #fig y ax: se utiliza para establecer propiedades generales de la 
        # figura (tamaño, título, leyenda, no o varios ejes dentro de la figura)
        fig, ax = plt.subplots() #esta funcion devuelve dos objetos
        
        #que crea el mapa de calor utilizando los valores de la matriz 
        # data y el mapa de colores "summer".
        im = ax.imshow(data, cmap='summer')

        #data.shape[0] retorna el número de filas 
        # y data.shape[1] retorna el número de columnas de data
        for i in range(data.shape[0]):
            for j in range(data.shape[1]):
                #escribe en el grafico la informacion de data
                #j,i: posicions/ data[i,j]: el contenido de data
                text = ax.text(j, i, data[i, j],
                            ha="center", va="center", color="black")
        
        # Añadir la barra de color
        #im: objeto de la imagen 
        #ax: ejes se dibujará la barra de colores
        cbar = ax.figure.colorbar(im, ax=ax)

        # Ajustar la etiqueta de los países en el eje x
        #se establece en un rango que va desde 0 hasta la 
        # longitud de la segunda dimensión de la matriz data.
        ax.set_xticks(np.arange(data.shape[1]))
        #escribe la informacion de la columna pais
        ax.set_xticklabels(['País 1', 'País 2', 'País 3'])

        #quita la informacion de y
        ax.set_yticks([])


        # Rotar las etiquetas del eje x
        plt.setp(ax.get_xticklabels(), rotation=90, ha="right",
                rotation_mode="anchor")

        # Ajustar los márgenes del gráfico
        plt.tight_layout()

        plt.show()


In [13]:
#PRUEBAS DE METODOS Y OBJETOS 
#v= VisualizadorVentas(ventas_lunes)
#
##v.graficar_ventas_totales()
##
##v.graficar_ventas_totales2()
##
##v.graficar_ventas_totales3()
#
##v.graficar_ventas_promedio_por_mes()
#
#v.graficar_productos_mas_vendidos(2)
#
VentasLunes = DatosVentas('datos_ventas.csv')

VentasLunes.procesar_datos()

VentasLunes.obtener_datos()
#
#VentasMartes = DatosVentas('datos_ventas.csv')
#
#VentasLunes.datos
#
#VentasLunes.obtener_datos()
#
#VentasLunes.procesar_datos()
##ventas_lunes.datos
#
#VentasLunes.obtener_datos()
#
#analizador_ventas_Lunes = AnalizadorVentas(VentasLunes)
#
#analizador_ventas_Lunes.datos
#
#analizador_ventas_Lunes.obtener_ventas_totales()
#
#vv = VisualizadorVentas(VentasLunes)
#
#vv.graficar_ventas_totales1()
#
#vv.graficar_ventas_totales2()
#
#vv.graficar_ventas_totales3()
#
#vv.graficar_ventas_promedio_por_mes()
#
#vv.graficar_productos_mas_vendidos(2)
#
#vv.graficar_mapa_ventas()
#
#ruta_archivo = 'datos_ventas.csv'
#datos = pd.read_csv(ruta_archivo, sep=",", encoding='')
#datos
#
#datos_por_pais = datos.groupby('País')['Ventas'].sum().reset_index()
#datos_por_pais
#
#data_pais = np.array([datos_por_pais.Ventas])
#data_pais
#
#data_pais.shape[0]
#
#data_pais.shape[1]
#
#data_pais.shape

Unnamed: 0,Fecha,Producto,País,Ventas,Mes,Año
0,2022-02-17,Producto 1,País 2,5137,2,2022
1,2022-06-19,Producto 2,País 3,3696,6,2022
2,2022-08-21,Producto 2,País 2,923,8,2022
3,2022-07-17,Producto 1,País 2,3208,7,2022
4,2022-06-05,Producto 1,País 2,7795,6,2022
...,...,...,...,...,...,...
995,2022-07-28,Producto 1,País 1,6715,7,2022
996,2022-05-24,Producto 2,País 2,2148,5,2022
997,2022-05-18,Producto 1,País 1,8782,5,2022
998,2022-12-23,Producto 2,País 2,8314,12,2022


Añadir una clase para generar resumen de ventas en la aplicación de ventas que venimos desarrollando durante el tercer trimestre.

código para la clase GeneradorResumenVentas


In [8]:
class GeneradorResumenVentas:
   def __init__(self, datos_ventas):
       #usamos el dataframe y llamamos al metodo .obtener_datos()
       #para acceder a sus indices y buscar el parametro de la lista 
       #de años. Sino colocamos nada nos aparecera 'DatosVentas' object is not subscriptable
       self.datos = datos_ventas.obtener_datos()

#espera como parametro las palabras: mensual, anual, diario
   def generar_resumen(self, periodo, años=None, mes=None):
       if periodo == "mensual":
           #del dataframe selecciona el parametro de año y busca ese año en la serie 'Año'
           #Agrupa esos nuevos datos por año y mes y suma las ventas 
           #el resultado lo guarda en resumen (PERO LOS DATOS TODAVÍA NO ESTÁN ESCRITO EN EL FICHERO TXT)
           resumen = self.datos[self.datos['Año'].isin(años)].groupby(['Año', 'Mes'])['Ventas'].sum().reset_index()

           #CREAMOS EL TXT VACIO 
           nombre_archivo = "resumen_ventas_mensual.txt"
       
       elif periodo == "anual":
           resumen = self.datos[self.datos['Año'].isin(años)].groupby(['Año'])['Ventas'].sum().reset_index()
           nombre_archivo = "resumen_ventas_anual.txt"
       
       #si periodo es diario y mes tiene valor entonces
       elif periodo == "diario" and mes is not None:
           #selecciono dataframe con la columna años y mes, agrupo por año, mes, 
           # fecha y creo otro dataframe en resumen (sin sumarlas)
           resumen = self.datos[(self.datos['Año'].isin(años)) & (self.datos['Mes'] == mes)].groupby(['Año', 'Mes', 'Fecha'])['Ventas'].sum().reset_index()
           
           #creo el archivo con el mes puesto por parametro
           nombre_archivo = f"resumen_ventas_diario_{mes}.txt"
       
       #si el primer parametro no está dentro de las palabras 
       #mensual, anual, diario salta a este else
       else:
           print("Periodo no válido. Debe ser 'mensual', 'anual' o 'diario' (con un mes especificado).")
           return


        #escribimos el archivo creado, segun la condicion de arriba
       with open(nombre_archivo, 'w') as archivo:
           #como periodo es entero cambiamos a cadena y hacemos salto de linea
           archivo.write("Resumen de ventas " + str(periodo) + "\n")
           archivo.write("###########################################" + "\n")
           archivo.write("\n")
           if años != None:
               archivo.write("años: " + str(años) + ":\n")
           if mes != None:
               archivo.write("mes: " + str(mes) + ":\n")
           archivo.write("--------------------------------------------" + "\n")
           archivo.write("\n")

           #aqui escribe la suma de ventas

           """
           La línea de código archivo.write(resumen.to_string(index=False)) escribe en 
           el archivo de resumen de ventas el contenido del DataFrame resumen 
           convertido en una cadena de texto.

            resumen.to_string(index=False) convierte el DataFrame resumen en una 
            representación en formato de cadena de texto, donde index=False indica 
            que no se incluirá la columna de índices en la representación. 
            Esto significa que el resultado no mostrará los números de fila 
            en la cadena de texto generada.

            Luego, archivo.write() se utiliza para escribir esa cadena de texto 
            en el archivo de resumen de ventas. De esta manera, los datos resumidos 
            se guardan en el archivo en un formato legible.
           """
           archivo.write(resumen.to_string(index=False))

        #toma una lista de valores y los convierte en una cadena de texto donde los 
        # elementos están separados por comas y espacios.
       print(f"¡Se ha generado el archivo de resumen de ventas {periodo} para los años {', '.join(map(str, años))}!")




In [9]:

datos_ventas = DatosVentas('datos_ventas.csv')
datos_ventas.procesar_datos()


generador_resumen = GeneradorResumenVentas(datos_ventas)


# Generar resumen mensual para los años 2021 y 2022
#generador_resumen.generar_resumen("mensual", [2021, 2022])


# Generar resumen anual para los años 2020, 2021 y 2022
#generador_resumen.generar_resumen("anual", [2020, 2021, 2022])


# Generar resumen diario para el mes de enero de 2023
#generador_resumen.generar_resumen("diario", [2022], mes=1)

#PRUEBAS MIAS 
generador_resumen.generar_resumen("diario", [2022], mes= 2)

¡Se ha generado el archivo de resumen de ventas diario para los años 2022!


In [10]:
import sqlite3

class bd_ventas:
    #datos_ventas: dataframe, nombre_base_datos: nombre de la bd 
    def __init__(self, datos_ventas, nombre_base_datos):
        self.datos_ventas = datos_ventas
        self.nombre_base_datos = nombre_base_datos

    def guardar_datos(self):
        # Establecer conexión con la base de datos
        conexion = sqlite3.connect(self.nombre_base_datos)
        cursor = conexion.cursor()

        # Crear la tabla en la base de datos
        cursor.execute('''CREATE TABLE IF NOT EXISTS ventas (
                            Fecha date,
                            Producto varchar2(50),
                            País varchar2(50),
                            Ventas number(5,2)
                        )''')

        # Insertar los datos en la tabla
        for indice, fila in self.datos_ventas.iterrows():
            cursor.execute("INSERT INTO ventas VALUES (?, ?, ?, ?)",
                           (fila['Fecha'], fila['Producto'], fila['País'], fila['Ventas']))

        # Confirmar los cambios
        conexion.commit()

        # Cerrar la conexión
        cursor.close()
        conexion.close()

        print("¡Los datos han sido guardados en la base de datos SQLite!")

    def mostrar_consulta(self):
        conexion= sqlite3.connect('datos_ventas.db')
        cursor= conexion.cursor()
        
        #consulta
        cursor.execute('SELECT * FROM ventas')
        
        tabla= cursor.fetchall()

        for valor in tabla:
            print (valor)
        conexion.close()
        
        
    

In [11]:
# Ejemplo de uso
datos_ventas = pd.read_csv('datos_ventas.csv')
guardador = bd_ventas(datos_ventas, 'datos_ventas.db')
guardador.guardar_datos()

#categorias= cursor.execute("SELECT * FROM categoria").fetchall()


guardador.mostrar_consulta()

¡Los datos han sido guardados en la base de datos SQLite!
('2022-11-06', 'Producto 2', 'País 2', 1338)
('2022-09-15', 'Producto 1', 'País 2', 384)
('2022-12-04', 'Producto 2', 'País 1', 6775)
('2022-06-26', 'Producto 3', 'País 3', 1048)
('2022-01-25', 'Producto 3', 'País 1', 4822)
('2022-06-10', 'Producto 2', 'País 3', 3502)
('2022-09-08', 'Producto 3', 'País 3', 3335)
('2022-08-14', 'Producto 2', 'País 1', 7040)
('2022-11-12', 'Producto 1', 'País 3', 1754)
('2022-08-25', 'Producto 2', 'País 2', 7259)
('2022-10-22', 'Producto 2', 'País 2', 9824)
('2022-12-17', 'Producto 3', 'País 1', 4749)
('2022-10-15', 'Producto 3', 'País 2', 9728)
('2022-10-01', 'Producto 2', 'País 2', 1492)
('2022-06-06', 'Producto 3', 'País 1', 1691)
('2022-01-28', 'Producto 2', 'País 1', 4586)
('2022-05-15', 'Producto 2', 'País 3', 4126)
('2022-05-06', 'Producto 3', 'País 2', 5503)
('2022-01-08', 'Producto 1', 'País 1', 874)
('2022-11-10', 'Producto 1', 'País 1', 3723)
('2022-03-05', 'Producto 3', 'País 1', 8067)