Tenemos un archivo CSV con información de ventas y queremos procesar este archivo para 
calcular el total de ventas para cada producto y luego queremos escribir esta información en 
un nuevo archivo CSV.

Queremos generar un nuevo CSV 'total_ventas.csv' que muestre el total de ventas para 
cada producto.

En Python usamos Pandas, acá usaremos una biblioteca llamada DataFrames.

In [3]:
# Importamos la biblioteca DataFrames y CSV
import Pkg
Pkg.add("DataFrames")
Pkg.add("CSV")

[32m[1m   Resolving[22m[39m package versions...
[32m[1m  No Changes[22m[39m to `~/.julia/environments/v1.10/Project.toml`
[32m[1m  No Changes[22m[39m to `~/.julia/environments/v1.10/Manifest.toml`
[32m[1m   Resolving[22m[39m package versions...
[32m[1m   Installed[22m[39m CodecZlib ────────── v0.7.4
[32m[1m   Installed[22m[39m TranscodingStreams ─ v0.10.9
[32m[1m   Installed[22m[39m WeakRefStrings ───── v1.4.2
[32m[1m   Installed[22m[39m FilePathsBase ────── v0.9.21
[32m[1m   Installed[22m[39m WorkerUtilities ──── v1.6.1
[32m[1m   Installed[22m[39m CSV ──────────────── v0.10.14
[32m[1m    Updating[22m[39m `~/.julia/environments/v1.10/Project.toml`
  [90m[336ed68f] [39m[92m+ CSV v0.10.14[39m
[32m[1m    Updating[22m[39m `~/.julia/environments/v1.10/Manifest.toml`
  [90m[336ed68f] [39m[92m+ CSV v0.10.14[39m
  [90m[944b1d66] [39m[92m+ CodecZlib v0.7.4[39m
  [90m[48062228] [39m[92m+ FilePathsBase v0.9.21[39m
  [90m[3bb67fe8] 

In [5]:
# Leemos el archivo CSV original y lo almacenamos en un DataFrame
using DataFrames
using CSV

df = CSV.read("./../data/ventas.csv", DataFrame)

Row,Producto,Cantidad,Venta
Unnamed: 0_level_1,String7,Int64,Float64
1,Manzana,15,0.85
2,Naranja,7,0.42
3,Platano,12,1.25
4,Manzana,8,0.95
5,Naranja,3,0.68
6,Platano,10,1.1
7,Manzana,14,0.92
8,Naranja,6,0.55
9,Platano,9,1.18
10,Manzana,11,0.75


In [8]:
# Calculamos el total de ventas para cada producto.
# Para esto, primero creamos una nueva columna 'Total' que es el producto de 'Cantidad' y 'Venta'

df.Total = df.Cantidad .* df.Venta
println(df)

[1m48×4 DataFrame[0m
[1m Row [0m│[1m Producto [0m[1m Cantidad [0m[1m Venta   [0m[1m Total   [0m
     │[90m String7  [0m[90m Int64    [0m[90m Float64 [0m[90m Float64 [0m
─────┼──────────────────────────────────────
   1 │ Manzana         15     0.85    12.75
   2 │ Naranja          7     0.42     2.94
   3 │ Platano         12     1.25    15.0
   4 │ Manzana          8     0.95     7.6
   5 │ Naranja          3     0.68     2.04
   6 │ Platano         10     1.1     11.0
   7 │ Manzana         14     0.92    12.88
   8 │ Naranja          6     0.55     3.3
   9 │ Platano          9     1.18    10.62
  10 │ Manzana         11     0.75     8.25
  11 │ Naranja          5     0.63     3.15
  12 │ Platano         13     0.98    12.74
  13 │ Manzana          9     0.88     7.92
  14 │ Naranja          4     0.5      2.0
  15 │ Platano         11     1.2     13.2
  16 │ Manzana         12     0.8      9.6
  17 │ Naranja          6     0.78     4.68
  18 │ Platano         14

In [11]:
# Luego, agrupamos por 'Producto' y sumamos 'Total
df_total = combine(groupby(df, :Producto), :Total => sum => :Suma_Total)
println(df_total)

[1m3×2 DataFrame[0m
[1m Row [0m│[1m Producto [0m[1m Suma_Total [0m
     │[90m String7  [0m[90m Float64    [0m
─────┼──────────────────────
   1 │ Manzana       149.48
   2 │ Naranja        45.34
   3 │ Platano       202.8


In [12]:
# Mostramos el DataFrame de totales para revisión.
println("DataFrame de totales de ventas:")
println(df_total)

DataFrame de totales de ventas:
[1m3×2 DataFrame[0m
[1m Row [0m│[1m Producto [0m[1m Suma_Total [0m
     │[90m String7  [0m[90m Float64    [0m
─────┼──────────────────────
   1 │ Manzana       149.48
   2 │ Naranja        45.34
   3 │ Platano       202.8


In [13]:
CSV.write("total_ventas.csv", df_total)

"total_ventas.csv"