Tenemos un archivo CSV con información de ventas y queremos procesar este archivo para 
calcular el total de ventas para cada producto y luego queremos escribir esta información en 
un nuevo archivo CSV.

Queremos generar un nuevo CSV 'total_ventas.csv' que muestre el total de ventas para 
cada producto.

In [2]:
# Importamos la biblioteca readr y dplyr
install.packages(c("dplyr", "readr"))
library(dplyr)
library(readr)

Installing packages into ‘/home/tux/R/x86_64-pc-linux-gnu-library/4.1’
(as ‘lib’ is unspecified)


Attaching package: ‘dplyr’


The following objects are masked from ‘package:stats’:

    filter, lag


The following objects are masked from ‘package:base’:

    intersect, setdiff, setequal, union




In [3]:
# Leemos el archivo CSV original y lo almacenamos en un DataFrame
df <- read_csv('../data/ventas.csv')

[1mRows: [22m[34m48[39m [1mColumns: [22m[34m3[39m
[36m──[39m [1mColumn specification[22m [36m────────────────────────────────────────────────────────[39m
[1mDelimiter:[22m ","
[31mchr[39m (1): Producto
[32mdbl[39m (2): Cantidad, Venta

[36mℹ[39m Use `spec()` to retrieve the full column specification for this data.
[36mℹ[39m Specify the column types or set `show_col_types = FALSE` to quiet this message.


In [4]:
# Mostramos el DataFrame original para revisión
cat("DataFrame original: \n")
print(df)

DataFrame original: 


[90m# A tibble: 48 × 3[39m
   Producto Cantidad Venta
   [3m[90m<chr>[39m[23m       [3m[90m<dbl>[39m[23m [3m[90m<dbl>[39m[23m
[90m 1[39m Manzana        15  0.85
[90m 2[39m Naranja         7  0.42
[90m 3[39m Platano        12  1.25
[90m 4[39m Manzana         8  0.95
[90m 5[39m Naranja         3  0.68
[90m 6[39m Platano        10  1.1 
[90m 7[39m Manzana        14  0.92
[90m 8[39m Naranja         6  0.55
[90m 9[39m Platano         9  1.18
[90m10[39m Manzana        11  0.75
[90m# ℹ 38 more rows[39m


In [5]:
# Calculamos el total de ventas para cada producto.
# Para esto, primero creamos una nueva columna 'Total' que es el producto de 'Cantidad' y 'Venta'
df <- df %>%
  mutate(Total = Cantidad * Venta)

In [6]:
# Luego, agrupamos por 'Producto' y sumamos 'Total'
df_total <- df %>%
  group_by(Producto) %>%
  summarise(Total = sum(Total, na.rm = TRUE)) %>%
  ungroup()

In [15]:
# Mostramos el DataFrame de totales para revisión.
# Los tibbles recortan la informacion de decimales para
# que los resultados sean mas facil de leer
# En nuestro caso lo convertiremos en un dataframe para que nos muestre
# todos los decimales

cat("\nDataFrame de totales de ventas:")
print(as.data.frame(df_total))


DataFrame de totales de ventas:  Producto  Total
1  Manzana 149.48
2  Naranja  45.34
3  Platano 202.80


In [18]:
write.csv(df_total, file = "total_ventas.csv", row.names = FALSE)