# PDF Power Hacks: Everything You Didn’t Know You Could Do with R and Your PDF Files  
### 🛡️ DIY in AI: Protect your data. Don’t upload it anywhere.

# 🦉 R | Scan Multiple Images into One PDF 🖼️➡️📄  

## ❓Got a stack of scanned images you need to share as a single file? 🙃  
With R and `magick`, you can create a polished PDF locally — no upload, no risk.  

## 👉 Solution  
📸 Generate multiple grayscale images (e.g. scanned pages)  
📄 Insert them as pages in a new PDF sized A4 using `grid` and `pdf()`  
🧾 Scale and center each image for a professional layout  

## 🔧 How does it work?  
🖼️ Create random grayscale images simulating scans  
📄 Save images locally with a consistent prefix  
🧾 Create a PDF with each image scaled and centered on A4 pages  

## 🔎 Why does it matter?  
📚 Makes digitizing and securely archiving physical documents easy  
🔐 Keeps your data fully under your control—no cloud uploads  
📊 Prepares your data for OCR, NLP, or AI workflows  

## ✨ Real-world example:  
📝 You scanned receipts, notes, or reports  
📥 Combine them into one clean PDF for sharing or archiving  
📈 Perfect for batch uploading in AI pipelines  

## ⚙️ Business impact:  
🗃️ Simplifies and secures document management  
📨 Speeds up information flow and presentation  
🔍 Ensures privacy and reproducibility  

🔗 [GitHub Repository](https://github.com/jcombari/AI-For-Unstructured-Data/tree/main/PDF%20Power%20Hacks)  

## 💭 Thought  
How do you handle scanned images today? Could automating this locally with R reduce risks and improve your workflow?

🔑 #Rstats #magick #DataScience #PDFprocessing #Automation #AI #DataPrivacy #NLP #MachineLearning #TechForGood  

🔁 If you found this useful, feel free to share with your network.  
⚠️ Please respect the original work and do not copy or repost as your own.

---

# PDF Power Hacks: Todo lo que no sabías que podías hacer con R y tus archivos PDF  
### 🛡️ DIY en IA: Protege tus datos. No los subas a ningún sitio.

# 🦉 R | Escanea múltiples imágenes a un solo PDF 🖼️➡️📄  

## ❓ ¿Tienes varias imágenes escaneadas que necesitas enviar como un solo archivo? 🙃  
Con R y `magick` puedes crear un PDF ordenado, local y seguro.  

## 👉 Solución  
📸 Genera múltiples imágenes en escala de grises (como si fueran escaneos)  
📄 Inserta cada imagen como página en un PDF tamaño A4 usando `grid` y `pdf()`  
🧾 Escala y centra cada imagen para una presentación profesional  

## 🔧 ¿Cómo funciona?  
🖼️ Creamos imágenes aleatorias en escala de grises para simular escaneos  
📄 Las guardamos localmente con un prefijo organizado  
🧾 Creamos un PDF con cada imagen escalada y centrada en páginas A4  

## 🔎 ¿Por qué importa?  
📚 Facilita la digitalización y archivo seguro de documentos físicos  
🔐 Mantiene el control total de tus datos, sin subir nada a la nube  
📊 Prepara tus datos para flujos de trabajo de OCR, NLP o análisis  

## ✨ Ejemplo real o Caso práctico:  
📝 Escaneaste recibos, apuntes o actas  
📥 Combínalos en un solo PDF limpio para compartir o archivar  
📈 Ideal para automatizar cargas masivas en pipelines de IA  

## ⚙️ Impacto en el negocio:  
🗃️ Simplifica y asegura la gestión documental  
📨 Agiliza el flujo y presentación de información  
🔍 Garantiza privacidad y reproducibilidad  

🔗 [Repositorio en GitHub](https://github.com/jcombari/AI-For-Unstructured-Data/tree/main/PDF%20Power%20Hacks)  

## 💭 Reflexión  
¿Cómo gestionas hoy tus imágenes escaneadas? ¿Automatizar localmente con R podría reducir riesgos y mejorar tu flujo de trabajo?

🔑 #Rstats #magick #CienciaDeDatos #PDFprocessing #Automatización #IA #PrivacidadDeDatos #NLP #MachineLearning #TechForGood  

🔁 Si te ha parecido útil, siéntete libre de compartirlo con tu red.  
⚠️ Por favor, respeta el trabajo original y no lo copies ni publiques como propio.


In [None]:
# Instala paquetes si no los tienes
if (!require(magick)) install.packages("magick")
if (!require(gridExtra)) install.packages("gridExtra")
if (!require(grid)) install.packages("grid")

library(magick)
library(gridExtra)
library(grid)

# 📁 Configuración
prefix <- "20250620_"
directory <- prefix  # La carpeta será "20250620_"

# Crear directorio si no existe
if (!dir.exists(directory)) {
  dir.create(directory)
}

# 🖼️ Generar y guardar 3 imágenes en escala de grises
image_list <- c()
for (i in 1:3) {
  # Crear imagen aleatoria 350x250 en escala de grises
  img_matrix <- matrix(sample(0:255, 350 * 250, replace = TRUE), nrow = 350, ncol = 250)
  
  # Convertir matriz a imagen magick (grayscale)
  img <- image_read(as.raster(img_matrix / 255))
  
  # Guardar imagen
  filename <- file.path(directory, paste0(prefix, "image_", i, ".png"))
  image_write(img, path = filename, format = "png")
  image_list <- c(image_list, filename)
}

# Comprobar que hay imágenes
if (length(image_list) == 0) stop(paste0("No PNG images with prefix '", prefix, "' found in '", directory, "'."))

# 📄 Crear PDF con las imágenes (centradas en A4)
pdf_filename <- file.path(directory, paste0(prefix, "combined_output.pdf"))

pdf(pdf_filename, width = 8.27, height = 11.69)  # tamaño A4 en pulgadas

for (img_path in image_list) {
  img <- image_read(img_path)
  
  # Obtener dimensiones imagen en píxeles
  info <- image_info(img)
  img_w <- info$width
  img_h <- info$height
  
  # Dimensiones A4 en pixeles a 72 dpi para device pdf
  a4_w <- 8.27 * 72
  a4_h <- 11.69 * 72
  
  # Escalar la imagen para que encaje en A4 manteniendo proporción
  scale_factor <- min(a4_w / img_w, a4_h / img_h)
  new_w <- img_w * scale_factor
  new_h <- img_h * scale_factor
  
  # Escalar imagen
  img_scaled <- image_scale(img, paste0(round(new_w), "x", round(new_h)))
  raster_img <- as.raster(img_scaled)
  
  # Dibujar imagen centrada
  grid.newpage()
  pushViewport(viewport(width = unit(new_w / a4_w, "npc"),
                        height = unit(new_h / a4_h, "npc"),
                        x = 0.5, y = 0.5, just = "center"))
  grid.raster(raster_img)
  popViewport()
}

dev.off()

# 📊 Mostrar imágenes con corrección (usar rasterGrob)
plots <- lapply(image_list, function(p) {
  img <- image_read(p)
  rasterGrob(as.raster(img), interpolate = FALSE)
})

grid.arrange(grobs = plots, ncol = length(plots))


Cargando paquete requerido: magick

"package 'magick' was built under R version 4.4.3"
Linking to ImageMagick 6.9.12.98
Enabled features: cairo, freetype, fftw, ghostscript, heic, lcms, pango, raw, rsvg, webp
Disabled features: fontconfig, x11

Cargando paquete requerido: gridExtra

Cargando paquete requerido: grid

