# 📘 PDF Power Hacks: Everything You Didn’t Know You Could Do with R and Your PDF Files  
### 🛡️ DIY in AI: Protect your data. Don’t upload it anywhere.

# 🐍 R | Split a PDF by Chapters using qpdf and pdftools 📄✂️  

## ❓Got a huge PDF like a thesis or manual and want to split it into manageable parts? 🙃  
With R and qpdf, you can do it locally and securely without uploading anything to the cloud.

## 👉 Solution  
📂 Split a PDF into multiple files by specific page intervals.  
📚 Perfect for organizing long documents and sharing only what you need.

## 🔧 How does it work?  
📦 Use pdftools to inspect the PDF and qpdf to split the file.  
🖥️ Run system commands from R for automation.

## 🔎 Why does it matter?  
🚀 Boosts productivity when working with large documents.  
🛡️ Keeps your data safe without relying on external services.  
🤖 Useful for data scientists, engineers, and analysts working with extensive reports.

## ✨ Real-world example:  
📖 Imagine a 30-page thesis divided into 3 chapters:  
🔹 Chapter 1: pages 1-10  
🔹 Chapter 2: pages 11-20  
🔹 Chapter 3: pages 21-30  
With R and qpdf, you can extract and save each chapter automatically as separate PDFs.

## ⚙️ Business impact:  
💡 Optimizes document management  
💡 Makes collaboration easier by sharing only needed sections  
💡 Automates manual workflows to save time

## 📊 Code summary  
📝 Creates a sample PDF with 30 numbered pages  
📂 Defines page ranges for chapters  
🔗 Uses qpdf called from R to split the PDF and save each chapter separately

🔗[Github](https://github.com/jcombari/RForAll/tree/main/PDF%20Power%20Hacks)  

## 💭 Thought:  
How would you organize your long documents to make your workflow more efficient? What other PDF files would you automate with R?

🔑 #RStats #DataScience #pdftools #qpdf #Automation #AI #TechForGood #DataPrivacy  

🔁 If you found this post useful, feel free to share it with your network.  
⚠️ Please do not copy or repost it as your own. Respect original work.

---

# 📘 PDF Power Hacks: Todo lo que no sabías que podías hacer con R y tus archivos PDF  
### 🛡️ DIY en IA: Protege tus datos. No los subas a ningún sitio.

# 🐍 R | Separar un PDF por capítulos con qpdf y pdftools 📄✂️  

## ❓¿Tienes un PDF grande como una tesis o manual técnico y quieres dividirlo en partes manejables? 🙃  
Con R y qpdf, puedes hacerlo localmente y de forma segura sin subir nada a la nube.

## 👉 Solución  
📂 Divide un PDF en varios archivos por intervalos de páginas específicos.  
📚 Ideal para organizar documentos largos y compartir solo lo que necesitas.

## 🔧 ¿Cómo funciona?  
📦 Usa pdftools para inspeccionar el PDF y qpdf para dividir el archivo.  
🖥️ Ejecuta comandos del sistema desde R para automatizar.

## 🔎 ¿Por qué importa?  
🚀 Aumenta la productividad al manejar documentos grandes.  
🛡️ Mantiene tus datos seguros sin depender de servicios externos.  
🤖 Útil para científicos de datos, ingenieros y analistas que trabajan con reportes extensos.

## ✨ Ejemplo real o Caso práctico:  
📖 Imagina una tesis de 30 páginas dividida en 3 capítulos:  
🔹 Capítulo 1: páginas 1-10  
🔹 Capítulo 2: páginas 11-20  
🔹 Capítulo 3: páginas 21-30  
Con R y qpdf, puedes extraer y guardar cada capítulo en un PDF separado automáticamente.

## ⚙️ Impacto en el negocio:  
💡 Optimiza la gestión documental  
💡 Facilita la colaboración al compartir solo la sección necesaria  
💡 Automatiza procesos manuales para ahorrar tiempo

## 📊 Resumen del código  
📝 Crea un PDF de muestra con 30 páginas numeradas  
📂 Define rangos de páginas para capítulos  
🔧 Usa qpdf desde R para dividir el PDF y guardar cada capítulo por separado

🔗[Github](https://github.com/jcombari/RForAll/tree/main/PDF%20Power%20Hacks)  

## 💭 Reflexión:  
¿Cómo organizarías tus documentos largos para hacer tu flujo de trabajo más eficiente? ¿Qué otros archivos PDF te gustaría automatizar con R?

🔑 #RStats #CienciaDeDatos #pdftools #qpdf #Automatización #IA #TechForGood #PrivacidadDeDatos  

🔁 Si te ha parecido útil, siéntete libre de compartir esta publicación con tu red.  
⚠️ Por favor, no la copies ni la publiques como propia. Respeta el trabajo original.


In [1]:
suppressWarnings(library(pdftools))
if (!require(pdftools)) install.packages("pdftools")
invisible(capture.output(suppressPackageStartupMessages(library(pdftools))))


if (!require(pdftools)) install.packages("pdftools")
suppressPackageStartupMessages(library(pdftools))

create_sample_pdf <- function(file) {
  pdf(file, width = 8.5, height = 11)
  for (i in 1:30) {
    plot.new()
    text(0.5, 0.5, paste("Page", i), cex = 4)
  }
  dev.off()
}

input_pdf <- "20250617_document.pdf"
create_sample_pdf(input_pdf)
cat("Sample PDF created:", input_pdf, "\n")

output_dir <- "20250617_pdf_files"
if (!dir.exists(output_dir)) {
  dir.create(output_dir)
  cat("Directory created:", output_dir, "\n")
} else {
  cat("Directory already exists:", output_dir, "\n")
}

chapters <- list(
  Chapter1 = 1:10,
  Chapter2 = 11:20,
  Chapter3 = 21:30
)

split_pdf <- function(input, output_dir, page_ranges) {
  for (name in names(page_ranges)) {
    pages <- page_ranges[[name]]
    output_file <- file.path(output_dir, paste0("20250617_", name, ".pdf"))
    page_range_str <- paste(range(pages), collapse = "-")
    cmd <- sprintf('qpdf "%s" --pages "%s" %s -- "%s"', input, input, page_range_str, output_file)
    
    cat("Running command:", cmd, "\n")
    res <- system(cmd, intern = TRUE, ignore.stderr = FALSE)
    if (length(res) > 0) cat(paste(res, collapse = "\n"), "\n")
  }
}

split_pdf(input_pdf, output_dir, chapters)

cat("PDF successfully split into chapters and saved in folder", output_dir, "\n")


Using poppler version 23.08.0



Sample PDF created: 20250617_document.pdf 
Directory already exists: 20250617_pdf_files 
Running command: qpdf "20250617_document.pdf" --pages "20250617_document.pdf" 1-10 -- "20250617_pdf_files/20250617_Chapter1.pdf" 
Running command: qpdf "20250617_document.pdf" --pages "20250617_document.pdf" 11-20 -- "20250617_pdf_files/20250617_Chapter2.pdf" 
Running command: qpdf "20250617_document.pdf" --pages "20250617_document.pdf" 21-30 -- "20250617_pdf_files/20250617_Chapter3.pdf" 
PDF successfully split into chapters and saved in folder 20250617_pdf_files 
