# 📘 PDF Power Hacks: Everything You Didn’t Know You Could Do with R and Your PDF Files  
### 🛡️ DIY in AI: Protect your data. Don’t upload it anywhere.

# 🐍 R | Split a PDF by Chapters using qpdf and pdftools 📄✂️  

## ❓Got a huge PDF like a thesis or manual and want to split it into manageable parts? 🙃  
With R and qpdf, you can do it locally and securely without uploading anything to the cloud.

## 👉 Solution  
📂 Split a PDF into multiple files by specific page intervals.  
📚 Perfect for organizing long documents and sharing only what you need.

## 🔧 How does it work?  
📦 Use pdftools to inspect the PDF and qpdf to split the file.  
🖥️ Run system commands from R for automation.

## 🔎 Why does it matter?  
🚀 Boosts productivity when working with large documents.  
🛡️ Keeps your data safe without relying on external services.  
🤖 Useful for data scientists, engineers, and analysts working with extensive reports.

## ✨ Real-world example:  
📖 Imagine a 30-page thesis divided into 3 chapters:  
🔹 Chapter 1: pages 1-10  
🔹 Chapter 2: pages 11-20  
🔹 Chapter 3: pages 21-30  
With R and qpdf, you can extract and save each chapter automatically as separate PDFs.

## ⚙️ Business impact:  
💡 Optimizes document management  
💡 Makes collaboration easier by sharing only needed sections  
💡 Automates manual workflows to save time

## 📊 Code summary  
📝 Creates a sample PDF with 30 numbered pages  
📂 Defines page ranges for chapters  
🔗 Uses qpdf called from R to split the PDF and save each chapter separately

## 🔗 GitHub (RForAll)

## 💭 Thought:  
How would you organize your long documents to make your workflow more efficient? What other PDF files would you automate with R?

🔑 #RStats #DataScience #pdftools #qpdf #Automation #AI #TechForGood #DataPrivacy  

🔁 If you found this post useful, feel free to share it with your network.  
⚠️ Please do not copy or repost it as your own. Respect original work.

---

# 📘 PDF Power Hacks: Todo lo que no sabías que podías hacer con R y tus archivos PDF  
### 🛡️ DIY en IA: Protege tus datos. No los subas a ningún sitio.

# 🐍 R | Separar un PDF por capítulos con qpdf y pdftools 📄✂️  

## ❓¿Tienes un PDF grande como una tesis o manual técnico y quieres dividirlo en partes manejables? 🙃  
Con R y qpdf, puedes hacerlo localmente y de forma segura sin subir nada a la nube.

## 👉 Solución  
📂 Divide un PDF en varios archivos por intervalos de páginas específicos.  
📚 Ideal para organizar documentos largos y compartir solo lo que necesitas.

## 🔧 ¿Cómo funciona?  
📦 Usa pdftools para inspeccionar el PDF y qpdf para dividir el archivo.  
🖥️ Ejecuta comandos del sistema desde R para automatizar.

## 🔎 ¿Por qué importa?  
🚀 Aumenta la productividad al manejar documentos grandes.  
🛡️ Mantiene tus datos seguros sin depender de servicios externos.  
🤖 Útil para científicos de datos, ingenieros y analistas que trabajan con reportes extensos.

## ✨ Ejemplo real o Caso práctico:  
📖 Imagina una tesis de 30 páginas dividida en 3 capítulos:  
🔹 Capítulo 1: páginas 1-10  
🔹 Capítulo 2: páginas 11-20  
🔹 Capítulo 3: páginas 21-30  
Con R y qpdf, puedes extraer y guardar cada capítulo en un PDF separado automáticamente.

## ⚙️ Impacto en el negocio:  
💡 Optimiza la gestión documental  
💡 Facilita la colaboración al compartir solo la sección necesaria  
💡 Automatiza procesos manuales para ahorrar tiempo

## 📊 Resumen del código  
📝 Crea un PDF de muestra con 30 páginas numeradas  
📂 Define rangos de páginas para capítulos  
🔧 Usa qpdf desde R para dividir el PDF y guardar cada capítulo por separado

## 🔗 GitHub (RForAll)

## 💭 Reflexión:  
¿Cómo organizarías tus documentos largos para hacer tu flujo de trabajo más eficiente? ¿Qué otros archivos PDF te gustaría automatizar con R?

🔑 #RStats #CienciaDeDatos #pdftools #qpdf #Automatización #IA #TechForGood #PrivacidadDeDatos  

🔁 Si te ha parecido útil, siéntete libre de compartir esta publicación con tu red.  
⚠️ Por favor, no la copies ni la publiques como propia. Respeta el trabajo original.


In [5]:
# Instalar si es necesario: install.packages("pdftools")
library(pdftools)

# Crear un PDF de ejemplo (necesita tener `ghostscript` o `cairo`)
create_sample_pdf <- function(filename, total_pages = 30) {
  pdf(filename)
  for (i in 1:total_pages) {
    plot.new()
    text(0.5, 0.5, paste("Page", i), cex = 3)
  }
  dev.off()
}

# Crear PDF de ejemplo
sample_pdf <- "20250617_document.pdf"
create_sample_pdf(sample_pdf)

# Define capítulos como rangos de páginas
chapter_ranges <- list(
  c(1, 10),
  c(11, 20),
  c(21, 30)
)

# Crear carpeta de salida si no existe
output_folder <- "20250617_pdf_files"
if (!dir.exists(output_folder)) {
  dir.create(output_folder)
}

# Función para dividir el PDF usando qpdf
split_pdf_by_chapters <- function(input_pdf, output_prefix, output_folder, chapters) {
  for (i in seq_along(chapters)) {
    range <- chapters[[i]]
    output_file <- file.path(output_folder, paste0(output_prefix, "_Chapter_", i, ".pdf"))
    cmd <- sprintf("qpdf '%s' --pages . %d-%d -- '%s'",
                   input_pdf, range[1], range[2], output_file)
    system(cmd)
    message(sprintf("Saved Chapter %d: %s", i, output_file))
  }
}

# Dividir PDF por capítulos
split_pdf_by_chapters(sample_pdf, "20250617", output_folder, chapter_ranges)


"package 'pdftools' was built under R version 4.4.3"
Using poppler version 23.08.0



"'qpdf' not found"
Saved Chapter 1: 20250617_pdf_files/20250617_Chapter_1.pdf

"'qpdf' not found"
Saved Chapter 2: 20250617_pdf_files/20250617_Chapter_2.pdf

"'qpdf' not found"
Saved Chapter 3: 20250617_pdf_files/20250617_Chapter_3.pdf



In [17]:
# Oculta mensajes del paquete
suppressPackageStartupMessages(library(pdftools))

# Crear un PDF de ejemplo
create_sample_pdf <- function(filename, total_pages = 30) {
  pdf(filename)
  for (i in 1:total_pages) {
    plot.new()
    text(0.5, 0.5, paste("Page", i), cex = 3)
  }
  dev.off()
}

# Crear PDF
sample_pdf <- "20250617_document.pdf"
create_sample_pdf(sample_pdf)

# Rango de capítulos
chapter_ranges <- list(
  c(1, 10),
  c(11, 20),
  c(21, 30)
)

# Carpeta de salida
output_folder <- "20250617_pdf_files"
if (!dir.exists(output_folder)) dir.create(output_folder)

# Dividir PDF por capítulos usando qpdf
split_pdf_by_chapters <- function(input_pdf, output_prefix, output_folder, chapters) {
  qpdf_path <- Sys.which("qpdf")
  if (qpdf_path == "") {
    warning("'qpdf' not found. Please install qpdf and ensure it is in your PATH.")
    return(invisible(NULL))
  }
  for (i in seq_along(chapters)) {
    range <- chapters[[i]]
    output_file <- file.path(output_folder, paste0(output_prefix, "_Chapter_", i, ".pdf"))
    cmd <- sprintf("qpdf '%s' --pages . %d-%d -- '%s'",
                   input_pdf, range[1], range[2], output_file)
    suppressWarnings(system(cmd))
    message(sprintf("✅ Saved Chapter %d: %s", i, output_file))
  }
}

# Ejecutar división
split_pdf_by_chapters(sample_pdf, "20250617", output_folder, chapter_ranges)


"'qpdf' not found. Please install qpdf and ensure it is in your PATH."


In [15]:
install.packages("qpdf")


Installing package into 'C:/Users/jenny/AppData/Local/R/win-library/4.4'
(as 'lib' is unspecified)



package 'qpdf' successfully unpacked and MD5 sums checked


"cannot remove prior installation of package 'qpdf'"
"problema al copiar C:\Users\jenny\AppData\Local\R\win-library\4.4\00LOCK\qpdf\libs\x64\qpdf.dll  a C:\Users\jenny\AppData\Local\R\win-library\4.4\qpdf\libs\x64\qpdf.dll: Permission denied"
"restored 'qpdf'"



The downloaded binary packages are in
	C:\Users\jenny\AppData\Local\Temp\RtmpEVHopL\downloaded_packages
