Qué hace que un PDF pese tanto: imágenes, fuentes y metadatos
Entender qué ocupa espacio en un PDF te ayuda a comprimirlo de forma más inteligente. Desglose técnico con ejemplos reales.
- 1. 1. Imágenes: el mayor culpable (60–95% del tamaño)
- 2. 2. Fuentes: más de lo que imaginas (50 KB – 2 MB)
- 3. 3. Metadatos (generalmente < 1 MB, pero acumulable)
- 4. 4. Estructura interna del PDF
- 5. 5. Streams de contenido (texto y vectores)
- 6. Cómo saber qué ocupa más en tu PDF
- 7. Implicación práctica para comprimir
Qué hace que un PDF pese tanto: imágenes, fuentes y metadatos
Para comprimir un PDF eficientemente, hay que entender qué ocupa espacio dentro del archivo. Un PDF no es un contenedor simple: tiene una estructura interna con múltiples componentes.
1. Imágenes: el mayor culpable (60–95% del tamaño)
Las imágenes son con diferencia el componente que más peso añade a un PDF.
Por qué pesan tanto:
- Una foto de 12 megapíxeles puede ocupar 8–15 MB sin comprimir
- Un PDF con 20 páginas de catálogo puede tener 20–100 imágenes embebidas
- Los escáneres guardan cada página como imagen a 300 DPI
Cómo se comprime: reduciendo la resolución DPI y aumentando la compresión JPEG. Para pantalla, 96–150 DPI es suficiente.
2. Fuentes: más de lo que imaginas (50 KB – 2 MB)
Las fuentes (tipografías) se pueden embeber de dos formas:
- Fuente completa embebida: el archivo incluye todos los glifos del alfabeto aunque solo uses 50 caracteres. Puede añadir 500 KB – 2 MB por fuente.
- Subsetting: solo se embeben los glifos realmente usados. Una fuente con solo los caracteres de tu documento puede pesar 10–50 KB.
Los buenos exportadores de PDF (Word, LibreOffice, la mayoría de apps modernas) hacen subsetting automáticamente. Los PDFs antiguos o generados por algunos programas incluyen fuentes completas.
3. Metadatos (generalmente < 1 MB, pero acumulable)
Los PDFs pueden incluir:
- Metadatos XMP: autor, fechas, descripción, palabras clave
- Historial de versiones: cambios anteriores del documento
- Miniaturas de página: vistas previas en alta resolución de cada página
- Capas de diseño: información de capas de InDesign o Illustrator
- Comentarios y anotaciones: todos los comentarios de revisión acumulados
- Adjuntos embebidos: otros documentos dentro del PDF
En PDFs editados repetidamente, los metadatos pueden llegar a añadir varios MB.
4. Estructura interna del PDF
El formato PDF tiene una tabla de referencias cruzadas (xref) que puede crecer y fragmentarse con el tiempo si el archivo ha sido editado muchas veces. La "linearización" o "optimización web" del PDF reorganiza esta estructura y puede reducir el tamaño un 5–15%.
5. Streams de contenido (texto y vectores)
El texto y los gráficos vectoriales en PDF se guardan como streams. Pueden comprimirse con Flate (zip), lo que generalmente ya están. Pero si el archivo es antiguo, puede no tener esta compresión activa.
Cómo saber qué ocupa más en tu PDF
Puedes usar Acrobat Pro (Archivo → Propiedades → Descripción) o herramientas como pdfinfo para ver la composición del archivo.
En general: si tu PDF tiene imágenes, están ocupando el 80–95% del espacio total.
Implicación práctica para comprimir
| Componente | Acción de compresión |
|---|---|
| Imágenes | Reducir DPI y aumentar compresión JPEG |
| Fuentes | Hacer subsetting (solo caracteres usados) |
| Metadatos | Eliminar historial, miniaturas y capas innecesarias |
| Estructura | Linearizar y compactar la tabla xref |
ReducirPDF aplica todas estas optimizaciones automáticamente cuando comprimes un archivo.