Extraer imaxes dun pdf
Explícase cómo extraer as imaxes que contén un .pdf a través dun comando da terminal.
Instalación do paquete
Vamos requerir o paquete “poppler” nalgunhas distros tamén pode facer falta o “poppler-utils”.
Instalación necesaria en arch:
sudo pacman -S poppler
Argumentos
- -f
: Elixes a primeira páxina do PDF a procesar. - -l
: Elixes a última páxina do PDF a procesar. - -j: Elixes que as imaxes saian en formato .jpg en lugar do orixinal da mesma.
- -png: Elixes que saian as imaxes en .png .
Extraemos tódalas imaxes en .jpg nun directorio indicado:
pdfimages -j <fichero_pdf> <directorio_donde_extraer_las_imagenes>
Con iso xa teriamos extraídalas imaxes do ficheiro .pdf .