Cómo modificar los metadatos de un archivo PDF con Pdftk en Linux

Aunque no es algo que necesitemos hacer con demasiada frecuencia, puede darse el caso de que necesitemos modificar los metadatos de un archivo PDF con nuestro Linux. En este caso de querer editar los metadatos, no nos servirá el habitual PDFedit, ya que éste no puede editarlos. Por contra, recurriremos al maravilloso PDF Toolkit o pdftk.

Los pasos son:

  1. Instalar, si no lo tenemos ya, el pdfk desde nuestros repositorios. En distribuciones de la familia de Debian será suficiente con el habitual # apt-get install pdftk.
  2. Componer un pequeño archivo de texto en el que introducimos los metadatos básicos que queremos meter en nuestro PDF. Con un editor tipo Gedit creamos un archivo que tenga la siguiente pinta:

    InfoKey: Title
    InfoValue: La neutralidad de la Red
    InfoKey: Subject
    InfoValue: Por qué es una pésima idea acabar con la neutralidad de la Red
    InfoKey: Keywords
    InfoValue: Sociotecnología, Internet, Neutralidad de la Red, Economía
    InfoKey: Author
    InfoValue: Jose Alcántara
    InfoKey: Creator
    InfoValue: TeX
    InfoKey: Producer
    InfoValue: pdftk
    InfoKey: CreationDate
    InfoValue: D:20101023140009
    NumberOfPages: 116

    Es deseable, claro, que adaptéis los valores de los parámetros a lo que necesitéis realmente ;)

  3. Suponiendo que nuestro pdf se llame «neutralidad.pdf», que el archivo con los metadatos se llame «metadatos.txt» y ambos estén en el mismo directorio, abrimos una terminal de comandos y nos movemos hasta el directorio que contiene nuestros dos archivos. Una vez ahí ejecutamos $ pdftk neutralidad.pdf update_info metadatos.txt output neutralidad-con-metadatos.pdf, que nos generará un nuevo documento con nombre «neutralidad-con-metadatos.pdf».

Y esto es todo, la info básica la saque de Lagotzki.de, y sólo he sacado el grano para ponerlo en español.

Doctor en Química laser especializado en desarrollo de hardware para análisis. Consultor y Project Manager. Autor de los libros publicados La sociedad de control y La neutralidad de la Red.

2 Comments

  1. Hola a todos,

    Llevo mucho tiempo queriendo modificar las propiedades de los pdf’s, porque tengo un ebook y los nombres que aparecen en la lista de selección no son los del nombre del archivo, sino los que aparecen en los metadatos, y la mayoría de los pdf’s que hay por ahí tienen mal puestos los metadatos. Ya había hecho scripts con pdftk, pero no sabía que podía hacer esto (suponía que era capaz, porque es muy potente), pero desde luego, no tenía ni idea de cómo hacerlo. Te agradezco mucho la información, da gusto ver cómo en el mundo del software libre la gente se ayuda y se propaga el conocimiento.

    Un saludo

    • ¡Me alegro que te sirviera! Yo indagué precisamente por ese motivo, mi lector electrónico carga metadatos y la mayoría de los documentos o no tenía metadatos o tenía metadatos irrelevantes (con títulos tipo «Documento sin título 1», que no sirven de nada).

Submit a comment