Icono del sitio BorrowBits

Cómo descargar un backup de todas tus publicaciones de Tumblr (y guardarlo en el formato que quieras)

tutorialtumblrxml_5

Tras una breve pero tortuosa investigación, os comparto la solución a un problema que parece estar poco documentado: cómo guardar todas las publicaciones de una cuenta de Tumblr en un documento de Word, Writer, Google Drive, HTML (o el formato que queráis).

En mi caso particular, lo que pretendía era obtener un backup de todos mis posts publicados en Tumblr hasta la fecha, y almacenarlos posteriormente en un documento de Word.

Al principio, se me ocurrió lo más evidente: ir copiando las entradas una a una, mediante copy-paste manual, hasta que me dí cuenta de que tenía cerca de 200 entradas.

Aquí os presento una solución bastante cutre, pero rápida en la misma medida.

Si tienes prisa y no quieres leer milongas, haz scroll down hasta donde pone Resumen express. Si en cambio quieres saber lo que estás haciendo, sigue leyendo desde aquí:

Problema 1: cómo descargar de un plumazo todo el contenido de Tumblr

A diferencia de Twitter, la plataforma Tumblr no incluye – a día de hoy – una función que te permita descargar todos tus posts de un golpe, a modo de backup.

Si a estas alturas se te ha ocurrido utilizar el feed RSS (que se obtiene a través de «usuario.tumblr.com/rss») ya te puedes ir olvidando: sólo descarga las 10 ó 15 publicaciones últimas. Hace falta algo más sofisticado.

Existen plataformas de pago como Frostbox que te permiten hacer copias de seguridad de los timeline de casi todas tus redes sociales. El problema es que no tienen un servicio de un solo uso: tienes que suscribirte y pagar durante meses o años. Así pues, para este caso particular no es una solución adecuada. Además, para estas cosas soy un poco rata…

En fin, que lo más sencillo para este caso sería utilizar la app gratuita online Tumblr2Wordpress. Lo único que hace es descargar todo el contenido de una cuenta cualquiera de Tumblr en un archivo XML de Wordpress.

En la siguiente imagen tenéis un «paso a paso» simplificado:

Debo advertiros que, al exportar una cuenta de Tumblr así, se podría perder información valiosa: metadatos, comentarios, ciertos posts multimedia… Es importante que le echéis un ojo al fichero XML y os vayáis a la sección de «Warnings» para comprobar si se ha quedado algo pendiente:

Problema 2: cómo convertir o renderizar un archivo XML de Wordpress en HTML «bonito»

El problema lo hemos solucionado, pero sólo parcialmente: ahora tenemos nuestro contenido descargado en un archivo XML que sólo Wordpress comprende. La pregunta que surge de forma natural en las mentes despiertas es:

¿Existe alguna forma de «parsear» ese archivo XML de Wordpress en un HTML «bonito» que podamos copiar y pegar en un documento de Word?

Sí, claro que la hay.

Solución 2.1: podrías simplemente importar tu archivo XML en una cuenta de Wordpress, pero entonces estaríamos igual que al principio, con la diferencia de que el contenido estará alojado en Wordpress en lugar de Tumblr.

Solución 2.2: algunos sugieren utilizar el procesador XML embebido de Wordpress para mostrar ese contenido ya renderizado y procesado como HTML en el navegador. El objetivo sería crear un pequeño script PHP para leer ese XML automáticamente con un include_once de ese script (el archivo XML debe estar cargado en alguna carpeta del servidor accesible por Wordpress)… Pero bueno, a estas alturas seguro que os habéis dado cuenta de que soy un poco vago. Además mis superpoderes de programación están un poco oxidados. Y lo más importante: hoy es domingo.

He aquí una solución rápida y elegante:

Solución 2.3: traducir XML Wordpress en HTML mediante fichero XSLT

Una de las características que hace de XML en un formato tan potente es su flexibilidad para ser transformado en cualquier otra cosa que no sea XML. Para este asunto particular, existe un estándar llamado XSLT o también Transformaciones XSL. Mediante una hoja de estilo XSLT, podemos realizar una traducción de unas reglas XML en otras. En este caso, necesitamos un fichero XSLT que permita convertir el fichero XML de Wordpress en HTML de toda la vida.

Aunque nosotros mismos podríamos escribir estas traducciones, invertiríamos demasiada energía, y yo ya he buscado para vosotros el dichoso archivo.

Hélo aquí, en GibHub:

Una vez lo hayamos descargado, sólo tenemos que llevárnoslo a cualquiera de los muchos conversores-parseadores-formateadores que hay en Internet, como CoolUtils.com o FreeFormater.com.

En el ejemplo he usado el segundo, FreeFormater, que a mí me funcionó mejor:

Entonces obtendremos un output completamente en HTML que podremos guardar en un fichero .html, que a su vez podremos abrir con nuestro editor de texto favorito: Word, Libre Office, Google Drive, etc:

Resumen Express

«No me calientes la cabeza y dime cómo se hace».

Ok, si te pones así… aquí va la versión resumida de todo lo que hemos visto arriba:

 

Espero que os sea útil. Quedo a vuestra disposición en comentarios si necesitáis ayuda o aclaraciones.

¡Feliz domingo!

Salir de la versión móvil