El HTML ha evolucionado mucho desde sus inicios y gracias a el somos capaces de visualizar páginas que se basan en su mayoría en texto -depende, por supuesto- pero que están adornadas con todo tipo de encabezados, fotografías que acompañan las palabras, y demás elementos. Sin embargo, en ocasiones podemos necesitar el texto en un formato menos rico, más plano.

Texto HTML a texto plano

A fin de cuentas, cualquiera que quiera dicho texto en formato de texto plano puede acceder al código fuente de la página, el cual interpreta el navegador, y guardarselo, el problema es que éste está lleno de los elementos típicos del lenguaje que hacen posible su formato, y que dependiendo de la complejidad de la página pueden ser muy abundantes, tanto como para perder bastante al lector del texto, eso por no hablar de casos en los que necesitemos dicha información para adaptarlo a otros formatos.

Por eso hoy he querido hacer esta nota en la que os hablo de dos utilidades para convertir texto HTML a texto plano, una desde Windows, muy potente y que sin duda no os decepcionará, y otra más simple para hacer operaciones sencillas desde el propio navegador. Empezamos.

HTMLasText (Windows)

Estamos ante una de las mejores aplicaciones al respecto que he visto, y en realidad por la cual estoy escribiendo este artículo. HTMLasText es simple pero potente, portable pero imprescindible si trabajamos con HTML y en ocasiones necesitamos texto sin formato. Su mayor ventaja sobre otros programas es que puede trabajar con múltiples archivos, convirtiéndose en una herramienta que puede servirnos para transformar sitios enteros en formato texto.

Aparte, las opciones de conversión son suficientemente intuitivas para que no haya que explicar que hacen. Tenemos todas estas disponibles:

  • Especificar los caracteres por línea
  • Añadir saltos de línea o separadores cada vez que se encuentren encabezados
  • Añadir el título o deshacernos de él
  • Incluir carácteres para marcar negritas (por ejemplo comillas, etc)
  • Respetar los centrados de texto
  • Respetar las alineaciones laterales de texto
  • Evitar elementos como tablas o separadores
  • Formateo de vínculos

La utilidad viene de la mano de NirSoft, compañía de software que dispone de otros programas conocidos como Battery Info View o My Uninstaller.

HTML to Text (Chrome)

HTML to Text es una utilidad muy similar pero esta vez que utilizamos bajo Google Chrome. Ideada para convertir texto HTML rápidamente a texto plano, en palabras de su autor, para hacer más entendible que el código, su utilización es realmente sencilla.

Al acceder a la extensión se nos muestra una caja de texto donde debemos pegar, manualmente, el texto HTML. Después simplmente tenemos que utilizar el botón de convertir para ver el resultado en una nueva caja de texto, donde se habrá eliminado todo el código y además los espacios en blanco restantes si así lo decidimos en la pantalla principal.

Se trata de una herramienta sencilla enfocada a gente que tenga que trabajar adaptando texto HTML, o que tal vez se encuentre realizando una migración y recopilando datos por algún motivo.