Según la Wikipedia:
CHM (Microsoft Compiled HTML Help) es un formato privativo de ayuda en lÃnea desarrollado por Microsoft. Se publicó por primera vez en 1997 como sucesor del formato Microsoft WinHelp Format.
Hace poco conseguà unos e-books en este formato, pero no me agrada mucho la interfaz de la utilidad que hay en Kubuntu para abrirlos. Gracias a Ubuntu Geek aprendà a convertir estos archivos a un formato más amigable como es el PDF utilizando CHM2PDF.
En Debian/(K)Ubuntu lo instalamos por Adept o por consola:
sudo apt-get install chm2pdf
Los CHM son páginas web empaquetadas dentro de un archivo. Hay dos tipos de archivos CHM: los que contienen HTML no estructurado y los que contienen HTML estructurado (con encabezados, capÃtulos, etc.).
Convertir CHM a PDF
Si tenemos un CHM no estructurado, ejecutamos:
chm2pdf --webpage nombre.chm
Se creará un archivo nombre.pdf
Si nuestro archivo CHM es estructurado, ejecutamos:
chm2pdf --book nombre.chm
¿Y cómo saber si nuestro archivo CHM es o no estructurado? A ciencia cierta no lo se, pero si intentan el segundo comando y su archivo no es estructurado, saltará un error
Extraer el contenido de un CHM
Como mencioné antes, los archivos CHM empaquetan páginas web. Es posible entonces extraer su contenido:
chm2pdf --extract-only nombre.chm
Esto extraerá todos los html contenidos y los guardará en la ruta: /tmp/chm2pdf/orig/.
Para conocer las diversas opciones de la utilidad: chm2pdf --help




One Comentario
Es genial, además haciendo una búsqueda con aptitude search para ver de que se trata se ve que es un script de python. Genial.
Un Trackback
[...] VÃa: El Modem.com [...]