1. Descomprima el EPUB (los archivos EPUB son en realidad archivos ZIP)
2. Busque el documento del paquete (el archivo `.opf`)
3. Enumere los elementos “ en el archivo OPF (un documento XML. El itemrefs define el orden de lectura de los documentos de contenido, por lo que debe procesarlos en orden de ocurrencia)
4. Para cada elemento “, busque el elemento correspondiente “ (como ejemplo, “ se referiría a algo como ` `)
5. Convierta el archivo HTML (X) al que se hace referencia en el atributo ítems `href` en texto. Hay muchas herramientas por ahí si las busca, no sé cuáles son las mejores. También podría escribir su propio bastante rápidamente usando algunas expresiones regulares o XPath si solo desea obtener una salida básica.
6. Si lo desea, combine los archivos de texto resultantes en un archivo de texto en el orden en que fueron procesados.
¿Puedo convertir ePub a cadena mediante programación?
Related Content
¿Cómo convierto un .png en un .jpg?
More Interesting
¿Qué servicios de conversión son los mejores?
¿Cómo puedo convertir un archivo XML a un archivo de texto usando XPath?
Microsoft Publisher: ¿Cómo se convierte un archivo pub de ms office en formato ePub?
¿Hay alguna empresa que convierta documentos financieros archivados (formato XML o PDF) a XBRL?
¿Cómo se convierte un archivo hexadecimal en un archivo jpg?
¿Qué software PDF puede recomendar para convertir mis facturas guardadas?