¿Puedo convertir ePub a cadena mediante programación?

1. Descomprima el EPUB (los archivos EPUB son en realidad archivos ZIP)
2. Busque el documento del paquete (el archivo `.opf`)
3. Enumere los elementos “ en el archivo OPF (un documento XML. El itemrefs define el orden de lectura de los documentos de contenido, por lo que debe procesarlos en orden de ocurrencia)
4. Para cada elemento “, busque el elemento correspondiente “ (como ejemplo, “ se referiría a algo como ` `)
5. Convierta el archivo HTML (X) al que se hace referencia en el atributo ítems `href` en texto. Hay muchas herramientas por ahí si las busca, no sé cuáles son las mejores. También podría escribir su propio bastante rápidamente usando algunas expresiones regulares o XPath si solo desea obtener una salida básica.
6. Si lo desea, combine los archivos de texto resultantes en un archivo de texto en el orden en que fueron procesados.