Ebook import sometimes messes up chapter order. #264

simjanos-dev · 2024-05-16T16:22:04Z

There should be an option to use the current default option, or order chapters by the element.

Someone sent me this code, I will look at it later.

def loadBook(file):
    # rp and rt tags are used in adding prononciation over words, we need to remove the content of the tags
    cleaner = lxml.html.clean.Cleaner(allow_tags=[''], remove_unknown_tags=False, kill_tags = ['rp','rt'], page_structure=False)
    content = ''
    book = epub.read_epub(file)
    items = list(book.get_items())
    spine_keys = {idref: ii for ii, (idref, _) in enumerate(book.spine)}
    sorted_items = sorted(items, key=lambda item: spine_keys.get(item.id, float('inf')))

    for item in sorted_items:
        if item.get_type() == ebooklib.ITEM_DOCUMENT:
            epubPage = cleaner.clean_html(item.get_content()).decode('utf-8')
            # needed to removed extra div created by cleaner...
            epubPage = lxml.html.fromstring(epubPage).text_content()
            content += epubPage

The text was updated successfully, but these errors were encountered:

simjanos-dev · 2024-05-21T23:30:46Z

Added an option to import e-books based on spine metadata. It fixes this issue.

simjanos-dev added the bug Something isn't working label May 16, 2024

simjanos-dev closed this as completed May 21, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Ebook import sometimes messes up chapter order. #264

Ebook import sometimes messes up chapter order. #264

simjanos-dev commented May 16, 2024 •

edited

simjanos-dev commented May 21, 2024

Ebook import sometimes messes up chapter order. #264

Ebook import sometimes messes up chapter order. #264

Comments

simjanos-dev commented May 16, 2024 • edited

simjanos-dev commented May 21, 2024

simjanos-dev commented May 16, 2024 •

edited