четверг, 11 марта 2010 г.

fprog.ru на букридер, без pdf

Задумался, что и правда неплохо было бы иметь возможность читать журнал fprog.ru на букридере в формате, отличном от pdf (например в fb2). Готовых конверторов из latex в fb2 с наскока не нашел.
Нужно будет попозже поглядеть на Hevea (конвертор latex в html). Также глянуть на plasTeX (Python framework for processing LaTeX document).

Есть резон не заморачиваться с latex'ом, а конвертировать сразу из html (статьи доступны и в этом формате). Из готовых юниксовых конвертеров на глаза попался только html2fb. Хоть он и не обновлялся с 2008 года, но результат оказался не таким уж удручающим.
Отработал скрипт без падений (python2.6) на статье Р.Душина из четвертого номера. Сходу увидел следующие огрехи в сформированном fb2-документе:
  • не проставлены линки на примечания, хотя из самих примечаний линк на место в тексте есть;
  • проблема с фрагментами кода в квадратных скобках, которые распознаются как ссылки на литературу;
  • настоящие линки на литературу не работают;
  • заметил отсутствие subscript и superscript;
  • многострочный код сливается в одну строку, но это уже ньюанс в форматировании исходного html.
Вообщем, я вполне его работой удовлетворен, и пока не вижу проблем, которые было бы трудно исправить: в конвертере или в самих исходных документах (или утилита, которая предварительно подготавливает исходные документы.

Может имеет смысл обратить внимание и на другие открытые форматы электронных книг, кроме fb2 (типа epub или prc), позже на них нужно не забыть взглянуть.

1 комментарий:

Анонимный комментирует...

есть calibre и формат epub - не пробовали?