среда, 15 мая 2013 г.

Отличный инструмент для преобразования документов PDF в нормальные HTML-страницы

Конвертер pdf2htmlEX — отличный инструмент для преобразования документов PDF в нормальные HTML-страницы, с сохранением форматирования. Конвертер на удивление хорошо справляется с разными документами, включая научные статьи, журналы, формулы и прочее.
Несколько примеров в качестве демонстрации. 
Типографика (LaTeX): HTML / PDF
Шпаргалка (математически формулы): HTML / PDF
Научная статья (текст и графики): HTML / PDF
Журнал Full Circle (для Linux-сообщества): HTML / PDF
Руководство Git: HTML / PDF
Конвертер старается бережно сохранить шрифты из PDF-документа и генерирует статичную страницу вполне приемлемого размера, примерно такого же, как оригинальный PDF-файл.
Код конвертера опубликован на github под GPLv3, его можно использовать в своих проектах. Например, можно сделать опцию предварительного просмотра PDF на сайте, пригодится для просмотра газет, журналов, книг, резюме и прочей информации, которую в интернете часто публикуют в формате PDF. Более того, теперь можно создавать полноценные веб-страницы прямо в математическом редакторе LaTeX!

Сравнение pdf2htmlEX с другими методами преобразования PDF в вебе см.здесь.

Комментариев нет:

Отправить комментарий