玩蛇网提供最新Python编程技术信息以及Python资源下载!

用python下载gitbook上的pdf书籍后 如何转化为html

如题,,,

想把转化后的html丢进nginx中, 请问如何转为html。。。。。。。

你不如使用pdf.js直接在网页里加载PDF

直接weg下载gitbook目录不可么?

这个问题分两部分回答吧:

  1. PDF 转 HTML;
    PDF 和 HTML 结构差别极大,和epub比之HTML(epub只是HTML/XHTML的封装)

或者 Markdown 比之HTML(Markdown和HTML逻辑结构类似)有本质的区别。
目前有很多转换工具,可以用谷歌搜:PDF to HTML。需要注意的是,转换效果都不会很好

  1. Gitbook上的PDF文档是由其它格式转换而来的(默认Markdown)。即 Markdown -> PDF;
    所以你可以尝试获取该PDF的Markdown源码,再转换成HTML。

建议选择这条路。

有个第三方python库可以很轻松解决这个问题,这个是项目的托管地址

[https://github.com/coolwanglu...

它的具体用法在这里
https://github.com/coolwanglu...

http://app.xunjiepdf.com/pdf2...

楼主你是不是在一个Python-flask的群里。。昵称彼岸花开。。

玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/wenda/wd13835.html

相关文章 Recommend

玩蛇网Python互助QQ群,欢迎加入-->: 106381465 玩蛇网Python新手群
修订日期:2017年05月31日 - 17时28分04秒 发布自玩蛇网

您现在的位置: 玩蛇网首页 > Python问题解答 > 正文内容
我要分享到:

必知PYTHON教程 Must Know PYTHON Tutorials

必知PYTHON模块 Must Know PYTHON Modules