1
murmur 346 天前
html 转 pdf 用无头浏览器打印就行了
html 转 word 效果会很差 不建议使用 还是直接转 pdf 吧 word 转 html 也是 得用在线 office 预览 pdf 转 html 这个得 ocr 识别 收费没毛病 基于你的需求除了 html 转 pdf 估计都做不出来 |
2
xtreme1 346 天前
你比 knuth 还牛逼
|
3
wWjd5V5L0636B5YV 346 天前
之前做过 docx 转 html 的需求 恶心死了 关键字替换组件更恶心
|
4
wWjd5V5L0636B5YV 346 天前
@xiaogang530 用 Java 在后台硬拼接的 然后上传到 fastdfs
|
5
kilasuelika 346 天前 via Android 1
pandoc 不能满足要求吗
|
6
zydxn 346 天前
你自己做一个试试呗,别说转换了,导出 word 做的就很恶心,大多都是基于 FTL ( xml 格式)去做占位符和替换。
|
8
coyove 346 天前
html 转 pdf 还好,html 转 word 的需求点在哪,我们学校 60 岁的老教授都知道装个万能复制的插件了
|
9
siweipancc 346 天前 via iPhone
直接调 C 库啊,你还在折腾什么?一大堆开源的工具,非得自己实现个四不像?
|
10
charlestang 346 天前
不是有什么 pandoc 么?支持狂多格式互转。另外以前我做过 html 转 pdf ,有一个叫 wkhtmltopdf 的库,挺好用,转得效果不错的。还能转图片。
|
11
Mithril 346 天前
唯一能正常支持几乎所有源文件效果的转换格式的,就是 HTML 转 PDF 。
严格来说这都不能叫格式转换,而是“渲染”和“打印”。把 HTML 加 CSS 通过渲染得出结果,然后按照打印的方式将渲染结果输出到 PDF 里。 你可以用 puppeteer 等工具做到这一点,比如前面说的 wkhtmltopdf ,实际原理都是一样的,要么套了 Chrome 或者 CEF ,要么直接 WebKit 。都是用浏览器来做的,这样才能做到完美转换和渲染样式。 其他方法和格式转换都属于“勉强能用”。只有 PDF 这种可以通过虚拟打印机来做最终输出的格式,才能作为能适配大多数格式的转换目标。 所以你看大多格式都能转成 PDF ,但 PDF 再转回去就有各种问题了。 |
12
Aixtuz 346 天前
之前用过 Pandoc ,对格式要求不苛刻的话,感觉还行。
|
13
weijancc 346 天前
node 有一个 html 转 word 的, 效果还可以, https://github.com/privateOmega/html-to-docx
|
14
Skifary 346 天前
因为文件转换特别是 pdf 几乎是没有通用转换方法的,只能根据特定的格式做解析去解决特定的需求
|
15
abersheeran 346 天前
因为别人不想免费开发这种对于很多人都是刚需的东西。
|
16
duzhuo 345 天前 via Android
pandoc 咯
|
18
dode 345 天前
今年搞了 html 转 word 的功能,可以实现文字、图片、表格的全部转换
|