V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  stormfeng  ›  全部回复第 1 页 / 共 1 页
回复总数  2
@stormfeng 直接 CV 大法该代码 会有 3 个坑,
1 ) 去除水印的 pdf 损坏打不开; 2 )文字水印无法去除; 3 )无法去除图片水印。

我调试了半天才发现, 应该是防止 CV 大师们随意施展大法吧,挺好。
1 )这行代码,会导致 pdf 文件损坏,直接 注释掉这行代码即可。
// document.removePage(document.getNumberOfPages() - 1);

2 ) replaceText(page, "Ltd.", ""); // 这里的几行代码,要改成 跟你的看到的水印一毛一样的。aspose 不同的版本,水印文字也有差异。否则无法删除。

3 )该行代码,参数 X1 可调,removeImage(page, "X1"); // 可以改为 X2 X3 等等,数字代表 遍历到的图片序号

总结:
改好的代码,已经上传了,here
https://blog.csdn.net/w1047667241/article/details/125431049
楼上各种方案,都不是 博主想要的 maven 呀!
1 )调接口? 还要尼玛的注册 aliyun 沙雕账号,还要实名制的手机号? 接口还收费,尼玛什么玩意。
如果所有的需求都去调接口,那还要程序猿干什么? 程序媛就够了呢
2 )调 wps 或者 windows 接口? 你以为你部署在自己的 windows 测试自己玩呢? 谁的 项目不是跑在线上的 linux 呀
3 )调 libreoffice ? 你让运维给你现场去装 这个 软件到 linux 服务器吗? 运维问: 你谁啊你?
4 )还有的 调用 google doc 或者 微软 doc 在线接口的,我就问问了,你们的老大知道你把 文档远程传输到外网了吗?
5 ) fr.opensagres.xdocreport.core , 这个其实是需要 POI 的,并且不支持 word 中有表格的,会报错的。
6 ) aspose-word , 效果虽好,但是 收费,有水印。https://zh.blog.aspose.com/2021/04/23/%E5%9C%A8java%E4%B8%AD%E4%BB%A5%E7%BC%96%E7%A8%8B%E6%96%B9%E5%BC%8F%E5%B0%86word-doc-docx%E8%BD%AC%E6%8D%A2%E4%B8%BApdf/
7 ) spire doc ,效果也不错,但是 收费,有水印
https://www.e-iceblue.cn/spiredocforjavaconversion/java-convert-word-to-pdf.html
8 ) jOfficeConvert:demo 看起来不错,但是收费,而且还看不到源码 。 官网只是说自己使用了 Microsoft Word Viewing Technology 实现的。但是 完全搜索不到相关信息在 微软的官网。所以,难道就是 windows seerver 服务器本地装了 office 进行转换的 ?
https://www.qoppa.com/pdfhtml/demo/html5-pdf-viewer-live-demo/
9 ) openoffice 和 jodconverter 没试过,没有发言权。
10)其他方案,大部分看了,都是垃圾,要么 项目太老了,要么太新了,不匹配旧的 POI 和 jdk7 , https://stackoverflow.com/questions/3022376/how-can-i-convert-a-word-document-to-pdf
综上:
思路如下: 用收费版的 先把 word 转换为 pdf ,然后再把其中的水印去掉!
具体的代码都有了:
http://www.codebaoku.com/it-java/it-java-250846.html
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1097 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 10ms · UTC 22:37 · PVG 06:37 · LAX 14:37 · JFK 17:37
Developed with CodeLauncher
♥ Do have faith in what you're doing.