需求:
手上有几十万份 txt 文档,但是换行很混乱,目测是根据一定页面宽度去换行的。 往往一个句子还没完就换行了。
目标:
希望能将这些多余的换行去掉, 也许不需要多完美,只要把非句号的换行给去掉,留下句号结尾的换行,貌似就好很多了。
1
LittleWhiteMouse 2018-09-02 11:06:20 +08:00
正则表达式
|
2
herozhang OP @LittleWhiteMouse 现在用 python 简单谢了个脚本处理
|