从PDF中复制文字到word时,都会有回车符,要一个一个删掉回车符会非常麻烦,这里介绍一下怎么在word中整体替换掉回车符。
其实在word中替换掉回车符也挺麻烦的,因此我用python编写了一个exe可执行程序,可在windows下直接运行,它可以方便快捷地去除回车符,还是一个翻译器,具体可见:
超实用可执行程序-PDF文字复制后的回车符去除和谷歌百度英汉翻译-python GUI
下面是在word中整体替换掉回车符的步骤:
步骤
step1:把PDF中的文字复制到word中,并选中要删掉回车符的部分,如下图中灰色部分所示:
step2:选择word中的替换,快捷键是Ctrl+H,「查找内容」一栏里填入「^p」(一定要英文输入法情况下输入),「替换为」一栏空着不填。最后,单击全部替换
step3:之后在弹出框时选择否,如果选择是,它会继续搜索除我们选中的其它区域。选择否则停止搜索,你将得到删除回车符之后的文字。
针对英文
以上是针对中文PDF复制的情况,如果是英文PDF复制,因为英文之间是有空格符的,因此要注意的是「替换为」一栏要填上空格,这样就是用空格去替换回车符。
替换操作前:
替换操作后:
多段复制
另外,当一次性复制多段文字时,因为复制过来每段前的空格不会被保留,因此,在用上述方法替换之后,不同段落会连在一起,如下面情况所示:
PDF截图:
word截图:
替换后截图:
可以看到替换后段落连在了一起,需要手动回车。
注意
- 在执行替换操作前,可以先选中要操作的部分,如上面图中的灰色部分所示,这样替换操作只对灰色部分作用,而如果提前未选中,则是对全文进行操作
- 中文文字的「替换为」一栏什么也不填,英文文字的「替换为」一栏是空格
- 文字可以一次复制一段,这样容易分段;也可以一次复制多段,但每次选中一段进行替换操作,或全部替换后再手动分段。