巧借“虚空”拨乱反正

软件先锋 2015-12-26 06:57网络整理点击: 标签:

空格是一个符号,但如果连空格也没有,那么就显得更空虚了。你别小瞧这空虚的东西,它能让你的文章版面“拨乱反正”呢。

如今,不少人都学会了从网上引用文字来充实自己的文章内容。这不,某校的大教授也知道从外国网站上扒文章据为己有了。我们且不说这拷贝文字使用的合法与否,自己收藏点好文章阅读总还是可以的吧。今天,我们主要说说拷贝来的文章的在处理上遇到的一个麻烦问题——随处可见的不规律空格或者是有规律的多余字串的问题。

由于文章中出现的多余元素本来就没有固定的规律,因此常常可以看到人们在处理这类网络拷贝来的资料的时候,往往是反复用手动处理删除。其实,学会用“空”串替换的方法能成百上千倍地提高工作效率。

比方说,文章中的每个自然段的末尾出现了个数不等的半角空格字符,如果文章中也有合法的半角空格,这时我们就不能用传统思维中的半角空格来成批替换为无内容的“空”,这样会连正文中的合法空格也替换掉,英文单词之间就没有了空格,练成了一串,这显然是不行的。

在这种情况下,我们可以用如下巧妙的办法来实施成批替换:

将复制下来的文字拷贝到文字编辑软件EmEditor中,通过Ctrl+H快捷键启动“替换”窗口,先选中窗口中的选项“使用正则表达式”复选框,在“查找”框中输入一个半角空格紧跟+$两个半角符号,在“替换为”框中什么也不用输入,保持其空白(注意连一个空格也不能有)。之后点击“全部替换”按钮,这样全文尾部的空格就会被一次性去除掉了(图1)。

1313asw-qjkxblfz-1

01

再比方说,在每段文字的开头部分,均出现一个以阿拉伯字符串开头的无规律的无用编号,长度不定,类似于如下格式:

34566722这里是第一段的开头文字……

32219999999992334这里的第n段的开头文字……

23445561这里是第m段的开头文字……

对于出现在每段固定开头位置,但长度和数字排列规律不固定的数字串,我们怎么成批替换呢?

我们仍然可以在文字编辑软件EmEditor中实施替换,批量除去前面累赘的方法是:在“替换”窗口中激活“使用正则表达式”选项,然后再“查找”框中输入“^\d+”字符(不含外边的双引号),在“替换为”框中不输入任何内容,保持其空白,然后执行“全部替换”(图2)。

1313asw-qjkxblfz-2

02

替换完成之后,将替换之后的文字内容复制到Word或WPS中,即可得到不含首尾“杂质”的版面,这样就可以以规整的版面留存阅读了。

小提示:在Word和WPS也可以直接通过构造高级条件来完成如上替换任务。读者朋友们可自行挖掘,尝试实现方法。