转自嘀嘀咕咕空间
鉴于俺是从一个完全不懂滴小白,成长为一个半瓢水滴小白,故从俺个人滴角度来谈谈校对的一些情况,欢迎探讨!
选定目录后单击“确定”按钮。
然后在TXTFORMAT窗口上方的工具栏里面,选择文件分割/章节处理
单击“重新获取章节名”按钮,这个过程根据文本的大小会花费不同的时间,请耐心等候……
然后再单击“导出章节标题列表”按钮
TXTFORMAT会给出相应提示,单击“确定”按钮即可。当然也可以直接用“文件分割/章节整理”的小窗口来进行比对,呵呵。
TXTFORMAT会自动打开生成的目录文件(默认路径是放在TXTFORMAT所在的目录,文件名默认为:ChapterList.txt)
凡是出现了问号的章节(例如上图中第二章、第三章、第十六章等)都是有问题的,上图第二栏是章节文中的字数,第三栏是章节的正序号!
根据这个章节文件,可以比较方便的定位有问题的章节!直接打开原文,定位到有问题的章节,进行相应处理即可。
对比章节一般去原站进行对比即可。
这里面有几个地方需要注意一下:
1、有的章节名不规范,例如这样:第二十二 XXX,缺少“章”字,这个直接在原文中补上“章”字即可;
2、缺章(经与原站对比后),先记录下来,然后去百度、贴吧或是其他站点下载该章;
3、重复章节,这里分为两种情况:原站原本就是重复章节名(内容不同),可以注明一下;再一种就是文本本身重复了(内容相同),直接删掉即可;
4、章节名没有第章关键字,例如这样:212. 213. 214. ,这时候需要先处理一下,用EMEDITOR打开原文,按住CTRL+F键,出现如下窗口
在查找的输入框中输入:[0-9]{1,4}[.]{1} 在替换为输入框中输入:第\0章 (注意章字后面带有一个空格!),然后勾选“使用正则表达式”,单击“替换全部”按钮。
注意:这样替换会导致出现 第212章章 XXX的情况,再来将“章章 ”替换为“章 ”就行了。
这里有个问题要注意一下,就是这种替换可能会导致正文中的数字也被替换了,所以在替换之前先检查一下。在上面的查找窗口中,点击“全部提取”按钮(注意需要先填写好正则表达式,参见替换窗口),EMEDITOR会将所有满足条件的文本全部提取出来,这样就便于检查了,呵呵。
此文篇幅较长,关于通用处理部分就放在下一次再来说吧,呵呵。
再来谈谈通用处理的问题。
点击“全部提取”按钮,会出现一个新的文本,如下图所示:
这时候就可以来观察一下,有没有共性的内容,上述截图中,我们可以看到,PS前面会带有空格,PS后面截止到回车符(截图中的下箭头标记)部分,全部是求票类信息,都是可以去掉的!
然后我们可以在新文本中用正则表达式来测试一下去除废物内容是否可行,如下图所示:
在查找输入框中输入 (冒号之后的内容):[ ]{4}[ps]{2}.*
然后点击“查找全部”按钮,看是否有效?请注意,务必要仔细检查,谨防删除了正文内容!切记切记!不然到时候哭都没地方哭滴!
确认无误后,点击“替换”按钮,将其替换为“”(空)即可。
在点击“替换全部”按钮之前,保险起见,请回到原文,利用这个正则表达式再次搜索,并提取全部,然后查找全部再次检查!确认没问题后就可以点击“替换全部”一次性清理掉这些广告内容了。
请注意:如果发现有不满足条件的,先行找到该地方,用其他内容暂时替换一下,再清除了废物内容后再替换回来即可!
上述正则表达式的含义为:[ ]这个表示单个空格,{4}这个表示有4个,对应截图中“PS”标记前的空格;[ps]{2}表示以下几种情况(pp、ss、ps、sp),在不特别标注的情况下,正则表达式忽略大小写的区别;后面的.*则表示任意多个字符,截止到终止符为止(这里是硬回车符,也就是截图中的下箭头)。
当然,文本的PS信息可能有很多种不同的变化形式,例如:【PS】、P.S等等,无论哪种变化形式,都可以找出其对应的规律,然后用正则表达式进行处理。
正则表达式的范畴很广,这里就不一一列举了,针对常见的情况简要的说明一下,一般来说,用[]这个符号包含待搜索的字符;用{2}这个符号标识字符的个数(中英文无差异,即一个汉字等价于一个字符,数字代表了个数,自己去数一下就行了,呵呵);[0-9]这个表示从数字0到数字9,顺序任意;[a-z]这个表示字符a到字符z,顺序任意(大小写无所谓),有兴趣的朋友可以百度一下常用的正则表达式,自己多试一下,呵呵。
同理,可以用上述方法处理另一类较常见的广告信息:未完待续,大家可以自行试验一下,呵呵。
下一篇我们会谈一下使用TF进行文本校对,也就是俗称的“软校”。
今天来谈一谈最重要的校对工具TXTFORMAT的常见用法,呵呵。
这其中,使用的比较多的包括有:广告及其他问题(几乎是必用)、含有PS的行、引号不匹配、屏蔽字、半角标点符号、字母串、数字串、不常见的特殊字符、不规则的标点符号、硬回车、无标点的行尾等。
目前论坛针对校对版的要求是:广告和屏蔽字必须要处理,对应到TF中就是:广告及其他问题、含有PS的行、屏蔽字,当然如果有充足的时间,可以尽量的多检查几项。
从下拉框中选择某一个选项(例如广告及其他问题),然后单击“查找下一个”按钮
TF会根据预先设定的规则进行查找并定位,请根据实际情况进行处理,注意:并非找出来的都是广告!
文本全部检查完毕后,TF会给出相应提示,这时需要将光标放在文本的最前方(第一行),然后再来选择第二个检查项(例如屏蔽字),如此反复,直到将所需要的检查工作全部完成,保存退出即可。
TF是一款非常强大好用的校对工具,但在使用过程中,也需要注意几点:慎用“全部替换选定”!这个地方很容易出纰漏!有时候会莫名其妙的系统自动去掉了替换后的文字,结果导致误删除!另外,有些选项比较古老了,基本上用不上,没必要把所有选项都用一遍!TF有个很实用的功能,就是当你一次弄不完的时候,下次再进入的时候,它会帮你定位到上次最后的位置(当然需要你记住你当时用了哪个选项:是PS还是屏蔽字等)!
一般来说,读校+软校(TF)是比较合适的做法,当然也可以直接单独使用软校,但不建议单独使用读校,因为读校很难检查出某些问题(例如标点符号错误)。
到这里,关于校对的东西就差不多结束了,后续日志中俺会说一下早安E书大师和HUGECHM的常见用法,呵呵。
今天我们来看一下早安E书大师的用法,呵呵。
排版主要由两步构成,首先单击窗口下方的“第一步”,选择文本的路径,如下图所示
可以任意更换文本的存放路径(将路径复制到上图高亮的输入框中),这里我们是使用的默认路径(也就是E书的目录),注意,这里是文本的存放路径(目录),不是文本!
单击“提交”按钮,E书给给出相应提示,如下图所示:
首先还是复制文本的存放路径(目录),这里是:C:\Tools\早安E书(请根据实际情况更改),排版关键词的意思是,E书是通过什么关键词来区分章节的,这里使用的关键词是“第章”,意味着文本中凡是出现第XX章的地方,均视为章节名,例如:第326章、第一千零二十一章等。后面的20表示的是第章之间限制字数,这里设定为20意思是说“第章”关键字之间,最多只能有20个字符(汉字)!这样设定的目的是为了避免出现正文中有“第章”关键字,从而导致E书将正文内容错误的判断为章节名!一般情况下,设定为12~14基本上就可以了。另外,有的文本用的是“第二十八节”这种章节名,那么只需要将截图中的“章”替换为“节”字即可。
确认无误后单击“提交”按钮,如下图所示
E书会给出相应提示,到这里,排版工作就已经完成了。排版的第三步是用于处理特殊文本的,一般不需要理会。
排版后会生成两个文本,一个是原文,一个是原文2,
其中,原文2(这里是《都市血影》2.txt)就是我们需要的排版后的文本了。
在这里,有几个问题需要注意一下:
1、第一个章节名之前不要带有过多内容,通常写上“正文”两字即可(这两个字在制作后的E书中起到一个先导的作用)
在第一章之前必须要有这个!否则E书无法定位章节名的起始位置。
2、章节名与内容之间,如果是本章的内容,则无空行,如果是上一章的内容,则有两个空行,如下图所示
注意,空行之中不能有空格!
3、如果文本带有卷名,则卷名与章节名之间,如果是本卷下的章节,空两行!如果是上一卷的章节,则空三行!如下图所示
注意,如果是非标准的章节名,需要手工调整,例如上图中的“锲子”章节。
下一篇会继续谈E书的制作,呵呵。
今天来谈一下E书的最后工序-制作。
管理书籍是对文本的全文信息进行处理,管理章卷是对文本的卷、章节等信息进行处理,管理文章是对文本的正文内容进行处理。
处理完毕之后,单击“确认导入操作”按钮,如下图所示:
填写必要的信息(可以跟后期生成CHM文件进行对比,来了解这里如何填写,呵呵),单击“提交”按钮
点击左边的“阅读书本”,选择相应的模板和列数(每行显示多少列),如下图所示
选择好了之后单击“确定”按钮即可。可以再次通过左边的菜单“阅读文本”重新选择列数和模板,直至不再修改为止。
模板选择好了之后,单击左边的菜单“管理书籍”,并选择“生成WEB”选项,如下图所示
单击“执行按钮”,程序会将模板和文本进行打包,并给出相应提示
到了这一步,基本上就已经完成了,剩下的,就是将所有内容生成到CHM文件中即可(注意电子书的位置信息,后面HUGECHM需要用到)。
打开HUGECHM,如下图所示:
首先选择打包文件夹的位置(上图中的第一步后面的“打开”小按钮),然后选择“INDEX文件”的位置(第二步的小按钮)
找到刚才使用早安E书打包文本所在的文件夹,并选中,然后单击“确定”按钮
再来选择封面文件(第二步,Index文件),如下图所示:
选中“Index.htm”文件,并单击“打开”按钮进行确认,选中HUGECHM窗口中的“初始窗口最大化”选项,并单击“4、开始打包”按钮,HUGECHM会进行打包操作,生成的CHM文件默认会放在打包文件夹的下面(早安E书的“Book”文件夹里面)。
至此,关于校对和制作的基础知识就全部结束了,所用到的工具在本系列文章中仅提到了一小部分常用的,其他的功能大家有兴趣可以自行摸索一下,需要提醒的是,注意备份!
最后说两句题外话,校对是个很辛苦的工作,需要的是耐心和细心,任何大神都是从菜鸟成长起来的,鉴于个人的精力和时间有限,在校对的过程中难免会出现疏漏之处,还望大家多体谅多包涵!至于标注,个人的看法是,只要不违背坛子的相关规定,可以随意,既可以标注为[校对全本],也可以标注为[精校全本],没必要去计较那么多,所谓的校对,事实上并无所谓的标准!也不存在严格意义上的精校!大家如果想要收藏文本,可以在校对本的基础上,自己再来慢慢润色调整就行了。
请希望发布校对本的朋友们注意,本论坛的校对标准是:1、屏蔽字要处理;2、广告类信息要处理!其他的一些问题,可以自行的来进行相应的处理(例如章节序号的重排、引号的不正确用法等),欢迎大家共同参与进来,我为人人,人人为我,呵呵。
|Archiver|手机版|小黑屋| ( Q群816270601 )
GMT+8, 2024-5-14 11:43 , Processed in 0.558965 second(s), 24 queries .
Powered by Discuz! X3.2
© 2001-2013 Comsenz Inc.