星期二, 四月 28, 2009

告别乱码


2000-03-02 00:00作者:答俊波
出处:cpcw

衣攵晕颐抢此凳蔷S龅降模蜗贰⑼尽⑷砑缑妫馐焙蚓鸵玫侥诼胱还ぞ卟拍芑袢∥颐窍胍男畔ⅰichWin、MagicWin、NJstart(南极星)、LAT(两岸通)等,都是我们经常用到的内码转换工具。但当我们从网上下载了一篇是乱码的文章时,虽然可以用这些工具将其转换成我们所能阅读的形式,但当我们想引用文章中的部分语句从而进行复制粘贴的操作时,我们会发现粘贴后的部分仍是乱码。那么我们如何将这类文章转换成我们所用的GB码(即国标码),而不需要再次打开RichWin之类的内码转换工具呢?下面就我们所常用的一些软件来介绍一下。在实际应用中,我们遇到纯西文文本乱码情况较少,而对于中文文本,由于汉字编码的不同,像大陆的简体国标码(GB)与港台地区的大五码(Big5)无法通用的情况却经常碰到,限于篇幅,本文仅介绍大五码转换为国标码的情况。

  先来看一下Microsoft公司的产品吧!在Word 2000 (Word 97 则不行)中,选择要打开所要转码的文件,这时会弹出如图1所示对话框,选择“其它编码”中的“繁体中文(Big5)” 一项,打开后,再选择“文件”中的“另存为”,注意,选择存盘格式不能为“文本”,包括“编码文本”,否则,存盘后打开仍为乱码。建议先存为“Word文档", 存盘后打开再存为纯文本等格式。以后打开该文件,我们便可直接阅读了。在Internet Explorer 5.0 (即我们常说的网络探索者IE 5.0)中,打开文件,若显示不为乱码,这是因为在菜单栏中的“查看→编码”里设置为“自动选择”,但这并不影响内码转换。接下来的操作与Word中相似,选择“另存为”,弹出的对话框中有“文件名、保存类型、编码”等选项,打开时选择的编码与保存时选择的编码的种种配合,会影响最终保存文件。(不信?大家自己可以试试 !)建议如下操作:打开文件时便在“查看→编码”中设置为“自动选择”,存盘时保存类型选“Web页”, 编码选Unicode,这样保存过的文件再次打开后,编码不管选择简体中文(GB2321)、简体中文(HZ)、还是Unicode(UTF-8)和繁体中文(Big5),最终显示都一样,均为我们可识别的繁体中文。(注意,在IE4.0中则无此功能!)如果你不喜欢繁体中文,在Word2000中提供了一个“中文简繁转换”的工具,在菜单栏中的“工具→语言→中文简繁转换”即可看到它。在Windows2000(Bate版)中也提供了这样的功能,一个方便的“代码转换工具”,如图2 所示为Win2000“开始→程序→附件”中的局部图,该工具使用很简单,仅有“来? 、“目标”、“选项”三个标签页,如果本文前文所述已搞清楚,那么对这个代码转换工具的使用也就不会有什么问题了!这里就不多写了。另外,这个工具还提供了中文简体字/繁体字转换、半角/全角字符转换等功能,如图3所示。不过,这个工具在Win9x中并没有提供,如果你想使用这个工具,而你的机器配置又太低的话,你可以找个装有Win2000的机器, 设法把这个工具拷贝过去。不过,本人将其可执行文件拷入Win98后并不能用,不知为何,这里还望各位大侠指点。

  下面来看一下金山公司的WPS吧! 在WPS 97中提供了在打开文件时自动识别国标、大五码的功能,还可以将页面或框中的文字输出到不同内码的文本文件中。它的输出格式只有文本文件和WPS文件;WPS 2000支持 GB 2312 、BIG5、GBK等三种主要汉字编码,并可以在输出 RTF 、TXT、HTM 文件时对文件的内码进行 GB 2312 与 BIG5 的相互转换。WPS相比WORD的优点在于: 打开和输出的文本文件为简体中文,不需再次转换。

  除了以上软件外,市面上还有一些专门在此方面显身手的产品。如华语通(图4所示),它像Win2000中提供的“代码转换工具”一样,专门进行国标码和大五码之间的相互转换。它支持文本、Web页、RTF格式,提供了批量文件转换、打开剪贴板及预览的功能,转换后得到的是简体中文。该软件为免费软件,可从http://lanny.yeah.net下载得到。由于软件只进行国标码和大五码之间的相互转换,所以界面简单直观,点击“批量文件转换”,即可进行文件的选择、保存路径的设置等操作。(是不是有点动心?)

   Text Robot(如图5)也是一款进行内码转换的工具,其界面不如华语通漂亮,但它的功能还是挺强的,有格式转换、文件合并、内码转换、段落重排、查剪贴板等功能。Text Robot不仅支持Big5到GBK的转换,还支持Big5到GBK简体的转换和GBK繁体到GBK简体的转换,支持多文件操作。使用时,先确定是单文件还是多文件,再选源文件或创建文件列表,然后进行你所需要的操作,图5中左上角的四个按钮是它的四个功能。它比华语通功能略强的地方是支持的内码多,可将文本格式转换为Web页,并且可选择Web页的字符集、背景颜色、文字颜色和链接颜色。该软件也为免费软件,可从作者个人主页(http://denvor.yeah.net)下载得到。其它的一些诸如RichWin、MagicWin、Njstar、LAT等多内码识别软件,虽然也可进行内码转换,但转换是动态的,不能将转换后的部分进行存盘操作,即使你试着去进行复制粘贴,得到的依旧是乱码。

  一些专业的汉化软件如东方快车等,也提供了批量内码转换的功能。在东方快车中,用鼠标选中转码的文本文件,按住鼠标不放,把它们拖到东方快车上方,文件将被自动进行转码,生成的文件后缀名为gb_或b5_,转码还是比较方便的。当然,你也可在菜单中找到“批量内码转换”这一项,在该界面中进行转码。你可在帮助信息中找到详细的用法介绍,这里便不多写了。

  一些电子小说阅读器之类的软件(如ReadBook)也可进行多种内 码转换。以 ReadBook (如图5)为例,它支持Txt、Html、Wps等多种文件格式,同时支持GB、BIG5码,并可自动识别乱码。在ReadBook中,打开为乱码(Big5码)的文件,在工具栏右侧,勾选“Big5码”,图中已放大显示,“智能分段”可不选。(选?不选?大家自己可试试。这个影响并不大!)然后再选择存盘即可。ReadBook为共享软件,可从http://ReadBook.126.com下载得到,软件不大,只有400K。不过ReadBook每次只能转换当前的一个文件。(毕竟内码转换只是它的附带功能!)

  除了商业软件外,在Internal网上应该还有许多像这样的转码软件,不过,我只找到这几个。

  有了上面介绍的任意一款软件,你就再也不会为复制粘贴后的乱码而发愁了,从而可以轻松地引用Big5码中的文字。怎么样 ?快试一试吧!

没有评论: