 |
|
 |
| 您现在的位置: 先创网 >> 工具软件 >> 实用工具 >> 文章正文 |
|
|
| 中文简繁转换完全手则 |
| enet |
| 2005-1-24 9:18:00文/计算机应用文摘 |
|
|
|
|
|
三、未来之路
单纯从游戏方面来考虑,微软Windows图形和游戏负责人Lester在不久前接受Gamespot采访的时候谈到:“微软计划简化PC游戏运行方式,将向游戏机游戏运行方式看齐,即‘即插即运行’,大大简化PC游戏安装和进行方式。”而有部分使用过Windows XP SP2的玩家则表示SP2似乎现在能比较智能地转换字符编码,以前一些须要AppLocale加载的游戏和软件在SP2上已经在启动的时候自行完成这个过程。
不过在游戏之外,这个进程似乎很缓慢。从技术上考虑,Unicode才是最完美的解决方案,但是Unicode的推广并不容易,虽然Windows XP操作系统已经很好地集成了Unicode环境,但是为了延续性不得不兼容着其他编码形式。而著名搜索引擎Google也率先在全站默认使用Unicode编码搜索,在网络上热透半边天的Blog系统,由于更多两岸三地网友交流的需要,也基本上采用了Unicode编码。
但是这还远远不够,目前各种转码的工具都有着各自的缺陷,比如Textpro就可能在处理时忽略部分文字的转码,还有单纯的1对1的文字转换也不代表能转换阅读习惯,比如“鼠标”和“滑鼠”的区别。如果没有智能化的,能够方便处理目前已有编码文字资料的数字解决方案,则庞大而优秀的Unicode编码也不能在短期内解决须要转码的繁琐问题。
游戏之外的编码应用案例
只是简单地在游戏中解决乱码问题和输入其他编码的文字这两件事看似简单,其实包括相当多知识和技巧。当然,会出现乱码和须要输入其他编码的文字的情况绝对不会仅仅出现在游戏中。所以这些软件、输入法和技巧同样可以在碰到类似的问题时发挥作用。
1.浏览繁体站点,使用繁体站点搜索引擎
如果操作系统已经装有相应的字库,那么IE浏览器可以在访问繁体站点的时候自动切换到合适的编码模式。浏览自然容易解决,但要使用繁体站点搜索引擎就须要利用前文所讲到的繁体字输入方法。对于Windows 98以前的操作系统,笔者推荐使用KanjiWeb,因为它对HZ编码的处理能力非常强。KanjiWeb可以同屏显示BIG5、GB、HZ三种文字,而且可以将它们打印出来。比如一个论坛,可能第一帖是HZ编码,而回复的分别有BIG5和GB两种编码,则用KanjiWeb时不会看到任何乱码。同时它自带一个简单的字库,即便是英文操作系统,它也可以正常显示各种编码的汉字。
在网络游戏中,或者实时聊天环境中,笔者认为《微软输入法2003》较为方便,根据当前编码环境自动识别并输入文字的功能可以省却每次都须要转码的烦恼。
如果须要输入大量的文字,用繁体输入法就比较麻烦,这个时候笔者推荐以二次转码的方式来完成。首先用正常的简体环境输入内容,然后进行二次转码,最后将转码的结果张贴到浏览器中即可,这非常适合在繁体论坛拍砖。
小技巧:为Windows 98、2000系统安装更多的编码字库
当使用Windows 98、2000系统的IE浏览器访问繁体站点或者日文韩文站点时,IE会提示安装新的编码字库,这个时候Windows98可以直接连接到微软的官方网站下载字库并安装。对于Windows98的用户,如果无法正常访问微软的网站,也可以选择下载繁体字库补丁直接安装。而Windows 2000的系统安装盘上都带有2000常用的字库,只须要插入安装盘,根据提示操作即可。Windows XP系统在默认安装的时候就带有标准的繁体、韩文和日文字库,用户无须特别安装新的字库。
2.使用其他繁体软件
虽然常用软件都是英文版或者中文版,但一些小工具或者某些软件的最新版本出现的时候可能只有繁体版,其实这种情况就和一个繁体版的游戏差不多,毕竟游戏也是软件的一种。这个时候可以先试试《化繁为简》或者AppLocale来尝试简单的转码,绝大部分情况下都可以正常使用。对于一些非常特殊的软件,如果须要转码的同时还输入繁体文字,则笔者推荐直接将区域设置为中国香港特别行政区,然后使用《微软输入法2003》来完美解决。
3.文件中的文字转换
小规模的文字转换使用Textpro非常容易,但如果手中有大量的Word文件或者文本文件须要转换则应该考虑其他方法。前文提到的KanjiWeb附带一个Multi-Code软件可以批量转换各种代码的文件。同时笔者还推荐另外一款称为《搜易繁简通》的免费软件,它更可以对不限数量的多个文件同时进行繁简转换,并且支持从资源管理器拖放文件到程序窗口。当然在使用这些软件的时候都须要做好备份,尤其是Word文件的格式比较复杂,可能在转码过程中出现兼容性错误。对于部分无法正常转换的文档,用Textpro手动处理也是解决方案之一,此外转换的过程中还应该特别注意GBK内码繁体字和Big5内码繁体字的区别。
4.日常应用中解决乱码的要点
(1)对于IE、Outlook等软件,解决显示乱码的基本办法是确认系统装有字库,同时已经为当前内容指定了正确的编码类型。须要注意多种字库的区别,比如HZ和GB2312虽然都是简体字库,但它们仍然有一定区别。
(2)对于Windows 2000系统,须要运行非Unicode编码的软件时,解决乱码的办法主要还是修改区域设置为编码文字所在区域,同时还须要将该编码设置为默认文字编码。
(3)对于Windows XP系统,显然它更加适合作为个人工作、学习和娱乐的平台,AppLocale软件很好地解决了乱码问题,并且使用简单。
(4)输入繁体中文最好的环境是区域设置为香港特别行政区的Windows XP系统和《微软输入法2003》,而在Windows XP系统下只须要安装AppLocale、《微软输入法2003》,则可以解决90%以上的繁体中文应用问题。显然作为操作系统的重要组成部分,微软希望在系统中更好地集成这些功能,而不是使用第三方软件。
(5)可以转换Unicode编码的常用编辑器有Editplus和UltraEdit,而Windows XP系统的记事本(Notepad)也可以在保存的时候选择不同编码类型,从而达到转换Unicode编码的效果。
(6)日文、韩文同样可能是导致乱码的原因,碰到乱码的时候不仅仅须要考虑Big5编码,还应该考虑HZ和其他语言。解决乱码的方法有很多,最好的办法是根据操作系统和乱码的具体情况选择合适的方案。
知识了解:GB2312
GB2312码是中华人民共和国国家汉字信息交换用编码,全称《信息交换用汉字编码字符集—基本集》,由国家标准总局发布,1981年5月1日实施,通行于大陆,新加坡等地也使用此编码。GB2312收录简化汉字及符号、字母、日文假名等共7445个图形字符,其中汉字占6763个。
GBK
GBK是GB2312-80的扩展,是向上兼容的。它包含了20902个汉字,其编码范围是0x8140-0xfefe,剔除高位0x80的字位。其所有字符都可以一对一映射到Unicode2.0。
GB18030-2000(GBK2K)在GBK的基础上进一步扩展了汉字,增加了藏、蒙等少数民族的字形。GBK2K从根本上解决了字位不够,字形不足的问题。
Unicode
Unicode于1992年6月通过DIS(Draf International Standard),目前最新版本V4.0于2004年公布。国际标准ISO/IEC 10646-1:2000(包含CJK和CJK Extension A 汉字27484),已于2000年10月5日正式出版,其内容与工业标准Unicode3.0是完全等同的。而ISO/IEC 10646-2:2000(包含CJK Extension B汉字42711)已于2001年10月正式颁布。
BIG5
BIG5是我国台湾省的常用标准,编码汉字13061字,在Windows 2000诞生之前,俗称的繁体平台普遍采用此编码标准。
HZ码
HZ是GB码的变体,只用每个字节的首7-bit作编码(即ANSI的首128个字符),常用于网络资料传送。
复杂的汉字编码是电脑发展历程中诸多标准从无到有,从混乱到统一的过程的映射,最开始流行于各个地区的标准肯定会在全球化应用的过程中带来诸多弊端。现在给中国玩家带来大麻烦的正是GB2312编码、HZ编码、BIG5编码三种编码,其中我国香港特别行政区以前流行的HZ编码已经逐步退出舞台,但是作为我国台湾省标准的BIG5编码至今还在部分地区广泛使用。很显然Unicode编码是“万码一家”的解决之道,但是要完成这个过程还需要相当长的时间。
上一页 [1] [2] [3] [4] |
|
|
|
|
|
|
 |
|
 |
|
|
|