编码问题在继续研究

Post date: Jul 30, 2009 7:47:12 AM

对字符串的编码, 已经写了一个有问题的小程序:

http://code.google.com/p/cyiridiumsitewikineed/source/browse/trunk/charcode/org/iridium/charcode/util/CharParser.java

这个问题, 逐渐明晰了写, 研究整理还在继续. 下面需要知道的就是:

1. 汉字编码的具体规则: GB2312, GBK, Unicode(UTF-n), BIG5 等.

2. BOM的定义和使用.

在知晓以上两个问题后, 如何识别文本文件的编码就比较容易了.