编码问题在继续研究
Post date: Jul 30, 2009 7:47:12 AM
对字符串的编码, 已经写了一个有问题的小程序:
http://code.google.com/p/cyiridiumsitewikineed/source/browse/trunk/charcode/org/iridium/charcode/util/CharParser.java
这个问题, 逐渐明晰了写, 研究整理还在继续. 下面需要知道的就是:
1. 汉字编码的具体规则: GB2312, GBK, Unicode(UTF-n), BIG5 等.
2. BOM的定义和使用.
在知晓以上两个问题后, 如何识别文本文件的编码就比较容易了.