以文本方式查看主题 - 计算机科学论坛 (http://bbs.xml.org.cn/index.asp) -- 『 C/C++编程思想 』 (http://bbs.xml.org.cn/list.asp?boardid=61) ---- Unicode格式和纯文本格式的相互转换 (http://bbs.xml.org.cn/dispbbs.asp?boardid=61&rootid=&id=56855) |
-- 作者:卷积内核 -- 发布时间:12/17/2007 1:48:00 PM -- Unicode格式和纯文本格式的相互转换 ---- 用Word7.0写完文章,可选用Unicode格式或纯文本格式保存文件。 Unicode文件以0xff,0xfe作为开始,文件中每个ASCII符和汉字均用两个字节表 示;纯文本文件中,汉字也用两个字节表示,但编码与Unicode文件不同。以有代 表性的"0a啊雹帷幔"字串为例,在GB-2312(80)码表中,"啊雹"是一级字,对 应16区1位和17区2位,"帷幔" 是二级字,对应65区1位和65区3位,在Unicode文 件中,此字串依此存成0x30,0,0x61,0,0x4a,0x55,0xf9,0x96,0x37,0x5e,0x54, 0x5e在纯文本文件中,依此存成0x30,0x61,0xb0,0xa1,0xb1,0xa2,0xe1,0xa1, 0xe1,0xa3.两者的存储映射关系不易看出。 ---- 下面给出实用转换C程序,它将Unicode文件的内容处理为宽字节,将纯文 #include ---- 以上程序在VC6.0环境下通过. |
W 3 C h i n a ( since 2003 ) 旗 下 站 点 苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》 |
23.438ms |