关于编码(折腾一晚上的中文乱码、中文编码问题)

1. windows 系统默认编码为:GBKnn2. C++语法以字节为单元处理字符串,不关心处理中文的编码。 但是接口可以获取系统当前的编码,这并不代表什么。nn所以,中文处理的切词程序会要求提前文本按照编码格式输出。nn3. 编码会通过位置flag, 提醒编译器按照两位编码,还是按照三位编码。nn4. 文字的编码是生成的时候,生成方决定的。xtrem 或者vim等需要解析字节的会根据自己系统设…