JsonCpp第五课读取带BOM的UTF-8编码文本

知识解读
在Windows通过记事本打开的UTF-8编码文件，默认会在保存的时候，往文件开头多添加三个字节EF BB BF，表明文本的编码方式是UTF-8，这种技术就叫做BOM（Byte Order Mark，就是字节序标记）。在Unix或者Linux操作系统中不会出现这种情况。如果该文本是ANSI格式编码的，也没有添加其他的字符。

创新互联专注于网站建设，为客户提供成都网站设计、网站建设、网页设计开发服务，多年建网站服务经验，各类网站都可以开发，品牌网站设计，公司官网，公司展示网站，网站设计，建网站费用，建网站多少钱，价格优惠，收费合理。

文本内容读取差异
带有BOM的文本字节流
"锘縖\r\n{\r\n\t\"version\": \"1.0.0\",\r\n\t\"messagetype\": \"alarm\",\r\n\t\"cmdtype\": 10009,\r\n\t\"sn\":\"202039248932482934\"

不带BOM的文本字节流
"[\r\n{\r\n\t\"version\": \"1.0.0\",\r\n\t\"messagetype\": \"alarm\",\r\n\t\"cmdtype\": 10009,\r\n\t\"sn\": \"202039248932482934\"

问题
默认情况下传递带有BOM的文本字节流给JsonCpp解析，肯定是解析不出来的，因为多了EF BB BF三个字节，所以需要将这三个字节从文本中剔除

代码
std::ifstream ifs;
ifs.open(pFileName, std::ifstream::in | std::ifstream::binary);

std::string str((std::istreambuf_iterator<char>(ifs)), std::istreambuf_iterator<char>());
std::string strValidJson;
if ((0xef == (unsigned char)str[0]) && (0xbb == (unsigned char)str[1]) && (0xbf == (unsigned char)str[2]))
{
strValidJson = str.substr(3, str.length() - 3);
}
else
{
strValidJson = str;
}
//开始解析Json文本
Json::Reader reader;
Json::Value root;
if (NULL == reader.parse(strJson, root))

{

ifstream.close();

return;

}

本文题目：JsonCpp第五课读取带BOM的UTF-8编码文本
文章路径：https://www.cdcxhl.com/article12/psccgc.html

成都网站建设公司_创新互联，为您提供App开发、网站导航、小程序开发、、企业网站制作、品牌网站建设

声明：本网站发布的内容（图片、视频和文字）以用户投稿、用户转载内容为主，如果涉及侵权请尽快告知，我们将会在第一时间删除。文章观点不代表本网站立场，如需处理请联系客服。电话：028-86922220；邮箱：631063699@qq.com。内容未经允许不得转载，或转载时需注明来源：创新互联

猜你还喜欢下面的内容