博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
C++转换unicode utf-8 gb2312编码
阅读量:5836 次
发布时间:2019-06-18

本文共 1878 字,大约阅读时间需要 6 分钟。

windows开发环境下用VC++6.0 对unicode 、utf-8、 gb2312 三种编码格式之间的转换方法:

 

[cpp] 
 
  1. #include <iostream>  
  2. #include <string>  
  3. #include <Windows.h>  
  4. using namespace std;  
  5.   
  6. void unicodeToUTF8(const wstring &src, string& result)  
  7. {  
  8.     int n = WideCharToMultiByte( CP_UTF8, 0, src.c_str(), -1, 0, 0, 0, 0 );  
  9.     result.resize(n);  
  10.     ::WideCharToMultiByte( CP_UTF8, 0, src.c_str(), -1, (char*)result.c_str(), result.length(), 0, 0 );  
  11. }  
  12.   
  13. void unicodeToGB2312(const wstring& wstr , string& result)  
  14. {  
  15.     int n = WideCharToMultiByte( CP_ACP, 0, wstr.c_str(), -1, 0, 0, 0, 0 );  
  16.     result.resize(n);  
  17.     ::WideCharToMultiByte(CP_ACP, 0, wstr.c_str(), -1, (char*)result.c_str(), n, 0, 0 );  
  18. }  
  19.   
  20. void utf8ToUnicode(const string& src, wstring& result)  
  21. {  
  22.     int n = MultiByteToWideChar( CP_UTF8, 0, src.c_str(), -1, NULL, 0 );  
  23.     result.resize(n);  
  24.     ::MultiByteToWideChar( CP_UTF8, 0, src.c_str(), -1, (LPWSTR)result.c_str(), result.length());  
  25. }  
  26.   
  27. void gb2312ToUnicode(const string& src, wstring& result)  
  28. {  
  29.     int n = MultiByteToWideChar( CP_ACP, 0, src.c_str(), -1, NULL, 0 );  
  30.     result.resize(n);  
  31.     ::MultiByteToWideChar( CP_ACP, 0, src.c_str(), -1, (LPWSTR)result.c_str(), result.length());  
  32. }  
  33.   
  34. void printByte(string str)  
  35. {  
  36.     int i=0;  
  37.     for (i=0; i<str.length(); i++)  
  38.     {  
  39.         printf("%X ",(unsigned char)str.at(i));  
  40.     }  
  41.     printf("\n");  
  42. }  
  43.   
  44. void wprintByte(wstring str)  
  45. {  
  46.     int i=0;  
  47.     for (i=0; i<str.length()*sizeof(wchar_t); i++)  
  48.     {  
  49.         printf("%X ",*((unsigned char*)str.c_str()+i));  
  50.     }  
  51.     printf("\n");  
  52. }  
  53.   
  54. int main()  
  55. {  
  56.     string strText = "AB汉字";  
  57.     string strUTF8;  
  58.     wstring wstrUnicode;  
  59.     string strGB2312;  
  60.   
  61.     gb2312ToUnicode(strText, wstrUnicode);  
  62.     printf("Unicode=");  
  63.     wprintByte(wstrUnicode);  
  64.   
  65.     unicodeToUTF8(wstrUnicode, strUTF8);  
  66.     printf("UTF-8  =");  
  67.     printByte(strUTF8);  
  68.       
  69.     utf8ToUnicode(strUTF8,wstrUnicode);  
  70.     printf("Unicode=");  
  71.     wprintByte(wstrUnicode);  
  72.       
  73.     unicodeToGB2312(wstrUnicode,strGB2312);  
  74.     printf("GB2312 =");  
  75.     printByte(strGB2312);  
  76.   
  77.     return 0;        
  78. }  

这里用“AB汉字”这样一个字符串做测试,它的ASCII编码为41 42 BA BA D7 D6

输出结果:

 

转载地址:http://ceccx.baihongyu.com/

你可能感兴趣的文章
Linux 目录结构及内容详解
查看>>
OCP读书笔记(24) - 题库(ExamD)
查看>>
.net excel利用NPOI导入oracle
查看>>
$_SERVER['SCRIPT_FLENAME']与__FILE__
查看>>
[分享]Ubuntu12.04安装基础教程(图文)
查看>>
django 目录结构修改
查看>>
win8 关闭防火墙
查看>>
CSS——(2)与标准流盒模型
查看>>
C#中的Marshal
查看>>
linux命令:ls
查看>>
Using RequireJS in AngularJS Applications
查看>>
【SAP HANA】关于SAP HANA中带层次结构的计算视图Cacultation View创建、激活状况下在系统中生成对象的研究...
查看>>
【ros】Create a ROS package:package dependencies报错
查看>>
通过容器编排和服务网格来改进Java微服务的可测性
查看>>
Linux基础命令---rmdir
查看>>
Squid 反向代理服务器配置
查看>>
Java I/O操作
查看>>
Tomcat性能调优
查看>>
Android自学--一篇文章基本掌握所有的常用View组件
查看>>
灰度图像和彩色图像
查看>>