搜索
bottom↓
回复: 12

崩溃了,unicode编码制下,向txt写入字符,有空格,求破

[复制链接]

出0入0汤圆

发表于 2014-1-1 10:48:45 | 显示全部楼层 |阅读模式
unicode字符集的char型字符,难道是16位的?我初学C++,说错了还请大家纠正我。

用fwrite命令创建了一个txt文件,用记事本打开后看起来是这样的:


用UE打开,看起来是这样的:


可以看到,每个ASCII字符后面都跟了个“00”。

请问大家,怎么把unicode下的string转成普通的8位编码制的string啊?
我翻了一上午的MSDN,实在是不得要领啊。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

阿莫论坛20周年了!感谢大家的支持与爱护!!

曾经有一段真挚的爱情摆在我的面前,我没有珍惜,现在想起来,还好我没有珍惜……

出0入0汤圆

发表于 2014-1-1 10:51:23 来自手机 | 显示全部楼层
就是这样的!
不过Utf8会有8位的Asii码。

出0入0汤圆

 楼主| 发表于 2014-1-1 10:58:33 | 显示全部楼层
divineliu 发表于 2014-1-1 10:51
就是这样的!
不过Utf8会有8位的Asii码。

就是这样的? 是没办法的意思吗?


这看起来太别扭啦。

出0入93汤圆

发表于 2014-1-1 11:23:29 | 显示全部楼层
Unicode下的char,还真就是16位的。他的等价替换是wchar_t,通常是作为一个关键字来看待的。
其实楼主不用崩溃,是因为你不严谨引起的。TXT文件是需要编码的,编码由BOM决定,没有BOM头的时候,他自己进行推断:可能存在ANSI、UTF8、UTF16 Little Endian三种推断。很显然,你的方案被推断成ANSI了。那么加上BOM头吧,就是最前面加上0xFEFF。
我给你一个示例:Unicode Little Endian下的1234567890,请解压缩后分别用记事本和UE/WinHex打开查看。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

出0入0汤圆

 楼主| 发表于 2014-1-1 11:29:13 | 显示全部楼层
takashiki 发表于 2014-1-1 11:23
Unicode下的char,还真就是16位的。他的等价替换是wchar_t,通常是作为一个关键字来看待的。
其实楼主不用 ...

谢谢楼上的解答。
不过,你的压缩包是坏的,可以重传一个吗?

出0入93汤圆

发表于 2014-1-1 11:34:44 | 显示全部楼层
Kvaqdxjl9f 发表于 2014-1-1 11:29
谢谢楼上的解答。
不过,你的压缩包是坏的,可以重传一个吗?


内容就是这么回事而已,注意最前面的FF FE。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

出0入0汤圆

发表于 2014-1-1 12:26:11 | 显示全部楼层
调用合理的流输出函数或许可以解决这个问题~

出0入0汤圆

 楼主| 发表于 2014-1-1 12:53:37 | 显示全部楼层
takashiki 发表于 2014-1-1 11:34
内容就是这么回事而已,注意最前面的FF FE。

不好意思又来麻烦你了,你能给我做个带回车的winhex截图吗?
我这边一加回车就乱码了。

出0入0汤圆

 楼主| 发表于 2014-1-1 12:54:50 | 显示全部楼层
285144996 发表于 2014-1-1 12:26
调用合理的流输出函数或许可以解决这个问题~

谢谢,百度上有用stream输出的。
我先搞搞bom头的问题,会尝试流输出函数的。

出0入0汤圆

发表于 2014-1-1 13:25:19 | 显示全部楼层
使用libiconv做编码转换,可以解决你的问题.

出0入0汤圆

 楼主| 发表于 2014-1-1 13:26:34 | 显示全部楼层
本帖最后由 Kvaqdxjl9f 于 2014-1-1 13:28 编辑
takashiki 发表于 2014-1-1 11:34
内容就是这么回事而已,注意最前面的FF FE。


搞明白原因了。
unicode给字符串加的“\n”,数据位0x0D0A00。
但是在txt文件中的UTF编码下的回车应该是:  0x0D000A00

不知道为什么这样,我正在想办法把回车搞定。

出0入0汤圆

发表于 2014-1-1 22:20:31 | 显示全部楼层
前面要写入0xFFFE还是0xFEFF,否则不能自动识别为unicode 编码。

出0入93汤圆

发表于 2014-1-2 06:38:22 | 显示全部楼层
Kvaqdxjl9f 发表于 2014-1-1 13:26
搞明白原因了。
unicode给字符串加的“\n”,数据位0x0D0A00。
但是在txt文件中的UTF编码下的回车应该是: ...

0x0D0A00是错的,嘿嘿,你想想啊,每个wchar_t是2字节,3字节怎么得来的?
L"\r\n"就是0x0D000A00的吧。
回帖提示: 反政府言论将被立即封锁ID 在按“提交”前,请自问一下:我这样表达会给举报吗,会给自己惹麻烦吗? 另外:尽量不要使用Mark、顶等没有意义的回复。不得大量使用大字体和彩色字。【本论坛不允许直接上传手机拍摄图片,浪费大家下载带宽和论坛服务器空间,请压缩后(图片小于1兆)才上传。压缩方法可以在微信里面发给自己(不要勾选“原图),然后下载,就能得到压缩后的图片。注意:要连续压缩2次才能满足要求!!】。另外,手机版只能上传图片,要上传附件需要切换到电脑版(不需要使用电脑,手机上切换到电脑版就行,页面底部)。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|amobbs.com 阿莫电子技术论坛 ( 粤ICP备2022115958号, 版权所有:东莞阿莫电子贸易商行 创办于2004年 (公安交互式论坛备案:44190002001997 ) )

GMT+8, 2024-8-26 01:23

© Since 2004 www.amobbs.com, 原www.ourdev.cn, 原www.ouravr.com

快速回复 返回顶部 返回列表