yyzhen 发表于 2011-8-17 13:15:10

C#中string和byte相互转换的问题

最近遇到C#中string和byte相互转换的问题,通常的做法,采用下面的方法进行转换:

1. string -> byte[]

   byte[] data = System.Text.Encoding.Unicode.GetBytes(var); //var is string

2. byte[] -> string

   string var = System.Text.Encoding.Unicode.GetString(data, 0, data.Length); //data is byte[]

注:采用Unicode而不是Default,主要是因为C#中string的存储格式就是Unicode的标准形式,一个字符占用两个字节。当然具体怎么转换取决你的思路,Default采用最节省空间的方式。

这种方法是标准的方法,肯定正确,但是不够快。可以采用unsafe的方法提高效率。具体做法如下:

1. string -> byte[]

            fixed (char* str = var)   //var is string
            {
                fixed (byte* ptr = data)    //data is byte[]
                {
                  byte* bstr = (byte*)str;      //---------------------1
                  for (int i = 0; i < var.Length * 2; i++)
                  {
                        ptr = bstr;
                  }
                }
            }

2. byte[] -> string

            char[] tvar = new char;
            fixed (char* str = tvar)
            {
                fixed (byte* ptr = data)
                {
                  byte* pstr = (byte*)str;      //-----------------------2
                  for (int i = 0; i < data.Length; i++)
                  {
                        pstr = ptr;
                  }
                }
            }
            string var = new string(tvar);

注意:a. 在string中,每个字符占两个字节,所以转换成byte数组时,长度要注意乘以2,反之除以2

      b. 在1,2标记中,有一个强制转换成byte字节,这也正是为了方便下面的for语句拷贝,否则一个c#中一个char也是两个字节。



经过测试,对一个简单的中英文混合的字符串转换1000000次,写字符串要快10倍,读字符串大约只快2倍,这是由于最后创建string对象造成的。

myhonour 发表于 2011-9-5 14:16:59

mark

sfp208 发表于 2011-11-20 18:45:59

mark
页: [1]
查看完整版本: C#中string和byte相互转换的问题