推荐榜 短消息 big5 繁体中文 找回方式 手机版 广 广告招商 主页 VIP 手机版 VIP 界面风格 ? 帮助 我的 搜索 申请VIP
客服
打印

终于知道移动比联通牛的原因了(绝对真实绝对有趣)

购买/设置 醒目高亮!点此感谢支持作者!本贴共获得感谢 X 11

终于知道移动比联通牛的原因了(绝对真实绝对有趣)

如果你的电脑操作系统是win2000或winxp的话,那么:

1、在桌面上点右键,选择新建-文本文档;

2、打开"新建文本文档",录入"移动"两字后存盘退出;

3、重新打开"新建文本文档",看到什么了?

4、是不是刚刚录入的"移动"两字? 咱们换过来 1、在桌面上点右键,选择新建-文本文档; 2、打开"新建文本文档",录入"联通"两字后存盘退出; 3、重新打开"新建文本文档",看到什么了? 4、是不是刚刚录入的"联通"两字不见了,取而代之是个烧焦的手机电池的模样? 是真的你就顶一下~~~~



===========================================

是真的啊,这是编码的问题,不过再输入一次联通就可以正常显示了.


其实这是因为GB2312编码与UTF8编码产生了编码冲撞的原因。
从网上引来一段从UNICODE到UTF8的转换规则:

Unicode
UTF-8

0000 - 007F
0xxxxxxx

0080 - 07FF
110xxxxx 10xxxxxx

0800 - FFFF
1110xxxx 10xxxxxx 10xxxxxx

例如"汉"字的Unicode编码是6C49。6C49在0800-FFFF之间,所以要用3字节模板:1110xxxx 10xxxxxx 10xxxxxx。将6C49写成二进制是:0110 1100 0100 1001,将这个比特流按三字节模板的分段方法分为0110 110001 001001,依次代替模板中的x,得到:1110-0110 10-110001 10-001001,即E6 B1 89,这就是其UTF8的编码。
而当你新建一个文本文件时,记事本的编码默认是ANSI, 如果你在ANSI的编码输入汉字,那么他实际就是GB系列的编码方式,在这种编码下,"联通"的内码是:
c1 1100 0001
aa 1010 1010
cd 1100 1101
a8 1010 1000
注意到了吗?第一二个字节、第三四个字节的起始部分的都是"110"和"10",正好与UTF8规则里的两字节模板是一致的,于是再次打开记事本时,记事本就误认为这是一个UTF8编码的文件,让我们把第一个字节的110和第二个字节的10去掉,我们就得到了"00001 101010",再把各位对齐,补上前导的0,就得到了"0000 0000 0110 1010",不好意思,这是UNICODE的006A,也就是小写的字母"j",而之后的两字节用UTF8解码之后是0368,这个字符什么也不是。这就是只有"联通"两个字的文件没有办法在记事本里正常显示的原因。
而如果你在"联通"之后多输入几个字,其他的字的编码不见得又恰好是110和10开始的字节,这样再次打开时,记事本就不会坚持这是一个utf8编码的文件,而会用ANSI的方式解读之,这时乱码又不出现了。







点此感谢支持作者!本贴共获得感谢 X 11
TOP

我還真珮服LZ竟然研究得這么深啊,
很多可能是巧而已得吧

TOP

刚才试了一下,真的变成这个"ͨ"了!
真是觉得"牛"

TOP

这有什么呀!在汉字内码转换上,出点问题是很正常的,关键是有必要这么去究吗?

TOP

实在太厉害了,我佩服你,哥们,竟然会有这样的现象出现!试验有效

TOP

原先看过,闹了半天这个才是真正的原因那。领教了

TOP

佩服楼主的知识结构,在下看不懂,没弄明白移动为什么比联通好

TOP

太厉害了,领教了
不知道输入电信怎么样呢

TOP

不是有个笑话吗?大家还记得吗?话说一对男女洞房夜,男的进入之后趴在女的身上不动,温柔的说:咱们现在联通了,女的有些不悦, 男猛烈进攻,女的高声大喊:移动就是比联通好。

TOP

晕了,居然真的有这回事,联通可以去起诉微软了。告他侮辱联通得形象

TOP



当前时区 GMT+8, 现在时间是 2025-7-1 06:41