【硬核解析】千问请喝奶茶口令中奇怪但能看懂的字是怎么打出来的
不知道大家有没有发现这几天千问通义的分享文案悄悄改了仔细看每个字都多了“一点”并且这个点并无法单独选中。注意每个字的上、下方有额外的点原理探究把这个字转为Unicode看看发现这是两个字符这个点的unicode编码是0308拿去unicode官网查一下找到这个字符对应的区域可以看到0300-036F这个区间是属于“组合附加符号”意思就是这些字符可以附加到任何文字上让他们看起来就是一体的。并且这是属于可见但不占位的字符所以无法被选中。知道了这个那我们就可以为所欲为的造“异形字”了千问为什么要这么做目的只有一个那就是尽可能的绕过社交平台的敏感词检测防止被封杀扩展还有哪些被非法使用的字符康熙部首这个此前在小红书看到还蛮多人用的效果如图所示如果你不换字体就不会发现这些字它不是常用字小红书上的异形字短信中经常出现图里标出来的不是现代汉语属于康熙部首这两者在unicode是不同区域由于康熙部首中有大量和现代汉语相同的字但编码不同所以就可以利用这点进行替换文字是不是有同学抱怨手机短信设置了关键字但还是有没拦住的现在知道原理了吧。零宽字符零宽就是没有宽度看不见代表有200B、200C、200D、FEFF为啥特地提这个呢因为很多很多的程序过滤使用正则表达式\s但是\s只会过滤空格、水平/垂直制表符、换行、回车和换页符。所以在正常字符中加入零宽字符人眼既看不见又能绕过审核程序控制符看过图片木马科普那期的同学应该很熟悉了。顾名思义控制符可以控制文本的显示方向。而如果程序没处理好就可以制造出如图不一致的消息同样如果审核系统是正则匹配\s那一样无法过滤掉该类字符导致关键词无法命中同一条消息苹果显示51安卓显示15其他像全角字母数字、数学字母、同形字母、相似汉字这些我就不举例了这些应该是大家知道得最多的“骗过程序但是人又看得懂的手段”。值得一提的是20年的时候还有使用 rn m 来伪造微软域名与汉字中“米果”这种拆分组合可谓异曲同工真假微软名称本期解析就到这了如果有什么想看的可以评论区给我留言参考资料#替换为.中文字符Unicode编码范围lddgo#net/string/cjk-unicodeunicode标准unicode#org/charts/千问用到的组合附加符号unicode#org/charts/PDF/U0300.pdf声明本文为原创图片有水印是因为我首发不在CSDN
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2441235.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!