GBase 8a之替换字符串中中文的方法
主要解决问题字符串中存在中文将中文识别出来并替换为想要的字符串。实现原理1用REGEXP_REPLACE函数将字符串里的中文字符替换为所需要的字符串。2正则表达式[\u4e00-\u9fa5]用于匹配中文字符。3由于识别到的中文每个中文字符占3个字节折合一个英文字符这里需要去重。正则表达式(Chinese)的含义是匹配一个或多个连续的Chinese字符串。其中(Chinese)是一个捕获组它将Chinese当作一个整体表示前面的元素也就是捕获组里的Chinese出现一次或多次。再次REGEXP_REPLACE函数嵌套即可实现去重效果。实现方式gbase select a,REGEXP_REPLACE( REGEXP_REPLACE(a,[^\u4e00-\u9fa5], Chinese) ,(Chinese), Chinese ) from zhao ; ----------------------------------------------------------------------------------------------------------- | a | REGEXP_REPLACE( REGEXP_REPLACE(a,[^\u4e00-\u9fa5], Chinese) ,(Chinese), Chinese ) | ----------------------------------------------------------------------------------------------------------- | abc | abc | | ab赵钱孙c | abChinesec | | abc周润发 | abcChinese | | 周星驰haha | Chinesehaha | ----------------------------------------------------------------------------------------------------------- 4 rows in set (Elapsed: 00:00:00.06)
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2613723.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!