前言
最近有做相关汉字转拼音处理,因此了解一下,摘抄于此,方便查阅。
好记性不如烂笔头
正文
虽然不常用,了解一下。
基本汉字有20902字。
相关汉字编码介绍
GB2312编码
1981年5月1日发布的简体中文汉字编码国家标准。GB2312对汉字采用双字节编码,收录7445个图形字符,其中包括6763个汉字。
BIG5编码
台湾地区繁体中文标准字符集,采用双字节编码,共收录13053个中文字,1984年实施。
GBK编码
1995年12月发布的汉字编码国家标准,是对GB2312编码的扩充,对汉字采用双字节编码。GBK字符集共收录21003个汉字,包含国家标准GB13000-1中的全部中日韩汉字,和BIG5编码中的所有汉字。
GB18030编码
2000年3月17日发布的汉字编码国家标准,是对GBK编码的扩充,覆盖中文、日文、朝鲜语和中国少数民族文字,其中收录27484个汉字。GB18030字符集采用单字节、双字节和四字节三种方式对字符编码。兼容GBK和GB2312字符集。
Unicode编码
国际标准字符集,它将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言、跨平台的文本信息转换。
简体字范围
4E00-9FA5
简体和繁体字范围
4E00-9FFF
判断简体和繁体的范围
Java代码片段
public static String REGEXP_SIMPLIFIED = "^[\u4E00-\u9FA5]+$"; public static String REGEXP_SIMPLIFIED_TRADITIONAL = "^[\u4E00-\u9FFF]+$"; public static boolean matcher(String str, String regex) { return Pattern.compile(regex).matcher(str).find(); } HanZiUtils.matcher("体", HanZiUtils.REGEXP_SIMPLIFIED); HanZiUtils.matcher("體", HanZiUtils.REGEXP_SIMPLIFIED_TRADITIONAL);
参考文章
历史上的今天
暂无评论...
随机推荐
Post请求前端后端简单记录
前言简单记录一下JavaScript和PHP中,使用post方法发送请求到后端并处理响应。偶尔需要用,简单记录一下,方便自己查阅。主要摘抄,只是参考思路,具体还是结合自己代码使用正文通常涉及以下步骤:发送POST请求。后端处理请求并返回数据在前端,使用回调函数处理后...
自定义TextSeekBar记录
前言TextSeekBar自定义的View,酷我中也是这个样式。记录于此,方便自己查阅。正文直入正题效果图隐藏内容!付费阅读后才能查看!¥3多个隐藏块只需支付一次付费阅读
Android TextView文本颜色线性渐变(包括上下和左右渐变)
前言对于文本简记录文本颜色渐变,方便自己查阅。好记性不如烂笔头正文要用渐变,需要了解一下LinearGradient的各种参数简单介绍LinearGradientLinearGradient的实现有两种。第一种public LinearGradient(float x0, floa...
Android6.0修改默认输入法
系统内置了搜狗输入法,但有时候系统起来后输入法不是搜狗,客户很捉急,因此只好百度了一下下,参考大神们的教程。我这使用的代码是Android 6.0的,在SettingsProvider没有找到配置项,我记得以前Android 4.2上是有写配置项的,可Android 6.0中竟然没有,,...
蒋勋:人生,即是修行
选择修行的空间人类的空间感是非常奇怪的东西。过去的人从西门町走路到北门,再从北门走到南门,就是台北市的范围了。可是今日你问任何一个小学生,他都会觉得很近,他坐上公交车、地铁就可以到更远的地方。人类在整个工业革命之后,空间不断在扩大。我自己读完大学,要留学的时候,坐飞机还是一件大事,做这件事情之...
AS动态配置module时异常
前言动态配置module时出现如下错误提示。Could not compile build file 'D:\Android\WaterFun\UserCenter\build.gradle'.> startup failed: build file 'D:\Android\Wat...