java判断String是否为汉字

Java用的是Unicode 编码char 型变量的范围是0-65535 无符号的值,可以表示 65536个字符,基本上地球上的字符可被全部包括了

汉字基本集中在[19968,40869]之间,共有20901个汉字

unicode编码范围:

汉字:[0x4e00,0x9fa5](或十进制[19968,40869])

数字:[0x30,0x39](或十进制[48, 57])

小写字母:[0x61,0x7a](或十进制[97, 122])

大写字母:[0x41,0x5a](或十进制[65, 90])

ASCII表见:

http://home.educities.edu.tw/wanker742126/asm/ap04.html

unicode中文范围

http://www.iteye.com/topic/558050

汉字编码范围:\u4e00-\u9FA5

双字节字符编码范围:\u0391-\uFFE5

双字节字符编码范围

1.GBK (GB2312/GB18030)

/x00-/xff GBK双字节编码范围

/x20-/x7f ASCII

/xa1-/xff 中文 gb2312

/x80-/xff 中文 gbk

2.UTF-8 (Unicode)

/u4e00-/u9fa5 (中文)

/x3130-/x318F (韩文

/xAC00-/xD7A3 (韩文)

/u0800-/u4e00 (日文)

第一种 判断是否存在汉字

public boolean checkcountname(String countname)
{
Pattern p = Pattern.compile("[\u4e00-\u9fa5]");
Matcher m = p.matcher(countname);
if (m.find()) {
return true;
}
return false;
}

用正则表达式去匹配

第二种 判断整个字符串都由汉字组成

public boolean checkname(String name)
{
int n = 0;
for(int i = 0; i < name.length(); i++) {
n = (int)name.charAt(i);
if(!(19968 <= n && n <40869)) {
return false;
}
}
return true;
}

————————————————

版权声明:本文为CSDN博主「知足--常乐」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接:https://blog.csdn.net/changjiale110/java/article/details/78915969