当前位置:首页 > 编程教程 > java技术文章 > Character.UnicodeBlock中cjk的说明详解

Character.UnicodeBlock中cjk的内容说明

  • 发布时间:
  • 作者:码农之家
  • 点击:128

这篇文章主要知识点是关于Character.UnicodeBlock、cjk、的内容,如果大家想对相关知识点有系统深入的学习,可以参阅以下电子书

Java面试突击 v3.0
Java面试突击 v3.0中文高清版
  • 类型:Java面试大小:7.61 MB格式:PDF作者:韩胤祥
立即下载

Character.UnicodeBlock中cjk的说明详解

本文为大家分享了Character.UnicodeBlock中cjk的说明,供大家参考,具体内容如下

Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS : 4E00-9FBF:CJK 统一表意符号
Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS :F900-FAFF:CJK 兼容象形文字 Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A :3400-4DBF:CJK 统一表意符号扩展 A
CJK的意思是“Chinese,Japanese,Korea”的简写 ,实际上就是指中日韩三国的象形文字的Unicode编码
Character.UnicodeBlock.GENERAL_PUNCTUATION :2000-206F:常用标点 Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION :3000-303F:CJK 符号和标点 Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS :FF00-FFEF:半角及全角形式

/**
   * 校验一个字符是否是汉字
   * 
   * @param c
   *      被校验的字符
   * @return true代表是汉字
   */
  public static boolean isChineseChar(char c) {
    try {
      return String.valueOf(c).getBytes("UTF-8").length > 1;
    } catch (UnsupportedEncodingException e) {
      e.printStackTrace();
      return false;
    }
  }

  /**
   * 验证字符串内容是否包含下列非法字符<br>
   * `~!#%^&*=+\\|{};:'\",<>/?○●★☆☉♀♂※¤╬の〆
   * 
   * @param content
   *      字符串内容
   * @return 't'代表不包含非法字符,otherwise代表包含非法字符。
   */
  public static char validateLegalString(String content) {
    String illegal = "`~!#%^&*=+\\|{};:'\",<>/?○●★☆☉♀♂※¤╬の〆";
    char isLegalChar = 't';
    L1: for (int i = 0; i < content.length(); i++) {
      for (int j = 0; j < illegal.length(); j++) {
        if (content.charAt(i) == illegal.charAt(j)) {
          isLegalChar = content.charAt(i);
          break L1;
        }
      }
    }
    return isLegalChar;
  }

  /**
   * 验证是否是汉字或者0-9、a-z、A-Z
   * 
   * @param c
   *      被验证的char
   * @return true代表符合条件
   */
  public static boolean isRightChar(char c) {
    return isChinese(c) || isWord(c);
  }

  /**
   * 校验某个字符是否是a-z、A-Z、_、0-9
   * 
   * @param c
   *      被校验的字符
   * @return true代表符合条件
   */
  public static boolean isWord(char c) {
    String regEx = "[\\w]";
    Pattern p = Pattern.compile(regEx);
    Matcher m = p.matcher("" + c);
    return m.matches();
  }

  /**
   * 判定输入的是否是汉字
   * 
   * @param c
   *      被校验的字符
   * @return true代表是汉字
   */
  public static boolean isChinese(char c) {
    Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
    if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS
        || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS
        || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A
        || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION
        || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION
        || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {
      return true;
    }
    return false;
  }

  /**
   * 校验String是否全是中文
   * 
   * @param name
   *      被校验的字符串
   * @return true代表全是汉字
   */
  public static boolean checkNameChese(String name) {
    boolean res = true;
    char[] cTemp = name.toCharArray();
    for (int i = 0; i < name.length(); i++) {
      if (!isChinese(cTemp[i])) {
        res = false;
        break;
      }
    }
    return res;
  }

 

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持码农之家。

以上就是本次给大家分享的关于java的全部知识点内容总结,大家还可以在下方相关文章里找到相关文章进一步学习,感谢大家的阅读和支持。

您可能感兴趣的文章:

  • 分享jquery.bgiframe.js在IE9下提示INVALID_CHARACTER_ERR错误解决方案
  • 相关电子书
    学习笔记

    Copyright 2018-2020 www.xz577.com 码农之家

    版权投诉 / 书籍推广 / 赞助:520161757@qq.com