`
softwarexiang120
  • 浏览: 38651 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
文章分类
社区版块
存档分类
最新评论

java识别中文字符的简单办法

阅读更多

import java.util.regex.Matcher;

  import java.util.regex.Pattern;

  public class IfHanZi {

  public static void main(String[] args) {

  //方法一:

  String s1 = "我是中国人";

  String s2 = "imchinese";

  String s3 = "im中国人";

  System.out.println(s1 + ":" + new String(s1).length());

  System.out.println(s2 + ":" + new String(s2).length());

  System.out.println(s3 + ":" + new String(s3).length());

  System.out.println((s1.getBytes().length == s1.length()) ? "s1无汉字":"s1有汉字");

  System.out.println((s2.getBytes().length == s2.length()) ? "s2无汉字":"s2有汉字");

  System.out.println((s3.getBytes().length == s3.length()) ? "s3无汉字":"s3有汉字");

  //方法二:

  int count = 0;

  String regEx = "[\\u4e00-\\u9fa5]";

  String str = "中文fd我是中国人as ";

  Pattern p = Pattern.compile(regEx);

  Matcher m = p.matcher(str);

  while (m.find()) {

  for (int i = 0; i <= m.groupCount(); i++) {

  count = count + 1;

  }

  }

  System.out.println("共有 " + count + "个 ");

  }

  }

 

分享到:
评论

相关推荐

    Java OCR 图像智能字符识别技术,可识别中文

    对于中文字符的识别,Java OCR面临更大的挑战,因为中文字符数量庞大且形状复杂。常用的Java OCR库如Tesseract、EasyOCR等都支持中文识别,但需要额外配置语言数据包。例如,Tesseract需要下载中文语言数据包(`chi_...

    Java OCR 图像智能字符识别-文字识别Demo

    Java OCR(Optical Character Recognition,光学字符识别)技术是一种用于将图像中的文本转换为机器编码文本的方法,尤其在处理纸质文档、扫描件或照片中的文本时非常有用。在这个"Java OCR 图像智能字符识别-文字...

    java字符模式识别

    Java字符模式识别是一种在编程领域中用于识别和处理文本中特定字符序列的技术。它主要涉及到图像处理、机器学习和自然语言处理等领域。Java作为一种广泛使用的编程语言,提供了丰富的库和框架来实现字符模式识别。 ...

    Java编写的非常有用的方法,文字中提取中文字符

    以下是一个简单的示例方法,用于从字符串中提取所有的汉字: ```java public static String extractChineseChars(String input) { StringBuilder chineseChars = new StringBuilder(); for (int i = 0; i (); i++...

    Java源码 OCR 图像智能字符识别技术,大幅提升中文识别率,完善修正版

    总之,这个Java OCR项目展示了如何利用现代计算机视觉技术和机器学习方法来高效准确地识别图像中的中文字符。通过不断的优化和修正,达到了较高的识别准确率,为实际应用提供了可靠的解决方案。对于开发者来说,理解...

    OCR 字符识别_java

    总的来说,"OCR 字符识别_java"涵盖了在Java环境中利用OCR技术进行字符识别的关键点,包括选择合适的OCR引擎、优化识别流程以及应对不同类型的字符识别问题。通过持续的实验和调整,开发者可以构建一个高效且准确的...

    java解析xml字符串

    Java提供了多种库来解析和操作XML文档,其中JDOM(Java Document Object Model)是一个广泛使用的开源库,它提供了简单且强大的API来读取、创建和修改XML文档。 ### Java解析XML字符串 在给定的代码示例中,我们...

    Java+OpenCV+OCR 图像字符处理

    本项目“Java+OpenCV+OCR 图像字符处理”聚焦于利用Java编程语言结合OpenCV库和OCR(Optical Character Recognition,光学字符识别)技术来实现这一功能。下面我们将深入探讨这些知识点。 首先,OpenCV是一个开源的...

    java手写识别超级准确

    Java手写识别技术是一种在Java平台上实现的图像处理与机器学习技术,主要用于识别手写数字或字符。在本项目中,"java手写识别超级准确" 提示我们这是一个高效的识别系统,具有高度的准确率,并且它采用了Swing库来...

    Java简单验证码识别(附源码)

    源码分析可能涉及类的构造函数、方法等,例如预处理图像的方法(如`preProcessImage()`),特征提取的方法(如`extractFeatures()`),字符分割的方法(如`separateChars()`)以及识别字符的方法(如`recognizeChar...

    Java 字符识别程序 源代码

    Java字符识别程序是一种基于OCR(Optical Character Recognition,光学字符识别)技术的应用,它能够将图像中的文字转换为可编辑的文本格式。在本项目中,我们深入探讨Java实现OCR的过程,以及相关的关键知识点。 ...

    Java 正则表达式判断字符串是否包含中文

    ### Java正则表达式判断字符串是否包含中文 在日常的软件开发过程中,我们经常会遇到需要对输入的字符串进行校验的情况。例如,在处理用户输入、文本分析或数据清洗时,可能需要判断一个字符串中是否包含中文字符。...

    Java自动识别文件字符编码工具类.rar

    Java自动识别文件字符编码工具类 参考博客 https://blog.csdn.net/superbeyone/article/details/103036914 使用方式: String encode = EncodingDetect.getFileEncode(geoJsonFile); log.info("系统检测到文件[ {}...

    java非法字符过滤器

    该Java非法字符过滤器的主要功能是对输入字符串中的非法字符进行识别和替换。设计者通过预定义一组非法字符(或字符序列),并将其存储在一个`HashMap`中,其中键为非法字符,值为用于替换的替代字符串。这使得过滤...

    图文识别_java图文识别_java文字识别_

    本篇将深入探讨Java在图文识别和文字识别方面的应用。 首先,我们要了解什么是OCR技术。OCR是一种将图像中的打印或手写字符转换为机器编码文本的技术。这项技术广泛应用于文档扫描、票据处理、自动翻译等领域,极大...

    JAVA智能验证码识别,可训练识别率高

    通过以上方法,JAVA OCR验证码识别系统可以实现高效且准确的识别,尤其在处理复杂验证码时,训练和优化显得尤为重要。开发者需要根据实际应用场景,灵活运用这些技术和策略,以构建出适应性强、识别率高的JAVA验证码...

    JAVA识别验证码,支持变形,扭曲,斜线,噪点,支持自己训练

    总的来说,JAVA识别验证码是一项涉及图像处理、机器学习和模式识别的综合技术。通过JAVA实现的OCR系统,不仅可以帮助我们应对各种复杂的验证码挑战,还能让我们深入理解这些核心技术,提升自身的编程和算法能力。

    基于Java实现手写汉字识别系统源码(毕业设计).zip

    基于Java实现手写汉字识别系统,不使用机器学习的方法,而是使用0-1矩阵的文件来保存手写体的字形,再通过欧氏距离计算出可能的字符,是一个比较简单的手写识别系统,可以比较准确的识别出大多数的常用汉字。...

    java识别pdf图片中的文字

    Java识别PDF图片中的文字是一项常见的任务,特别是在文档处理和数据提取领域。Tess4J是一个强大的工具,它基于Tesseract OCR(光学字符识别)引擎,能够帮助开发者在Java应用程序中实现这一功能。以下是对这个主题的...

Global site tag (gtag.js) - Google Analytics