`
hesihua
  • 浏览: 233689 次
  • 性别: Icon_minigender_2
  • 来自: 武汉
社区版块
存档分类
最新评论

提取中文

 
阅读更多
package regex;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class tiquChinese {
	public static void main(String[] args) {
		String regEx="[\\u4E00-\\u9FFF]+";
		String str="welcome to china , 洛丁山, yes, 谢谢! ";
		Pattern p=Pattern.compile(regEx);
		Matcher m=p.matcher(str);
		StringBuffer sb=new StringBuffer();
		
		while(m.find()){
			sb.append(m.group());
			System.out.println(m.group());
		}
		System.out.println(sb);
	}

}

 

执行后的结果为:

洛丁山
谢谢
洛丁山谢谢

 

分享到:
评论

相关推荐

    C#正则提取中文

    下面将深入探讨如何使用C#的正则表达式来提取中文字符,这不仅适用于简单的文本处理,也广泛应用于网页抓取、数据清洗等场景。 ### C#正则表达式提取中文 在C#中,`System.Text.RegularExpressions`命名空间提供了...

    oracle提取汉字拼音和首字母

    总的来说,"oracle提取汉字拼音和首字母"的PL/SQL存储过程提供了一种在Oracle数据库内处理中文字符的解决方案,它涉及到了字符串处理、文本解析和自定义函数等技术,对于处理中文数据的应用场景具有很高的实用价值。...

    sql server 提取汉字/数字/字母的方法 demo

    ### SQL Server 提取汉字、数字、字母的方法 在SQL Server中,经常需要处理字符串,比如提取其中的特定字符集(如汉字、数字或英文字母)。本文将介绍如何使用SQL Server编写函数来实现这些功能,并提供示例代码...

    用c#提取汉字字模点阵信息

    在中文环境中,汉字字模尤其重要,因为它涉及到如何在屏幕上或者纸上精确地呈现每一个汉字。本篇文章将详细探讨如何使用C#语言来提取汉字字模的点阵信息。 C#是一种面向对象的编程语言,广泛应用于Windows平台的...

    汉字提取拼音首字母函数

    - **Unicode简介**:Unicode是一种国际化的字符集标准,旨在为世界上的每种语言提供统一的编码方式,支持多种书写系统,其中包括中文汉字。Unicode编码通常以UCS-2或UCS-4的形式表示。 - **汉字Unicode范围**:在...

    Java编写的非常有用的方法,文字中提取中文字符

    本文将深入探讨两个关键知识点:如何从字符串中提取所有中文字符以及如何判断一个字符串是否为空白字符串。 首先,让我们关注“提取汉字”这个主题。在Java中,我们可以使用正则表达式和循环遍历的方式来实现这个...

    sql server 提取汉字、数字、英文 函数

    ### SQL Server 提取汉字、数字、英文函数 #### 概述 在SQL Server中处理文本数据时,我们经常需要从字符串中提取特定类型的字符,比如只保留数字、仅提取英文字符或者只保留汉字等。这对于数据清洗、数据分析以及...

    Qt提取汉字拼音首字母

    在本项目"Qt提取汉字拼音首字母"中,我们将探讨如何利用Qt来处理汉字与拼音之间的转换,特别是在获取汉字的拼音首字母方面。 首先,我们需要理解汉字与拼音的关系。汉字是中文的主要书写系统,而拼音是用拉丁字母来...

    PB提取汉字简拼_pb_PB汉字_PowerBuilder_

    在给定的标题“PB提取汉字简拼_pb_PB汉字_PowerBuilder_”中,我们可以看出这个话题是关于在PowerBuilder中如何实现汉字到其首字母简拼的转换。描述中的“通过自己写的函数/。”暗示我们将讨论自定义函数来完成这一...

    Excel混合字符串中提取汉字[文].pdf

    Excel 混合字符串中提取汉字、数字和非汉字部分的方法总结 在 Excel 中,经常需要从混合字符串中提取汉字、数字和非汉字部分。这篇文章总结了提取汉字、数字和非汉字部分的方法。 一、提取汉字 可以使用小刀公式=...

    提取汉字首字母

    总结来说,"提取汉字首字母"是一个涉及到中文处理、MFC编程和拼音转换技术的任务。通过理解汉字与拼音的关系,利用Windows API或第三方库,我们可以有效地在C++环境中实现这一功能。在实际项目中,可能还需要考虑...

    DELPHI 提取汉字首字母或者全拼的程序,带源码

    在这个特定的场景中,我们讨论的是一个使用DELPHI编写的程序,其功能是提取汉字的首字母或全拼。这个程序对于数据处理、搜索优化、拼音索引等方面非常有用,比如在构建中文搜索引擎或者实现拼音排序时。 首先,我们...

    gis字段计算器提取数字和中文

    这里使用Unicode范围`\u4e00-\u9fa5`来匹配中文字符,这包括了几乎所有的常用汉字。如果找到匹配的中文字符列表,函数将逐个连接这些字符并返回结果;如果没有找到匹配的中文字符,函数返回一个空字符串。 接下来,...

    提取汉字拼音首字母最佳方案VB/VBA源码

    "提取汉字拼音首字母最佳方案VB/VBA源码"是一个针对这种需求的解决方案,它提供了一种高效且准确的方法来获取汉字的拼音首字母。这个源代码经过了对两万多个汉字的测试,确保了其在VB(Visual Basic)和VBA(Visual ...

    MFC提取汉字的首字母的方法

    MFC中汉字首字母提取方法 在MFC中实现汉字首字母提取功能是一个常见的需求,下面我们将详细介绍如何使用MFC来实现这个功能。 首先,需要了解汉字的编码方式。在 Unicode 中,汉字的编码范围从 0x4E00 到 0x9FA5,...

    精品--汉字字符特征提取器 (featurizer),提取汉字的特征(发音特征、字形特征)用做深度学习的特征 |.zip

    深度学习,特别是卷积神经网络(CNN)和循环神经网络(RNN),在自然语言处理(NLP)领域已经取得了显著成果,而汉字作为中文文本的基础元素,其特征提取对于理解和处理中文信息至关重要。 1. **发音特征**: - ...

    汉字内码,用于提取汉字的内码

    此软件为汉字内码软件,用于提取汉字的内码,比较方便!

    javascript提取汉字首字母

    在JavaScript编程语言中,汉字首字母的提取是一个常见的需求,特别是在中文数据处理、搜索关键词简化或者拼音排序等场景。这个话题涉及到JavaScript字符串处理、Unicode编码以及多音字识别。下面我们将详细探讨这些...

    java提取汉字首字母

    在Java编程中,提取汉字首字母是一项常见的任务,特别是在处理汉字数据、建立索引或进行拼音搜索时。这个任务涉及到字符编码、Unicode和中文字符处理。以下是对这一知识点的详细阐述: 1. **字符编码**:汉字在...

    电信设备-一种从文本信息中提取中文机构单位名称的方法.zip

    "一种从文本信息中提取中文机构单位名称的方法"是一个针对这一需求的具体解决方案,旨在有效地从大量文本数据中识别和提取中文机构单位的名称,以支持诸如客户管理、市场分析、合规监控等多种业务场景。 首先,我们...

Global site tag (gtag.js) - Google Analytics