`
itace
  • 浏览: 181605 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

句子中快速找词

    博客分类:
  • java
 
阅读更多
public class WordsFinder {

	/**
	 * 统计word在text中出现的次数
	 * @Date: 2013-6-14下午05:57:19
	 * @Description: int
	 * @param word
	 * @param text
	 * @return
	 */
	public static int count(String word,String text){
		char[]w = word.toCharArray();
		char[]t = text.toCharArray();
		int size = w.length;
//		List<String> list = new ArrayList<String>();
		int sum = 0;
		for (int i = 0; i < t.length; i++) {
			if(w[0]==t[i]){
				if(i+size-1<t.length){
					boolean bool = true;
					for (int j = 1; j < size; j++) {
						bool&=(w[j]==t[i+j]);
						if(!bool){
							break;
						}
					}
					if(bool){
						sum++;
					}
				}
			}
		}
		return sum;
	}
	/**
	 * 查找text中是否包含的list的元素,返回包含的元素
	 * @Date: 2013-6-27下午02:57:28
	 * @Description: Set<String>
	 * @param list
	 * @param text
	 * @return
	 */
	public static Set<String> seek(List<String> list,String text){
		Set<String> words = new HashSet<String>(list);
		Set<String> set = new HashSet<String>();
		for (String word : words) {
			int sum = count(word, text);
			if(sum>0){
				set.add(word);
			}
		}
		return set;
	}
	/**
	 * 查找text中是否包含的list的元素,返回包含的元素及数量
	 * @Date: 2013-6-27下午02:57:33
	 * @Description: Map<String,Integer>
	 * @param list
	 * @param text
	 * @return
	 */
	public static Map<String,Integer> seekCount(List<String> list,String text){
		Set<String> words = new HashSet<String>(list);
		Map<String,Integer> map = new HashMap<String, Integer>();
		for (String word : words) {
			int sum = count(word, text);
			if(sum>0){
				map.put(word, sum);
			}
		}
		return map;
	}
}

 

分享到:
评论

相关推荐

    基于词向量与句法树的中文句子情感分析_相若晨1

    在情感分析中,句法树可以帮助识别情感词(如形容词、动词)及其修饰语,从而更准确地理解句子的情感色彩。通过对句法树的遍历和分析,可以确定情感焦点,比如找出带有强烈情感色彩的短语或从句,进而判断整个句子的...

    paddle_nlp_之词或者句子相似度计算.zip

    5. **应用场景**:词或句子相似度计算广泛应用于信息检索、问答系统、情感分析、文本分类等多种NLP任务中。例如,在问答系统中,通过计算问题与候选答案的相似度来找出最相关的答案。 总的来说,这个压缩包可能包含...

    细粒度中文情感词典

    2. **匹配规则**:根据词典的结构和数据格式,制定合适的匹配规则,找出文本中与词典中的情感词相对应的部分。 3. **情感赋值**:对找到的情感词,根据词典中的情感标签,赋予文本相应的情感值。 4. **综合分析**...

    情感分析正负面词典

    2. **匹配词典**:然后,将分词后的词汇与情感词典进行比对,找出词典中包含的词汇。 3. **计算情感得分**:根据词典中词汇的情感极性和强度,为每个词汇赋予权重,累积计算整个文本的情感得分。 4. **综合判断**:...

    四年级句子排序讲解.rar

    3. 根据逻辑线索连接句子:识别关键词和连接词,依据时间、因果等关系连接句子。 4. 检查连贯性:将排序后的句子通读一遍,确保逻辑清晰,故事完整。 此外,这份资料可能还会包含一些练习题和解答,旨在通过实践...

    小学语文语文常识句子句子成份“顺口溜”

    5. **状语**:修饰动词、形容词、副词或全句,表示时间、地点、方式等,如“他快速地跑”中,“快速地”是状语,描述了动作的方式。 6. **补语**:补充说明动作的结果、程度、状态等,通常位于动词之后,如“他跑得...

    进入页面的欢迎词.rar

    3. 结合功能:如果页面有特定功能,可以在欢迎词中巧妙提及,引导用户尝试。 4. 考虑情境:根据页面的上下文环境,让欢迎词与之相协调。例如,在购物网站上,可以使用“购物愉快!”这样的欢迎语。 5. 适时更新:...

    羞愧的近义词精选.doc

    同时,这种训练也有助于培养学生的思维敏捷性,因为他们需要在不同的情境中快速找出合适的词语来表达自己的想法。 总的来说,近义词和反义词的学习是中文教育中的基础环节,它对于学生的语言能力发展起着不可或缺的...

    伪原创软件源码(易语言)同义词可左右交替替换 带13000词库

    该算法会扫描输入的文本,找出可以被替换的词汇,并用其同义词替换,同时允许同义词在句子中的位置发生变化,以保持语句的自然度和流畅性。13000词库意味着软件内置了大量词汇及其同义词,能够覆盖多种常见应用场景...

    英语六级快速阅读的解题真计PPT课件.pptx

    在英语六级考试中,快速阅读理解占据了10%的分数,这部分测试考生快速获取和理解信息的能力。它包括是非判断和句子填空两类题型,共10题。为了高效解答这部分试题,我们需要掌握一定的解题步骤和技巧。 1. **先题后...

    语文基础知识之句子成分分析.doc

    ”这个口诀可以帮助我们快速定位句子的各个成分。 通过练习题来巩固理解: 1. “他非常诚恳的征求大家的意见。”——主语:他,谓语:征求,宾语:意见,状语:非常诚恳的。 2. “秋天比春天更富有欣欣向荣的景象...

    基于BERT和多相似度融合的句子对齐方法研究.docx

    通常,从篇章或段落级别的平行语料中切分句子,再通过句子对齐技术获得高质量的句子级平行语料,进一步通过词对齐得到词汇级或短语级平行语料。 目前,句子对齐技术主要有四种方法: 1. 基于句子长度的方法:通过...

    文本分类之词频统计(分词、词干提取、去停用词、计算词频,有界面)

    在英文中,同一个词的不同形式(如复数、时态变化)可能具有相同的词根,词干提取就是找出这个共同的词根。在中文中,虽然词形变化不明显,但有时也需要进行词性还原,如将“跑得快”中的“得”还原为“得”,以便...

    中文分词软件,支持自动标引

    全文检索允许用户输入任意查询词,软件会在所有文档中搜索包含这些词的句子或段落,返回最相关的结果。实现全文检索通常需要构建倒排索引,这是一种预处理技术,将每个词对应到包含它的文档列表,从而实现快速查找。...

    雅思考试快速阅读有什么技巧_1.docx

    2. 阅读并找出答案:一旦确定了可能的段落,考生需快速阅读该段,依据题目中的其他关键词在原文中找到相应的词汇。然后,仔细阅读包含这些关键词的句子,从中确定正确答案。 3. 顺序原则:雅思快速阅读遵循一定的...

    英语句子的词性标注工具

    命名实体识别的准确性超过95%,这意味着在大量文本中,该工具能高效地找出具有特定意义的实体,帮助研究人员或分析师快速定位关键信息,这对于新闻摘要、社交媒体分析、舆情监控等领域有着重大价值。 文件名...

    电信设备-基于句长惩罚因子的富含信息量句子的选择方法.zip

    1. **预处理**:对原始文本进行清洗,去除无用的标点符号、停用词和特殊字符,同时进行词干化和词形还原,以便更好地理解句子的含义。 2. **句分词**:将连续的文本分解成独立的句子,为每个句子建立单独的评估基础...

    雅思考试快速阅读有什么技巧.docx

    1. **关键词定位**:首先,找出题目中的关键词,并尝试将其与原文的段落标题或每段开头的句子对应。如果能够直接定位到某个段落,解题速度和准确性都会提高。 2. **细读段落**:确定段落后,迅速阅读整个段落,寻找...

    借我一双慧眼高考语文辨析病句.ppt

    该方法可以帮助考生快速地识别和纠正句子中的语法错误。 语法分析法的步骤包括: 1. 划分句子成份:将句子分解成不同的成份,如主语、谓语、宾语、定语、状语等。 2. 审查句子主干:检查句子的主干是否存在搭配...

    Android电子词典

    作为一个基于Android平台的软件,它利用了Android系统的开放性和可扩展性,使得用户能够在手机、平板电脑等移动设备上随时随地查阅单词、短语和句子的含义。本系统的开发旨在提供一个简洁易用的界面,让用户能够快速...

Global site tag (gtag.js) - Google Analytics