Trie树单词查找树键树（JAVA版附分析说明）

jaychang

浏览: 743859 次
性别:
来自: 嘉兴

最近访客更多访客>>

lesliehanhan

anyitzy

zlj04141220

kelly_zsl

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Data Structure And Algorithm

来源于英文“retrieval”. Trie树就是字符树，其核心思想就是空间换时间。

举个简单的例子。
给你100000个长度不超过10的单词。对于每一个单词，我们要判断他出没出现过，如果出现了，第一次出现第几个位置。
这题当然可以用hash来，但是我要介绍的是trie树。在某些方面它的用途更大。比如说对于某一个单词，我要询问它的前缀是否出现过。这样hash就不好搞了，而用trie还是很简单。

现在回到例子中，如果我们用最傻的方法，对于每一个单词，我们都要去查找它前面的单词中是否有它。那么这个算法的复杂度就是 O(n^2)。显然对于100000的范围难以接受。现在我们换个思路想。假设我要查询的单词是abcd，那么在他前面的单词中，以b，c，d，f之类开头的我显然不必考虑。而只要找以a开头的中是否存在abcd就可以了。同样的，在以a开头中的单词中，我们只要考虑以b作为第二个字母的……这样一个树的模型就渐渐清晰了……

假设有b，abc，abd，bcd，abcd，efg，hii这6个单词，我们构建的树就是这样的。

对于每一个节点，从根遍历到他的过程就是一个单词，如果这个节点被标记为红色，就表示这个单词存在，否则不存在。
那么，对于一个单词，我只要顺着他从根走到对应的节点，再看这个节点是否被标记为红色就可以知道它是否出现过了。把这个节点标记为红色，就相当于插入了这个单词。

我们可以看到，trie树每一层的节点数是26^i级别的。所以为了节省空间。我们用动态链表，或者用数组来模拟动态。空间的花费，不会超过单词数×单词长度。(转自一大牛)

Trie树的java代码实现如下：

import java.util.ArrayList;
import java.util.List;

/**
 * 单词查找树
 * 
 * @author Jay Chang
 * @since 2012-06-13
 */
class Trie {
	/** 单词查找树根节点，根节点为一个空的节点 */
	private Vertex root = new Vertex();

	/** 单词查找树的节点(内部类) */
	private class Vertex {
		/** 单词出现次数统计 */
		int wordCount;
		/** 以某个前缀开头的单词，它的出现次数 */
		int prefixCount;
		/** 子节点用数组表示 */
		Vertex[] vertexs = new Vertex[26];

		/**
		 * 树节点的构造函数
		 */
		public Vertex() {
			wordCount = 0;
			prefixCount = 0;
		}
	}

	/**
	 * 单词查找树构造函数
	 */
	public Trie() {

	}

	/**
	 * 向单词查找树添加一个新单词
	 * 
	 * @param word
	 *            单词
	 */
	public void addWord(String word) {
		addWord(root, word.toLowerCase());
	}

	/**
	 * 向单词查找树添加一个新单词
	 * 
	 * @param root
	 *            单词查找树节点
	 * @param word
	 *            单词
	 */
	private void addWord(Vertex vertex, String word) {
		if (word.length() == 0) {
			vertex.wordCount++;
		} else if (word.length() > 0) {
			vertex.prefixCount++;
			char c = word.charAt(0);
			int index = c - 'a';
			if (null == vertex.vertexs[index]) {
				vertex.vertexs[index] = new Vertex();
			}
			addWord(vertex.vertexs[index], word.substring(1));
		}
	}

	/**
	 * 统计某个单词出现次数
	 * 
	 * @param word
	 *            单词
	 * @return 出现次数
	 */
	public int countWord(String word) {
		return countWord(root, word);
	}

	/**
	 * 统计某个单词出现次数
	 * 
	 * @param root
	 *            单词查找树节点
	 * @param word
	 *            单词
	 * @return 出现次数
	 */
	private int countWord(Vertex vertex, String word) {
		if (word.length() == 0) {
			return vertex.wordCount;
		} else {
			char c = word.charAt(0);
			int index = c - 'a';
			if (null == vertex.vertexs[index]) {
				return 0;
			} else {
				return countWord(vertex.vertexs[index], word.substring(1));
			}
		}
	}

	/**
	 * 统计以某个前缀开始的单词，它的出现次数
	 * 
	 * @param word
	 *            前缀
	 * @return 出现次数
	 */
	public int countPrefix(String word) {
		return countPrefix(root, word);
	}

	/**
	 * 统计以某个前缀开始的单词，它的出现次数(前缀本身不算在内)
	 * 
	 * @param root
	 *            单词查找树节点
	 * @param word
	 *            前缀
	 * @return 出现次数
	 */
	private int countPrefix(Vertex vertex, String prefixSegment) {
		if (prefixSegment.length() == 0) {
			return vertex.prefixCount;
		} else {
			char c = prefixSegment.charAt(0);
			int index = c - 'a';
			if (null == vertex.vertexs[index]) {
				return 0;
			} else {
				return countPrefix(vertex.vertexs[index], prefixSegment.substring(1));
			}
		}
	}
	
	/**
	 * 调用深度递归算法得到所有单词
	 * @return 单词集合
	 */
	public List<String> listAllWords() {
		List<String> allWords = new ArrayList<String>();
		return depthSearchWords(allWords, root, "");
	}

	/**
	 * 递归生成所有单词
	 * @param allWords 单词集合
	 * @param vertex 单词查找树的节点
	 * @param wordSegment 单词片段
	 * @return 单词集合
	 */ 
	private List<String> depthSearchWords(List<String> allWords, Vertex vertex,
			String wordSegment) {
		Vertex[] vertexs = vertex.vertexs;
		for (int i = 0; i < vertexs.length; i++) {
			if (null != vertexs[i]) {
				if (vertexs[i].wordCount > 0) {
					allWords.add(wordSegment + (char)(i + 'a'));
					if(vertexs[i].prefixCount > 0){
						depthSearchWords(allWords, vertexs[i], wordSegment + (char)(i + 'a'));
					}
				} else {
					depthSearchWords(allWords, vertexs[i], wordSegment + (char)(i + 'a'));
				}
			}
		}
		return allWords;
	}
}

public class Main {
	public static void main(String[] args) {
		Trie trie = new Trie();
		trie.addWord("abc");
		trie.addWord("abcd");
		trie.addWord("abcde");
		trie.addWord("abcdef");
		System.out.println(trie.countPrefix("abc"));
		System.out.println(trie.countWord("abc"));
		System.out.println(trie.listAllWords());
	}
}

分享到：

Trie树应用 Phone List | Trie树单词查找树键树

2012-06-13 10:27
浏览 5213
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

高比例可再生能源电力系统的调峰成本量化与分摊模型——基于Matlab、Yalmip和Cplex的优化研究: 内容概要：本文探讨了高比例可再生能源接入对电力系统调峰能力的影响，提出了一种基于净负荷波动的调峰成本量化与分摊模型。首先，通过将负荷和可再生能源出力曲线转换为无波动的均值线，构建了无调峰需求的替代场景。接着，建立了含深度调峰和抽水蓄能的调度优化模型，用于计算不同场景下的调峰成本。通过比较有无调峰需求两种场景下的系统调峰成本，确定了单一主体导致的边际调峰成本，并采用Shapley值方法合理分摊调峰成本。研究表明，该模型可以有效反映各主体的调峰成本或贡献，有助于促进可再生能源的消纳和电力系统的稳定运行。适合人群：从事电力系统规划、运营管理和可再生能源研究的专业人士，以及关注能源政策和技术发展的研究人员。使用场景及目标：适用于评估和优化高比例可再生能源接入条件下的电力系统调峰成本，旨在提高电力系统的灵活性和经济性，同时促进可再生能源的有效利用。其他说明：该模型需要根据实际情况进行调整和优化，以适应不同地区的电力市场特点和技术水平。

ABB机器人与博图V16 Profinet通讯及外部启动配置详解: 内容概要：本文详细介绍了如何使用博图V16进行ABB机器人的外部启动及其与西门子设备的Profinet通讯配置。首先概述了ABB机器人和博图V16的基本概念，接着深入讲解了外部启动的重要性和实现方式，重点介绍了FB功能块的应用，以及Profinet通讯的具体配置步骤。文中还强调了GSD文件的作用，用于描述机器人的属性和行为，最后讨论了硬件配置的要求和注意事项，特别是对dsqc1030或dsqc652板卡的支持和888-2或888-3选项的需求。适合人群：从事工业自动化领域的工程师和技术人员，尤其是那些负责机器人集成和编程的专业人士。使用场景及目标：适用于需要将ABB机器人与西门子设备通过Profinet网络进行通讯并实现外部启动的项目。目标是提高自动化生产线的灵活性和效率，确保机器人和PLC之间的无缝协作。其他说明：本文不仅提供了理论指导，还包含了实际操作中的关键细节，有助于读者快速掌握相关技能并在实践中应用。

scratch少儿编程逻辑思维游戏源码-3D环境.zip: scratch少儿编程逻辑思维游戏源码-3D环境.zip

少儿编程scratch项目源代码文件案例素材-泼溅猫.zip: 少儿编程scratch项目源代码文件案例素材-泼溅猫.zip

新能源领域基于EMD-ARMA的风光出力预测方法及其应用: 内容概要：本文介绍了基于EMD-ARMA的组合风光出力预测方法，详细阐述了经验模态分解（EMD）和自回归移动平均（ARMA）模型的应用步骤。首先，通过EMD将原始发电数据分解为多个本征模态函数（IMF），然后用ARMA模型对各IMF分量进行建模和预测，最后将预测结果叠加重构，获得最终的风光功率预测值。文中还提供了简化的Python代码示例，帮助读者理解和实现该方法。适合人群：从事新能源研究和技术开发的专业人士，尤其是对风光发电预测感兴趣的科研人员和工程师。使用场景及目标：适用于需要提高风光发电预测精度的项目，旨在通过先进的数学模型优化电力调度和资源配置。其他说明：本文提供的代码示例仅用于教学目的，实际应用中需根据具体情况调整和完善。此外，建议在实践中参考更多专业文献和寻求专家意见以确保预测模型的准确性和可靠性。

scratch少儿编程逻辑思维游戏源码-scratch RPG 战斗.zip: scratch少儿编程逻辑思维游戏源码-scratch RPG 战斗.zip

scratch少儿编程逻辑思维游戏源码-窗户冒险.zip: scratch少儿编程逻辑思维游戏源码-窗户冒险.zip

scratch少儿编程逻辑思维游戏源码-FC经典游戏沙罗曼蛇.zip: scratch少儿编程逻辑思维游戏源码-FC经典游戏沙罗曼蛇.zip

少儿编程scratch项目源代码文件案例素材-跑酷版《我的世界》.zip: 少儿编程scratch项目源代码文件案例素材-跑酷版《我的世界》.zip

scratch少儿编程逻辑思维游戏源码-抜刀.zip: scratch少儿编程逻辑思维游戏源码-抜刀.zip

永磁同步电机无传感器控制：基于反电动势估计的扰动观测器设计与应用: 内容概要：本文介绍了永磁同步电机（PMSM）无位置传感器控制的一种创新方法，重点探讨了通过反电动势估计和扰动观测器增益设计来实现转子位置的精确估算。该方法避免了传统的PLL等位置观测器，仅需一次反正切计算即可获得转子位置，极大简化了系统复杂度。此外，模型控制器采用离散域设计，便于参数调整和适应不同电机参数。文中还提供了具体的Python代码示例，展示了从初始化电机参数到主循环控制的具体实现步骤。适合人群：从事电机控制系统设计的研究人员和技术工程师，尤其是关注永磁同步电机无传感器控制领域的专业人士。使用场景及目标：适用于需要简化调试流程、提高系统灵活性和适应多种电机参数的应用场景。主要目标是在保持高性能的同时降低硬件成本和系统复杂性。其他说明：该方法不仅简化了调试过程，还提高了系统的鲁棒性和可靠性，特别适合于工业自动化、机器人技术和电动汽车等领域。

汽车制动系统中双腔制动主缸的精细化建模与Simulink-Amesim联合仿真验证: 内容概要：本文深入探讨了乘用车双腔制动主缸的精细化建模及其在Simulink和Amesim中的联合仿真验证。文章首先介绍了双腔制动主缸的物理结构和动力学方程，特别是考虑了液压特性和机械传动的耦合关系。接着，作者详细描述了如何在Simulink中实现这些模型，并通过S函数处理变步长积分问题，确保仿真精度。此外，还讨论了联合仿真过程中遇到的数据交换频率问题，并提出了使用二阶保持器来补偿相位滞后的解决方案。最终，通过对不同推杆力输入条件下的仿真结果对比，验证了精细化模型的有效性和稳定性。适合人群：从事汽车制动系统研究的技术人员、高校相关专业师生、对车辆动力学仿真感兴趣的工程师。使用场景及目标：①帮助研究人员更好地理解和掌握双腔制动主缸的工作原理；②为后续更复杂的整车制动系统仿真提供可靠的子系统模型；③提高仿真精度，减少因模型简化带来的误差。其他说明：文中提供了详细的建模步骤、公式推导、代码实现以及仿真结果对比，附带完整视频教程和参考资料，便于初学者学习。同时强调了实际应用中需要注意的关键细节，如流量计算、数据交换频率调整等。

scratch少儿编程逻辑思维游戏源码-Scratch版Windows11.zip: scratch少儿编程逻辑思维游戏源码-Scratch版Windows11.zip

少儿编程scratch项目源代码文件案例素材-青蛙.zip: 少儿编程scratch项目源代码文件案例素材-青蛙.zip

基于Matlab Simulink的光伏交直流混合微电网离网模式双下垂控制仿真模型研究: 内容概要：本文详细介绍了光伏交直流混合微电网在离网（孤岛）模式下的双下垂控制仿真模型。该模型利用Matlab/Simulink工具进行构建和仿真，涵盖了直流微电网、交流微电网以及互联变换器（ILC）的结构和控制策略。直流微电网采用电压电流双闭环下垂控制，交流微电网则通过恒压控制和下垂控制来维持稳定的频率和电压。ILC采用双下垂控制策略，通过归一化处理和偏差调整，使得交流母线频率和直流母线电压趋于一致。此外，模型还包括采样保持、坐标变换、功率滤波、SVPWM等辅助环节，以确保系统的稳定运行和高效能量管理。实验结果显示，在负载突增的情况下，系统依然能够保持良好的波形质量和稳定性。适合人群：对微电网控制系统感兴趣的科研人员、电力工程技术人员及高校师生。使用场景及目标：适用于研究和验证光伏交直流混合微电网在离网模式下的控制策略，特别是双下垂控制的应用效果。目标是提升微电网的稳定性和能量管理效率。其他说明：仿真环境为Matlab2020b及以上版本，部分模块仅支持高版本软件。对于希望深入了解双下垂控制机制的研究者，可以通过进一步的学习和交流获得更多信息。

基于EKF的INS-GPS松组合导航：15状态NED坐标系下的精准定位技术: 内容概要：本文详细介绍了基于扩展卡尔曼滤波器（EKF）的INS（惯性测量单元）和GPS（全球定位系统）松组合导航技术。首先解释了为何需要松组合导航，即通过融合INS和GPS的优势，提高定位的稳定性和准确性。接着阐述了15状态下的EKF融合方法，涵盖速度、姿态、位置等多个系统动态参数的估计与更新。然后讨论了NED（北东地）坐标系的应用及其带来的直观物理意义。最后提供了简化的Python代码片段，演示了如何在EKF中融合INS和GPS数据，以获得连续、稳定的导航结果。适合人群：从事导航技术研发的专业人士，尤其是对EKF、INS、GPS以及多传感器数据融合感兴趣的工程师和技术研究人员。使用场景及目标：适用于需要高精度、高可靠性定位系统的应用场景，如自动驾驶汽车、无人机飞行控制系统等。目标是通过融合INS和GPS数据，克服单一传感器的局限性，提升整个导航系统的性能。其他说明：文中提供的代码仅为概念验证性质，实际工程应用中还需考虑更多复杂的因素和优化措施。

三相逆变器孤岛运行的双闭环控制策略及LCL滤波电路仿真实现: 内容概要：本文详细介绍了基于MATLAB Simulink平台的三相逆变器稳压控制仿真模型，重点探讨了孤岛运行环境下的电压电流双闭环控制策略及其LCL滤波电路的应用。首先，通过对主电路电流电压的采样并进行Park和Clark变换，将数据转换为dq坐标系下的电流电压值，然后输入双闭环控制系统进行精确调节。接着，通过反变换回到abc坐标系，并利用PWM调制对逆变器进行控制，最终实现了电压电流的稳定输出。文中还提供了简化的Matlab代码片段，展示了关键步骤的具体实现方法。此外，作者通过多次仿真实验验证了该控制策略的有效性和鲁棒性。适合人群：从事电力电子、自动化控制领域的研究人员和技术人员，尤其是对逆变器控制策略感兴趣的读者。使用场景及目标：适用于需要深入了解三相逆变器在孤岛运行环境下的稳压控制机制的研究人员和技术人员。目标是掌握电压电流双闭环控制策略以及LCL滤波电路的设计与应用，提高逆变器系统的稳定性和可靠性。其他说明：本文不仅提供了理论分析，还包括具体的仿真模型和代码示例，有助于读者更好地理解和实践相关技术。

少儿编程scratch项目源代码文件案例素材-七龙珠RPG 测试.zip: 少儿编程scratch项目源代码文件案例素材-七龙珠RPG 测试.zip

scratch少儿编程逻辑思维游戏源码-城市世界.zip: scratch少儿编程逻辑思维游戏源码-城市世界.zip

少儿编程scratch项目源代码文件案例素材-黏糊糊的圣诞节.zip: 少儿编程scratch项目源代码文件案例素材-黏糊糊的圣诞节.zip

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论