前缀树

全部 Ruby Python PHP Flash C++ .net Rails Flex C C# Django

浏览 6301 次

锁定老帖子主题：前缀树精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者	正文
thd52java 等级: 初级会员性别: 文章: 2 积分: 50 来自: 北京	发表时间：2013-11-11 相关推荐: C#前缀树红点系统源码.zip javascript trie前缀树的示例前缀树转到路由器-Golang开发 C++前缀树trie的实现 C++前缀树字典树 TrieTree的学习与模拟实现更多相关推荐算法在计算机科学中，trie，又称前缀树，是一种有序树，用于保存关联数组，其中的键通常是字符串。与二叉查找树不同，键不是直接保存在节点中，而是由节点在树中的位置决定。一个节点的所有子孙都有相同的前缀，也就是这个节点对应的字符串，而根节点对应空字符串。一般情况下，不是所有的节点都有对应的值，只有叶子节点和部分内部节点所对应的键才有相关的值。 Trie 这个术语来自于 retrieval。根据词源学，trie 的发明者 Edward Fredkin 把它读作/ˈtriː/ "tree"。但是，其他作者把它读作 /ˈtraɪ/ "try"。在图示中，键标注在节点中，值标注在节点之下。每一个完整的英文单词对应一个特定的整数。Trie 可以看作是一个确定有限状态自动机，尽管边上的符号一般是隐含在分支的顺序中的。键不需要被显式地保存在节点中。图示中标注出完整的单词，只是为了演示 trie 的原理。 trie 中的键通常是字符串，但也可以是其它的结构。trie 的算法可以很容易地修改为处理其它结构的有序序列，比如一串数字或者形状的排列。比如，bitwise trie 中的键是一串位元，可以用于表示整数或者内存地 Trie树是一种哈希树的变种，典型应用是用于统计，排序和保存大量的字符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。它的优点是：利用字符串的公共前缀来节约存储空间，最大限度地减少无谓的字符串比较，查询效率比哈希表高。字典树与字典很相似,当你要查一个单词是不是在字典树中,首先看单词的第一个字母是不是在字典的第一层,如果不在,说明字典树里没有该单词,如果在就在该字母的孩子节点里找是不是有单词的第二个字母,没有说明没有该单词,有的话用同样的方法继续查找.字典树不仅可以用来储存字母,也可以储存数字等其它数据。相对来说,Trie树是一种比较简单的数据结构.理解起来比较简单,正所谓简单的东西也得付出代价.故Trie树也有它的缺点,Trie树的内存消耗非常大.当然,或许用左儿子右兄弟的方法建树的话,可能会好点. 其基本性质可以归纳为： 1. 根节点不包含字符，除根节点外每一个节点都只包含一个字符。 2. 从根节点到某一节点，路径上经过的字符连接起来，为该节点对应的字符串。 3. 每个节点的所有子节点包含的字符都不相同。其基本操作有:查找插入和删除,当然删除操作比较少见.我在这里只是实现了对整个树的删除操作,至于单个word的删除操作也很简单. 搜索字典项目的方法为： (1) 从根结点开始一次搜索； (2) 取得要查找关键词的第一个字母，并根据该字母选择对应的子树并转到该子树继续进行检索； (3) 在相应的子树上，取得要查找关键词的第二个字母,并进一步选择对应的子树进行检索。 (4) 迭代过程…… (5) 在某个结点处，关键词的所有字母已被取出，则读取附在该结点上的信息，即完成查找。其他操作类似处理. #define MAX 26 //字符集大小 enum NODE_TYPE{ DONE, UNDONE }; typedef struct TrieNode 　　{ enum NODE_TYPE type　　 char ch; 　　 struct TrieNode next[MAX]; //26-tree->a, b ,c, .....z　　 }TrieNode; 　　 /初始化/ 　　 void InitTrieRoot(TrieNode pRoot) 　　 { 　　 pRoot = NULL; 　　 } 　　 /创建新结点/ 　　 TrieNode CreateTrieNode(char ch) 　　 { 　　 int i; 　　 TrieNode p = (TrieNode )malloc(sizeof(TrieNode)); 　　　　 p->ch = ch; p->type= UNDONE;　　 for(i =0 ; i < MAX ; i++) 　　 { 　　 p->next[i] = NULL; 　　 } 　　 return p; 　　 } 　　 /插入/ void InsertTrie(TrieNode pRoot , char s) 　　 { 　　 int i , k; 　　 TrieNode p; 　　 if(!(p =pRoot)) 　　 { 　　 p =pRoot = CreateTrieNode(' '); 　　 } 　　 i =0; for(i=0;(s+i)!='\0';i++) { k=s[i]-'a' if(!p->next[k]) p->next[k] = CreateTrieNode(s[i]); p = p->next[k]; }　　 p->type=DONE; 　　 } 　　 //查找　　 int SearchTrie(TrieNode *pRoot , chars) 　　 { 　　 TrieNode p; 　　 int i , k; 　　 if(!(p =pRoot)) 　　 { 　　 return 0; 　　 } 　　 i =0; 　　 while(s[i]) 　　 { 　　 k = s[i++] -'a'; if(p->next[k] == NULL) return 0; p = p->next[k]; 　　 } 　　 return (s[i] == '\0') && (p->type==DONE); 　　 } 声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

lonelybug 等级: 初级会员性别: 文章: 271 积分: 60	发表时间：2013-11-17 我是做过suffixtree的研究。前缀跟后缀应该只是起始点不一样，当然，解决的问题也应该略有不同！
返回顶楼	回帖地址 0 0 请登录后投票

论坛首页 → 编程语言技术版

跳转论坛: