摘自: http://blog.csdn.net/jiqiren007/article/details/6451405
这篇文章主要是描述一个单词的变体或者变换。
问题的描述:
在编程珠玑里面是这样的:
据说是百度的一个面试题,是这样描述的:
其实总结下问题描述其实是差不多的:给定一个字典(即单词序列),用户输入一个单词,求出字典中单词的变换?
一:
看到这个题目后,直觉是可能是这样的:求出输入单词的全部变换(假如单词的长度是n,则其全部变换有n!个。如果有相同的字母就不是n!了吧?),求出单词的变换后,判断每个变换是否在字典中。
例如对于输入abc,则其变换有3!=6种:abc、acb、bca、bac、cab、cba。然后在依次判断这6个单词(当然这里不是单词了,而是字符串)是否在字典中,如果在字典中则记录下来。
很明显这种思想的复杂度是比较高的,因为对于n稍微大点的话,n!是一个很可怕的递增过程,因此这个方法是不太可取的。
二:
考虑使用hash的方法。构造一个hash函数,该函数使得单词的变换具有相同的hash值。
可以构造这样的函数,给定一个字符串,其hash值是字符串中字母的有序排列。例如字符串cda对应的hash值是acd;zhang的hash值是aghnz,即是字母从小到大的排列。这样对于一个单词的变换其hash值是相同的。
有上面的介绍后可以根据下面的步骤来进行了:
1、根据输入单词求出其hash值,即将单词按字母从小到大进行排列。
2、遍历给定的字典,对于字典里的每个单词,求出其hash值,然后和上一步中求出的hash值进行比较,如果相等,那么这个单词就是输入单词的一个变换,否则不是。
当然上面的方法是可行的。不过时间复杂度是比较高的:
word_hash = hash(word); //如果使用快排,复杂度是nlgn
for(i=0; i<n; i++)//n
{
temp = hash(dic[i]); //nlgn
if(strcmp(temp, word_hash) == 0)
{
output dic[i];
}
}
总的时间复杂度是n*nlgn(不知道算的正确不),当然,如果hash的时间复杂度降低的话还是很不错的。
通过上面可以知道其实可以提前求出字典中单词的hash值,然后再进行匹配的。这样可以有一个变化的方法:
利用c++中的mutilmap或者其他容器,将hash值和字典中的单词昨为一个pair保存在mutilmap中。pair的情况是:<hash(word), word>,其中hash(word)作为map的key,word作为value。
这样就可以遍历map进行判断了。当然也可以先对map进行排序,这样会更快点。
这大概就是这个题目的思路。
编程珠玑上有一些简单的介绍和一个程序实现;这本 STL.Tutorial.and.Reference.Guide 的第12~15章节都是分析了这个问题,不断的改进,是一个很详细的介绍,值得学习。
分享到:
相关推荐
在C语言中,查找一个已知字符串中的最长单词是一项常见的编程任务,这涉及到字符串处理、指针操作以及循环控制等基础知识。在这个问题中,我们假设输入的字符串仅包含字母和空格,空格用于分隔不同的单词。接下来,...
Anagrams by Robert Rayment.Finding anagrams quickly for up to 9 letters in VB is impossible challenge!).
不可能差分指的是,在一个特定的输入差分下,经过一定轮数的加密后,不可能得到预期的输出差分。这种现象可以被用来排除错误的密钥候选,从而加速密钥恢复过程。 #### 三、统一不可能差分查找方法(UID-method) ##...
finding a majority among n votes.pdffinding a majority among n votes.pdffinding a majority among n votes.pdffinding a majority among n votes.pdfv
它的全名可能为"A Frog for Finding Vulnerabilities",正如其标题所言,它是一款专为发现系统漏洞而设计的高性能、高稳定性的扫描工具。在网络安全日益受到重视的今天,`afrog` 的出现为安全研究人员和开发者提供了...
Finding the area and volume of a circle on matlab
solution set SE of the matrix equation AXB + CY D = E to a given matrix pair (Xf, Yf ), where A, B, C, D, and E are given matrices of suitable sizes. Our work is based on the projection theorem in the...
标题"Astar.zip_A star planning_A* path finding_STAR_matlab A-star_mov"中提到的核心概念是A*(A-star)路径规划算法,这是一种在图形搜索中非常有效的寻路算法,广泛应用于游戏开发、机器人导航和地图路线规划等...
在图论中,最短路径问题是指在一个带权重的图中找出两个节点之间的路径,使得路径上的边权之和最小。这个问题有许多经典的解决方案,如Dijkstra算法和Bellman-Ford算法。 1. Dijkstra算法:这是解决单源最短路径...
A binary search algorithm (or binary chop) is a technique for finding a particular value in a sorted list. It makes progressively better guesses, and closes in on the sought value, by comparing an ...
A Recommender System for Finding Passengers and Vacant Taxis
信息安全_数据安全_Finding a Domain’s Worth of Malware 云数据库 安全防御 区块链 安全防御 安全芯片
在探讨“finding experts on link of data”这一主题时,我们深入研究了由Lada Adamic与Eytan Adar撰写的论文摘要,该文详细分析了如何在一个社会网络中搜索和定位专家或特定个体,特别是在仅能利用局部信息的情况下...
《寻找阿尔法:量化构建交易策略》是一本深入探讨金融投资领域中量化交易策略的专著。阿尔法(Alpha)在投资领域中通常指的是超越市场平均收益的能力,是投资者追求的高回报目标。本书旨在通过严谨的定量方法,帮助...
总之,“A星寻路插件A*Pathfind Project”是一个强大的工具,它简化了Unity中的路径规划问题,使得开发者能够专注于游戏逻辑和交互设计,而无需深入研究底层算法的实现细节。通过理解和使用这个插件,你可以提升AI...
Finding the eigenvalues and eigenvectors of a symmetric matrix The algorithm finds eigen pairs of a symmetric matrix by reducing it to tridiagonal form and using the QL/QR algorithm.
Detect lanes using computer vision techniques.The following steps were performed for lane detection:* Compute the camera calibration matrix and distortion coefficients given a set of chessboard images...
- **肘部法则**:通过计算不同簇数下的误差平方和(SSE)或聚类的紧密度和分离度,画出一个随着簇数增加而减少的趋势图。最佳簇数通常是误差平方和曲线开始显著平缓的那个点,就像人的肘部那样。 - **轮廓系数**...