《编程珠玑》第二章提到的问题C,查找一个单词的变位词,如果,直接全排列,然后再各个比对,那效率很低,书中使用了标签来表示同一类单词,而这一标签就是签名。签名的方式很多,不同签名,不同作用方式。由于变位词是指字母相同,但字母顺序不同的单词。故使用全字母签名。由此提出了“三段式”管道结构,三部分分别加签名,排序以及挤压合并。
第一部分,产生带有签名的词典:
void ExtendTheDictionary()
{
//extend the dictionary in the dictionary.txt
char word[WORDMAX],sig[WORDMAX];
fstream iofile("dictionary.txt",ios::in|ios::out);
assert(iofile);
cout<<"input the word..."<<endl;
while (scanf("%s",word) != EOF)
{
UpperToLower(word);
strcpy(sig,word);
Signature(sig);
iofile.seekp(0,ios::end);
iofile<<sig<<'\t'<<'\t'<<word<<endl;
//c语言标准库中的排序算法
//qsort(sig,strlen(sig),sizeof(char),charcomp);
printf("%s %s\n",sig,word);
}
iofile.close();
}
第二部分,按签名排序(方法很简单,也是标题中提到的关于文件内部排序的方法,每次提取出当前未排序的单词文件中最小单词,然后更新未排序单词文件):
void SortTheDictionary()
{
char word[WORDMAX],sig[WORDMAX],word1[WORDMAX],sig1[WORDMAX],word2[WORDMAX],sig2[WORDMAX];
cout<<"be sorting now...";
//实现签名的排序 并生成新文件
char *temp = "dictionary.txt";
ofstream outfile("SortedDictionary.txt",ios::out);
assert(outfile);
while (true)
{
ifstream tmp1(temp,ios::in|ios::_Nocreate);
//因为要删除上一个旧文件,需要清空
ofstream tmp2("temp2.txt",ios::out);
assert(tmp1);
assert(tmp2);
//find the smallest one in the current text
if(! (tmp1>>sig>>word)) break;
while (tmp1>>sig1>>word1)
{
//将当前文件中最小的签名提取出到最终文件,其他放到临时文件中
if (strcmp(sig1,sig) > 0)
{
tmp2<<sig1<<'\t'<<'\t'<<word1<<endl;
}
else
{
strcpy(sig2,sig);
strcpy(word2,word);
strcpy(sig,sig1);
strcpy(word,word1);
tmp2<<sig2<<'\t'<<'\t'<<word2<<endl;
}
}
outfile.seekp(0,ios::end);
outfile<<sig<<'\t'<<'\t'<<word<<endl;
tmp1.close();
tmp2.close();
//copy剩下未排序的元素
//temp2 -> temp1
ifstream f2("temp2.txt",ios::in);
ofstream f1("temp1.txt",ios::out);
//assert(f1);
//assert(f2);
f2.seekg(0);
while (f2>>sig>>word)
{
f1<<sig<<'\t'<<'\t'<<word<<endl;
}
f1.close();
f2.close();
//更改下次排序原文件
temp = "temp1.txt";
}
outfile.close();
cout<<endl<<"√ ok."<<endl;
}
第三部分,合并。此问题解决很简单,比较相邻两单词的签名是否相同,如果是的话,就合并到一行。
ifstream infile("SortedDictionary.txt",ios::in);
ofstream outfile("Result.txt",ios::out);
assert(infile);
assert(outfile);
infile>>sig>>word;
outfile<<sig<<'\t'<<'\t'<<word;
while (infile>>sig1>>word1)
{
if (strcmp(sig1,sig) == 0)
{
if (strcmp(word1,word) == 0)
{
//same word here
continue;
}
else
{
//same signature,different word
outfile<<'\t'<<'\t'<<word1;
}
}
else
{
outfile<<endl;
outfile<<sig1<<'\t'<<'\t'<<word1;
strcpy(sig,sig1);
strcpy(word,word1);
}
}
infile.close();
outfile.close();
另外,单词查找的话,我编了一个小函数,找到某一单词的同位词。但是,实现上有一些问题,就是,单词本身也会出现在其变位词中,如,输入stop,结果会显示:stop tops pots。还有待进一步改善。
void FindTheShiftingWord()
{
bool result1 = false; //has this signature
bool result2 = false; //has shifting words
char sig[WORDMAX],word[WORDMAX],sig1[WORDMAX],word1[WORDMAX];
//define the cache for one line
char temp[WORDMAX*10];
cout<<"now input the word whose shifting words u wanna find:";
cin>>word;
cout<<"result are:"<<endl;
strcpy(sig,word);
Signature(sig);
ifstream infile("Result.txt",ios::in);
assert(infile);
//the first word
infile>>sig1;
if (strcmp(sig,sig1) == 0)
{
result1 = true;
while (infile.get(word1,WORDMAX,'\n'))
{
//and put out all the words
if (strcmp(word,word1) == 0) continue;
else
{
cout<<word1<<endl;
result2 = true;
}
}
}
else
{
infile.seekg(0);
while(infile.getline(temp,WORDMAX*10))
{
//find this line's signature
infile>>sig1;
if (strcmp(sig,sig1) == 0)
{
//find the same signature
result1 = true;
while (infile.get(word1,WORDMAX,'\n'))
{
//and put out all the words
if (strcmp(word,word1) == 0) continue;
else
{
cout<<word1<<endl;
result2 = true;
}
}
break;//get out
}
else
{
//not the same signature
//the next line for checking out
continue;
}
}
}
if (! result1)
{
cout<<"? the dictionary does not have this word!"<<endl;
}
if (result1 && !result2)
{
cout<<"? cannot find the same word!"<<endl;
}
}
上述程序都集合到一个小程序中,可以实现一些功能,如添加单词,扩充词典,查看词典,找变位词等。
此外,在尝试从其他文件导入数据上遇到些麻烦,在这点上还在努力中。
分享到:
相关推荐
变位词:一种把某个词或句子的字母的位置(顺序)加以改换所形成的新词,英文叫做anagram,词典把这个词翻译成“变位词”。 书中将这个程序按三个阶段的“管道”组织,其中一个程序的输出文件作为下一个程序的输入...
在这个项目中,我们关注的是一个由C语言实现的词典变位词检索系统,这可能是某高校学生在学期末进行的课程设计任务。 C语言是一种底层、高效且灵活的编程语言,适合开发这样的系统,因为它能够直接操作内存,提供...
从给定的文件信息来看,这是一份针对C++编程的考试试题,主要涉及两个大题,分别是关于变位词查找的程序设计和基于`realNumber`与`complex`类的编程任务。下面将对这两个知识点进行详细解析。 ### 第一题:变位词...
在本项目中,“学生成绩的录入统计等代码”是一个基于C++编程语言实现的程序,主要用于处理学生的成绩数据。这个程序集成了多种功能,包括成绩的录入、计算、排序、修改、查找以及删除,这些都是数据管理与处理的...
当需要判断两个单词是否为变位词时,对这两个单词排序并查询AVL树,如果它们在树中的键相同,则是变位词。 4. 操作步骤: - 初始化AVL树:创建空的AVL树。 - 读取文件:逐行读取`vocabulary.txt`文件中的单词。 ...
变位词检测可以通过排序后比较或使用哈希表来实现。 **Python数据结构的性能** Python提供了多种内置数据结构,如列表(List)、字典(Dictionary)等。这些数据结构的性能差异较大,了解它们的内部实现机制对于选择...