`
CalvinMnakor
  • 浏览: 52516 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

实现变位词的程序(文件内容排序的实现)

阅读更多
       《编程珠玑》第二章提到的问题C,查找一个单词的变位词,如果,直接全排列,然后再各个比对,那效率很低,书中使用了标签来表示同一类单词,而这一标签就是签名。签名的方式很多,不同签名,不同作用方式。由于变位词是指字母相同,但字母顺序不同的单词。故使用全字母签名。由此提出了“三段式”管道结构,三部分分别加签名,排序以及挤压合并。
       第一部分,产生带有签名的词典:
void ExtendTheDictionary()
{
	//extend the dictionary in the dictionary.txt
	char word[WORDMAX],sig[WORDMAX];
	fstream iofile("dictionary.txt",ios::in|ios::out);
	assert(iofile);
	cout<<"input the word..."<<endl;
	while (scanf("%s",word) != EOF)
	{
		UpperToLower(word);
		strcpy(sig,word);
		Signature(sig);
		iofile.seekp(0,ios::end);
		iofile<<sig<<'\t'<<'\t'<<word<<endl;
		//c语言标准库中的排序算法
		//qsort(sig,strlen(sig),sizeof(char),charcomp);
		printf("%s %s\n",sig,word);
	}
	iofile.close();
}

        第二部分,按签名排序(方法很简单,也是标题中提到的关于文件内部排序的方法,每次提取出当前未排序的单词文件中最小单词,然后更新未排序单词文件):
void SortTheDictionary()
{
	char word[WORDMAX],sig[WORDMAX],word1[WORDMAX],sig1[WORDMAX],word2[WORDMAX],sig2[WORDMAX];
	cout<<"be sorting now...";
	//实现签名的排序 并生成新文件
	char *temp = "dictionary.txt";
	ofstream outfile("SortedDictionary.txt",ios::out);
	assert(outfile);
	while (true)
	{
		ifstream tmp1(temp,ios::in|ios::_Nocreate);
		//因为要删除上一个旧文件,需要清空
		ofstream tmp2("temp2.txt",ios::out);
		assert(tmp1);
		assert(tmp2);
		//find the smallest one in the current text
		if(! (tmp1>>sig>>word))  break;
		while (tmp1>>sig1>>word1)
		{
			//将当前文件中最小的签名提取出到最终文件,其他放到临时文件中
			if (strcmp(sig1,sig) > 0)
			{
				tmp2<<sig1<<'\t'<<'\t'<<word1<<endl;
			}
			else
			{
				strcpy(sig2,sig);
				strcpy(word2,word);
				strcpy(sig,sig1);
				strcpy(word,word1);
				tmp2<<sig2<<'\t'<<'\t'<<word2<<endl;
			}

		}
		outfile.seekp(0,ios::end);
		outfile<<sig<<'\t'<<'\t'<<word<<endl;
		tmp1.close();
		tmp2.close();
		//copy剩下未排序的元素
		//temp2 -> temp1
		ifstream f2("temp2.txt",ios::in);
		ofstream f1("temp1.txt",ios::out);
		//assert(f1);
		//assert(f2);
		f2.seekg(0);
		while (f2>>sig>>word)
		{
			f1<<sig<<'\t'<<'\t'<<word<<endl;
		}
		f1.close();
		f2.close();
		//更改下次排序原文件
		temp = "temp1.txt";
	}
	outfile.close();
	cout<<endl<<"√ ok."<<endl;
}

        第三部分,合并。此问题解决很简单,比较相邻两单词的签名是否相同,如果是的话,就合并到一行。
	ifstream infile("SortedDictionary.txt",ios::in);
	ofstream outfile("Result.txt",ios::out);
	assert(infile);
	assert(outfile);
	infile>>sig>>word;
	outfile<<sig<<'\t'<<'\t'<<word;
	while (infile>>sig1>>word1)
	{
		if (strcmp(sig1,sig) == 0)
		{
			if (strcmp(word1,word) == 0)
			{
				//same word here
				continue;
			}
			else
			{
				//same signature,different word
				outfile<<'\t'<<'\t'<<word1;
			}
		}
		else
		{
			outfile<<endl;
			outfile<<sig1<<'\t'<<'\t'<<word1;
			strcpy(sig,sig1);
			strcpy(word,word1);
		}
	}
	infile.close();
	outfile.close();




        另外,单词查找的话,我编了一个小函数,找到某一单词的同位词。但是,实现上有一些问题,就是,单词本身也会出现在其变位词中,如,输入stop,结果会显示:stop tops pots。还有待进一步改善。
void FindTheShiftingWord()
{
	bool result1 = false; //has this signature
	bool result2 = false; //has shifting words
	char sig[WORDMAX],word[WORDMAX],sig1[WORDMAX],word1[WORDMAX];
	//define the cache for one line
	char temp[WORDMAX*10];
	cout<<"now input the word whose shifting words u wanna find:";
	cin>>word;
	cout<<"result are:"<<endl;
	strcpy(sig,word);
	Signature(sig);
	ifstream infile("Result.txt",ios::in);
	assert(infile);
	//the first word
	infile>>sig1;
	if (strcmp(sig,sig1) == 0)
	{
        result1 = true;
		while (infile.get(word1,WORDMAX,'\n'))
		{
			//and put out all the words
			if (strcmp(word,word1) == 0) continue;
			else 
			{
				cout<<word1<<endl;
				result2 = true;
			}
		}
	}
	else
	{
		infile.seekg(0);
		while(infile.getline(temp,WORDMAX*10))
		{
			//find this line's signature
			infile>>sig1;
			if (strcmp(sig,sig1) == 0)
			{
				//find the same signature
				result1 = true;
				while (infile.get(word1,WORDMAX,'\n'))
				{
					//and put out all the words
					if (strcmp(word,word1) == 0) continue;
					else 
					{
						cout<<word1<<endl;
						result2 = true;
					}
				}
				break;//get out
			}
			else
			{
				//not the same signature
				//the next line for checking out
				continue;
			}
		}
	}
	if (! result1)
	{
		cout<<"? the dictionary does not have this word!"<<endl;
	}
	if (result1 && !result2)
	{
		cout<<"? cannot find the same word!"<<endl;
	}
}

        上述程序都集合到一个小程序中,可以实现一些功能,如添加单词,扩充词典,查看词典,找变位词等。
        此外,在尝试从其他文件导入数据上遇到些麻烦,在这点上还在努力中。


2
0
分享到:
评论

相关推荐

    变位词《编程珠玑》

    变位词:一种把某个词或句子的字母的位置(顺序)加以改换所形成的新词,英文叫做anagram,词典把这个词翻译成“变位词”。 书中将这个程序按三个阶段的“管道”组织,其中一个程序的输出文件作为下一个程序的输入...

    词典变位词检索系统.rar

    在这个项目中,我们关注的是一个由C语言实现的词典变位词检索系统,这可能是某高校学生在学期末进行的课程设计任务。 C语言是一种底层、高效且灵活的编程语言,适合开发这样的系统,因为它能够直接操作内存,提供...

    09-10_下_C++_试题.doc

    从给定的文件信息来看,这是一份针对C++编程的考试试题,主要涉及两个大题,分别是关于变位词查找的程序设计和基于`realNumber`与`complex`类的编程任务。下面将对这两个知识点进行详细解析。 ### 第一题:变位词...

    学生成绩的录入统计等代码

    在本项目中,“学生成绩的录入统计等代码”是一个基于C++编程语言实现的程序,主要用于处理学生的成绩数据。这个程序集成了多种功能,包括成绩的录入、计算、排序、修改、查找以及删除,这些都是数据管理与处理的...

    avl_Tree.rar

    当需要判断两个单词是否为变位词时,对这两个单词排序并查询AVL树,如果它们在树中的键相同,则是变位词。 4. 操作步骤: - 初始化AVL树:创建空的AVL树。 - 读取文件:逐行读取`vocabulary.txt`文件中的单词。 ...

    算法与数据结构 Python版

    变位词检测可以通过排序后比较或使用哈希表来实现。 **Python数据结构的性能** Python提供了多种内置数据结构,如列表(List)、字典(Dictionary)等。这些数据结构的性能差异较大,了解它们的内部实现机制对于选择...

Global site tag (gtag.js) - Google Analytics