- 浏览: 153443 次
- 性别:
- 来自: 深圳
文章分类
最新评论
-
lyaqys:
lz实现的OptimisticExclusiveLock有点问 ...
java park/unpark 【java并发】基于JUC CAS原理,自己实现简单独占锁
>> 关于文件结束符EOF
EOF 是 End Of File 的缩写。
在C语言中,它是在标准库中定义的一个宏。
人们经常误认为 EOF 是从文件中读取的一个字符(牢记)。其实,EOF 不是一个字符,它被定义为是 int 类型的一个负数(比如 -1)。EOF 也不是文件中实际存在的内容。EOF 也不是只表示读文件到了结尾这一状态(这种状态可以用 feof() 来检测),它还能表示 I/O 操作中的读、写错误(通常可以用 ferror() 来检测)以及其它一些关联操作的错误状态。
一、getchar的两点总结:
1.getchar是以行为单位进行存取的。
当用getchar进行输入时,如果输入的第一个字符为有效字符(即输入不是文件结束符EOF,Windows下为组合键Ctrl+Z,Unix/Linux下为组合键Ctrl+D),那么只有当最后一个输入字符为换行符'/n'(也可以是文件结束符EOF,EOF将在后面讨论)时,getchar才会停止执行,整个程序将会往下执行。譬如下面程序段:
while((c =getchar())!=EOF){
putchar(c);
}
执行程序,输入:abc,然后回车。则程序就会去执行puchar(c),然后输出abc,这个地方不要忘了,系统输出的还有一个回车。然后可以继续输入,再次遇到换行符的时候,程序又会把那一行的输入的字符输出在终端上。
对于getchar,肯定很多初学的朋友会问,getchar不是以字符为单位读取的吗?那么,既然我输入了第一个字符a,肯定满足while循环(c = getchar()) != EOF的条件阿,那么应该执行putchar(c)在终端输出一个字符a。不错,我在用getchar的时候也是一直这么想的,但是程序就偏偏不着样执行,而是必需读到一个换行符或者文件结束符EOF才进行一次输出。对这个问题的一个解释是,在大师编写C的时候,当时并没有所谓终端输入的概念,所有的输入实际上都是按照文件进行读取的,文件中一般都是以行为单位的。因此,只有遇到换行符,那么程序会认为输入结束,然后采取执行程序的其他部分。同时,输入是按照文件的方式存取的,那么要结束一个文件的输入就需用到EOF(Enf Of File). 这也就是为什么getchar结束输入退出时要用EOF的原因。
2.getchar()的返回值一般情况下是字符,但也可能是负值,即返回EOF。
这里要强调的一点就是,getchar函数通常返回终端所输入的字符,这些字符系统中对应的ASCII值都是非负的。因此,很多时候,我们会写这样的两行代码:
char c;
c =getchar();
这样就很有可能出现问题。因为getchar函数除了返回终端输入的字符外,在遇到Ctrl+D(Linux下)即文件结束符EOF时,getchar()的返回EOF,这个EOF在函数库里一般定义为-1。因此,在这种情况下,getchar函数返回一个负值,把一个负值赋给一个char型的变量是不正确的。为了能够让所定义的变量能够包含getchar函数返回的所有可能的值,正确的定义方法如下(K&R C中特别提到了这个问题):
int c;
c =getchar();
二、EOF的两点总结(主要指普通终端中的EOF)
1.EOF作为文件结束符时的情况:
EOF虽然是文件结束符,但并不是在任何情况下输入Ctrl+D(Windows下Ctrl+Z)都能够实现文件结束的功能,只有在下列的条件下,才作为文件结束符。
(1)遇到getcahr函数执行时,要输入第一个字符时就直接输入Ctrl+D,就可以跳出getchar(),去执行程序的其他部分;
(2)在前面输入的字符为换行符时,接着输入Ctrl+D;
(3)在前面有字符输入且不为换行符时,要连着输入两次Ctrl+D,这时第二次输入的Ctrl+D起到文件结束符的功能,至于第一次的Ctrl+D的作用将在下面介绍。
其实,这三种情况都可以总结为只有在getchar()提示新的一次输入时,直接输入Ctrl+D才相当于文件结束符。
2.EOF作为行结束符时的情况,这时候输入Ctrl+D并不能结束getchar(),而只能引发getchar()提示下一轮的输入。
这种情况主要是在进行getchar()新的一行输入时,当输入了若干字符(不能包含换行符)之后,直接输入Ctrl+D,此时的Ctrl+D并不是文件结束符,而只是相当于换行符的功能,即结束当前的输入。以上面的代码段为例,如果执行时输入abc,然后Ctrl+D,程序输出结果为:
abcabc
注意:第一组abc为从终端输入的,然后输入Ctrl+D,就输出第二组abc,同时光标停在第二组字符的c后面,然后可以进行新一次的输入。这时如果再次输入Ctrl+D,则起到了文件结束符的作用,结束getchar()。
如果输入abc之后,然后回车,输入换行符的话,则终端显示为:
abc //第一行,带回车
abc //第二行
//第三行
其中第一行为终端输入,第二行为终端输出,光标停在了第三行处,等待新一次的终端输入。
从这里也可以看出Ctrl+D和换行符分别作为行结束符时,输出的不同结果。
EOF的作用也可以总结为:当终端有字符输入时,Ctrl+D产生的EOF相当于结束本行的输入,将引起getchar()新一轮的输入;当终端没有字符输入或者可以说当getchar()读取新的一次输入时,输入Ctrl+D,此时产生的EOF相当于文件结束符,程序将结束getchar()的执行。
【补充】本文第二部分中关于EOF的总结部分,适用于终端驱动处于一次一行的模式下。也就是虽然getchar()和putchar()确实是按照每次一个字符 进行的。但是终端驱动处于一次一行的模式,它的输入只有到“/n”或者EOF时才结束,因此,终端上得到的输出也都是按行的。
如果要实现终端在读一个字符就结束输入的话,下面的程序是一种实现的方法(参考《C专家编程》,略有改动)
/*Edit by Godbach
CU Blog: http://blog.chinaunix.net/u/33048/
*/
#include<stdio.h>
#include<stdlib.h>
int
main(void)
{
int c;
/* 终端驱动处于普通的一次一行模式 */
system("stty raw");
/* 现在的终端驱动处于一次一个字符模式 */
c =getchar();
putchar();
/* 终端驱动处又回到一次一行模式 */
system("stty cooked");
return 0;
}
编译运行该程序,则当如入一个字符时,直接出处一个字符,然后程序结束。
由此可见,由于终端驱动的模式不同,造成了getchar()输入结束的条件不一样。普通模式下需要回车或者EOF,而在一次一个字符的模式下,则输入一个字符之后就结束了。
(1) 字节的读取
在正常的情况下, getc 以 unsigned char 的方式读取文件流, 扩张为一个整数,并返
回. 换言之, getc 从文件流中取一个字节, 并加上24个零,成为一个小于256的整数,
然后返回.
int c;
while ((c = fgetc (rfp))!= -1) // -1就是 EOF
fputc (c, wfp);
上面 fputc 中的 c 虽然是整数, 但在 fputc 将其写入文件流之前, 又把整数的高24位
去掉了, 因此 fgetc, putc 配合能够实现文件复制. 到目前为止, 把 c 定义为
char仍然是可行的, 但下面我们将看到,把 c 定义为 int 是为正确判段文件是否结束.
(2) 判断文件结束.
多数人认为文件中有一个EOF,用于表示文件的结尾. 但这个观点实际上是错误的,在文
件所包含的数据中,并没有什么文件结束符. 对getc 而言, 如果不能从文件中读取,
则返回一个整数 -1,这就是所谓的EOF. 返回 EOF 无非是出现了两种情况,一是文件已
经读完; 二是文件读取出错,反正是读不下去了.
请注意: 在正常读取的情况下, 返回的整数均小于256, 即0x0~0xFF. 而读不出返回的
是 0xFFFFFFFF. 但, 假如你用fputc把 0xFFFFFFFF 往文件里头写, 高24位被屏蔽,写入的将
是 0xFF. // lixforalpha 请注意这一点
(3) 0xFF 会使我们混淆吗?
不会, 前提是, 接收返回值的 c 要按原型定义为 int.
如果下一个读取的字符将为 0xFF, 则
int c;
c = fgetc (rfp); // c = 0x000000FF;
if (c != -1) // 当然不等, -1 是 0xFFFFFFFF
fputc (wfp); // 噢, OXFF 复制成功.
字符0xFF, 其本身并不是EOF.
(4) 将 c 定义 char
假定下一个读取的字符为 0xFF 则
char c;
c = fgetc (rfp); // fgetc(rfp)的值为 0x000000FF, 暗中降为字节, c = 0xFF
if (c != -1) // 字符与整数比较? c 被带符号(signed)扩展为0xFFFFFFFF, 喔噢,
条件成立,文件复制提前退出.
while ((c=fgetc(rfp))!=EOF) 中的判别条件成立, 文件复制结束! 意外中止.
(5) 将 c 定义为 unsigned char;
当读到文件末尾, 返回 EOF 也就是 -1 时,
unsigned char c;
c = fgetc (rfp); // fgetc (rfp)的值为EOF,即-1,即0xFFFFFFFF, 降格为字节, c=0xFF
if ( c!= -1) // c 被扩展为 0x000000FF, 永远不回等于 0xFFFFFFFF
所以这次虽然能正确复制 0xFF, 但却不能判断文件结束. 事实上,在 c 为 uchar 时,
c != -1 是永远成立的, 一个高质量的编译器, 比如 gcc会在编译时指出这一点.
(6) 为何需要feof?
FILE *fp;
fp 指向一个很复杂的数据结构, feof 是通过这个结构中的标志来判断文件是否结束的.
如果文件用 fgetc 读取, 刚好把最后一个字符读出时, fp 中的EOF标志不会打开,这时
用feof判断,将会得到文件尚未结束的结论.
fgetc 返回 -1 时, 我们仍无法确信文件已经结束, 因为可能是读取错误! 这时我们
需要 feof 和 ferror.
总结:EOF并不是存在于文件中的,而是一种状态,当读到文件末尾或者读取出错时就会返回这个值来判断文件结束。(即即使读取错误可能也被认为文件结束,所以就需要用feof 和 ferror来判断是不是真的文件结束了)
当用getchar(c)时,即使c定义成字符型,也可以结束,主要是c与-1比较时,c也会从char转换为整型值。
写个小程序验证了一下
[cpp] view plaincopy
#include <stdio.h>
int main()
{
char c;
c = -1;
printf("%x",c);
return 0;
}
得到的结果为ffffffff,所以c即使定义为char型,读取文件等时还是能正常结束。
关于EOF(文件结束符)问题的体会
最近写了些代码,在对文件的操作中发现了很经典的EOF问题,呵呵。
EOF,即end of file,文件结尾,作为文件结束的标志,在程序中常作为判断的一个标志。但在我们平常的程序中却常发生意想不到的结果。
下面这段程序,猜猜它输出的是什么?
char c;
ifstream fin("d://dat");//设d:/dat文件已存在,内容为ab。
while(!fin.eof())
{
fin >> c;
cout << c;
}
输出结果是abb,没想到吗?你可能会问,再输出第一个b的时候,文件指针已经指向了EOF,为何不结束?
问题的关键是文件EOF机制是怎样运作的。
我们来谈三个问题:
1、文件指针
当打开一个文件时,文件指针位置为0,并不是指向第一个字符,即第一个字符的位置为1。这一点我们可以通过peek()函数验证。peek()返回的是当前文件指针下一个位置的字符。所以有:
ofstream fo("d://dat");
fo << 'h';
fo.close();
ifstream fi("d://dat");
char temp = fi.peek();
cout << temp;
会显示h。
还有,用fo.seekp(0,ios::beg),得文件指针为0;fo.seekp(0,ios::end),得文件指针指向最后一个字符。
2、关于EOF
很多朋友认为文件尾有EOF,这是错误的。EOF是流的状态标志。在 C++中,是在读取文件失败时才产生EOF。所以第一个程序中,在输出第一个b时,产生了EOF,再输出第二个b时读取到EOF,循环结束。
3、解决EOF困惑的办法
我感觉在判断文件结束上,最好的方法就是判断文件指针相对于开头的位置,是否等于文件长度。即:
long filelen;
ifstream fin("d://dat");//设d:/dat文件已存在,内容为ab。
fin.seekg(0,ios::end);
filelen = fin.tellg();//获取文件长度
fin.seekg(0,ios::beg);
while (1)
{
if (filelen == fin.tellg())//到达文件尾,即指向EOF
{
flag = true;
break;
}
读取数据...
}
当然还有别的方法,就是用peek()的预读性。
peek()返回当前文件指针下一个位置的字符,而指针位置不变。所以我们可以这样:
while (fi.peel()!=EOF)
{
...
}
当while循环体中,文件指针指向最后一个字符,若没有fi.peel()!=EOF,则需要再下一个循环中才能触发EOF。而加了fi.peel()!=EOF后,用预读的方法检测出了EOF。呵呵,这个方法挺好的吧!
ifstream 流 判断文件是否结尾的函数eof()
分类: C++2009-10-14 14:48 1807人阅读 评论(2) 收藏 举报
fstream流的eof() 判断有点不合常理
按正常逻辑来说,如果到了文件末尾的话 ,那eof()应返回真
但是,c++输入输出流如何知道是否到末尾呢?
原来是根据的是: 如果fin>>不能再读入数据了,才发现到了文件结尾,这时才给流设定文件结尾的标志,此后调用eof()时,才返回真。
假设
fin>>x; //此时文件刚好读完最后一个数据(将其保存在x中)
但是, 这时 fin.eof()仍未假 因为,fin流的标志eofbit是FALSE, fin流此时认为文件还没有到末尾
只有当流再次读写时
fin>>x; 发现已无可读写数据,此时流才知道到达了结尾,这时才将标志eofbit修改为TRUE
此时流才知道了文件到底了末尾
也就是说,eof在读取完最后一个数据后,仍是False,
当再次试图读一个数据时,由于发现没数据可读了 才知道到末尾了,此时才修改标志,eof变为TRUE
以下例子:
ifstream fin("D://line.txt");
ofstream fout("D://T_line.txt",ios::trunc);
list<tag_Point> test_list;
tag_Point test;
while (!fin.eof())
{
fin>>test.x;
fin>>test.y;
fin>>test.z;
test_list.push_back(test);
}
fin.close();
在运行时 发现 test_list中的数据比文本中的数据多一行,也就是 文本中最后一行的数据写了两遍
始终无法理解
现在明白了:》
再读完最后一行后,
因为fin.eof()仍为假, 所以会继续while循环
当执行到while的第一个语句 fin>>test.x时,发现无可读数据了,此时修改流属性,fin.eof ()变为TRUE
再执行 fin>>test.y; fin>>test.z;时,因为已经到文件末尾了 ,所以 test保留了上次的值,也即test中的值为变,还是文本最后一行
的数据
此时再push_back(test),压入列表的仍是最后一行数据
由此导致了,列表中的数据比文本中的数据多一行
---------------------
知道了原因 ,便很好作出修改了
修改为:
while ( fin>>test.x&&fin>>test.y&& fin>>test.z)
{
test_list.push_back(test);
}
fin.close();
这样便没问题了 ,当读取完最后一行数据后,将其放入列表中,此时判断while条件,也就是再次读取数据,发现无数据可读,读取不成功 fin>>test.x返回False 由此结束循环。
C++编程语言中的很多功能在我们的实际应用中起着非常大的作用。比如在对文件文本的操作上,就可以用多种方式来实现。在这里我们介绍的C++ eof()函数就是其中一个比较常用的基本函数。
在使用C/C++读文件的时候,一定都使用过C++ eof()函数来判断文件是否为空或者是否读到文件结尾了,也会在使用这个函数的过程中遇到一些问题,如不能准确的判断是否为空或者是否到了文件尾,以至于有些人可能还会怀疑这个函数是不是本身在设计上就有问题。
先来看看如下这段代码:
#include < iostream>
#include < fstream>
using namespace std;
int main()
{
char ch = 'x';
ifstream fin("test.txt" /*, ios::binary*/);
if (fin.eof())
{
cout < < "file is empty."< < endl;
return 0;
}
while (!fin.eof())
{
fin.get(ch);
cout < < ch;
}
system("pause");
return 0;
}
如果test.txt不存在,程序会形成死循环,fin.eof()永远返回false,就是说,eof在读取完最后一个数据后,仍是False,当再次试图读一个数据时,由于发现没数据可读了 才知道到末尾了,此时才修改标志,eof变为TRUE
如果test.txt为空,程序打印出一个x字符,因为循环刚进来时eof()状态还没设置,当读不到数据时设置为ture循环结束;
当test.txt中存在一字符串“abcd”且没有换行时,程序打印出“abcdd”,
当存在以上字符串并且有一新的空行时,程序打印出“abcd”加上一空行。其实是两行 oA输出了两次,显示调试器的caret在第三行,为什么没OD了因为是以文本方式打开的 odoa自动转化为oa;
这种现象可能让很多人很迷惑,程序运行的结果似乎很不稳定,时对时错。使用binary模式读时结果一样。在这里,大家可能有一个误区,认为eof()返回true时是读到文件的最后一个字符,其实不然,C++ eof()函数返回true时是读到文件结束符0xFF,而文件结束符是最后一个字符的下一个字符。
while(infile.peek()!=EOF) 好处在于他获取的下一个数据(但并不会让FILE指针++哦)
EOF 是 End Of File 的缩写。
在C语言中,它是在标准库中定义的一个宏。
人们经常误认为 EOF 是从文件中读取的一个字符(牢记)。其实,EOF 不是一个字符,它被定义为是 int 类型的一个负数(比如 -1)。EOF 也不是文件中实际存在的内容。EOF 也不是只表示读文件到了结尾这一状态(这种状态可以用 feof() 来检测),它还能表示 I/O 操作中的读、写错误(通常可以用 ferror() 来检测)以及其它一些关联操作的错误状态。
一、getchar的两点总结:
1.getchar是以行为单位进行存取的。
当用getchar进行输入时,如果输入的第一个字符为有效字符(即输入不是文件结束符EOF,Windows下为组合键Ctrl+Z,Unix/Linux下为组合键Ctrl+D),那么只有当最后一个输入字符为换行符'/n'(也可以是文件结束符EOF,EOF将在后面讨论)时,getchar才会停止执行,整个程序将会往下执行。譬如下面程序段:
while((c =getchar())!=EOF){
putchar(c);
}
执行程序,输入:abc,然后回车。则程序就会去执行puchar(c),然后输出abc,这个地方不要忘了,系统输出的还有一个回车。然后可以继续输入,再次遇到换行符的时候,程序又会把那一行的输入的字符输出在终端上。
对于getchar,肯定很多初学的朋友会问,getchar不是以字符为单位读取的吗?那么,既然我输入了第一个字符a,肯定满足while循环(c = getchar()) != EOF的条件阿,那么应该执行putchar(c)在终端输出一个字符a。不错,我在用getchar的时候也是一直这么想的,但是程序就偏偏不着样执行,而是必需读到一个换行符或者文件结束符EOF才进行一次输出。对这个问题的一个解释是,在大师编写C的时候,当时并没有所谓终端输入的概念,所有的输入实际上都是按照文件进行读取的,文件中一般都是以行为单位的。因此,只有遇到换行符,那么程序会认为输入结束,然后采取执行程序的其他部分。同时,输入是按照文件的方式存取的,那么要结束一个文件的输入就需用到EOF(Enf Of File). 这也就是为什么getchar结束输入退出时要用EOF的原因。
2.getchar()的返回值一般情况下是字符,但也可能是负值,即返回EOF。
这里要强调的一点就是,getchar函数通常返回终端所输入的字符,这些字符系统中对应的ASCII值都是非负的。因此,很多时候,我们会写这样的两行代码:
char c;
c =getchar();
这样就很有可能出现问题。因为getchar函数除了返回终端输入的字符外,在遇到Ctrl+D(Linux下)即文件结束符EOF时,getchar()的返回EOF,这个EOF在函数库里一般定义为-1。因此,在这种情况下,getchar函数返回一个负值,把一个负值赋给一个char型的变量是不正确的。为了能够让所定义的变量能够包含getchar函数返回的所有可能的值,正确的定义方法如下(K&R C中特别提到了这个问题):
int c;
c =getchar();
二、EOF的两点总结(主要指普通终端中的EOF)
1.EOF作为文件结束符时的情况:
EOF虽然是文件结束符,但并不是在任何情况下输入Ctrl+D(Windows下Ctrl+Z)都能够实现文件结束的功能,只有在下列的条件下,才作为文件结束符。
(1)遇到getcahr函数执行时,要输入第一个字符时就直接输入Ctrl+D,就可以跳出getchar(),去执行程序的其他部分;
(2)在前面输入的字符为换行符时,接着输入Ctrl+D;
(3)在前面有字符输入且不为换行符时,要连着输入两次Ctrl+D,这时第二次输入的Ctrl+D起到文件结束符的功能,至于第一次的Ctrl+D的作用将在下面介绍。
其实,这三种情况都可以总结为只有在getchar()提示新的一次输入时,直接输入Ctrl+D才相当于文件结束符。
2.EOF作为行结束符时的情况,这时候输入Ctrl+D并不能结束getchar(),而只能引发getchar()提示下一轮的输入。
这种情况主要是在进行getchar()新的一行输入时,当输入了若干字符(不能包含换行符)之后,直接输入Ctrl+D,此时的Ctrl+D并不是文件结束符,而只是相当于换行符的功能,即结束当前的输入。以上面的代码段为例,如果执行时输入abc,然后Ctrl+D,程序输出结果为:
abcabc
注意:第一组abc为从终端输入的,然后输入Ctrl+D,就输出第二组abc,同时光标停在第二组字符的c后面,然后可以进行新一次的输入。这时如果再次输入Ctrl+D,则起到了文件结束符的作用,结束getchar()。
如果输入abc之后,然后回车,输入换行符的话,则终端显示为:
abc //第一行,带回车
abc //第二行
//第三行
其中第一行为终端输入,第二行为终端输出,光标停在了第三行处,等待新一次的终端输入。
从这里也可以看出Ctrl+D和换行符分别作为行结束符时,输出的不同结果。
EOF的作用也可以总结为:当终端有字符输入时,Ctrl+D产生的EOF相当于结束本行的输入,将引起getchar()新一轮的输入;当终端没有字符输入或者可以说当getchar()读取新的一次输入时,输入Ctrl+D,此时产生的EOF相当于文件结束符,程序将结束getchar()的执行。
【补充】本文第二部分中关于EOF的总结部分,适用于终端驱动处于一次一行的模式下。也就是虽然getchar()和putchar()确实是按照每次一个字符 进行的。但是终端驱动处于一次一行的模式,它的输入只有到“/n”或者EOF时才结束,因此,终端上得到的输出也都是按行的。
如果要实现终端在读一个字符就结束输入的话,下面的程序是一种实现的方法(参考《C专家编程》,略有改动)
/*Edit by Godbach
CU Blog: http://blog.chinaunix.net/u/33048/
*/
#include<stdio.h>
#include<stdlib.h>
int
main(void)
{
int c;
/* 终端驱动处于普通的一次一行模式 */
system("stty raw");
/* 现在的终端驱动处于一次一个字符模式 */
c =getchar();
putchar();
/* 终端驱动处又回到一次一行模式 */
system("stty cooked");
return 0;
}
编译运行该程序,则当如入一个字符时,直接出处一个字符,然后程序结束。
由此可见,由于终端驱动的模式不同,造成了getchar()输入结束的条件不一样。普通模式下需要回车或者EOF,而在一次一个字符的模式下,则输入一个字符之后就结束了。
(1) 字节的读取
在正常的情况下, getc 以 unsigned char 的方式读取文件流, 扩张为一个整数,并返
回. 换言之, getc 从文件流中取一个字节, 并加上24个零,成为一个小于256的整数,
然后返回.
int c;
while ((c = fgetc (rfp))!= -1) // -1就是 EOF
fputc (c, wfp);
上面 fputc 中的 c 虽然是整数, 但在 fputc 将其写入文件流之前, 又把整数的高24位
去掉了, 因此 fgetc, putc 配合能够实现文件复制. 到目前为止, 把 c 定义为
char仍然是可行的, 但下面我们将看到,把 c 定义为 int 是为正确判段文件是否结束.
(2) 判断文件结束.
多数人认为文件中有一个EOF,用于表示文件的结尾. 但这个观点实际上是错误的,在文
件所包含的数据中,并没有什么文件结束符. 对getc 而言, 如果不能从文件中读取,
则返回一个整数 -1,这就是所谓的EOF. 返回 EOF 无非是出现了两种情况,一是文件已
经读完; 二是文件读取出错,反正是读不下去了.
请注意: 在正常读取的情况下, 返回的整数均小于256, 即0x0~0xFF. 而读不出返回的
是 0xFFFFFFFF. 但, 假如你用fputc把 0xFFFFFFFF 往文件里头写, 高24位被屏蔽,写入的将
是 0xFF. // lixforalpha 请注意这一点
(3) 0xFF 会使我们混淆吗?
不会, 前提是, 接收返回值的 c 要按原型定义为 int.
如果下一个读取的字符将为 0xFF, 则
int c;
c = fgetc (rfp); // c = 0x000000FF;
if (c != -1) // 当然不等, -1 是 0xFFFFFFFF
fputc (wfp); // 噢, OXFF 复制成功.
字符0xFF, 其本身并不是EOF.
(4) 将 c 定义 char
假定下一个读取的字符为 0xFF 则
char c;
c = fgetc (rfp); // fgetc(rfp)的值为 0x000000FF, 暗中降为字节, c = 0xFF
if (c != -1) // 字符与整数比较? c 被带符号(signed)扩展为0xFFFFFFFF, 喔噢,
条件成立,文件复制提前退出.
while ((c=fgetc(rfp))!=EOF) 中的判别条件成立, 文件复制结束! 意外中止.
(5) 将 c 定义为 unsigned char;
当读到文件末尾, 返回 EOF 也就是 -1 时,
unsigned char c;
c = fgetc (rfp); // fgetc (rfp)的值为EOF,即-1,即0xFFFFFFFF, 降格为字节, c=0xFF
if ( c!= -1) // c 被扩展为 0x000000FF, 永远不回等于 0xFFFFFFFF
所以这次虽然能正确复制 0xFF, 但却不能判断文件结束. 事实上,在 c 为 uchar 时,
c != -1 是永远成立的, 一个高质量的编译器, 比如 gcc会在编译时指出这一点.
(6) 为何需要feof?
FILE *fp;
fp 指向一个很复杂的数据结构, feof 是通过这个结构中的标志来判断文件是否结束的.
如果文件用 fgetc 读取, 刚好把最后一个字符读出时, fp 中的EOF标志不会打开,这时
用feof判断,将会得到文件尚未结束的结论.
fgetc 返回 -1 时, 我们仍无法确信文件已经结束, 因为可能是读取错误! 这时我们
需要 feof 和 ferror.
总结:EOF并不是存在于文件中的,而是一种状态,当读到文件末尾或者读取出错时就会返回这个值来判断文件结束。(即即使读取错误可能也被认为文件结束,所以就需要用feof 和 ferror来判断是不是真的文件结束了)
当用getchar(c)时,即使c定义成字符型,也可以结束,主要是c与-1比较时,c也会从char转换为整型值。
写个小程序验证了一下
[cpp] view plaincopy
#include <stdio.h>
int main()
{
char c;
c = -1;
printf("%x",c);
return 0;
}
得到的结果为ffffffff,所以c即使定义为char型,读取文件等时还是能正常结束。
关于EOF(文件结束符)问题的体会
最近写了些代码,在对文件的操作中发现了很经典的EOF问题,呵呵。
EOF,即end of file,文件结尾,作为文件结束的标志,在程序中常作为判断的一个标志。但在我们平常的程序中却常发生意想不到的结果。
下面这段程序,猜猜它输出的是什么?
char c;
ifstream fin("d://dat");//设d:/dat文件已存在,内容为ab。
while(!fin.eof())
{
fin >> c;
cout << c;
}
输出结果是abb,没想到吗?你可能会问,再输出第一个b的时候,文件指针已经指向了EOF,为何不结束?
问题的关键是文件EOF机制是怎样运作的。
我们来谈三个问题:
1、文件指针
当打开一个文件时,文件指针位置为0,并不是指向第一个字符,即第一个字符的位置为1。这一点我们可以通过peek()函数验证。peek()返回的是当前文件指针下一个位置的字符。所以有:
ofstream fo("d://dat");
fo << 'h';
fo.close();
ifstream fi("d://dat");
char temp = fi.peek();
cout << temp;
会显示h。
还有,用fo.seekp(0,ios::beg),得文件指针为0;fo.seekp(0,ios::end),得文件指针指向最后一个字符。
2、关于EOF
很多朋友认为文件尾有EOF,这是错误的。EOF是流的状态标志。在 C++中,是在读取文件失败时才产生EOF。所以第一个程序中,在输出第一个b时,产生了EOF,再输出第二个b时读取到EOF,循环结束。
3、解决EOF困惑的办法
我感觉在判断文件结束上,最好的方法就是判断文件指针相对于开头的位置,是否等于文件长度。即:
long filelen;
ifstream fin("d://dat");//设d:/dat文件已存在,内容为ab。
fin.seekg(0,ios::end);
filelen = fin.tellg();//获取文件长度
fin.seekg(0,ios::beg);
while (1)
{
if (filelen == fin.tellg())//到达文件尾,即指向EOF
{
flag = true;
break;
}
读取数据...
}
当然还有别的方法,就是用peek()的预读性。
peek()返回当前文件指针下一个位置的字符,而指针位置不变。所以我们可以这样:
while (fi.peel()!=EOF)
{
...
}
当while循环体中,文件指针指向最后一个字符,若没有fi.peel()!=EOF,则需要再下一个循环中才能触发EOF。而加了fi.peel()!=EOF后,用预读的方法检测出了EOF。呵呵,这个方法挺好的吧!
ifstream 流 判断文件是否结尾的函数eof()
分类: C++2009-10-14 14:48 1807人阅读 评论(2) 收藏 举报
fstream流的eof() 判断有点不合常理
按正常逻辑来说,如果到了文件末尾的话 ,那eof()应返回真
但是,c++输入输出流如何知道是否到末尾呢?
原来是根据的是: 如果fin>>不能再读入数据了,才发现到了文件结尾,这时才给流设定文件结尾的标志,此后调用eof()时,才返回真。
假设
fin>>x; //此时文件刚好读完最后一个数据(将其保存在x中)
但是, 这时 fin.eof()仍未假 因为,fin流的标志eofbit是FALSE, fin流此时认为文件还没有到末尾
只有当流再次读写时
fin>>x; 发现已无可读写数据,此时流才知道到达了结尾,这时才将标志eofbit修改为TRUE
此时流才知道了文件到底了末尾
也就是说,eof在读取完最后一个数据后,仍是False,
当再次试图读一个数据时,由于发现没数据可读了 才知道到末尾了,此时才修改标志,eof变为TRUE
以下例子:
ifstream fin("D://line.txt");
ofstream fout("D://T_line.txt",ios::trunc);
list<tag_Point> test_list;
tag_Point test;
while (!fin.eof())
{
fin>>test.x;
fin>>test.y;
fin>>test.z;
test_list.push_back(test);
}
fin.close();
在运行时 发现 test_list中的数据比文本中的数据多一行,也就是 文本中最后一行的数据写了两遍
始终无法理解
现在明白了:》
再读完最后一行后,
因为fin.eof()仍为假, 所以会继续while循环
当执行到while的第一个语句 fin>>test.x时,发现无可读数据了,此时修改流属性,fin.eof ()变为TRUE
再执行 fin>>test.y; fin>>test.z;时,因为已经到文件末尾了 ,所以 test保留了上次的值,也即test中的值为变,还是文本最后一行
的数据
此时再push_back(test),压入列表的仍是最后一行数据
由此导致了,列表中的数据比文本中的数据多一行
---------------------
知道了原因 ,便很好作出修改了
修改为:
while ( fin>>test.x&&fin>>test.y&& fin>>test.z)
{
test_list.push_back(test);
}
fin.close();
这样便没问题了 ,当读取完最后一行数据后,将其放入列表中,此时判断while条件,也就是再次读取数据,发现无数据可读,读取不成功 fin>>test.x返回False 由此结束循环。
C++编程语言中的很多功能在我们的实际应用中起着非常大的作用。比如在对文件文本的操作上,就可以用多种方式来实现。在这里我们介绍的C++ eof()函数就是其中一个比较常用的基本函数。
在使用C/C++读文件的时候,一定都使用过C++ eof()函数来判断文件是否为空或者是否读到文件结尾了,也会在使用这个函数的过程中遇到一些问题,如不能准确的判断是否为空或者是否到了文件尾,以至于有些人可能还会怀疑这个函数是不是本身在设计上就有问题。
先来看看如下这段代码:
#include < iostream>
#include < fstream>
using namespace std;
int main()
{
char ch = 'x';
ifstream fin("test.txt" /*, ios::binary*/);
if (fin.eof())
{
cout < < "file is empty."< < endl;
return 0;
}
while (!fin.eof())
{
fin.get(ch);
cout < < ch;
}
system("pause");
return 0;
}
如果test.txt不存在,程序会形成死循环,fin.eof()永远返回false,就是说,eof在读取完最后一个数据后,仍是False,当再次试图读一个数据时,由于发现没数据可读了 才知道到末尾了,此时才修改标志,eof变为TRUE
如果test.txt为空,程序打印出一个x字符,因为循环刚进来时eof()状态还没设置,当读不到数据时设置为ture循环结束;
当test.txt中存在一字符串“abcd”且没有换行时,程序打印出“abcdd”,
当存在以上字符串并且有一新的空行时,程序打印出“abcd”加上一空行。其实是两行 oA输出了两次,显示调试器的caret在第三行,为什么没OD了因为是以文本方式打开的 odoa自动转化为oa;
这种现象可能让很多人很迷惑,程序运行的结果似乎很不稳定,时对时错。使用binary模式读时结果一样。在这里,大家可能有一个误区,认为eof()返回true时是读到文件的最后一个字符,其实不然,C++ eof()函数返回true时是读到文件结束符0xFF,而文件结束符是最后一个字符的下一个字符。
while(infile.peek()!=EOF) 好处在于他获取的下一个数据(但并不会让FILE指针++哦)
发表评论
-
c语言链表实现学生管理
2013-10-28 14:13 901#include<stdio.h> #includ ... -
简单的linux -c http-client
2013-10-23 15:35 4726#include<stdio.h> #includ ... -
毗连“"aa"”和“"bb"”不能给出一个有效的预处理标识符,gcc编译错误表
2013-10-01 18:54 2995gcc bug : ##’ cannot appear at ... -
负数转化为整数
2013-10-01 12:02 1354负数转化为整数 int a = -1321313; 12 ... -
STDIN_FILENO的作用及与stdin 的区别
2013-09-08 14:48 906if(NULL == fgets(msg,100,stdi ... -
c++ 动态内存分配
2013-08-28 22:35 844先看一段代码: [cpp] view plaincopy ... -
c 专家编程
2013-08-13 17:06 688总结: -2> int * a = NUL ... -
c语言api
2013-07-31 21:06 677原型:extern int isalnum(int c); 用 ... -
c 语言无符号类型使用注意,类型升级
2013-07-30 14:37 625#define SS sizeof(int) 5 int ... -
判断两个一个链表是否存在循环(C专家编程中的问题)
2013-06-24 15:35 913判断两个一个链表是否存在循环(C专家编程中的问题) #incl ... -
atoi源码
2013-05-14 19:32 1261原文: http://blog.csdn.net/eroswa ... -
c语言特殊字符串复制
2013-05-06 01:59 8642.strcpy和memcpy主要有以下3方面的区别。 2.1 ... -
《APUE》:线程和fork(父子进程锁)
2013-04-29 21:07 1169《Unix环境高级编程》这本书附带了许多短小精美的小程序,我在 ... -
Linux多线程同步的几种方式
2013-04-22 22:49 776Linux多线程同步的几种方式 线程的最大特点是资 ... -
sphinx 安装
2013-04-10 19:54 536[@zw-76-80 soft]$ rpm -ivh MySQ ... -
防止pause和alrm产生竞争
2013-04-08 22:51 8321 #include<stdio.h> 2 ... -
关于linux环境下信号SIGCHLD的排队机制
2013-04-07 22:13 1542下面是关于在SIGCHLD的一遍网上的摘要,但是在linux中 ... -
alarm与pause
2013-04-07 20:12 7641 #include<stdio.h> 2 ... -
Linux下的定时器
2013-04-07 20:05 648Linux下的定时器有两种,以下分别介绍: 1、 ... -
linux 信号量
2013-04-04 22:24 667目录 SIGCHLD 描述 编辑本段SIG ...
相关推荐
python中判断文件结束符的方法:可以使用try except语句块来进行判断。 具体使用方法:【try:while True:s = input() except EOFError: pass】。 Python 中,用try except语句块捕获并处理异常,其基本语法结构如下...
然而,“中间带有文件结束标志符的TXT文件”意味着在文件的内容中,除了常规的字符之外,还嵌入了文件结束标志符(EOF)。这种标志符通常用于二进制文件,用来指示文件的终止,但在文本文件中出现则较为罕见,可能是...
在使用这些函数进行文件操作时,如果遇到文件结束符EOF,函数会停止执行相关操作。例如,fgetc函数用于从文件中读取下一个字符,如果已经到达文件末尾,那么该函数会返回EOF。相似地,fputc用于将字符写入文件,在...
当用getchar进行输入时,如果输入的第一个字符为有效字符(即输入是文件结束符EOF,Windows下为组合键Ctrl+Z, Unix/Linux下为组合键Ctrl+D),那么只有当最后一个输入字符为换行符’\n'(也可以是文件结束符EOF,EOF将...
EOF,全称End of File(文件结束符),在编程领域中通常用来表示文件或数据流的末尾。但在本场景中,"EOF"是“经验正交函数”(Empirical Orthogonal Functions)的缩写,这是一个在气象学、海洋学和其他地球科学领域...
1. **文件操作**:在处理文件输入时,EOF被用来标记文件的结束。 2. **键盘输入**:在读取键盘输入时,EOF用于表示输入的结束。 3. **错误检测**:如果在读取过程中发生错误,`getchar()`也会返回EOF。 #### 六、...
标题中的“eof.f90.rar_EOF分解_eof_eof fortran_eof分析气象_降水”揭示了这个压缩包文件包含了一个用Fortran语言编写的程序`eof.f90`,该程序主要用于执行EOF分解,特别是针对气象领域的降水数据。 EOF分析的核心...
readlines() 方法用于读取所有行(直到结束符 EOF)并返回列表,该列表可以由 Python 的 for… in … 结构进行处理。 如果碰到结束符 EOF 则返回空字符串。 语法 readlines() 方法语法如下: fileObject.readlines( );...
在提供的"EOF.pdf"文件中,可能包含了EOF分析的具体实现步骤、代码示例以及解释。这份资料对于初学者来说是很好的学习资源,它可能涵盖了如何在Matlab中设置脚本、调用相关函数(如`eig`进行特征值分解),以及如何...
在压缩包中的"EOF.doc"文件可能是程序的详细说明文档,包括程序的使用方法、输入输出格式、示例数据以及可能遇到的问题和解决方案。对于初学者来说,详细阅读这份文档至关重要,因为它会提供执行EOF分析所需的步骤和...
EOF,全称为文件结束符,通常被用作表示文件读取到末尾的标志。在C语言中,EOF是一个常量,其值通常为-1。当你试图从文件中读取数据但已到达文件末尾时,`fgetc()`函数会返回EOF。然而,问题在于二进制文件中可能...
下面我们将深入探讨EOF分析的基本原理、Matlab中的实现以及"EOF_96.m"这个文件可能包含的内容。 EOF分析源于主成分分析(PCA),其目的是通过找到数据的主成分来减少数据的维度,同时保留大部分的信息。在地球科学...
在压缩包中的`eof.ncl`文件就是这样一个NCL脚本实例,它包含了完整的EOF分析流程。通过学习和运行这个脚本,你可以更深入地了解EOF分析在大气科学中的应用,并掌握如何使用NCL进行此类数据分析。记得在实际操作时,...
在MATLAB编程环境中,"EOF"(End Of File)是一个重要的概念,特别是在...通过解压缩并分析“eof.zip_EOF Matlab_eof”中的“eof.asv”文件,你可以深入理解如何在MATLAB中正确处理文件结束,并提升你的文件处理能力。
"eof.m"文件很可能包含了EOF分析的主要算法和函数,能够处理输入的距平序列数据。距平序列是通过对原始数据减去时间序列的平均值,得到的一种无趋势的序列,常用于消除长期趋势,使分析更加关注短期波动和模式。 ...
1. **日志文件分析**:网站服务器通常会记录访问日志,这些日志文件可能以EOF作为数据结束的标志。分析这些日志可以帮助我们了解用户行为、服务器性能和可能的安全问题。 2. **网络数据流**:当从网络接收数据时,...
标题"EOF分析代码.rar"表明这是一个包含用于执行EOF分析的编程代码的压缩包文件。可能包含的代码文件可能使用Python、MATLAB或R语言编写,这些语言都有成熟的库支持进行EOF分析,例如Python的`scipy`和`xarray`库,...
在EOF分解小程序中,`EOF.FOR`文件应该是源代码文件,包含了计算EOF分解的算法和逻辑。FORTRAN语言的语法简洁,对数值计算支持良好,因此在科学计算领域仍然有着广泛的使用。 `EOF.DAT`可能包含输入数据,这些数据...
EOF,全称End of File,是计算机编程领域中的一个概念,通常用来表示文件或数据流的结束。在本文中,我们将深入探讨EOF的含义、如何在编程中使用它,以及与给定的“eof.rar_eof”文件相关的知识。 在文本处理和数据...