看到以前limod写的一篇文章,
说python读纯文本已经将\r,\r\n,\n全部用\n来处理了。但我的系统中好像并没有这样。
我在ubuntu下面,Python 2.6.4
读写方式如下:
>>> data = open('dosfile.txt','r').read()
>>> print data
结果看到换行还是\r\n.
这样,我处理文本时如果想通过\n\n(两个换行)来作为分段的话,对dos格式的无效。
items = data.split('\n\n')就并不能达到我想分的段。
lines = data.splitline()倒能正确处理\r\n为\n,分行正确.但这不是我想要的。
执行:
if hasattr(open, 'newlines'):
print 'We have universal newline support'
我的没打印,说明没有设置open的
universal newline support
但不知在哪里设。
所以我用
open('dostext.txt','rU').read()解决了该问题。
在打开参数中,'rb'肯定是不会转的,'rU'是会转的。U不能和+,w等mode参数配。
==========
参考:
http://en.wikipedia.org/wiki/Newline
http://www.python.org/dev/peps/pep-0278/
http://bugs.python.org/issue6759
分享到:
相关推荐
【dos2unix_6.0.3】是一个用于在不同操作系统之间进行文本文件格式转换的实用程序,尤其针对从DOS或Windows系统到UNIX或Linux系统的情况。这个工具的主要功能是将那些使用CRLF(回车换行)作为行结束符的DOS/Windows...
在Python编程中,JSON(JavaScript Object Notation)是一种常用的数据交换格式,因其简洁和易于读写而被广泛采用。在处理JSON数据时,有时我们需要将数据写入到JSON文件中,以便于存储或后续处理。当我们在Python中...
【标题】dos2unix-5.3-win32.zip是一个针对Windows操作系统的压缩包,它包含了一款名为dos2unix的工具,该工具主要用于在Windows和Linux之间进行文本格式的转换。 【描述】dos2unix的主要功能是将Windows环境下创建...
在这篇文章中,作者详细介绍了如何使用Python脚本来模拟Unix系统中常见的dos2unix和unix2dos命令,这些命令通常用于在Windows的DOS格式和Unix/Linux的Unix格式之间转换文件的换行符。通过这种方式,可以处理跨平台...
VB(Visual Basic)格式文件和Unix格式文件之间的转换是这样的一个例子。VB格式文件通常指的是在Windows环境中创建的文本文件,它们使用CRLF(Carriage Return, Line Feed)作为行结束符,而Unix格式文件则使用LF...
《自然语言处理实战:利用Python理解、分析和生成文本》这本书是自然语言处理(NLP)领域的经典之作,由霍布森·莱恩撰写。书中的源代码是学习和实践NLP技术的重要资源,涵盖了从基础到高级的各种NLP任务。在Python...
文本分析和处理在数据挖掘、信息检索、自然语言处理等多个领域都有广泛的应用,掌握相关的技术和方法对于处理大量的文本数据是必不可少的。以下是对给定文件中提及的知识点的详细说明。 首先,文件提到了Python文本...
本文实例讲述了python正常时间和unix时间戳相互转换的方法。分享给大家供大家参考。具体分析如下: 这段代码可以用来转换常规时间格式为unix时间戳,也可以将unix时间戳转换回来, 例如:1332888820 格式转换成 ...
如果这是一个`.cpp`或`.h`文件,你可能会找到关于如何实现标题换行、富文本显示和自定义代理的具体代码示例。 总的来说,通过自定义`QHeaderView`、`QStyledItemDelegate`和使用`delegate`机制,我们可以极大地扩展...
Python中的`splitlines()`函数是处理文本数据时非常有用的一个工具,特别是在解析数据库中的text文本字段时,这些字段可能包含了换行符。本篇将详细探讨`splitlines()`函数的用法,以及如何利用它来正确地处理和解析...
### Python写入文件自动换行问题详解 #### 知识点概述 在Python编程中,文件操作是一项基本且重要的技能。对于数据处理、日志记录等应用场景,掌握如何正确地写入文件尤其关键。其中,“自动换行”是文件写入过程...
`try-except`语句用于捕获和处理异常,`pdb`模块则提供了一个交互式的调试器。 10. **持续集成与持续部署(CI/CD)**: 如`jenkins`或`travis-ci`的Python接口,可用于构建自动化测试和部署流程,确保系统管理脚本的...
另一位作者是一位资深的Python开发者,他在Python编程和文本数据挖掘方面有着丰富的实践经验,曾为多家企业提供过技术支持和咨询服务。 《文本数据挖掘与Python应用》这本书具有以下优点:内容丰富、全面、可读性强...
总的来说,`splitlines()`函数是Python中处理文本数据的一个强大工具,尤其在处理包含换行符的数据库文本时,它能确保数据在各种操作系统和开发环境中保持一致性和可读性。理解并熟练运用这个函数,将极大地提升你的...
Python是一种广泛使用的高级编程语言,它具有易于阅读和编写的特点。然而,在编写或运行Python脚本时,可能会遇到一些问题。...希望本文的内容能够帮助大家解决Python运行时不显示DOS窗口的问题,并提供一个参考。
例如,如果你有一个名为`f1.txt`的文本文件,你可以通过以下命令将其内容传递给你的Python脚本: ```bash python script.py ``` 在这个例子中,`f1.txt`的内容将被读取并作为`sys.stdin`的数据源,可供脚本处理。...
然而,系统默认的`Label`控件往往不具备自动换行的功能,这在处理长文本时可能会造成显示问题。为了克服这一限制,开发者们会编写自定义的程序来实现`Label`的文字自动换行功能。下面我们将详细讨论如何实现这一功能...
基于python实现自然语言处理敏感文本识别与分类源码+数据库sql.zip基于python实现自然语言处理敏感文本识别与分类源码+数据库sql.zip基于python实现自然语言处理敏感文本识别与分类源码+数据库sql.zip基于python实现...
"ChangeFileFormat.py" 是一个Python脚本,提供了更灵活和强大的文件格式转换功能。Python中可以使用内置的`open()`函数配合不同的模式来读写文件,并通过操作字符串来改变行结束符。例如,可以使用以下代码将LF转换...