`
totoxian
  • 浏览: 1096724 次
  • 性别: Icon_minigender_2
  • 来自: 西安
文章分类
社区版块
存档分类
最新评论

一个python处理dos和unix格式文本的换行的问题

阅读更多

看到以前limod写的一篇文章,

说python读纯文本已经将\r,\r\n,\n全部用\n来处理了。但我的系统中好像并没有这样。
我在ubuntu下面,Python 2.6.4

读写方式如下:
>>> data = open('dosfile.txt','r').read()
>>> print data
结果看到换行还是\r\n.
这样,我处理文本时如果想通过\n\n(两个换行)来作为分段的话,对dos格式的无效。
items = data.split('\n\n')就并不能达到我想分的段。

lines = data.splitline()倒能正确处理\r\n为\n,分行正确.但这不是我想要的。

执行:
if hasattr(open, 'newlines'):
print 'We have universal newline support'
我的没打印,说明没有设置open的
universal newline support
但不知在哪里设。

所以我用
open('dostext.txt','rU').read()解决了该问题。
在打开参数中,'rb'肯定是不会转的,'rU'是会转的。U不能和+,w等mode参数配。

==========
参考:
http://en.wikipedia.org/wiki/Newline
http://www.python.org/dev/peps/pep-0278/
http://bugs.python.org/issue6759
分享到:
评论
1 楼 y5ljue 2012-01-11  
            非常感谢、、、困惑了半天终于解决了、、、

相关推荐

    dos2unix_6.0.3

    【dos2unix_6.0.3】是一个用于在不同操作系统之间进行文本文件格式转换的实用程序,尤其针对从DOS或Windows系统到UNIX或Linux系统的情况。这个工具的主要功能是将那些使用CRLF(回车换行)作为行结束符的DOS/Windows...

    Python 写入json文件内容换行显示(csdn)————程序.pdf

    在Python编程中,JSON(JavaScript Object Notation)是一种常用的数据交换格式,因其简洁和易于读写而被广泛采用。在处理JSON数据时,有时我们需要将数据写入到JSON文件中,以便于存储或后续处理。当我们在Python中...

    dos2unix-5.3-win32.zip

    【标题】dos2unix-5.3-win32.zip是一个针对Windows操作系统的压缩包,它包含了一款名为dos2unix的工具,该工具主要用于在Windows和Linux之间进行文本格式的转换。 【描述】dos2unix的主要功能是将Windows环境下创建...

    使用python实现unix2dos和dos2unix命令的例子

    在这篇文章中,作者详细介绍了如何使用Python脚本来模拟Unix系统中常见的dos2unix和unix2dos命令,这些命令通常用于在Windows的DOS格式和Unix/Linux的Unix格式之间转换文件的换行符。通过这种方式,可以处理跨平台...

    将VB格式文件转换为Unix格式文件

    VB(Visual Basic)格式文件和Unix格式文件之间的转换是这样的一个例子。VB格式文件通常指的是在Windows环境中创建的文本文件,它们使用CRLF(Carriage Return, Line Feed)作为行结束符,而Unix格式文件则使用LF...

    《自然语言处理实战:利用Python理解、分析和生成文本》源代码,作者霍布森•莱恩

    《自然语言处理实战:利用Python理解、分析和生成文本》这本书是自然语言处理(NLP)领域的经典之作,由霍布森·莱恩撰写。书中的源代码是学习和实践NLP技术的重要资源,涵盖了从基础到高级的各种NLP任务。在Python...

    使用Python进行医疗临床文本处理

    医疗临床文本处理是医疗保健领域的一个重要应用,通过自然语言处理(NLP)技术,可以对医疗临床文本进行分析和处理,从而改善医疗保健的诊断、预防和治疗。 在描述中提到了人工智能在医学领域的崛起,对医疗保健的...

    python文本分析与处理

    文本分析和处理在数据挖掘、信息检索、自然语言处理等多个领域都有广泛的应用,掌握相关的技术和方法对于处理大量的文本数据是必不可少的。以下是对给定文件中提及的知识点的详细说明。 首先,文件提到了Python文本...

    python正常时间和unix时间戳相互转换的方法

    本文实例讲述了python正常时间和unix时间戳相互转换的方法。分享给大家供大家参考。具体分析如下: 这段代码可以用来转换常规时间格式为unix时间戳,也可以将unix时间戳转换回来, 例如:1332888820 格式转换成 ...

    QTableView 标题换行显示和富文本显示 qt5.8

    如果这是一个`.cpp`或`.h`文件,你可能会找到关于如何实现标题换行、富文本显示和自定义代理的具体代码示例。 总的来说,通过自定义`QHeaderView`、`QStyledItemDelegate`和使用`delegate`机制,我们可以极大地扩展...

    python使用splitlines()函数正确解析数据库中的text文本中换行内容

    Python中的`splitlines()`函数是处理文本数据时非常有用的一个工具,特别是在解析数据库中的text文本字段时,这些字段可能包含了换行符。本篇将详细探讨`splitlines()`函数的用法,以及如何利用它来正确地处理和解析...

    python写入文件自动换行问题的方法

    ### Python写入文件自动换行问题详解 #### 知识点概述 在Python编程中,文件操作是一项基本且重要的技能。对于数据处理、日志记录等应用场景,掌握如何正确地写入文件尤其关键。其中,“自动换行”是文件写入过程...

    Python.Unix和Linux系统管理指南 源代码

    `try-except`语句用于捕获和处理异常,`pdb`模块则提供了一个交互式的调试器。 10. **持续集成与持续部署(CI/CD)**: 如`jenkins`或`travis-ci`的Python接口,可用于构建自动化测试和部署流程,确保系统管理脚本的...

    文本数据挖掘与Python应用.pptx

    另一位作者是一位资深的Python开发者,他在Python编程和文本数据挖掘方面有着丰富的实践经验,曾为多家企业提供过技术支持和咨询服务。 《文本数据挖掘与Python应用》这本书具有以下优点:内容丰富、全面、可读性强...

    Web开发-使用splitlines()函数正确解析数据库中的text文本中换行内容-Python源码示例.zip

    总的来说,`splitlines()`函数是Python中处理文本数据的一个强大工具,尤其在处理包含换行符的数据库文本时,它能确保数据在各种操作系统和开发环境中保持一致性和可读性。理解并熟练运用这个函数,将极大地提升你的...

    Python运行不显示DOS窗口的解决方法

    Python是一种广泛使用的高级编程语言,它具有易于阅读和编写的特点。然而,在编写或运行Python脚本时,可能会遇到一些问题。...希望本文的内容能够帮助大家解决Python运行时不显示DOS窗口的问题,并提供一个参考。

    python把文本转换为html-Python基础教程-把文本转为HTML格式.pdf

    例如,如果你有一个名为`f1.txt`的文本文件,你可以通过以下命令将其内容传递给你的Python脚本: ```bash python script.py ``` 在这个例子中,`f1.txt`的内容将被读取并作为`sys.stdin`的数据源,可供脚本处理。...

    python文本处理

    经典的使用python进行文本处理的教程。

    实现label文字以指定长度自动换行

    然而,系统默认的`Label`控件往往不具备自动换行的功能,这在处理长文本时可能会造成显示问题。为了克服这一限制,开发者们会编写自定义的程序来实现`Label`的文字自动换行功能。下面我们将详细讨论如何实现这一功能...

Global site tag (gtag.js) - Google Analytics