`
wutheringsea
  • 浏览: 263342 次
  • 性别: Icon_minigender_1
  • 来自: 成都
社区版块
存档分类
最新评论

利用Python文件操作输出文本

阅读更多

1. 要求写一个程序输出指定路径下的所有java文件到一个文本文件中,用java写稍显复杂,于是试了下用python来写,代码如下:

 

 

#-*- coding:utf-8 -*-
import os

for parent,dirnames,filenames in os.walk('/home/xxxx/src'):   #遍历src下的文件
    for filename in filenames:   #循环文件列表
       if ".java" in filename:       #找出所以后缀是.java的文件
           javafile = open(os.path.join(parent,filename))   #得到该文件的绝对路径并打开文件
           for line in javafile.readlines():     #读取文件每一行,并循环
               if 'package' in line:    #行中有‘package’字样 则不输出
                   print 'Not write package'
               elif 'import' in line:    #行中有‘import’字样 则不输出
                   print 'Not write import'
               else:
                   open('myGrep.txt','a').write(line)   #将该行写入指定名称为'myGrep.txt'的文件中去
 

 

效果还不错,比用java写快捷多了。

 

参考: http://www.jb51.net/article/15459.htm

 

        http://www.phpfans.net/article/htmls/201004/Mjg0MDAy.html

 

 

2. 另外附上一个遍历文件夹下所有文件夹包括文件的方法:

 

 

#-*- coding:utf-8 -*-
#本功能借助了chardet包来实现探测字符集,并转换成utf-8的编码格式打印输出dir,file到文件
import os,chardet 

#转码函数,解决了中文显示成了ascii的问题
def _smartcode(stream):
     """smart recove stream into UTF-8
     """
     ustring=stream
     codedetect=chardet.detect(ustring)["encoding"]
     print codedetect
     try:
         print ustring
         ustring=unicode(ustring,codedetect)
         print ustring
         return "%s %s"%("",ustring.encode('utf8'))
     except:
         return u"bad unicode encode try!"



#主函数,遍历文件夹并输出文件夹和文件的路径信息保存到指定的文本中
for root,dirs,files in os.walk('/home/neptune/Dropbox'):
 #print root,dirs,files
 #open('mycd.cdc','a').write("%s %s %s" % (root,dirs,files))
 export="\n"+root+"\n"
 for d in dirs:
    export+="-d "+root+_smartcode(d)+"\n"
 for f in files:
    export+="-f %s %s \n" % (root,_smartcode(f))
 export+= "="*70

 open('mycd.cdc','a').write(export)
 

p.s. chardet包需要下载安装。地址是:http://chardet.feedparser.org/download/

p.p.s 在Python中,如果要显示中文字符,简单做法是把字符串先转化为unicode,然后在有unicode对象转化成任意其他系统可显示的编码。

分享到:
评论

相关推荐

    Python根据文本文件内容生成图片

    本项目涉及的是利用Python将文本文件的内容转化为图片,这在数据可视化、信息保密或者社交媒体分享等方面都有实际应用。关键在于使用了Python Imaging Library(PIL),这是一个用于处理图像的库。 首先,要实现这...

    使用Python读写文本文件及编写简单的文本编辑器

    本文将详细介绍如何利用Python语言进行文本文件的基本操作,并基于这些操作构建一个简单的文本编辑器。 #### 二、读取文本文件 **1. 使用`open()`函数** 要读取文本文件,最常用的方法是使用Python内置的`open()`...

    Python-将epub文件转换为文本

    通过这种方式,我们可以利用Python的强大功能将EPUB电子书转换为更易于处理的纯文本格式,方便进一步的数据分析或文本挖掘工作。同时,这也展示了Python在处理文件格式转换时的灵活性和实用性。

    利用Python语句读取json文件,并输出相应数据

    而"out"文件夹则是输出结果的地方,可能包含由Python程序生成的文本文件或其他形式的输出。 为了将数据写入新的文件,可以使用`json.dump()`函数。例如,如果你想将解析后的JSON数据保存到一个新的文件中,可以这样...

    python把文本转换为html-Python基础教程-把文本转为HTML格式.pdf

    总结来说,这个Python基础教程涵盖了将文本转换为HTML格式的核心步骤,包括利用`sys.stdin`读取输入、使用生成器`yield`处理文件内容、通过`blocks`函数实现智能分段,以及应用正则表达式进行文本过滤和格式化。...

    python文本分析与处理

    Python文本分析与处理是一门轻量级的资源文件,它涵盖了使用Python进行文本操作的常用方法和技术。文本分析和处理在数据挖掘、信息检索、自然语言处理等多个领域都有广泛的应用,掌握相关的技术和方法对于处理大量的...

    python将文本转换成图片输出的方法

    利用Python实现文本到图片的转换是一个非常实用的技巧。下面将详细介绍如何使用Python将文本内容转换为图片,并输出保存。 首先需要了解的是,文本到图片的转换涉及到Python中的图像处理库Pillow(之前称为PIL - ...

    Python笔记—利用字符串格式化输出好看文本.7z

    文件名:Python笔记—利用字符串格式化输出好看文本 配合博客地址:https://blog.csdn.net/XianZhe_/article/details/107762041 为在学习Python时所整理制作的笔记文件

    Python-命令行文本处理

    本文将深入探讨“Python-命令行文本处理”这一主题,讲解如何利用Python进行高效、灵活的文本操作。 一、Python基础与命令行界面 Python是一种解释型、面向对象的编程语言,它提供了丰富的标准库,其中包含了用于...

    快速比对txt内容并输出可视化html界面结果

    本项目利用Python这一强大的编程语言,结合文本处理和HTML生成技术,提供了一个便捷的解决方案来快速比对多个TXT文件的内容,并将比对结果以可视化的HTML界面展示出来。以下是对这个工具的详细解释: 1. **Python...

    python实现的使用huffman编码对文本的压缩与解压

    python版本为2.7.9,大家注意别下错了,里面有一个txt文件是进行压缩的,可以更改文件中的变量path1来对其他文件进行压缩与解压,代码中有详细注释,实现过程虽然简单,但是包含自己很多一些独特的想法,自己的知识...

    python统计文本文件内单词数量的方法

    在Python编程语言中,统计文本文件内的单词数量是一项常见的任务,尤其在数据分析、文本处理或者自然语言处理领域。本文将详细讲解如何通过Python实现这一功能,涉及到的关键知识点包括文件操作、字符串处理以及列表...

    Python统计西游记主要人物出场次数(使用jieba分词).zip

    在本项目中,我们利用Python编程语言和jieba分词库来统计《西游记》主要人物的出场次数。这是一个典型的自然语言处理(NLP)任务,涉及到文本处理、中文分词以及数据统计等多个知识点。下面将详细阐述这些关键点。 ...

    利用python编写exe应用,实现excel文件输出建表sql文件

    本主题聚焦于如何利用Python来创建一个图形用户界面(GUI)应用,该应用能够读取Excel文件并生成对应的SQL建表语句,然后打包成可执行文件(exe),以便在没有Python环境的计算机上运行。 首先,我们需要使用Python...

    以Java和Python为例,展示如何使用文件流来操作文本文件.rar

    本教程将深入探讨Java和Python这两种流行编程语言如何利用文件流进行文本文件的操作。让我们分别来看看Java和Python中的实现方法。 ### Java中的文件流操作 Java中的文件流操作主要依赖于`java.io`包。这个包提供...

    python实现CNN中文文本分类

    在IT领域,文本分类是一项重要的任务,特别是在自然语言处理(NLP)中。在这个场景下,我们将探讨如何使用Python和卷积神经...通过学习和实践这个项目,开发者可以深入了解如何利用深度学习技术解决中文文本分类问题。

    应用Python实现外业轨迹文本的矢量化.pdf

    因此,利用Python与ArcGIS相结合,成为一种高效的自动化空间数据处理技术。 本文提出了一种使用Python脚本和ArcGIS工具箱实现的外业轨迹文本批量转换为矢量线的软件。该软件实现了从XML、KML、CSV、TXT等多种文本...

    【精品小工具】利用python对大段文本进行预处理,并保存EXCEL表格软件

    标题中的“【精品小工具】利用python对大段文本进行预处理,并保存EXCEL表格软件”揭示了这个项目的核心:使用Python编程语言对大量文本数据进行预处理,并将处理后的结果存储为Excel表格。预处理通常包括清理文本...

    基于python语言的坐标信息转换为shapefile

    基于python语言的,将txt中坐标的文本信息转换成Arcgis中的点要素,并保存为shapefile文件

    统计文本文件中的字符单词和行数

    在IT领域,尤其是在软件开发中,经常会遇到对文本文件进行各种操作的需求,如统计文本文件中的字符、单词和行数。MFC(Microsoft Foundation Classes)是微软提供的一个C++类库,用于构建Windows应用程序,它提供了...

Global site tag (gtag.js) - Google Analytics