中文保存，读取，搜索 - 23号球衣 - ITeye博客

`

xushaoxun

浏览: 52792 次
性别:
来自: 厦门

最近访客更多访客>>

萧仁武

sn200837

楼兰雪

wanshi724

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

cscs31：很有用的函数！！
dojo and ajax
cscs31：这个函数很有用！！！
dojo and ajax
cscs31： Lz能加上一些注解和例子就更好了：）
Dojo 与style相关的函数整理

中文保存，读取，搜索

博客分类：

python

Excel C C++C#Eclipse

阅读更多

# -*- coding: utf-8 -*- 这行到底什么作用？？？

#中文字符保存到文件，读取，搜索
f = open('out2.txt', 'w')
f.write('你好吗？')
f.close()
#文件可正常显示中文。

#读取, print 到eclipse cosole
f = open('out2.txt')
s = f.read()
f.close()
print s    #浣犲ソ鍚楋紵. type(s)==<type str>
print s.decode('utf-8')     # 你好吗？
print s.find('好')   # 3

print re.search('好', s).group(0).decode('utf-8')    # 好

#读取网页
import urllib
url2 = 'http://scn1.travian.cn/login.php'
usock = urllib.urlopen(url2)
c = usock.read()
usock.close()

#读取出的字符流是utf-8编码
#似乎和<meta http-equiv="content-type" content="text/html; charset=UTF-8">有关
#保存之后可正常显示中文
print >>open('page.html', 'w'), c   #文件以utf-8编码保存。
idx = c.find('密码')      #5245
print c[idx:idx+10].decode('utf-8')         #可显示: 密码
#print c.decode('utf-8')     #错误, 为什么？搞不懂！

print re.search('用户名', c).group().decode('utf8')     #ok

保存中文到csv文件

# -*- coding: cp936 -*-
import sys
print sys.getdefaultencoding() #cp936, coding必须和这个值一致

cc = open('2.csv', 'w')
s = '我,你\na,b\n1,2'
print>>cc, s #用excel打开可查看中文

分享到：

python的3种时间表示 | 关于<#assign>

2008-09-05 11:36
浏览 909
评论(0)
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

c#读取pdf中文本内容: 然而，PDF文件的封闭性使得直接读取其中的文本内容并非易事，尤其是处理中文文本时。这时，我们就需要借助特定的库或插件来实现。本篇文章将围绕“C#读取PDF中文本内容”这一主题，详细介绍如何使用Spire.Pdf插件来...

TC16单片机读取TF卡中的TXT文件显示到LCD屏: 在本项目中，我们主要探讨如何使用STC16单片机来实现读取TF卡中的TXT文件，并将其内容显示在LCD屏幕上。...在实际应用中，还可以根据具体需求进行扩展，比如添加文件搜索、编辑功能，或者优化显示效果等。

usbkey(加密狗)读取: - 最后将读取到的USBKey信息保存到HTML表单元素`Hdfusbkey`中，并显示一个提示消息。 #### 四、USBKey的应用场景 USBKey因其安全性高、便携性强等特点，在多个领域得到广泛应用： - **银行网银**：用户使用USB...

C#读取CAD表格数据.zip: 在本项目中，Winform将创建一个窗口，展示读取到的CAD表格数据，可能包括数据列表、搜索功能、编辑选项等。 5. **读取CAD表格数据**：这个过程涉及到加载DWG文件、获取其中的表格对象、遍历表格单元格并提取数据。...

.NET生成二维码读取二维码Demo（修改版）: 在上一版本的代码中，如果读取错误可能是由于二维码图像质量差、解码参数设置不当或者解码库不支持中文字符导致的。为了解决这些问题，可以尝试调整图像预处理参数，如灰度化和二值化；确保使用支持UTF-8的解码器；...

易语言编辑框批量保存模块: 在“易语言编辑框批量保存模块”中，我们主要讨论的是如何利用易语言处理文本编辑框中的大量内容，并进行高效的批量保存和读取操作。编辑框是软件界面中常见的元素，通常用于用户输入或查看文本信息。在易语言中，...

易语言连接mysql数据库来实现读取写入修改实例: 易语言是一种专为中国人设计的编程语言，它以简体中文作为编程语法，降低了编程的门槛，使得更多非计算机专业的人也能快速上手编程。在本实例中，我们将探讨如何使用易语言连接MySQL数据库，进行数据的读取、写入和...

PHP汉字拼音对照搜索模块，附汉字拼音TXT库: 总的来说，这个PHP汉字拼音对照搜索模块是一个实用的工具，它可以帮助开发者实现基于拼音的中文搜索功能。在实际应用中，还需要考虑性能优化、错误处理和用户体验等方面的细节，确保系统的稳定性和效率。

VB获取汉字的拼音首字母: 在VB（Visual Basic）编程环境中，获取汉字的拼音首字母是一项常见的需求，特别是在处理中文数据、搜索优化或者信息分类时。这个功能可以帮助我们将汉字转换为它们对应的拼音缩写，便于计算机处理。以下将详细讲解...

MagnetSearch2.1.1 资源搜索神器: 3.5 CTRL + R从文件读取搜索结果 4.菜单操作：在下载结果可以使用菜单来进行查看，复制，删除，清空操作 5.引擎的数量不宜超过10个，取决与CPU速度，内存，网络带宽等 6.下载工具推荐迅雷，QQ旋风，百度网盘，115...

获取汉字拼音首字母、全拼: 在IT领域，处理汉字与拼音的转换是一项常见的任务，尤其在文本处理、搜索引擎优化或中文信息检索中。本文将详细探讨如何获取汉字的拼音首字母和全拼，并涉及字符集的相关知识。首先，我们要理解汉字拼音转换的基本...

DelPhi中文转拼音，全拼和首字母: 4. 文件I/O操作：如果程序涉及读取或保存拼音数据，可能需要掌握文件操作的相关知识。 5. 错误处理和异常处理：确保程序在遇到不正常情况时能够稳定运行。 6. 用户界面设计：如果提供图形用户界面，需要了解Delphi的...

如何使用Lucene的中文分词搜索: **标题：“如何使用Lucene的中文分词搜索”** 在信息检索和文本处理领域，Apache Lucene是一个强大的全文搜索引擎库，它提供了高级的索引和搜索功能。在处理中文文本时，由于中文句子是由词语组成的，而非单个字符...

易语言快速加载excel: 易语言是一种专为中国用户设计的编程语言，它以简化的语法和中文编程为特点，使得初学者能够更快地掌握编程技能。在“易语言快速加载excel”这个主题中，我们主要探讨的是如何利用易语言来高效地处理Excel文件，包括...

lucene 搜索中文PDF文档: 在索引过程中，需要将PDF文件的元数据（如文件名、路径等）一并保存，以便后续搜索时提供更多的上下文信息。搜索阶段，用户输入查询后，`Analyzer`会再次处理查询字符串，生成查询项。`IndexSearcher`负责执行查询...

ANSA第二章中文帮助文档: 保存/读取/比较设置 - **保存(Save/Saveto)**：用户可以使用“保存”按钮将当前的设置保存到ANSA文件、translators文件和ANSA.xml文件中。具体保存方式请参考2.2.2章节。 - **读取(Read)**：用户可以使用“读取”...

VS2013 VC++ 窗口程序使用汉字问题.doc: 在使用Visual Studio 2013 (简称VS2013)进行C++编程时，尤其是开发涉及中文界面的应用程序，可能会遇到窗口程序无法正常显示汉字的问题。这主要是因为默认情况下，VS2013的项目配置可能不支持多字节字符集，导致中文...

淘特站内搜索引擎(C#版) v2.1 源码: 淘特站内搜索引擎是由淘特JSP搜索引擎发展而来，系统基于Lucene.Net核心，通过高效的中文分词算法将数据库中内容进行分析、索引并保存至硬盘中。前台搜索时，通过读取索引文件查询，避免了传统数据库查询在高并发及...

淘特站内搜索引擎(C#版) v3.3: 淘特站内搜索引擎是由淘特JSP搜索引擎发展而来，系统基于Lucene.Net核心，通过高效的中文分词算法将数据库中内容进行分析、索引并保存至硬盘中。前台搜索时，通过读取索引文件查询，避免了传统数据库查询在高并发及...

spark实现财经新闻搜索引擎（正文提取、中文分词、倒排索引构建、执行搜索）: 2. **中文分词**：此阶段将新闻正文进行中文分词，使用类似于WordCount的算法，将分词后的结果与每个新闻的URL、标题和正文一起保存。可使用开源的中文分词工具，如jieba分词库，将分词结果写入文件或HBase数据库。...

Global site tag (gtag.js) - Google Analytics