`
wx1568037608
  • 浏览: 33539 次
最近访客 更多访客>>
文章分类
社区版块
存档分类
最新评论

jieba分词工具的使用方法

 
阅读更多

作为我这样的萌新,python代码的第一步是:#coding=utf-8

环境:python3.5+jieba0.39

一、jieba包安装方法:

方法1:使用conda安装 conda install jieba(首先使用conda search jieba查看远程仓库有没有jieba资源,有的话就方法一安装,没有用方法二 ,原则是优先使用conda,其次选用pip)
方法2:使用pip安装 pip install jieba

二、jieba使用方法

实现的代码用到open()函数,以下是open()函数的第二个参数,其参数解释如下:

    r   以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
    rb  以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。
    r+  打开一个文件用于读写。文件指针将会放在文件的开头。
    rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。
    w   打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
    wb  以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
    w+  打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
    wb+ 以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
    a   打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
    ab  以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
    a+  打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
    ab+ 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。  

下面代码实现读取txt文件(test.txt)内容,利用jieba实现分词并将分词结果写到一个新的txt文件(result.txt):

    #coding=utf-8
    import jieba
    import jieba.posseg as pseg
    fileNeedCut = 'G:/experiment/jieba/test.txt'
    fileName = 'G:/experiment/jieba/result.txt'
    
    fn = open(fileNeedCut, "r", encoding="utf-8")
    f = open(fileName, "w+", encoding="utf-8")
    for line in fn.readlines():
        #words = pseg.cut(line) #带分词的词性
        words = jieba.cut_for_search(line) #只是分词,不带词性
        for w in words:
            print(w, file=f)
    f.close()
    fn.close()
三、分词结果

分词前文件内容:

    大会的主题是:不忘初心,牢记使命

分词后的内容:

    大会
    的
    主题
    是
    :
    不忘
    初心
    ,
    牢记
    使命

注:使用words = pseg.cut(line)可在每个分词后面添加词性标注



作者:萌萌Msy
链接:https://www.jianshu.com/p/3a58db86a90b
来源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。
分享到:
评论

相关推荐

    如何让9人街霸变的个性化(带源代码和修改的工具)

    而"使用方法.txt"文件则提供了详细的操作指南,解释如何使用这些工具和源代码来个性化游戏。 为了个性化9人街霸,你需要按照以下步骤操作: 1. **研究源代码**:阅读并理解"源码.asm",了解游戏逻辑和数据结构。 2...

    街霸4设置汉化补丁

    街霸4设置汉化补丁,界面汉化补丁,使用与街霸43DM

    java手机游戏 街霸_源码.rar

    将源代码以RAR格式压缩,意味着用户需要使用解压工具才能查看和使用其中的内容。 【标签】:“java手机游戏 街霸_源码.rar”作为标签,突出了文件的关键信息:Java语言、手机游戏以及是街霸游戏的源代码。这个标签...

    少年街霸游戏程序

    《少年街霸游戏程序》是一款深受玩家喜爱的经典游戏,它承载了无数人的童年记忆。这款游戏在当时的街机市场上占据了重要地位,以其独特的角色设计、刺激的格斗体验和丰富的游戏模式吸引了众多玩家。 《少年街霸》的...

    街霸

    2. **Android SDK**:Android应用程序开发使用Android Software Development Kit (SDK),其中包含构建Android应用所需的所有工具和库。 3. **Activity生命周期**:Activity是Android应用的基本单元,理解其创建、...

    电子-街霸.zip

    【电子-街霸.zip】这个压缩包文件主要涵盖了与单片机和嵌入式系统相关的知识,特别是关于STM32系列微控制器的F0、F1和F2型号的使用。STM32是由意法半导体(STMicroelectronics)推出的基于ARM Cortex-M内核的微控制...

    jieba分词详解和实践

    jieba分词是Python编程语言中广泛用于处理中文文本的分词工具,它以其高效、易用和丰富的功能,成为了中文自然语言处理领域的首选组件。本文将深入解析jieba分词的工作原理,并通过实例探讨其在实践中的应用。 首先...

    Java手机街霸游戏源码.rar

    Java手机街霸游戏源码是基于早期的J2ME(Java 2 Micro Edition)平台开发的一款经典格斗游戏。J2ME是Java的一种轻量级应用平台,主要用于移动设备、嵌入式系统和其他有限资源的设备。这个源码提供了一个深入了解如何...

    Lowpoly风街霸角色布兰卡(Blanka)Blender源文件

    Lowpoly风街霸角色布兰卡(Blanka)Blender源文件 老王的原创教程见《手把手带你Godot游戏开发 第二弹】名场面临摹 之 街霸3D》 https://orzgame.blog.csdn.net/article/details/109402316

    USB摇杆手柄完美玩PC版街霸4的XP方案

    标题"USB摇杆手柄完美玩PC版街霸4的XP方案"表明了本主题的核心,即如何使用USB接口的摇杆手柄在Windows XP操作系统上顺畅地游玩PC版本的《街头霸王4》游戏。这涉及到硬件兼容性、驱动程序安装、游戏控制器设置以及...

    Blender Rigify版街霸角色隆(Ryu)绑定下载

    Blender Rigify版街霸角色隆(Ryu)绑定下载,隆的模型是由国外艺术家watchmeanimate设计的一个Lowpoly角色,原始文件是Maya格式,在Gumroad上免费下载。我将它转换成Blender格式并使用Rigify进行绑定

    街头霸王十二人街霸全人物招数战术详解.doc

    在本文档中,我们将详细介绍每个街霸的招数和战术,帮助玩家更好地理解游戏中每个街霸的特点和使用方法。 隆 ( RYU ) 和肯 ( KEN ) 隆和肯是街头霸王系列游戏中的两名主要街霸,他们的招数套路相仿,因此我们将...

    11jiebaex街霸EX酷图头像

    <img src=http://www.51one.net/softimg/2004719125065.gif border=0><br> <img border="0" alt="中国论坛网推荐" src="http://www.51one.net/softimg/2004719125065.gif" width="126" height="96">

    少年街霸图标下载

    《少年街霸》图标中常使用鲜明对比的颜色,如红色代表力量和激情,蓝色代表冷静和技术,这些颜色选择有助于强化角色的性格特征,并在视觉上吸引玩家的注意力。 除此之外,图标还需要考虑到跨平台的兼容性,例如在PC...

    街霸游戏摇杆源码

    【标题】"街霸游戏摇杆源码"揭示了这个项目的核心内容,即与街机游戏《街头霸王》相关的控制器源代码,特别是涉及到摇杆操作的部分。街霸游戏的控制器设计是游戏体验的重要组成部分,因为它直接影响到玩家的操作感受...

    html5游戏开发实力-街霸(用浏览器打开即可开玩,供开发学习使用)

    6. **Gamepad API**:允许游戏识别和使用游戏手柄,提供更丰富的输入方式。开发者可以利用这个API让玩家通过游戏手柄操作街霸的角色。 压缩包内的文件结构如下: - **index.html**:这是游戏的主入口文件,包含了...

    角色模型街霸4.zip

    《街霸4隆3D模型解析》 在游戏开发领域,3D模型是构建虚拟世界不可或缺的元素。本文将深入探讨“街霸4”中隆这一经典角色的3D模型,帮助读者理解层次模型的概念以及在游戏设计中的应用。 首先,我们要明确的是,...

    12人街霸刷键技巧.doc

    12人街霸刷键技巧.doc

    街霸:隆的模型(不含绑定)Blender源文件

    《【手把手带你Godot游戏开发 第二弹】名场面临摹 之 街霸3D》中使用的模型 教程地址:https://orzgame.blog.csdn.net/article/details/109402316

    J2ME 街霸篮球S40

    以篮球为竞技的争斗比赛,gameloft出品,在熟习技巧后进行自由赛或是街霸对抗,在达到某些积分状况下会开启新场地或角色。以自己最拿手的篮球策略击垮对手吧!动作清晰流畅,画面水准特高,投篮,过人有好多花样,是...

Global site tag (gtag.js) - Google Analytics