`
wx1568905209
  • 浏览: 25184 次
最近访客 更多访客>>
文章分类
社区版块
存档分类
最新评论

汉字字频统计工具(by九赢百信)

 
阅读更多

import os

path='C:\\a_9ybx.txt'

path1='C:\\a_9ybx_out.txt'

path2='C:\\a_9ybx_out1.txt'

liwai=[",","。","(",")"," ","、"," ",":",";","《","》","?","【","】","!"]

print("***************************************")

print()

print("名称:汉字词频统计工具软件 CPTJ v1.0")

print()

print("功能描述:将输入文本文件所包含的汉字进行统计,并进行输出。")

print()

print("方便汉字初学者对高频汉字进行学习。")

print()

print("作者:李刚 ")

print()

print("EMAIL:lglgang@126.com")

print()

print("版权所有:天津市九赢百信科技有限公司")

print()

print("***************************************")

a=1

while a==1:

print()

print("***************************************")

print()

print("请准备好待统计的文本文件UTF-8格式,并命名为a_9ybx.txt保存到C盘的根目录下")

str = input("如果准备好了文件请输入(Y):")

print("您输入的是:",str)

if str=='Y':

a=0

str2 = input("是否显示输出(Y显示,N不显示):")

if str2=='Y':

xx=1

else:

xx=0

f=open(path,encoding='utf-8',mode='r')

f1=open(path1,encoding='utf-8',mode='w+')

f2=open(path2,encoding='utf-8',mode='w+')

print(f)

n=os.path.getsize(path)

print(os.path.getsize(path))

a=n

tel={'0':0}

data=f.read(1)

n=1

while a>0:

a=a-1

data=f.read(1)

if data in tel:

tel[data]=tel[data]+1

else:

tel[data]=1

n=n+1

f.close()

print()

print("***************************************")

print()

print("***************************************")

dict= sorted(tel.items(),key=lambda x:x[1],reverse=True)

x=0

m=n

nmax=0

nuse=0

danzishu=0

print(type(dict[x][0]))

while n>0:

if len(dict[x][0])==1:

if ord(dict[x][0])>10000:

if dict[x][0] not in liwai:

nmax=nmax+dict[x][1]

danzishu=danzishu+1

n=n-1

x=x+1

x=0

n=m

while n>0:

if len(dict[x][0])==1:

if ord(dict[x][0])>10000:

if dict[x][0] not in liwai:

nuse=nuse+dict[x][1]

if xx==1:

print(dict[x][0],"---",dict[x][1], "完成率:",round(nuse/nmax*100,2),"%")

f1.write(dict[x][0])

n=n-1

x=x+1

print("总字数:",nmax)

print("单字数:",danzishu)

f1.close()

x=0

n=m

while n>0:

if len(dict[x][0])==1:

if ord(dict[x][0])>10000:

if dict[x][0] not in liwai:

nuse=nuse+dict[x][1]

f2.write(dict[x][0])

f2.write(",")

f2.write('%d\n' % dict[x][1])

n=n-1

x=x+1

f2.close()​​​​

转载于:https://my.oschina.net/9ybx/blog/2934039

分享到:
评论

相关推荐

    百信银行数字普惠金融架构实践共27页.pdf.zip

    【百信银行数字普惠金融架构实践】是一份深入探讨现代银行业务转型的文档,主要聚焦于如何利用数字化技术实现普惠金融的高效运作。在27页的报告中,它详细阐述了百信银行在这一领域所采取的策略、技术和架构设计,...

    百信数据在线留言系统

    总的来说,"百信数据在线留言系统"是一个方便用户交互的工具,其开源特性使开发者能够进行深度定制,提高用户体验。而提供的初始管理员账户和相关资料,使得初次接触此系统的用户也能较为顺利地进行安装和使用。对于...

    百信数据展览公司网站

    【百信数据展览公司网站】是一个专门为客户提供展览服务的在线平台,其特色在于它是由百信数据免费为用户开发的。这个网站的核心价值在于它的全站源代码是可供下载的,意味着用户可以获取到网站的完整构建,包括前端...

    百信超市POS收银系统

    总的来说,百信超市POS收银系统以其简洁的界面、丰富的功能和灵活的操作性,成为小型超市理想的收银工具。通过合理利用这套系统,商家可以有效提升店铺管理效率,优化顾客购物体验,从而提升整体经营效益。而"店铺...

    百信数据全站

    这个系统的核心特点是它的会员中心、信息发布、资源下载、信息管理、网站产品管理和友情链接等关键组件,同时还有流量统计功能,为网站运营者提供了深入的数据分析工具。 会员中心是用户在网站上进行个人操作的主要...

    20190622_智能金融(B会场)_机器阅读在智能银行中的应用深度剖析与实践_张真 百信银行AI Lab负责人.pdf

    百信银行作为一家由中信与百度联合打造、持银行牌照的金融科技企业,其首席技术架构师兼AILab负责人张真在WOT(Word Of Tech峰会)上的演讲深入剖析了机器阅读技术在智能银行中的应用。 机器阅读技术(Machine ...

    百信银行指标体系建设方案

    百信银行指标体系建设

    百信银行数据治理实践.docx

    百信银行数据治理实践.docx

    百信国际:年报2018.PDF

    百信国际:年报2018.PDF

    百信国际:年报2019.PDF

    百信国际:年报2019.PDF

    浅谈“互联网直销”新型银行的发展与未来以百信银行为例.pptx

    浅谈“互联网直销”新型银行的发展与未来——以百信银行为例 在本篇报告中,我们将探讨“互联网直销”新型银行的发展与未来,以百信银行为例。互联网直销银行是一个颠覆传统银行业的创新型银行模式,它通过互联网等...

    基于PHP的最新版有米埠百信卡盟源码.zip

    框架提供了预定义的结构、工具和最佳实践,帮助开发者更快地搭建和扩展应用。 3. **数据库设计**:源码中可能包含了数据库设计文件,如SQL脚本,用于创建和初始化数据库表。这通常涉及到商品分类、库存管理、订单...

    q百信公司全套管理制度.pdf

    但是,既然您需要从标题、描述以及提供的部分内容中生成相关知识点,我们可以尝试从“q百信公司全套管理制度.pdf”这个标题推断可能的知识点。请注意,以下内容是基于标题的假设和常规的公司管理制度的描述,并非...

    脑百信电子商务网站运营推广策划(草)

    ### 脑百信电子商务网站运营推广策划方案关键知识点解析 #### 一、网站使命与目标 1. **开辟网络销售渠道**: - 目的在于拓展除店面零售、渠道分销、行业客户之外的新销售渠道——网络销售。 - 通过网络销售替代...

    百信卡盟源码

    百信卡盟源码是一款基于PHP编程语言的在线平台源代码,主要应用于搭建卡盟网站,这类网站通常用于虚拟商品交易,如游戏点卡、充值卡等。源码的可用性已经得到了提供者的验证,确保了下载后可以正常运行,为用户提供...

    基于SpringBoot的百信手机商城的设计与实现.doc

    引入监控工具(如Prometheus、Grafana),实时监控系统状态;使用日志系统(如ELK Stack)收集和分析日志。 5.3 故障恢复与备份策略 制定故障恢复计划,定期备份数据,确保系统高可用性。 第 6章 结论 本项目...

    ASP网站实例开发源码——百信数据展览公司网站(源码+数据库).zip

    【ASP网站实例开发源码——百信数据展览公司网站(源码+数据库).zip】是一个包含ASP编程语言的网站开发实例,适用于初学者和有一定经验的开发者,用于学习和参考。这个压缩包提供了完整的百信数据展览公司的网站源...

    PHP实例开发源码-最新版有米埠百信卡盟源码.zip

    【PHP实例开发源码-最新版有米埠百信卡盟源码.zip】是一个包含PHP编程语言实现的具体项目源代码,适用于学习和研究PHP在实际应用中的开发技巧和设计模式。这个压缩包提供了有米埠百信卡盟系统的源代码,这是一个基于...

    ASP网站实例开发源码——百信数据展览公司网站(源码+数据库).rar

    【ASP网站实例开发源码——百信数据展览公司网站(源码+数据库).rar】是一个包含ASP编程语言的网站开发实例,主要用于展示如何利用ASP技术构建一个数据展览公司的在线平台。这个压缩包提供了完整的源代码和相关的...

Global site tag (gtag.js) - Google Analytics