相关推荐
-
国内外优秀开源项目创始人专访
这几年陆续采访了国内外一些优秀开源项目的zuozh
-
R语言︱文本挖掘之中文分词包——Rwordseg包(原理、功能、详解)
笔者寄语:与前面的RsowballC分词不同的地方在于这是一个中文的分词包,简单易懂,分词是一个非常重要的步骤,可以通过一些字典,进行特定分词。大致分析步骤如下: 数据导入——选择分词字典——分词 但是下载...
-
中文分词工具Rwordseg
Ansj 也是一个开源的 Java 中文分词工具,基于中科院的 ictclas 中文分词算法,采用隐马尔科夫模型(Hidden Markov Model, HMM)。作者孙健重写了一个Java版本,并且全部开源,使得 Ansi 可用于人名识别、地名识别...
-
中文分词的应用 新浪和庖丁两种方式对比
中文分词相比于英文难度要大得多,涉及到自然语言的理解和处理。分词也是文本挖掘中的关键技术之一,百度也是因为中文分词相比于google更优秀,才做到中文的检索结果更优。实际上新浪、百度云服务上很多开发者也开放...
-
Lucene下分词工具的学习探讨
今天一天学习的东西不多,除了看《Lucene实战》第20页的程序,就是研究Java版本的开源分词器了! 在网上找到了两种分词器,ansj和imdict,本质上没有什么区别,都是用采用ICTCLAS的核心。个人觉得ansj要更好一些,...
-
NLP自然语言处理干货贴
摘要:作者:苏剑林 来源网站:科学空间 原文链接:OCR技术浅探:9. 代码共享(完) 文件说明: 1. image... 2.OCR技术浅探:8. 综合评估 摘要:作者:苏剑林 来源网站:科学空间 原文链接:OCR技术浅探:8. 综合...
-
《基于YOLOv8的船舶货舱货物移位预警系统》(包含源码、可视化界面、完整数据集、部署教程)简单部署即可运行。功能完善、操作简单,适合毕设或课程设计.zip
资源内项目源码是来自个人的毕业设计,代码都测试ok,包含源码、数据集、可视化页面和部署说明,可产生核心指标曲线图、混淆矩阵、F1分数曲线、精确率-召回率曲线、验证集预测结果、标签分布图。都是运行成功后才上传资源,毕设答辩评审绝对信服的保底85分以上,放心下载使用,拿来就能用。包含源码、数据集、可视化页面和部署说明一站式服务,拿来就能用的绝对好资源!!! 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、大作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.txt文件,仅供学习参考, 切勿用于商业用途。
-
wrf转mp4播放器1.1.1
wrf转mp4播放器1.1.1
-
Simulink中三阶单环多位量化Σ-Δ调制器的设计与实现-音频带ADC的应用(复现论文或解答问题,含详细可运行代码及解释)
内容概要:本文档详细介绍了如何在Simulink中设计一个满足特定规格的音频带ADC(模数转换器)。首先选择了三阶单环多位量化Σ-Δ调制器作为设计方案,因为这种结构能在音频带宽内提供高噪声整形效果,并且多位量化可以降低量化噪声。接着,文档展示了具体的Simulink建模步骤,包括创建模型、添加各个组件如积分器、量化器、DAC反馈以及连接它们。此外,还进行了参数设计与计算,特别是过采样率和信噪比的估算,并引入了动态元件匹配技术来减少DAC的非线性误差。性能验证部分则通过理想和非理想的仿真实验评估了系统的稳定性和各项指标,最终证明所设计的ADC能够达到预期的技术标准。 适用人群:电子工程专业学生、从事数据转换器研究或开发的技术人员。 使用场景及目标:适用于希望深入了解Σ-Δ调制器的工作原理及其在音频带ADC应用中的具体实现方法的人群。目标是掌握如何利用MATLAB/Simulink工具进行复杂电路的设计与仿真。 其他说明:文中提供了详细的Matlab代码片段用于指导读者完成整个设计流程,同时附带了一些辅助函数帮助分析仿真结果。
-
4-1-台区智能融合终端技术规范(试行).pdf
国网台区终端最新规范
-
《基于YOLOv8的智慧农业水肥一体化控制系统》(包含源码、可视化界面、完整数据集、部署教程)简单部署即可运行。功能完善、操作简单,适合毕设或课程设计.zip
《基于YOLOv8的智慧农业水肥一体化控制系统》(包含源码、可视化界面、完整数据集、部署教程)简单部署即可运行。功能完善、操作简单,适合毕设或课程设计
-
GSDML-V2.33-LEUZE-AMS3048i-20170622.xml
GSDML-V2.33-LEUZE-AMS3048i-20170622.xml
-
宠物健康监测小程序.zip
微信小程序项目课程设计,包含LW+ppt
-
基于微信小程序的家校通系统开发与实现.zip
微信小程序项目课程设计,包含LW+ppt
-
终端输出随机颜色的进度条小脚本
终端运行进度条脚本
-
幼儿园预防肺结核教育培训课件资料.pptx
幼儿园预防肺结核教育培训课件资料
-
python相关资源,python相关资源
python,python相关资源
-
《基于YOLOv8的智慧校园电动车充电桩状态监测系统》(包含源码、可视化界面、完整数据集、部署教程)简单部署即可运行。功能完善、操作简单,适合毕设或课程设计.zip
《基于YOLOv8的智慧校园电动车充电桩状态监测系统》(包含源码、可视化界面、完整数据集、部署教程)简单部署即可运行。功能完善、操作简单,适合毕设或课程设计
-
deepseek 临床之理性软肋.pdf
deepseek 临床之理性软肋.pdf
136 楼 violet0925 2013-06-03 14:30
135 楼 ansjsun 2013-05-30 10:56
不支持......那是翻译该干的事情吧..不能抢别人饭碗
134 楼 345542875 2013-05-30 09:46
133 楼 ansjsun 2013-05-29 17:20
不支持......那是输入法该干的事情吧..不能抢别人饭碗
132 楼 345542875 2013-05-29 16:52
131 楼 x541211190 2013-04-14 14:04
1.你说的我明白,我把项目放在web上,但是它会有“Exception in thread "ContainerBackgroundProcessor[StandardEngine[Catalina]]" java.lang.OutOfMemoryError: Java heap space”异常,因为如果你的WEB APP下都用了第三方jar, 其大小超过了jvm默认的大小(4M)那么就会产生此错误信息。这个怎么办?
2.我想把它放在web上,输入一行字,然后后台分词后,显示在html网页上,就像“在线测试”一样,只不过放在我的项目里而已。请赐教
这是内存溢出了..你得调整tomcat的内存大小...
你要的效果是这样的吧 http://demo.ansj.org
把邮箱给我我发你邮箱算了
541211190@qq.com
130 楼 ansjsun 2013-04-14 13:02
1.你说的我明白,我把项目放在web上,但是它会有“Exception in thread "ContainerBackgroundProcessor[StandardEngine[Catalina]]" java.lang.OutOfMemoryError: Java heap space”异常,因为如果你的WEB APP下都用了第三方jar, 其大小超过了jvm默认的大小(4M)那么就会产生此错误信息。这个怎么办?
2.我想把它放在web上,输入一行字,然后后台分词后,显示在html网页上,就像“在线测试”一样,只不过放在我的项目里而已。请赐教
这是内存溢出了..你得调整tomcat的内存大小...
你要的效果是这样的吧 http://demo.ansj.org
把邮箱给我我发你邮箱算了
129 楼 x541211190 2013-04-14 00:36
我原来一直用的中科院分词,最近看到了您的这款,觉得不错,所以想弄个java web版本的,在eclipse中tomcat服务器上能运行的,如果您有的话可不可以给看一下项目部署及源码。邮箱541211190@qq.com
哦....web版啊....
来这里 下载最新的jar
https://github.com/ansjsun/ansj_seg/tree/master/dist
然后放到WEB-INF/lib目录中
就ok了
你可以在你程序的任意地方调用
List all = ToAnalysis.paser([分词的字符串]) ;
和普通java调用一样...
如果你要加载用户自定义词典
看这里..
https://github.com/ansjsun/ansj_seg/wiki/%E7%94%A8%E6%88%B7%E8%87%AA%E5%AE%9A%E4%B9%89%E8%AF%8D%E5%85%B8%E8%B7%AF%E5%BE%84%E8%AE%BE%E7%BD%AE
Test文件夹我在本地测试过了,效果不错,但Src里的那些怎么运行不了,请指教?
你不是做java的吧...
src是源码..你要用..直接
来 这里
https://github.com/ansjsun/ansj_seg/tree/master/dist
下载个jar就可以用了不需要src
1.你说的我明白,我把项目放在web上,但是它会有“Exception in thread "ContainerBackgroundProcessor[StandardEngine[Catalina]]" java.lang.OutOfMemoryError: Java heap space”异常,因为如果你的WEB APP下都用了第三方jar, 其大小超过了jvm默认的大小(4M)那么就会产生此错误信息。这个怎么办?
2.我想把它放在web上,输入一行字,然后后台分词后,显示在html网页上,就像“在线测试”一样,只不过放在我的项目里而已。请赐教
128 楼 ansjsun 2013-04-13 20:15
我原来一直用的中科院分词,最近看到了您的这款,觉得不错,所以想弄个java web版本的,在eclipse中tomcat服务器上能运行的,如果您有的话可不可以给看一下项目部署及源码。邮箱541211190@qq.com
哦....web版啊....
来这里 下载最新的jar
https://github.com/ansjsun/ansj_seg/tree/master/dist
然后放到WEB-INF/lib目录中
就ok了
你可以在你程序的任意地方调用
List all = ToAnalysis.paser([分词的字符串]) ;
和普通java调用一样...
如果你要加载用户自定义词典
看这里..
https://github.com/ansjsun/ansj_seg/wiki/%E7%94%A8%E6%88%B7%E8%87%AA%E5%AE%9A%E4%B9%89%E8%AF%8D%E5%85%B8%E8%B7%AF%E5%BE%84%E8%AE%BE%E7%BD%AE
Test文件夹我在本地测试过了,效果不错,但Src里的那些怎么运行不了,请指教?
你不是做java的吧...
src是源码..你要用..直接
来 这里
https://github.com/ansjsun/ansj_seg/tree/master/dist
下载个jar就可以用了不需要src
127 楼 x541211190 2013-04-13 19:29
我原来一直用的中科院分词,最近看到了您的这款,觉得不错,所以想弄个java web版本的,在eclipse中tomcat服务器上能运行的,如果您有的话可不可以给看一下项目部署及源码。邮箱541211190@qq.com
哦....web版啊....
来这里 下载最新的jar
https://github.com/ansjsun/ansj_seg/tree/master/dist
然后放到WEB-INF/lib目录中
就ok了
你可以在你程序的任意地方调用
List all = ToAnalysis.paser([分词的字符串]) ;
和普通java调用一样...
如果你要加载用户自定义词典
看这里..
https://github.com/ansjsun/ansj_seg/wiki/%E7%94%A8%E6%88%B7%E8%87%AA%E5%AE%9A%E4%B9%89%E8%AF%8D%E5%85%B8%E8%B7%AF%E5%BE%84%E8%AE%BE%E7%BD%AE
Test文件夹我在本地测试过了,效果不错,但Src里的那些怎么运行不了,请指教?
126 楼 ansjsun 2013-04-13 11:50
我原来一直用的中科院分词,最近看到了您的这款,觉得不错,所以想弄个java web版本的,在eclipse中tomcat服务器上能运行的,如果您有的话可不可以给看一下项目部署及源码。邮箱541211190@qq.com
哦....web版啊....
来这里 下载最新的jar
https://github.com/ansjsun/ansj_seg/tree/master/dist
然后放到WEB-INF/lib目录中
就ok了
你可以在你程序的任意地方调用
List all = ToAnalysis.paser([分词的字符串]) ;
和普通java调用一样...
如果你要加载用户自定义词典
看这里..
https://github.com/ansjsun/ansj_seg/wiki/%E7%94%A8%E6%88%B7%E8%87%AA%E5%AE%9A%E4%B9%89%E8%AF%8D%E5%85%B8%E8%B7%AF%E5%BE%84%E8%AE%BE%E7%BD%AE
125 楼 x541211190 2013-04-13 10:29
我原来一直用的中科院分词,最近看到了您的这款,觉得不错,所以想弄个java web版本的,在eclipse中tomcat服务器上能运行的,如果您有的话可不可以给看一下项目部署及源码。邮箱541211190@qq.com
124 楼 ansjsun 2013-04-12 20:31
你确定研究分词很长时间了么..分词和jsp不沾边的..亲...
https://github.com/ansjsun/ansj_seg 这里能下载源码不过我真不会用jsp写这个
123 楼 x541211190 2013-04-12 17:42
122 楼 ansjsun 2013-03-29 11:18
好了...你再试试..免费空间,不稳定呵呵
121 楼 小网客 2013-03-28 16:56
120 楼 java__eye 2013-03-14 11:43
119 楼 ansjsun 2012-11-17 16:12
lucene_32.jar
里面org.ansj.lucene3.AnsjAnalysis.java
肯定定有的.....你没把jar加入到环境变量吧??或者你看看项目里面是不是有错误的jar
118 楼 song_in_china 2012-11-17 15:34
117 楼 song_in_china 2012-11-17 15:27
116 楼 tulip11088 2012-11-13 00:01
115 楼 ffychina 2012-11-12 18:35
114 楼 wangguo 2012-11-12 12:36
如果是说歪楼了,那歪楼的评论还有两类没删除:阿谀奉承的(说了几句跟技术讨论毫无关系的好话就走的),还有一类就是指责我没资格的、说我是喷子的、怪我没说好听的,这种跟文章主题毫无关系的,为什么不删除呢?为什么只删我反驳的,不删除先指责我的呢?有这么拉“偏架”的吗?
ok了,到此为止吧
如果有人再发攻击你的帖子,或者是语言争论的帖子,一概删除
你也不要再发类似帖子了,否则,也一概删除
请把讨论对象放在Ansj上
113 楼 fyland 2012-11-12 12:02
如果是说歪楼了,那歪楼的评论还有两类没删除:阿谀奉承的(说了几句跟技术讨论毫无关系的好话就走的),还有一类就是指责我没资格的、说我是喷子的、怪我没说好听的,这种跟文章主题毫无关系的,为什么不删除呢?为什么只删我反驳的,不删除先指责我的呢?有这么拉“偏架”的吗?
112 楼 linliangyi2007 2012-11-12 11:33
不过之前建议先把“语言之争”的所有相关回复删了吧,第一,是严重歪楼了,第二,这样的讨论毫无意义,且严重影响对主题的讨论啊
中文分词的专业人士林老师也来了啊。这次终于高手交流了。我用的是您的智能分词2012
折杀我也!
跟楼主这个“科班”算法相比,偶的是草根“山寨”算法,哈哈!
111 楼 lection.yu 2012-11-12 11:03
不过之前建议先把“语言之争”的所有相关回复删了吧,第一,是严重歪楼了,第二,这样的讨论毫无意义,且严重影响对主题的讨论啊
中文分词的专业人士林老师也来了啊。这次终于高手交流了。我用的是您的智能分词2012
110 楼 linliangyi2007 2012-11-12 10:21
不过之前建议先把“语言之争”的所有相关回复删了吧,第一,是严重歪楼了,第二,这样的讨论毫无意义,且严重影响对主题的讨论啊
109 楼 song_in_china 2012-11-10 00:53
.......主要看 ToAnalysis.java 这个类..其中有很多技术细节..比较专..说实话..ictclas算法本来就有点天书的味道...如果你想看原理..还得了解 .hmm和vterbi算法..和ngram语义模型..如果你想看热闹..就看看..tree-split..在我的git里面有...那个代码简单..我觉得是个数据结构的经典..
谢谢你的回复。你给我留个邮箱或者什么的 我再联系你,我的是1738042258@qq.com 你给我send一个字就知道了
108 楼 ansjsun 2012-11-09 21:49
.......主要看 ToAnalysis.java 这个类..其中有很多技术细节..比较专..说实话..ictclas算法本来就有点天书的味道...如果你想看原理..还得了解 .hmm和vterbi算法..和ngram语义模型..如果你想看热闹..就看看..tree-split..在我的git里面有...那个代码简单..我觉得是个数据结构的经典..
107 楼 ansjsun 2012-11-09 21:45
复旦NLP能把这几个识别出来了,我研究下它的源码看看!
{微信=100, 王道=15, 乳量=7, 识别=7, 泰国=0}
是的我感觉他那个句法分析很棒..效果很酷..好好研究..给我提交代码啊