- 浏览: 11393 次
- 性别:
- 来自: 北京
最近访客 更多访客>>
最新评论
-
excuse:
还是网游好。最多也就是个上网费,啥都能看到
09年出去给自己放放风 -
cris_jxg:
IT公主 写道准备去哪里呢...还没想好,年假还早!初步有去草 ...
09年出去给自己放放风 -
mewleo:
支持,旅游,开阔自己的视野!互联网上路太窄
09年出去给自己放放风 -
xiaoych:
呵呵,人家有权利决定是开源还是不开源,是收费还是免费哈
自然语言处理 -
cris_jxg:
不过据说是相当难用,所以一直没敢用jni来做,电话问了似乎奥运 ...
自然语言处理
文章列表
看到朋友出去的照片,很是羡慕,是不是该出去玩玩了?今年如果不出意外或者不跳槽的话,一定要出去玩玩,哪怕是一个人。换一种生活方式让自己好好善待自己,生活麻木了往往不知道自己活着的压力,出去逛逛或许会让自己更积极一点^_^
- 2009-02-06 20:38
- 浏览 2203
- 评论(3)
明天是牛年第一天上班,回家过年时间也不算短了,似乎什么都没做,倒是养成了好吃懒做的习惯,真是不应该啊,呵呵。08年自己的总结还没有做,不是没时间,而是不敢,虽然公司的总结没问题,但是对于我自己则是完全不靠谱,实现了多少目标,自己都不敢去想,如果真要一条条去反思,恐怕我只有惭愧到跳楼的份。 所以干脆不做08年总结,但是09年的计划还是必须的,纵然以后的实施是另一回事。
一.工作上掌握主动权,经历了08年一年的磨合期,09年应该更加积极主动,主动提出解决方案。
二.扩大交际面,包括公司内部和公司外部it圈人士。
三.坚持好好学习it技术。现在看来跳槽的概率小了很多,现在的公司只能是去自学 ...
- 2009-02-01 22:20
- 浏览 801
- 评论(0)
最近在公司做数据处理方面的工作,需要研究一下自然语言处理方面的课题,研究了一段时间,也算有所收获,贴一些自己的“成果”。
中文数据处理首先要解决的是分词,自然语言处理的单位是词,通过对有意义的词的统计来标识文本。所以一个好的分词工具是非常重要的,目前应用的是中科院分词工具 java版,速度不敢恭维(毕竟是java处理字节机制同c++不一样),据说是分词效果很不错,只可惜开源版不支持自定义词库,而这功能在处理行业数据方面是非常重要的,下一步研究一下自定义词库问题,其他开源分词podding之类的尚未测试效果。
现在做法律行业方面数据,主要涉及的应用包括文本分类、关键词提取、相似文本检索。goo ...
原来开发的工程有些乱,运营有半年了吧,随着脏数据和数据量的加大,系统开始出现很多问题,现在面临的最大问题是系统[频繁重启,基本上每天一次吧,真受不了了,怀疑是硬件问题.
另外系统咬添加一个博客系统,改的开源的roller,但加上后在运行不到1小时就开始报内存溢出错误,jvm设置的值是1.3G,服务器内存2G,cup Intel xeon 3.0 现在怀疑内存不足,是不是这个原因呢? 当然也不能只是一味的扩充硬件,最终要的还是软件问题,希望看到的能
公司使用windows2003做服务器,web服务器是tomcat, 以前开发的系统和现在的系统都在上面,系统开发的有点乱,没办法还是要跑起来,但今天上午系统就重启了两次,以前也经常出现重启现象,也出现过tomcat对请求不响应的现象,该从哪儿入手找问题呢?
或者有什么好的性能检测工具推荐一下.