`
robbin
  • 浏览: 4825307 次
  • 性别: Icon_minigender_1
  • 来自: 上海
博客专栏
377a9ecd-1ea1-34ac-9530-9daa53bb2a7b
robbin谈管理
浏览量:137386
社区版块
存档分类
最新评论

晒晒我们的开源项目

    博客分类:
  • Tech
 
阅读更多
我们的研发团队是一支mini型研发团队,目前共有研发人员13人。由于网站产品维护的历史原因,这13人的研发团队分为4支小组,分别是:Ruby研发小组5人;PHP研发小组4人;.net研发小组2人,Java搜索小组2人。

别看我们研发人员这么少,但是我们研发人员战斗力很强,我们维护和开发着十多条产品线。在我们开发自身产品的过程中,也积累了一些比较通用的组件,一些对大家来说有用的工具。因此从今年下半年开始,我们陆续将一些组件和工具开源出来,哪怕这些项目的质量并不是那么高,也希望能够给社区带来一点点自己的贡献。

以下简要介绍一下我们已经开源的项目,今后我们还会努力开源更多的东西和大家交流和分享:

1、Ansj中文分词 - 开源的高准确率Java中文分词器

项目Github地址:https://github.com/ansjsun/ansj_seg
这是基于大名鼎鼎中科院的Ictclas中文分词算法编写的Java实现版本,比常用的开源mmseg4j的分词准确率高。目前我们自己站内的搜索将逐渐从mmseg4j算法替换成Ansj中文分词算法。

2、ServiceFramework - 开源的羽量级Java Web服务框架

项目Github地址:https://github.com/allwefantasy/ServiceFramework
我们基于Java的开源搜索框架lucene编写了网站的分布式搜索和Tag文章分类服务。因为需要向前端的Web应用程序提供搜索和Tag服务接口API,所以我们编写了这个羽量级的Java框架软件。它的优点就是羽量级,自身集成了Jetty服务器,MVC,IoC和ORM,让你只需要编写非常少的代码,就可以快速将你的业务逻辑组件以Web API的方式提供服务。

3、ExportBlog - 开源的通用博客导出工具

项目Github地址:https://github.com/sqzhuyi/ExportBlog
这是一个基于.net Winforms编写的通用博客导出工具,支持导出网站包括:CSDN、ITEYE、博客园、新浪、搜狐、和讯、ChinaUnix、网易、51CTO、开源中国、百度空间、QQ空间等等。导出格式支持CHM、PDF、HTML、TXT和EPUB 5种格式文档。详细介绍:http://blog.csdn.net/sq_zhuyi/article/details/7924776

4、Secode_level_cache - 开源的Rails对象缓存插件

项目Github地址:https://github.com/csdn-dev/second_level_cache
Rails的ActiveRecord自身没有带强大的对象缓存功能,这是AR的一个重大的遗憾。早在2008年开始,我们就借鉴了Java强大的ORM框架Hibernate的二级对象缓存编写了这个Rails的AR对象缓存插件,并且一直作为JavaEye网站缓存优化的秘密武器来使用,取得了非常理想的效果。
现在我们将这个插件从Rails2.x的版本升级到了3.x版本,并且抽取成了一个通用插件,开始应用于新的Rails3.2的项目之上。有志于AR对象缓存优化的ruby程序员不容错过。

5、limiter - 网站反爬虫和DOS攻击的利器

项目Github地址:https://github.com/csdn-dev/limiter
早年的JavaEye网站曾经深受DOS攻击和爬虫海量抓取造成的负载过高的困扰,我曾经和这个问题进行了为期几年不懈的斗争,并且在总结几年斗争经验后写了一篇总结性博客文章:互联网网站的反爬虫策略浅析 。当时我基于这个反爬虫策略编写了JavaEye网站的智能防火墙插件,取得了良好的效果。
现在我们将这个插件从JavaEye的源代码中剥离出来,抽取成一个通用的rackware,便于应用于普通的Rails3.x的项目当中。


105
4
分享到:
评论
59 楼 jeffsang 2012-10-09  
支持开源,更敬佩这个mini型团队!
58 楼 ansjsun 2012-10-02  
madbluesky 写道
插件不支持lucene4beta,重写了final的tokenStream方法,lucene3中此方法不是final的么?
java.lang.VerifyError: class org.ansj.lucene3.AnsjAnalysis overrides final method tokenStream.(Ljava/lang/String;Ljava/io/Reader;)Lorg/apache/lucene/analysis/TokenStream;

我用的lucene3.2 测试没有问题。等下稍晚。我试试lucene4. 貌似lucene3.2的却不是final的。。那个final我也遇到过。好像在3.7上面。但是单位是3.2的我就只管3.2的了。
57 楼 madbluesky 2012-10-01  
插件不支持lucene4beta,重写了final的tokenStream方法,lucene3中此方法不是final的么?
java.lang.VerifyError: class org.ansj.lucene3.AnsjAnalysis overrides final method tokenStream.(Ljava/lang/String;Ljava/io/Reader;)Lorg/apache/lucene/analysis/TokenStream;
56 楼 caojian43 2012-09-30  
支持一下··
55 楼 ansjsun 2012-09-29  
xkorey 写道
IK Analyzer 这个分词也很好用,为什么不选择这个。?

如果一般项目的话。ik是个不错的选择。比较基于词典的分词方式比较稳定。准确率也能接受。但是作为一个职业的检索团队。需要有自己的深度定制。以及垂直搜索的特长。搜索引擎的策略效率都有了很成熟的解决方案。下一次的进步只能在nlp方面了。比如歧义句的识别。实体名的识别。是真正地难点。这些不是字典树+简单的规则所能处理的。
example“发展中国家庭养猪事业。”....大多数情况下这些歧义其实对检索质量的影响超不过1%。除了人名搜索。当你需要一个高质量的搜索引擎。以及其他比如。词性标注。人机互动。等自然语言处理方面的相关工作。就可以用ansj中文分词了。
54 楼 xkorey 2012-09-29  
IK Analyzer 这个分词也很好用,为什么不选择这个。?
53 楼 john_chou 2012-09-29  
支持开源!!
52 楼 dianthus 2012-09-29  
留个脚印。
51 楼 hudepin 2012-09-29  
支持开源,支持你
50 楼 jasshine 2012-09-28  
robbin 真心了不起啊
49 楼 blackproof 2012-09-28  
太感谢了,Ansj中文分词正好解决了我的问题。太强大了,其他的虽然不太了解,但是也太赞了
48 楼 SunJK000 2012-09-28  
学习学习。好好学习。。。。。
47 楼 chenjie100 2012-09-28  
robbin:
iteye感觉现在有点封闭了,不少功能把搜索引擎都屏蔽了。
查看一些博客和论坛什么的还必须要求登录。
这样不好,会对网站的发扬光大带来负面影响。
46 楼 icefishc 2012-09-27  
CshBBrain 写道
支持开源,
http://cshbbrain.iteye.com/blog/1685217
本人今天也发布了一个基于NIO的轻量级高性能的websocket服务器项目CshBBrain.可用于构建数据推送(股票行情),游戏,聊天/im等服务器程序的构建。

既然号称高性能,那么是否方便公开写性能测试的数据呢。
45 楼 javaboy8282 2012-09-27  
好东西啊 不错 不错
44 楼 zyslovely 2012-09-27  
想加入,怎么加入呢?
zyslovely@gmail.com
43 楼 java-007 2012-09-27  
感谢分享,都是实战的东西。
42 楼 kokojjy 2012-09-27  
支持开源,
41 楼 jadethao 2012-09-26  
感谢分享!@
40 楼 chris93419955 2012-09-26  
有实力啊

相关推荐

    [晒晒我们班的牛人作文600字大全]晒晒班上的牛人作文.docx

    今天,我想向大家晒晒我们班的几位“牛人”,他们的特点和故事,给我们的校园生活增添了无限的色彩。 首先,我们班有位打饭高手,潘玉翔同学。他在打饭这一日常活动上展现出了非凡的技能,总能在食堂开放的第一瞬间...

    晒晒我们班的牛人3000字初二作文范例.pdf

    晒晒我们班的牛人3000字初二作文范例.pdf

    晒晒我们班的牛人周记3000字初一作文范例.pdf

    晒晒我们班的牛人周记3000字初一作文范例.pdf

    晒晒我们班的牛人.doc

    在我们这个充满活力的班级中,有几位同学因其鲜明的个性和在各自领域中的出色表现,被同学们昵称为“牛人”。他们的故事不仅是班级趣事的来源,更是我们青春记忆中不可或缺的部分。 首先,让我们来谈谈施良玉,她是...

    基于SSH晒晒图网站

    在这个名为“晒晒图”的网站项目中,SSH框架被用来实现一个功能丰富的社交图片分享平台。以下是关于这个项目的一些关键知识点: 1. **Struts2框架**:作为MVC(模型-视图-控制器)设计模式的实现,Struts2负责处理...

    高中晒晒我们班的牛人作文600字.pdf

    【知识点】 1. 文章写作技巧:文章中的魏小凡以简洁而不失细节的写作手法,展现出优雅的文风,她的文章引人入胜,显示了深入思考和独特的表达能力。这表明在写作中,注重语言的精炼和对细节的捕捉能够提升文章的...

    (石雨)项目论坛(学校答辩)多组项目合集

    通过“晒晒”,我们可以理解为作者愿意将这些成果公开展示,供他人借鉴或评价。 【标签】:“石雨 源码 论坛 答辩 .NET”是关键词,揭示了这个合集的几个关键点: 1. **石雨**:可能是一个人名,也可能是项目团队的...

    晒晒你的系统架构.zip

    《晒晒你的系统架构》这份PDF文档,虽然标签部分没有提供具体信息,但从标题我们可以推断,它可能涉及的是IT行业中关于系统架构设计与展示的内容。系统架构是信息技术领域的一个核心概念,它定义了系统各个组件之间...

    晒晒台湾近年高考作文题.pdf

    晒晒台湾近年高考作文题.pdf

    Ten-Year-Engagement:开源自己的十年之约2020-2030,奇妙的念头往往来自于一瞬间,捕捉灵魂的闪光,自然且有趣

    订婚十年开源自己的十年之约2020-2030,奇妙的念头往往来自于一瞬间,捕捉灵魂的闪光,自然且有趣-2021年今天,天气不错,晒晒太阳,开源自己的项目,开源自己的十年之约,源自社区,回馈社区,我好菜啊,想的再多,...

    中考语文满分作文晒晒我的收获

    一位中学生在中考语文中取得满分的作文——“晒晒我的收获”,不仅是对其文字驾驭能力的肯定,更是对其思考深度和生命感悟的赞赏。 这篇作文以白居易的名句“野火烧不尽,春风吹又生”开篇,通过自然界的生动比喻,...

    颈椎病,晒晒脖子

    针对“颈椎病,晒晒脖子”这一话题,我们可以深入探讨颈椎病的成因、治疗方法以及晒太阳对颈椎病的潜在益处。 首先,颈椎病的发生往往与长时间保持不良姿势有关,如长时间低头看手机或电脑,导致颈部肌肉疲劳,颈椎...

    晒晒课堂教学中的常见流行病.doc

    晒晒课堂教学中的常见流行病.doc

    晒晒Windows 10里的那些新功能.docx

    晒晒Windows 10里的那些新功能.docx

    晒晒我家的幸福生活手抄报.doc

    晒晒我家的幸福生活手抄报.doc

    晒晒我的软件,还有一些控件资源免费传给大家!!!

    标题中的“晒晒我的软件,还有一些控件资源免费传给大家!!!”表明这是一份包含作者个人制作的软件和一些控件资源的分享。这些资源可能是为了帮助其他开发者或编程爱好者学习和使用,尤其是对于初学者来说,这样的...

    晒晒我家的幸福生活手抄报精选.doc

    【晒晒我家的幸福生活手抄报精选.doc】是一份以家庭幸福为主题的文档,通过不同篇章展现了家庭中的温馨、欢乐和亲情。以下是基于文档内容提取的相关知识点: 1. **家庭教育**:文中提到孩子们与父母之间的互动,如...

    晒晒你的系统架构.pdf

    从这些案例中我们可以看出,系统架构设计应当权衡各种因素,包括但不限于资源的高效利用、系统的可靠性、维护的便利性以及成本控制。良好的系统架构是企业信息化建设成功的关键,需要在理论和实践中不断探索和完善。...

Global site tag (gtag.js) - Google Analytics