`
yawl
  • 浏览: 60735 次
最近访客 更多访客>>
社区版块
存档分类
最新评论
文章列表
railsconf时,在oreilly展台见到一本'Programming Collective Intelligence'的书,其实是讲data mining的。比其他的教科书类书易懂的多。下面摘抄了一下有用的内容: =knn= + new data can be added at any time--does not require any computation at all; the data is simply added to the set. -  it requires all the trainning data to be present in order to mak ...
为了研究怎么解决recrawl的问题,今天仔细观察了一下nutch crawl的每一步具体发生了什么。 ==============准备工作====================== (Windows下需要cygwin) 从SVN check out代码; cd到crawler目录; ==============inject========================== $ bin/nutch inject crawl/crawldb urls Injector: starting Injector: crawlDb: crawl/crawldb Injecto ...
上个周末和公司的同事一起参加今年rails rumble(http://railsrumble.com). rails rumble是48小时内用rails做出一个网站的比赛.基本规则是: *团队最多可以四人,单人组队也可以. *自选题目 *48小时,对于美国东部来说,其实早周五晚上8点开始,周日晚上8点结束 *竞赛开始之前,不可以做任何电子形式保存的代码和设计,如果需要可以用纸和笔. *open source gem, plugin都可以用 *github提供了repository *deployment也包括在48小时之内,linode提供了VPS. 今年有529人,231个teams参 ...
config.gem是rails 2.1里很喜欢的一个功能,方便了gem的管理。 但是最近在用solr-ruby的时候发现一个问题:尽管这个gem被安装了,'gem.config "solr-ruby"'却报找不到。 后来发现,solr-ruby的gem名字是‘solr-ruby’,但里面没有'solr-ruby.rb'这个文件,只有'solr.rb'. 这样就和config.gem要求的naming convention不一样了。 Update: Thank people who helped me out: config.gem "solr-ruby&qu ...
没有时间详细看具体的问题,但是有几个显然是比较严重buffer overflow。如果rails没做足够的参数检查的话,很有可能造成远程代码执行。 有趣的是,目前最详细的介绍是来自‘著名’的zed shaw。其他地方都语焉不详。 http://www.zedshaw.com/rants/the_big_ruby_vulnerabilities.html 目前的一个问题是ruby的向后兼容做得很不好。比如很多人遇到了1.8.7会造成rals 2.1以下的版本不能运行。即使是这个official的ruby 1.8.6的新版本也造成了一些rail app不能运行。为此phusion做了个第三方的r ...
第四天,先去听了CRUD Doesn't Have an 'S' in It: Managing Complex Searching in Rails.这个session和mod_rails的在同一个时间了,只好放弃了后者。我本来期待的是free text search的内容,比如solr,sphinx之类,结果完全不是。讲得是构造SQL的复杂的search.由于作者是介绍的自己的一个travel site的hand-on经验,所以倒也从中学到了些知识。 下午听的Building an App in 48 Hours - A Rails Rumble Case Study。Rails Rumb ...
第三天早上就是Jeremy Kemper发布了rails 2.1,介绍了新的特征。 然后去听了Using Git to Manage and Deploy Rails Apps,可惜内容深度不够,我用git尽管也只是两个月左右也不是很熟悉,但里面讲得东西也大概都知道了。 后来去了‘Scaling Rail ...
在Portland待了四天,昨天乘夜班飞机回家,现在精神好些了,稍微记录一下自己的感受。 第一天有些tutorial,但是没去听,而是参加了Community Code Drive活动。Community Code Drive基本上是就是大家聚在一块Hacking个一些open source code,一些open source项目的牵头的人会在那里帮着一些对项目感兴趣的人。Chad Fowler一开始提议了几个项目,不过很快就是干什么都有了。 第一天晚上jruby自己组织了个codefest,位置还蛮偏的,离会议中心很远。本来想利用这个机会了解一下jruby,结果去了才发现人来的太多了,本 ...
Amazon的一系列web service服务推出后在开发者社区一直很受欢迎。不管是startup还是fortune 500,很多人在选用EC2服务来替代传统的dedicated server租用或架设自己的服务器。我也准备将自己的一个网站搭建在EC2上。 流程大致就是选用一个machine image(AMI),然后launch,几秒钟之后一个属于你自己的server可以用了。有很多的public machine images可以用,比如ec2onrails是一个搭配好ruby on rail环境的ubuntu系统。你也可以在其上做改动,然后存成你自己的image.AMI可以设为privat ...
Ruby on Rails项目往往用到大量第三方的gems,在项目有新成员加入,或配置新的开发系统时,一个个的安装是件很繁琐的事情。 我用的办法就是写一个自己的gem,让它依赖于项目里用到的其他gems。这样的话,安装这个gem的时候,就会顺带把其他gems安装了。 代码非常简单: >cat install-gems.gemspec # #Usage: #gem build install-gems.gemspec #gem install install-gems.0.0.1.gem #gem uninstall install-gems (optional, remove th ...
两周前还在谈论git,结果很快就见到rails从svn转到了git上,上周自己的一个项目也用到了git. 一开始,当然至少能像CVS/SVN那样使用起来,其实很相似: git clone [url]   -> 把项目下载到本地 git pull          -> update一下 git commit -a     -> 这个是把自己的change保存到本地(注意不是远程,这也是git分布性所在)。而且不要忘记 '-a', '-a'的意思是当前全部的commit, 当然也可以跟文件名commmit单独文件 git push           -> 这个是把你c ...
update 03/20/2008: RubyCentral今年继续被选中作为Mentor Organization参与Google Summer of Code,学生的申请会很快开试。如果想做Ruby语言相关的项目请提交给RubyCentral。 http://code.google.com/soc/2008/ Google Summer of Code是为了鼓励在校学生参与open source project每年举办的活动。除了获得实际的指导与项目经验外,Google会为选中的学生付4500美元的来鼓励参与。 学生的申请是面向几乎所有国家的,每年也都有中国的学生参与。但是相对来说知道 ...
有关编译器的书中"Dragon Book" (Compilers: Principles, Techniques, and Tools)是最经典,最有名的一本,但其实是对很多想学习编译器的人非常不适合的一本书.这本书的内容更适合的读者是编译器的研究人员,或者想构造parser generator等底层工具的开发者.我认识的大多数人往往是想了解编译器的工作原理,或者作一个中小型的编译器,Dragon book里的太细致的学术理论解释其实帮助并不大.结果很多把Dragon book当作自己编译器入门书的人,错以为编译器是什么dark art而放弃了. 由于编译器已经理论技术都很 ...
Antonio Cangiano今天在blog上更新了各种ruby实现的性能比较: http://antoniocangiano.com/2007/12/03/the-great-ruby-shootout/ ruby 1.8, ruby 1.9, jruby, rubinius, ruby.net还有我们做的xruby的性能数据都在里面了。Antonio说xruby是最youngest的其实不太准确。只能说是进展最缓慢的:) 。我是2005年初开始做这个项目,后来ruby.net在2006初开始做,rubinius不太清楚具体历史,但似乎也很新。代码一开始一直在我的本机的subversion ...
基本和上一个版本(0.3.1)相比变化不大, 大多数都是bug fix. sishen加入了我们的项目,给我们带来了很多重要的改进。 下个版本(0.4.0)的目标就是支持yaml和rubygems。这里和原来的计划不太一样了。最初准备0.4.0的miltstone是先将ruby自带的所有unit test先通过,但目前的形势下,觉得还是支持ruby on rails最重要。这样就要提前面对yaml和rubygems的问题了。
Global site tag (gtag.js) - Google Analytics