- 浏览: 143785 次
- 性别:
- 来自: 上海
-
最新评论
-
omadesala:
附件的论文确实是SGD 的论文,一楼的SB看清楚在说吧
mahout 逻辑回归算法详述 -
249708193o:
骗人的!一篇英语论文给大家,你破解个屁!
mahout 逻辑回归算法详述 -
lection.yu:
大哥。。。你这个。。太抽象了。。啥意思?
搜索引擎常用排名策略-混合时间与字符串排名策略 -
mogui258:
太难理解了,呵呵
Lucene IndexDeletionPolicy -
wangtao0501:
怎么说也是得过诺贝尔的人
该回杨振宁一个公道?
文章列表
http://pan.baidu.com/s/1o7ilrhK gradle in action
grails 3.0 完全使用gradle了
2.4 还只是 用gant
1.请使用官方的工具 git gui吧,一溜地去点那些按钮
2. 即便是同步server端的文件到本地,也要先merge一下
3. git中 删掉类似 .project 文件使用命令: git rm --cache
创建数据库 aibeid(注意 编码为 utf8 utf8_general_ci),创建用户aibei(密码 参考 DataSource.groovy文件中)
导入 grails-app\migrations\ 下最新的db文件导入数据
生怕一些后续升级的ggts版本造成一些兼容的问题,强烈建议使用一下安装指南:
下载相关 软件:java ggts git easyphp(主要是为了mysql的本地) sqlyog:http://pan.baidu.com/s/1hqCWK2S.
安装时直接将java安装在 C:/ProgramFiles/java/... 当中,安装时只用删去默认安装目录中的一个空格。
JAVA_HOME, PATH 可在安装java后设置,不要设置 classpath(不知为啥老有人设置了classpath后 有如下 错误:Error occurred during initializatio ...
使用constraints 修改 CRUD页面中的字段顺序
class Airline { static constraints = { name() url() frequentFlyer() notes() }
install-template 是定制scaffold的关键
兴奋的找到了插件:https://grails.org/plugin/fields,可以模仿
很好的的一个 全实现:Alarm Klock: http://code.google.com/p/kraigsandroid/
设置闹钟使用AlarmManager.set()函数,它的triggerAtTime参数,如果要用 Calendar.getTimesInMillis()获得,就必须先设置Calendar对象,例如要让闹钟在当天的16:30分启动,就要设置 HOUR_OF_DAY(16)、MINUTE(30)、MILLISECOND(0),特别是HOUR_OF_DAY,我一开始误用了HOUR,这是 12进制计时方法,HOUR_OF_DAY是24进制计时方法。
针对 ...
mahout自带了逻辑回归算法,SGD 随机梯度下降,https://cwiki.apache.org/MAHOUT/logistic-regression.html
mahout官方wiki其实对算法做的介绍其实不清不楚,笔者辛苦了周把的时间终于“破解”了此算法,share给大家了。
RD(程序员) KPI的衡量方法讨论 - 代码量乘以 代码实际运行的次数
1.现有的RD KPI 中都有质量衡量,而质量 就是 告诉你 你没错过什么 这是一种负向的衡量。
2.关于“正向”衡量方面,代码量可以作为衡量方式之一,但的确不该唯代码量,因为容易造成代码堆积问题(当然堆积代码行的问题 可以通过代码字符数 来避免),另一个考虑衡量正向的东西可以是 代码量乘以 代码实际运行的次数。对于产品公司,应该可以考虑产品售卖数乘以代码量
3.经验分享方面 - 可以用自己向团队文章共享来计算。举办共享的session的次数与影响度来衡量。
4.创新点方面,专利数/发表有影响刊物的文章数衡量。
zz Java并行(1):JMM
1.什么是JMM?
JMM即Java Memory Model,设想有这样一条赋值语句:int a = 1;而a为诸多线程所共享, JMM所关注的问题就是:“读取a的线程在何时会看到值为1的这个写入?”
2. 为什么关注JMM?
在多数情况下 ...
我们已开发出Lucene的扩展包以使用特殊的变精度的字符串编码格式存储数字值(所有的诸如 double,long,float,和int的数字值会被转换为字典排序字符串的表示并以不同的精度存储,对于如何存储的细节,可以参看NumericUtils),一个range会被递归的分成多个小段以方便搜索: Range中间部分在Trie树中会以低精度搜索,边界则会以高精度搜索。这样可以急剧减少term的数量。
对于那些比较大的变长的值,我们提供了8种不同的精度(每个减少8位),最低精度的只有一个字节,这样最低精度的只有256个值。总的来说,一个range可以包含最大7*255*2 + 255 = 3825 ...
Recorded Future能预测未来的搜索引擎
分享到139说客
王建/文 首发2010年 第8期 《互联网天地》
能够预测未来是很多人难以企及的梦想,然而最近在美国波士顿诞生的一个名为“Recorded Future”的网站让这样的梦想有可能变成现实。这是个能够预测未来的搜索引擎,一经推出就引起了业内巨头谷歌的关注,有国外媒体称谷歌已经对Recorded Future网站进行了投资。
Recorded Future不同于一般的搜索引擎,打开RecordedFuture.com网站映入眼帘的并不是我们平时熟悉的搜索框,而更像是一个在线应用网站,用户需要注册后才能 ...
See Attachment
Heritrix Intro
Virgil
黄新宇
爬虫简介
? Search "Free Web Crawlers" in
amazon:
? Free Web Crawlers:
– Wget, Curl, Heritrix,
– Dataparksearch, Nutch, Yacy,
– Axel, Arachnode.net, Grub,
– Httrack, Mnogosearch, Methabot, Gwget
为什么要有爬虫
?
请看《钢铁侠》
-
工程师的一个很大的
价值之一是
-
可以从零做起
Mat ...
http://wiki.apache.org/hadoop/HadoopMapReduce
简介:
这篇文档描述在hadoop中map和reduce操作是怎样具体完成的。如果你对Google的MapReduce各式模式不熟悉,请先参阅MapReduce--http://labs.google.com/papers/mapreduce.html
Map
由于Map是并行地对输入的 ...
并行与并发的区别
一个系统说成是并发的是指它能同进度下支持两个或多个的动作。而并行是指能同时执行两个或多个动作。
一个并发的程序会有两个或多个的线程的。
我希望你能够推导出并行是并发的一个子集,即并行必并发,并发不必并行。
过去的二十年里,术语并行编程几乎是消息传递和分布式内存的同义词。在Cluster中或通过网络连接起来的计算节点中,每个节点有一个或多个处理器,这样就是一个并行平台。有一些专门的编程方法以分割计算任务或数据利用线程可以说是并行编程的思想,因为线程是共享内存的编程模型,且之中模型很好的适合于单核系统。
我将尽量正确使用并行或并发这些术语。这意思是并发与并发算法设计 所产生的代码 ...