`
文章列表
对于有些需求不用动态脚本来做就特别麻烦,故有了groovy之后,能在线写代码然后执行再修改这种感觉很好,之前有使用过groovy。这次再重新写个轮子来满足需求,特此将一些文档记录在此     Embedding Groovy (官方文档) http://groovy.codehaus.org/Embedding+Groovy       Groovy Goodness: Add Imports Transparently to Scripts with ImportCustomizer(一系列的关于groovy的tips) http://mrhaki.blogspot.com ...

weka 决策树 pmml

    博客分类:
  • JAVA
之前使用weka 将一个离线的决策树分类算法移植到线上,主要是借助于weka中对决策树的PMML规范的支持,对于使用方法也是琢磨了半天才搞定的,为了方便后来人故在此给出主要的使用步骤,鉴于当时使用的weka 3.7.3对决策树支持有bug,所以我修改了源码,故会给出使用的jar包。   首先给出java代码,这里主要是给出使用流程框架,具体的结果例子等涉及一些内部信息不便于直接举例,同时我本机的spss软件貌似被删除了,所以也找不到比较好的例子了。   前提说明:PMML 文件是一种通用的数据挖掘模型文件,spss软件支持将模型导出为pmml文件,weka目前支持的pmml类型不多,但是 ...

html xpath java parser

    博客分类:
  • JAVA
想爬取一个网页的生活数据使用,按照以前的方式是写正则来做了,但是面对页面经常变换的问题,而且有些正则不是那么一步到位就能写出,故希望能找到更合适的东西来解析html。   通过对比各种html的parser,最终选取了HtmlCleaner ,主要是他强大的支持xpath功能,以及对网页标签的容错性很好,api也很强大耐用。   htmlCleaner 官网 http://htmlcleaner.sourceforge.net/javause.php   Using XPATH and HTML Cleaner to parse HTML / XML http://think ...

http MIME-Typen

需要处理文件上传下载,其中涉及不同的文件类型,故找了些资料来学习下,   首先给出http中 常见的MIME-TYPE 转自:http://de.selfhtml.org/diverses/mimetypen.htm       MIME-Typ Dateiendung(en) Bedeutung application/acad

Unicode chars

找到一个unicode 的总的字符集 ,记录下     http://www.unicode.org/charts/
转自:http://smallvoid.com/article/hard-disk-cache.html   The hard disk is extremely slow compared to physical memory (RAM), but provides lots of storage capacity. Disk caching can be used to speed up the harddisk performance. The disk cache uses RAM to provide quick access to frequently accessed data ...

java访问svn

    博客分类:
  • JAVA
同学需要php的方式访问svn,他使用exec(svn)来实现,而我希望是通过http的方式或者其他tcp之上的协议来访问,毕竟这种方式算是跨各种平台与方便的。   找了下开源的java svn client,最出名的就是svnkit了 http://svnkit.com/index.html ,eclipse的插件也是基于这个。   看下wiki里的例子 http://wiki.svnkit.com/,就可以实现java访问svn了。   这里给出一个list svn tree的例子的链接,新版本的svn中已经没了。     http://svn.svnkit.com/rep ...
使用mongoDB时,默认的数据cache flush就是使用的fsync,这里找了一篇好文章故分享下,   转自:http://www.humboldt.co.uk/2009/03/fsync-across-platforms.html   fsync() Across Platforms When an application writes a file, the data does not become permanent immediately. The write operation first moves the data into the operati ...
找到一个总结的不错的文档关于set env  export的,故转载过来     转自:longxibendi的专栏 (感谢原作者的总结 *—*) http://blog.csdn.net/longxibendi/article/details/6125075       一.shell环境变量的分类以及set env export的区别:   set:显示(设置)shell变量 包括的私有变量以及用户变量,不同类的shell有不同的私有变量 bash,ksh,csh每中shell私有变量都不一样 env:显示(设置)用户变量变量 export:显示(设置)当前导出成用户 ...

maven search

    博客分类:
  • JAVA
用惯了公司内部的maven仓库搜索,突然没这个环境了还真不习惯,故这里收集下开放的一些maven search     1:官方 http://search.maven.org/     2:http://maven.ozacc.com/     3:http://mvnrepository.com/     4:http://www.jarvana.com/jarvana/

JNI debug

    博客分类:
  • JAVA
需要调用一个jni,有java和C++的源码,但是对于运行过程中出现的问题还是不好排查,故这时需要进行debug了。这个debug涉及java到C/C++的,所以不是那么直接,故找了些资料学习下。     1:调试集成 Java 和 C/C++ 的代码(对着例子跑通基本就可以了) http://www.ibm.com/developerworks/cn/java/j-jnidebug/       2:Linux_Macintosh 平台下 Eclipse 环境中的 JNI 混合语言调试 http://www.ibm.com/developerworks/cn/opensour ...
How to load data into Hive   http://www.codeweblog.com/how-to-load-data-into-hive/       Hive 入门 http://www.blogjava.net/hengheng123456789/archive/2011/01/05/342354.html     Hive-0.5中UDF和UDAF简述 http://blog.csdn.net/dajuezhao/article/details/5753001         以后继续补充
主要是M$家的,不过也有其他的 http://www.codeproject.com     主要是Java系 http://www.java2s.com/     html http://www.w3schools.com/html/html_examples.asp     HTML 5 Demos and Examples http://html5demos.com/     osi方面的 http://www.osischool.com/     c/C++ DOC http://www.cplusplus.com/reference/   ...

hive sql doc

记录2个常用的hive sql语法查询地   官方 https://cwiki.apache.org/confluence/display/Hive/LanguageManual     karmasphere http://www.karmasphere.com/Karmasphere-Analyst/hive-queries-on-table-data.html
最近需要提取一些数据,故开始使用hive,本机搭建了一个hive客户端环境,但是始终有问题,在本机装好了mysql以后,老是报     Caused by: org.datanucleus.store.rdbms.exceptions.MissingTableException: Required table missing : "`DBS`" in Catalog "" Schema "". DataNucleus requires this table to perform its persistence operations ...
Global site tag (gtag.js) - Google Analytics