- 浏览: 77840 次
- 性别:
- 来自: 南京
最新评论
-
john2007:
mark lxml and beautifulsoup
基于python的crawler -
ray_linn:
有什么难的?
ref的值在方法内部可能被使用,因此可能需要被 ...
Why does C# have both 'ref' and 'out'? -
小龟爬爬:
ref使用之前必须初始化,而 out 只需要定义,不用初始化, ...
Why does C# have both 'ref' and 'out'? -
john2007:
http://www.ebookee.com.cn/Compu ...
文本/Web挖掘推荐书目 -
john2007:
Computational Intelligence in M ...
文本/Web挖掘推荐书目
文章列表
废话不多说了,直接上代码:
public static void jAccess(){
String url="jdbc:odbc:driver={Microsoft Access Driver (*.mdb)};DBQ=F:\\2005\\mytoxicrawler\\OSHA\\bin\\Debug\\OSHA.mdb";
try{
Class.forName("sun.jdbc.odbc.JdbcOdbcDriver");
Connection conn = DriverManager.getConnection(url) ...
150M的训练集用WEKA做起来应该比较困难有这么几个办法:
1 增加内存。 其实WEKA不光可以用物理内存,还可以占用虚拟内存。把JAVA的可用内存设置成2G的话,如果机器的物理内存只有1G,操作系统是会在需要时自动在硬盘上划分一块出来作为虚拟内存的。不过这时候一般会处理得比较慢,因此不推荐这个方法。
2 抽样。从训练集中随机抽取一部分数据来作训练。在二分类的时候,一般样本数量达到几千个时就能预测得比较准确了。如果几千个样本还不怎么准,那要么是所用的分类算法不适合,要么数据中的输入变量根本无法预测目标变量。
我试过了KDD 99中“kddcup.data_10_percent” 数据 ...
- 2008-11-14 16:53
- 浏览 4468
- 评论(2)
网上资源
http://bbs.w3china.org/ W3CHINA 讨论区 - 语义网,本体的研究论坛
ftp://bookshelf:bookshelf@202.38.126.147:2004/
ftp://w3c:w3c@ftp3.xml.org.cn/
ftp://w3c:w3c@ftp.xml.org.cn/
http://sunsite.informatik.rwth-aachen.de/Publications/CEUR-WS/ Semantic Web 相关Paper下载
http://file.xml.org.cn/ W3CHINA讨论区FTP ...
- 2008-10-08 14:48
- 浏览 1434
- 评论(0)
如何把一张图片转换成用不同字符表示的文本文件?
原理:一张m*n大小的图片,实际上可以看成是一个m*n的矩阵。矩阵的每一个元素就是一个Color值,不同的Color值,用不同的Ascii可以在屏幕上打印显示的字符来代替,于是可以得到一个m*n的每一个元素是一个Ascii字符的两维矩阵,矩阵的每一行就是像素矩阵的每一行。再把这个字符矩阵输出到文本文件中保存,便可以得到图像对应的文本文件。当然了,所用的Ascii字符越多,生成的图像也就越逼真。如果只用两个字符,就相当于生成了只有黑白两色的黑白照片一样。
核心代码:
StringBuilder sb = new StringBuilder();
...