`
anna_zr
  • 浏览: 200472 次
  • 性别: Icon_minigender_2
  • 来自: 北京
社区版块
存档分类
最新评论
文章列表
在这一节我们看看属性选择。在数据挖掘的研究中,通常要通过距离来计算样本之间的距离,而样本距离是通过属性值来计算的。我们知道对于不同的属性,它们在样本空间的权重是不一样的,即它们与类别的关联度是不同的,因此有必要筛选一些属性或者对各个属性赋一定的权重。这样属性选择的方法就应运而生了。 在属性选择方面InfoGain和GainRatio的比较常见,也是最通俗易懂的方法。它们与Decision Tree的构造原理比较相似,哪个节点拥有的信息量就为哪个节点赋较高的权重。其它的还有根据关联度的办法来进行属性选择(Correlation-based Feature Subset Selection for ...
上次我介绍了分类器的使用方法,这次我来介绍一下聚类算法。聚类算法在数据挖掘里面被称之为无监督学习(unsupervised learning),这是与分类算法(supervised learning)相对的。在它们两者之间还一种叫做半监督学习(semi-supervised learning)这个我会在后面的文章中重点介绍。所谓无监督学习就是在预先不知道样本类别的情况下,由聚类算法来判别样本的类别的一种学习方法。 聚类算法的一般过程分为: 1.       读入需预测样本 2.       初始化聚类算法(并设置参数) 3.       使用聚类算法对样本进行聚类 4.       打 ...
从前年开始使用weka最数据挖掘方面的研究,到现在有一年半的时间了。看到我们同组的兄弟写了关于weka方面的总结,我也想整理一下。因为网上的资料实在是太少,记得刚接手的时候,真是硬着头皮看代码。不过到现在看来,也积累了很多的代码了。希望能够在这里跟大家分享一下学习weka的乐趣与经验。 Weka是来之新西兰怀卡托大学的一款开源软件,主要是数据挖掘方面的一些算法的集合。这款软件大概是当前数据挖掘领域最好的开源软件了,当然国外还有其它一些组织维护的有自己的开源软件,但是只有这款软件应用是比较广泛的了。具体关于weka的信息可以到官网去查看http://www.cs.waikato.ac.nz/ml ...

闲扯系列2

    博客分类:
  • life
据说家教是项暴利的兼职职业,所以我必须坚持。。。 我也很想认真的做实验,认真的做论文,认真的做研究。但是,做不来。
<form action="***.jsp" target="_blank" onSubmit="***"> <script   language="JavaScript">     <!--     window.open('***.jsp',  '',  'toolbar=no,menubar=no,scrollbars=no,location=no,status=no');     //-->     </script> 
http://www.blogjava.net/lushengdi/archive/2009/lushengdi/archive/2008/01/07/173250.html (一) JSP页面上是中文,但是看的是后是乱码: 解决的办法就是在JSP页面的编码的地方<%@ page language="java" contentType="text/html;charset=GBK" %>,因为Jsp转成Java文件时的编码问题,默认的话有的服务器是ISO-8859-1,如果一个JSP中直接输入了中文,Jsp把它当作ISO8859-1来处理 ...
本文列举了兼容 IE 和 FF 地换行 CSS 推荐样式,详细介绍了word-wrap同word-break地区别.兼容 IE 和 FF 地换行 CSS 推荐样式: 最好地方式是 word-wrap:break-word; overflow:hidden; 而不是 word-wrap:break-word; word-break:break-all; 也不是 word-wrap:break-word; overflow:auto; 这种最好地方式,在 IE 下没有任何问题,在 FF 下,长串英文会被遮住超出地内容. 技术总结: word-wrap是控制换行地. 使用break ...
本文转自“老紫竹”的http://www.java2000.net/viewthread.jsp?tid=68 解决文字过长,表格被撑大,自动换行,文字超出,切割 style="table-layout: fixed;WORD-BREAK: break-all; WORD-WRAP: break-word" 语法:  word-break : normal | break-all | keep-all  参数:  normal :  依照亚洲语言和非亚洲语言的文本规则,允许在字内换行  break-all :  该行为与亚洲语言的normal相同。也允许非亚洲 ...
原文地址:http://www.cn-java.com/www1/?action-viewnews-itemid-3819 1:超连接跳转      我们在超连接的时候,常常连接到一个jsp或者Action,比如: XXX      这样做会有一个问题:在test.jsp中,除你传递的param1和param2参数外,你用request.getPara ...
做实验时遇到问题 ACM的网页解析时,不能用httpClient,会出现连接超时; 而SpringerLink的网页解析,必须用httpClient才行。 SpringerLink涉及到自动转发问题,必须用HttpClient实现。
转自:http://www.ibm.com/developerworks/cn/opensource/os-httpclient/ HttpClient 是 Apache Jakarta Common 下的子项目,可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包,并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient,然后根据作者实际工作经验给出了一些常见问题的解决方法。 HttpClient简介 HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了,越来越多的 Java 应用程序需要直接通过 HTTP 协议来访问网络 ...
存储在数据库中的数据是结构化数据,因为它是以严格的格式表示的。例如,在关系数据库表中的每条记录,例如《数据库系统基础:初级篇》中图5.6的EMPLOYEE表,该表中的所有记录都遵循同一格式。对于结构化数据,为了创建 ...
#define是C语言中提供的宏定义命令,其主要目的是为程序员在编程时提供一定的方便,并能在一定程度上提高程序的运行效率,但学生在学习时往往不能 理解该命令的本质,总是在此处产生一些困惑,在编程时误用该命令,使得 ...

杂...

    博客分类:
  • life
蔡淳佳的专辑《回到最初》和《豪杰春香》的主题曲循环播放,听到心痛。。 论文,工作,工作,论文,实验。。。无休止的 明天又要去家教了,突然感觉好累,卑微的效率已经快让我承受不住 我像是走进了死胡同,想转弯却没有力气没有方向 我开始极度的不自信,对技术的不自信,对生活的不自信,对未来的不自信。。 我开始怀疑最初的选择,讨厌自己的懦弱,放不下,假洒脱。 各有各的难,各有各的烦。 生活总有不完美,我们只能抱着残缺继续前进。 或许我是该释放下堆积的情绪垃圾了。
JavaScript读取txt文本文件: 第一步:创建一个可以将文件翻译成文件流的对象。 Var fso=new ActiveXObject(Scripting.FileSystemObject); 第二步:用于创建一个textStream 对象,括号里边有三个属性 1.  文件的绝对路径 2.  文件的常数 只读=1,只写=2 ,追加=8 等权限。(ForReading 、 ForWriting 或 ForAppending 。); 3.  一个布尔值 允许新建则为true 相反为false; 例:Var f=fso.opentextfile(“C:\a.txt”,1,true); ...
Global site tag (gtag.js) - Google Analytics