- 浏览: 92975 次
- 性别:
- 来自: 上海
最新评论
-
forever1220:
你好 请教你可以直接使用weka 对微博话题文本进行情感极性 ...
Weka初步 -
orange.lpai:
从情感分类一般有两种思维方式,一种是构造情感词库来分类;另一种 ...
Java自然语言处理 LingPipe -
申公子:
你好 请问lingpipe怎么做中文章正负面判定? 是不是做 ...
Java自然语言处理 LingPipe -
申公子:
你好 请问就lingpipe中文分词 情感分析方面的问题和你讨 ...
Lingpipe中的spell模块-搜索建议 -
nextw3:
应该说,和数据挖掘只粘一点边..
程序员应知 -- 如何分析海量数据
文章列表
转自:
http://anna-zr.iteye.com/blog/578943
http://blog.sina.com.cn/s/blog_591e979d0100kds0.html
在这一节我们看看属性选择。在数据挖掘的研究中,通常要通过距离来计算样本之间的距离,而样本距离是通过属性值来计算的。我们知道对于不同的属性,它们在样本空间的权重是不一样的,即它们与类别的关联度是不同的,因此有必要筛选一些属性或者对各个属性赋一定的权重。这样属性选择的方法就应运而生了。
在属性选择方面InfoGain和GainRatio的比较常见,也是最通俗易懂的方法。它们与Decision Tree的构造原理 ...
原文地址:java 读文件夹作者:无尽空虚
判断一个路径是文件还是文件夹,是文件则输出文件路径和文件名,是文件夹则输出文件夹内的文件。
package test;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.IOException;
public class test {
public static void main(String[] args) {
try {
readfile("D:/");
} catch (FileNotFoun ...
XML的四种解析器(dom,sax,jdom,dom4j)原理及性能比较+代码实例
关键词:
1)DOM(JAXP Crimson解析器)
DOM是用与平台和语言无关的方式表示XML文档的官方W3C标准。DOM是以层次结构组织的节点或信息片断的集合。这个层次 ...
一.引言
XML是EXtensible Markup Language的缩写,它是一种可扩展性标识语言, 能够让你自己创造标识,标识你所表示的内容。DOM全称是Document Object Model(文档对象模型),定义了一组与平台和语言无关的接口,以便程序和脚本能够动态访问和修改XML文档内容、结构及样式。XML创建了标识,而 DOM的作用就是告诉程序如何操作和显示这些标识。
二.DOM树结构
实际上XML将数据组织成为一棵树,DOM通过解析XML文档,为XML文档在逻辑上建立一个树模型,树的节点是一个个的对象。这样通过操作这棵树和这些对象就可以完成对XML文档的操作,为处理文档的所有方面 ...
以下工具绝大多数都是开源的,基于GPL、Apache等开源协议,使用时请仔细阅读各工具的license statement
I. Information Retrieval
1. Lemur/Indri
The Lemur Toolkit for Language Modeling and Information Retrieval
http://www.lemurproject.org/
Indri:
Lemur's latest search engine
2. Lucene/Nutch
Apache Lucene is a high-performance, full-featured ...
最大公共子串:
2009-11-27 10:421. Levenshtein Distance
该算法又称之为 "编辑距离",用于计算两个字符串的相似程度。原理很简单,就是返回将第一个字符串转换(删除、插入、替换)成第二个字符串的编辑次数。次数越少,意味着字符串相似度越高。
算法原理:Wikipedia - Levenshtein distance 本文摘自:http://www.rainsts.net/article.asp?id=767
Step1:
人 民 共 和 时 代
0, 0, 0, 0, 0, 0, 0
中 1, 0, 0, 0, 0, 0, 0
华 2 ...
字符串表示方法:
Char *
Char[]
string
String
Wchar
字符串需要实现类的方法:
默认构造函数
析构函数
拷贝构造函数
赋值函数
其他辅助函数
1.字符串与整形之间的转换:
要求不调用库函数atoi(),atio()
int str2int(const char *str)
{
int i=0, sign=1, value = 0;
if(str==NULL) return NULL; // 空串直接返回 NULL
if(str[0]=='-' || str[0]=='+')
{ // 判断是否存在符号位
i = ...