- 浏览: 28589 次
- 性别:
- 来自: 广州
最新评论
-
Java小菜哈:
大哥,你有没有试过的,解析DOM数的时候还是个死循环。
java解析xml之一:使用SAX与DOM -
Sequencenet:
可以使用,开源精神发扬光大。
java获取网页主信息之五:测试 -
lahvey:
可以写一个浏览器了,利害
java获取网页主信息之一:html树操作 -
xo_tobacoo:
很想看看,可是干扰的字符太多,请清理下哦!
位操作技巧 -
sku:
好东东,谢谢博主无私奉献,真的太厉害。我一定要好好研究一下。
...
java获取网页主信息之五:测试
文章列表
1.所需文件
param.txt:存放需要提取信息的网页路径
TestPage:存放需要提取信息的网页
Out.txt:输出的网页内容
2.测试程序
package test;
import java.io.*;
import Source.*;
//提取页面主要信息测试
public class ETest{
public static void main(String args[])
{
//输出文件 ...
- 2007-09-01 22:29
- 浏览 2423
- 评论(3)
从已经建立完成的html树中抽取主信息。
package Source;
public class ChooseBlock
{
//构造方法,设置允许错误率
public ChooseBlock(double th)
{
threshold = th;
}
//获取一棵html树中的内容
public String getContent(HTree tree)
...
- 2007-09-01 22:24
- 浏览 2269
- 评论(0)
对html文件进行扫描,将html元素抽象出来形成树。
package Source;
import java.io.*;
public class HTML2Tree
{
//构造方法
public HTML2Tree()
{
tree = new HTree();
myStack = new Stack();
}
...
- 2007-09-01 22:22
- 浏览 2498
- 评论(0)
1.栈操作
package Source;
import java.util.LinkedList;
//用List定义一个栈
public class Stack
{
//构造方法
public Stack()
{
list = new LinkedList();
isEmpty = true;
}
//入栈
...
- 2007-09-01 22:19
- 浏览 1744
- 评论(0)
1.节点操作
package Source;
//html树节点类
public class Node
{
//构造方法
public Node()
{
content = "";
hasContent = fa ...
- 2007-09-01 22:17
- 浏览 2988
- 评论(2)
一.简介
DOM4J是dom4j.org出品的一个开源XML解析包。Dom4j是一个易用的、开源的库,用于XML,XPath和XSLT。它应用于Java平台,采用了Java集合框架并完全支持DOM,SAX和JAXP。DOM4J最大的特色是使用大量的接口,这也是它被认为比JDOM灵活的主要原因。
二.安装dom4j
1.下载dom4j:http://sourceforge.net/project/showfiles.php?group_id=16035
2.安装dom4j:将解压后的dom4j-full.jar文件放置到项目的类路径中去,也可以作为附加包添加到项目中。
三.实例
1.所需x ...
- 2007-09-01 22:06
- 浏览 4269
- 评论(0)
一.简介
JDOM是一种解析XML的Java工具包。 它由Breet Mclaughlin和Jason Hunter在2000年初作为一个开放源代码项目正式开始研发。DOM适合于当今流行的各种语言,包括Java,JavaScripte,VB,VBScript,Perl,C,C++等。它了为HTML和XML文档提供了一个可应用于不同平台的编程接口。 DOM的设计为了适用于不同的语言,它保留了不同语言中非常相似的API。但是它并不适合于Java编程者的习惯。而JDOM作为一种轻量级API被制定,它最核心的要求是以Java为中心,只适合于Java语言,它遵循DOM的接口主要规则,除去了DOM中 ...
- 2007-09-01 21:49
- 浏览 1615
- 评论(0)
一.概要
用Java解析XML文档,最常用的有两种方法:使用基于事件的XML简单API(Simple API for XML)称为SAX和基于树和节点的文档对象模型(Document Object Module)称为DOM。Sun公司提供了Java API for XML Parsing(JAXP)接口来使用SAX和DOM,通过JAXP,我们可以使用任何与JAXP兼容的XML解析器。
JAXP接口包含了三个包:
(1)org.w3c.dom W3C推荐的用于XML标准规划文档对象模型的接口。
(2)org.xml.sax 用于对XML进行语法分析的事件驱动的X ...
- 2007-09-01 17:29
- 浏览 3727
- 评论(1)
检测一个无符号数是不为2^n-1(^为幂): x&(x+1) <o:p></o:p>
将最右侧0位改为1位: x | (x+1) <o:p></o:p>
二进制补码运算公式:
-x = ~x + 1 = ~(x-1)
~x = -x-1
-(~x) = x+1
~(-x) = x-1
x+y = x - ~y - 1 = (x|y)+(x&y)
x-y = x + ~y + 1 = (x|~y)-(~x&y)
x^y = (x|y)-(x&y)
x|y = (x&~y)+y
x&y ...
- 2007-09-01 17:06
- 浏览 1057
- 评论(1)
问题简介:
所谓八数码问题是指这样一种游戏:将分别标有数字1,2,3,…,8的八块正方形数码牌任意地放在一块3×3的数码盘上。放牌时要求不能重叠。于是,在3×3的数码盘上出现了一个空格。现在要求按照每次只能将与空格相邻的数码牌与空格交换的原则,将任意摆放的数码盘逐步摆成某种特殊的排列。如下图表示了一个具体的八数码问题求解。
问题分析:
首先,八数码问题包括一个初始状态(START) 和 目标状态(END),所谓解八数码问题就是在两个状态间寻找一系列可过渡状态(START->STATE1->STATE2->...->END)。这个状态是否存在就是我们要解决 ...
- 2007-09-01 17:00
- 浏览 1725
- 评论(0)
1. 矢量减法
设二维矢量 P = (x1,y1) ,Q = (x2,y2)
则矢量减法定义为: P - Q = ( x1 - x2 , y1 - y2 )
显然有性质 P - Q = - ( Q - P )
如不加说明,下面所有的点都看作矢量,两点的减法就是矢量相减;
2.矢量叉积
设矢量P = (x1,y1) ,Q = (x2,y2)则矢量叉积定义为: P × Q = x1*y2 - x2*y1 得到的是一个标量
显然有性质 P × Q = - ( Q × P ) P × ( - Q ) = - ( P × Q )如不加说明,下面所有的点都看作矢量,点的乘法看作矢量叉积;
叉乘的重 ...
- 2007-09-01 16:41
- 浏览 3006
- 评论(0)