1.所需文件
param.txt:存放需要提取信息的网页路径
TestPage:存放需要提取信息的网页
Out.txt:输出的网页内容
2.测试程序
package test;
import java.io.*;
import Source.*;
//提取页面主要信息测试
public class ETest{
public static void main(String args[])
{
//输出文件
String out = "out.txt";
File outfile = new File(out);
//建立html树
HTML2Tree h2t = new HTML2Tree();
String file = getFilename();
h2t.main(file);
HTree tree = h2t.getTree();
//允许标准差
double th = 0.79;
//选择主要信息块
ChooseBlock cb = new ChooseBlock(th);
//输出主要信息
String str = cb.getContent(tree);
if(str == null)
{
System.out.println("文件为空");
System.exit(1);
}
try
{
PrintWriter p = new PrintWriter(new BufferedWriter(new FileWriter(outfile)));
p.println(str);
p.close();
}
catch(IOException e)
{
System.out.println(e);
System.exit(1);
}
}
//获取要提取的网页文件名
private static String getFilename()
{
String file = "";
try
{
File f = new File("param.txt");
BufferedReader fis = new BufferedReader(new FileReader(f));
String s;
while((s = fis.readLine()) != null)
if(!s.equalsIgnoreCase(""))
{
file = s;
break;
}
}
catch(IOException e)
{
System.out.println(e);
System.exit(1);
}
return file;
}
}
分享到:
相关推荐
JSON数据在这种情况下扮演了数据源的角色,可以包含层级关系和节点信息,如`text`(显示文本)、`children`(子节点数组)等。 例如,一个简单的JSON格式的树数据可能如下所示: ```json [ { "text": "父节点1",...
### Tree组件在EasyUI中的应用及Java代码集成详解 #### 一、Tree组件概述 在Web应用程序开发过程中,为了展示层级结构的数据,如文件系统、组织架构等,开发者经常需要使用到树形(Tree)控件。EasyUI框架提供了一...
console.error('Failed to fetch tree data:', error); } }); ``` 总结来说,这个项目涵盖了以下知识点: 1. Java实体类设计 2. MySQL数据库操作 3. 递归查询 4. JDBC/ORM框架使用 5. 数据结构与算法(构建树形...
这个"extjs-tree.zip"文件包含了使用Java编写的ExtJS异步树形控件的示例代码,旨在帮助开发者快速理解和应用这一功能。ExtJS是Sencha公司开发的一个前端框架,广泛应用于构建富互联网应用程序(RIA)。 在ExtJS中,...
在压缩包文件"treedemo"中,可能包含了实现上述功能的源代码文件,如HTML、CSS、JavaScript以及可能的Java后端接口。解压并研究这些文件,可以帮助我们更好地理解和学习如何在ExtJS中开发树效果。通过阅读和学习这个...
在这种情况下,Java POI库是一个非常有用的工具,它允许开发者在Java环境中操作Microsoft Office的文件格式,包括Excel的.xls和.xlsx文件。本文将详细介绍如何在Android中使用POI库来解析Excel文件,并将其转换为...
1. **数据获取**:首先,你需要获取一个`hprof`文件,这是Java虚拟机(JVM)生成的内存快照,通常在`OutOfMemoryError`发生时生成。你可以通过JVM参数`-XX:+HeapDumpOnOutOfMemoryError`配置自动导出,或者在程序...
tree.loadXML("/path/to/your/servlet/TreeDataServlet"); // 调用Java Servlet获取XML数据 ``` - 如果需要自定义行为,例如点击事件,可以注册事件处理器。 3. **XML数据结构**: - dhtmlXTree期望的XML结构...
1. **数据源获取**:通过从 Session 中获取名为 "tree" 的列表作为树的数据源。 2. **排序**:使用自定义的 `CommonUtils` 类对数据进行排序。 3. **构建节点**:遍历列表中的每个元素,为每个元素创建 `TreeCell`、...
- **三个经常使用的取值函数**:获取树节点的信息,如`getRoot()`获取根节点。 - **根据node得到path**:使用`getPath()`等方法来获取节点路径。 - **根据Path展开到该节点**:通过`expandPath()`方法展开到指定路径...
本篇将深入讲解如何利用JavaServer Pages (JSP) 技术,结合DTREE库动态从数据库中获取数据并生成树形结构。DTREE库提供了方便的API,使得开发者可以轻松地在网页上展示复杂的数据结构。 首先,我们需要了解JSP的...
document.getElementById('ttt').value = tree.getSelected().toHtml(); } ``` - **查找节点**:根据文本内容搜索子节点。 ```javascript function findnode() { tree.findChildByText(document....
out.println(new Gson().toJson(treeNodes)); %> ``` 4. **生成树形结构**: 在`generateTree`函数中,我们需要解析接收到的JSON数据,并构建树形结构。可以使用现成的JavaScript库,如jQuery UI的`treeview`...
- 示例:`<s:checkbox name="acceptTerms" label="I agree to the terms and conditions" />` - 用途:收集用户的选择数据。 - **`<s:radio>`**:生成单选按钮。 - 示例:`<s:radio list="{'male': 'Male', '...
url: 'tree_data.json', // 从服务器获取数据的URL reader: { type: 'json', rootProperty: 'nodes' // JSON数据中的根节点属性名 } } }); ``` 为了实现动态功能,我们需要扩展EXT的树节点行为。这包括编辑...
String json = Json.toJson(treeNodes); // 返回 JSON 数据 renderJson(json); } private List<TreeNode> getTreeNodesFromDB() { // 这里编写从数据库获取数据的逻辑 // ... // 创建 TreeNode 对象并填充...
例如,Action 类可能会返回一个包含节点 ID、节点文本、子节点数组等信息的 JSON 对象。 接下来,我们来看看 ZTree 的核心配置。在 HTML 文件中,我们需要创建一个 `<ul>` 标签作为 ZTree 的容器,并设置相应的 CSS...
#### 三、网络爬虫实现 **知识点概述:** 此题考察了网络爬虫的基本原理、HTTP请求发送以及数据库操作等方面的知识。 **详细解析:** 1. **爬虫基本框架**: - 使用Java语言编写爬虫通常会涉及到网络请求库(如...
在网页开发中,树形菜单是一种常见的用户界面元素,它能有效地组织和展示层次结构的信息。`dTree` 是一个JavaScript对象,专用于构建无限级的树形菜单。本篇文章将深入探讨如何利用`dTree`来生成动态的树形菜单,并...