`
liuxinglanyue
  • 浏览: 561719 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

java获取网页主信息之三:html to tree(转)

阅读更多

1.所需文件

 param.txt:存放需要提取信息的网页路径
 TestPage:存放需要提取信息的网页
 Out.txt:输出的网页内容

2.测试程序

package test;   
  
import java.io.*;   
import Source.*;   
  
//提取页面主要信息测试   
public class ETest{   
  
    public static void main(String args[])   
    {   
        //输出文件   
        String out = "out.txt";   
        File outfile = new File(out);   
        //建立html树   
        HTML2Tree h2t = new HTML2Tree();   
        String file = getFilename();   
        h2t.main(file);   
        HTree tree = h2t.getTree();   
        //允许标准差   
        double th = 0.79;   
        //选择主要信息块   
        ChooseBlock cb = new ChooseBlock(th);   
        //输出主要信息   
        String str = cb.getContent(tree);   
        if(str == null)   
        {   
            System.out.println("文件为空");   
            System.exit(1);   
        }   
        try  
        {   
            PrintWriter p = new PrintWriter(new BufferedWriter(new FileWriter(outfile)));   
            p.println(str);   
            p.close();   
        }   
        catch(IOException e)   
        {   
            System.out.println(e);   
            System.exit(1);   
        }   
    }   
    //获取要提取的网页文件名   
    private static String getFilename()   
    {   
        String file = "";   
        try  
        {   
            File f = new File("param.txt");   
            BufferedReader fis = new BufferedReader(new FileReader(f));   
            String s;   
            while((s = fis.readLine()) != null)    
            if(!s.equalsIgnoreCase(""))   
            {   
                 file = s;   
                 break;   
            }   
        }   
        catch(IOException e)   
        {   
            System.out.println(e);   
            System.exit(1);   
        }   
        return file;   
    }   
}   
 

分享到:
评论

相关推荐

    Extjs的Tree和Tab使用json做tree数据交互

    JSON数据在这种情况下扮演了数据源的角色,可以包含层级关系和节点信息,如`text`(显示文本)、`children`(子节点数组)等。 例如,一个简单的JSON格式的树数据可能如下所示: ```json [ { "text": "父节点1",...

    tree的使用

    ### Tree组件在EasyUI中的应用及Java代码集成详解 #### 一、Tree组件概述 在Web应用程序开发过程中,为了展示层级结构的数据,如文件系统、组织架构等,开发者经常需要使用到树形(Tree)控件。EasyUI框架提供了一...

    java实现无限级分类树形,连接mysql数据库

    console.error('Failed to fetch tree data:', error); } }); ``` 总结来说,这个项目涵盖了以下知识点: 1. Java实体类设计 2. MySQL数据库操作 3. 递归查询 4. JDBC/ORM框架使用 5. 数据结构与算法(构建树形...

    extjs-tree.zip_extjs tree

    这个"extjs-tree.zip"文件包含了使用Java编写的ExtJS异步树形控件的示例代码,旨在帮助开发者快速理解和应用这一功能。ExtJS是Sencha公司开发的一个前端框架,广泛应用于构建富互联网应用程序(RIA)。 在ExtJS中,...

    extjs开发tree效果

    在压缩包文件"treedemo"中,可能包含了实现上述功能的源代码文件,如HTML、CSS、JavaScript以及可能的Java后端接口。解压并研究这些文件,可以帮助我们更好地理解和学习如何在ExtJS中开发树效果。通过阅读和学习这个...

    Android通过POI完美解析Excel.xls xlsx成html编译前jar包

    在这种情况下,Java POI库是一个非常有用的工具,它允许开发者在Java环境中操作Microsoft Office的文件格式,包括Excel的.xls和.xlsx文件。本文将详细介绍如何在Android中使用POI库来解析Excel文件,并将其转换为...

    MAT解析hprof内存溢出分析工具OutOfMemoryError-java程序开发

    1. **数据获取**:首先,你需要获取一个`hprof`文件,这是Java虚拟机(JVM)生成的内存快照,通常在`OutOfMemoryError`发生时生成。你可以通过JVM参数`-XX:+HeapDumpOnOutOfMemoryError`配置自动导出,或者在程序...

    java中调用dhtmlXTree与xml (2)设置地址url

    tree.loadXML("/path/to/your/servlet/TreeDataServlet"); // 调用Java Servlet获取XML数据 ``` - 如果需要自定义行为,例如点击事件,可以注册事件处理器。 3. **XML数据结构**: - dhtmlXTree期望的XML结构...

    swing界面设计之JTree

    - **三个经常使用的取值函数**:获取树节点的信息,如`getRoot()`获取根节点。 - **根据node得到path**:使用`getPath()`等方法来获取节点路径。 - **根据Path展开到该节点**:通过`expandPath()`方法展开到指定路径...

    JSP动态生成树DTREE

    本篇将深入讲解如何利用JavaServer Pages (JSP) 技术,结合DTREE库动态从数据库中获取数据并生成树形结构。DTREE库提供了方便的API,使得开发者可以轻松地在网页上展示复杂的数据结构。 首先,我们需要了解JSP的...

    ajax实现目录树

    document.getElementById('ttt').value = tree.getSelected().toHtml(); } ``` - **查找节点**:根据文本内容搜索子节点。 ```javascript function findnode() { tree.findChildByText(document....

    ajax动态生成树 用于jsp

    out.println(new Gson().toJson(treeNodes)); %> ``` 4. **生成树形结构**: 在`generateTree`函数中,我们需要解析接收到的JSON数据,并构建树形结构。可以使用现成的JavaScript库,如jQuery UI的`treeview`...

    struts2标签的使用

    - 示例:`<s:checkbox name="acceptTerms" label="I agree to the terms and conditions" />` - 用途:收集用户的选择数据。 - **`<s:radio>`**:生成单选按钮。 - 示例:`<s:radio list="{'male': 'Male', '...

    EXT实现动态树的功能

    url: 'tree_data.json', // 从服务器获取数据的URL reader: { type: 'json', rootProperty: 'nodes' // JSON数据中的根节点属性名 } } }); ``` 为了实现动态功能,我们需要扩展EXT的树节点行为。这包括编辑...

    jfinal ztree实例

    String json = Json.toJson(treeNodes); // 返回 JSON 数据 renderJson(json); } private List<TreeNode> getTreeNodesFromDB() { // 这里编写从数据库获取数据的逻辑 // ... // 创建 TreeNode 对象并填充...

    ZTree使用例子

    例如,Action 类可能会返回一个包含节点 ID、节点文本、子节点数组等信息的 JSON 对象。 接下来,我们来看看 ZTree 的核心配置。在 HTML 文件中,我们需要创建一个 `<ul>` 标签作为 ZTree 的容器,并设置相应的 CSS...

    松迪培训入学测试题

    #### 三、网络爬虫实现 **知识点概述:** 此题考察了网络爬虫的基本原理、HTTP请求发送以及数据库操作等方面的知识。 **详细解析:** 1. **爬虫基本框架**: - 使用Java语言编写爬虫通常会涉及到网络请求库(如...

    dTree 生成无限级树形菜单

    在网页开发中,树形菜单是一种常见的用户界面元素,它能有效地组织和展示层次结构的信息。`dTree` 是一个JavaScript对象,专用于构建无限级的树形菜单。本篇文章将深入探讨如何利用`dTree`来生成动态的树形菜单,并...

    treeview树状文件选择结构

    在IT领域,`treeview`是一种常见的用户界面元素,特别是在网页和桌面应用程序中,它用于以树形结构展示数据,使得用户能够逐级展开、浏览和选择文件夹、目录或者项目。这种控件对于有层次关系的数据组织非常有用,...

Global site tag (gtag.js) - Google Analytics