`
sysu_zeh
  • 浏览: 28682 次
  • 性别: Icon_minigender_1
  • 来自: 广州
最近访客 更多访客>>
社区版块
存档分类
最新评论

java获取网页主信息之一:html树操作

阅读更多

1.节点操作

  1. package Source;   
  2.   
  3.   
  4. //html树节点类   
  5. public class Node   
  6. {   
  7.     //构造方法   
  8.     public Node()   
  9.     {   
  10.         content = "";   
  11.         hasContent = false;   
  12.         parent = null;   
  13.         isLeaf = true;   
  14.     }   
  15.        
  16.     //构造方法,初始化此节点的内容,标签,与其父辈节点   
  17.     public Node(String content, String tag, Node parent)   
  18.     {   
  19.         this.content = content;   
  20.         this.tag = tag;   
  21.         if(content.equalsIgnoreCase(""))   
  22.             hasContent = false;   
  23.         else  
  24.             hasContent = true;   
  25.         this.parent = parent;   
  26.         isLeaf = true;   
  27.     }   
  28.        
  29.     //添加节点内容   
  30.     public void addContent(String str)   
  31.     {   
  32.         content=content+str;   
  33.         if(content.equalsIgnoreCase("")) hasContent = false;   
  34.         else hasContent = true;   
  35.         return;   
  36.     }   
  37.        
  38.     //设置为叶子   
  39.     public void setLeaf(boolean is)   
  40.     {   
  41.         isLeaf = is;   
  42.     }   
  43.        
  44.     //设置为块   
  45.     public void setBlock(boolean is)   
  46.     {   
  47.         isBlock = is;   
  48.     }   
  49.   
  50.     public String toString()   
  51.     {   
  52.         return content;   
  53.     }   
  54.   
  55.     String content;   
  56.     String tag;   
  57.     boolean hasContent;   
  58.     boolean isLeaf;   
  59.     boolean isBlock;   
  60.     Node parent;   
  61. }  

2.树操作

  1. package Source;   
  2.   
  3. import java.util.LinkedList;   
  4.   
  5.   
  6. public class HTree   
  7. {   
  8.     //构造方法,初始化   
  9.     public HTree()   
  10.     {   
  11.         list = new LinkedList();   
  12.     }   
  13.        
  14.     //插入节点   
  15.     public void insert(Node node)   
  16.     {   
  17.         list.add(node);   
  18.     }   
  19.        
  20.        
  21.     //打印整棵树的节点的信息   
  22.     public void print()   
  23.     {   
  24.         int len = list.size();   
  25.         for(int i = len - 1; i >= 0; i--)   
  26.         {   
  27.             Node node = (Node)list.get(i);   
  28.             String str = node.content.trim();   
  29.             if(!str.equals("")) System.out.println(str);   
  30.         }   
  31.   
  32.     }   
  33.        
  34.     //打印块的信息   
  35.     public void print2()   
  36.     {   
  37.         int len = list.size();   
  38.         for(int i = len - 1; i >= 0; i--)   
  39.         {   
  40.             Node node = (Node)list.get(i);   
  41.             if(node.isBlock) System.out.println(node.content);   
  42.         }   
  43.   
  44.     }   
  45.        
  46.     //合并节点,将叶节点合并至其双亲   
  47.     public void merge()   
  48.     {   
  49.         int len = list.size();   
  50.         for(int i = len - 1; i >= 0; i--)   
  51.         {   
  52.             Node node = (Node)list.get(i);   
  53.             if(node.isLeaf)   
  54.             {   
  55.                 Node curr = node;   
  56.                 String str = curr.content;   
  57.                 while(curr != null)    
  58.                 {   
  59.                     Node next = curr.parent;   
  60.                     if(next != null)   
  61.                     {   
  62.                         if(next.hasContent)   
  63.                         {   
  64.                             next.addContent(str);   
  65.                             next.setLeaf(true);   
  66.                             node.setBlock(false);   
  67.                             break;   
  68.                         }   
  69.                         next.setLeaf(false);   
  70.                         curr = next;   
  71.                     }    
  72.                     else curr = null;   
  73.                 }   
  74.                 if(curr == null) node.setBlock(true);   
  75.             }   
  76.         }   
  77.   
  78.     }   
  79.        
  80.     //获取块信息   
  81.     public String[] getBlock()   
  82.     {   
  83.         int len = list.size();   
  84.         int num = 0;   
  85.         //获取非空节点的个数   
  86.         for(int i = len - 1; i >= 0; i--)   
  87.         {   
  88.             Node node = (Node)list.get(i);   
  89.             String str = node.content.trim();   
  90.             if(!str.equals("")) num++;   
  91.         }   
  92.   
  93.         String contBlock[] = new String[num];   
  94.         num = 0;   
  95.            
  96.         //返回信息   
  97.         for(int i = len - 1; i >= 0; i--)   
  98.         {   
  99.             Node node = (Node)list.get(i);   
  100.             String str = node.content.trim();   
  101.             if(!str.equals("")) contBlock[num++] = str;   
  102.         }   
  103.         return contBlock;   
  104.     }   
  105.   
  106.     private LinkedList list;   
  107. }  
分享到:
评论
2 楼 lahvey 2009-12-12  
可以写一个浏览器了,利害
1 楼 sku 2008-05-25  
-zeh,你的数据结构学的太好了吧,厉害,赞一个。

相关推荐

    java源码包---java 源码 大量 实例

    6个目标文件,EJB来模拟银行ATM机的流程及操作:获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,并将当前的计数器初始化,调用每一个EJB对象的count()方法,保证Bean正常被激活和钝化,EJB对象是用...

    基于java的网页浏览器.zip

    在这个项目中,开发者可能使用了其中之一来构建浏览器的界面,如地址栏、标签页、前进/后退按钮等。 2. **URL类与HttpURLConnection**: Java中的`java.net.URL`类用于表示统一资源定位符,它帮助解析和访问网页。`...

    java网页抓取Jsoup包全

    Java网页抓取是一个常见的任务,...由于其易用性和强大的功能,Jsoup已经成为Java开发者处理HTML数据的首选工具之一。结合完整的包集(javadoc和源码),开发者不仅可以快速上手,还能深入研究和定制,以满足特定需求。

    java源码包3

    6个目标文件,EJB来模拟银行ATM机的流程及操作:获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,并将当前的计数器初始化,调用每一个EJB对象的count()方法,保证Bean正常被激活和钝化,EJB对象是用...

    EasyUI的功能树之异步树JAVA版本.zip

    在 EasyUI 中,异步树是指树形节点的数据不是一次性全部加载,而是根据用户操作动态地从服务器获取。这样可以提高页面加载速度,降低服务器压力,尤其在处理大数据量时更为适用。 在 Java 后端,我们需要创建一个...

    java源码包2

    6个目标文件,EJB来模拟银行ATM机的流程及操作:获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,并将当前的计数器初始化,调用每一个EJB对象的count()方法,保证Bean正常被激活和钝化,EJB对象是用...

    HTML树型控件.zip_html格式目录树

    - `Jquery插件 ztree.js 最好用的开源免费树形插件,没有之一.url`可能是一个链接,指向关于zTree的详细文档或教程,帮助开发者快速上手。 - `Java的授权与认证-java教程-PHP中文网.url`可能是提供有关Java安全...

    使用java通过Get请求进行爬虫操作

    GET是HTTP协议中最基础的操作之一,用于从服务器获取资源。在爬虫中,我们通常发送GET请求到目标网站的URL,以获取HTML页面内容。 1. **导入必要的库** 要在Java中执行HTTP GET请求,我们需要引入Apache ...

    网页动态树形菜单图

    本文将深入探讨“网页动态树形菜单图”这一主题,以及与之相关的JSP技术。 动态树形菜单是一种能够展现层级关系的交互式用户界面组件,它通常用于导航菜单或数据展示,使得用户可以方便地浏览和选择层次结构中的...

    成百上千个Java 源码DEMO 4(1-4是独立压缩包)

    Calendar万年历 1个目标文件 EJB 模拟银行ATM流程及操作源代码 6个目标文件,EJB来模拟银行ATM机的流程及操作:获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,并将当前的计数器初始化,调用每一个...

    java源码包4

    6个目标文件,EJB来模拟银行ATM机的流程及操作:获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,并将当前的计数器初始化,调用每一个EJB对象的count()方法,保证Bean正常被激活和钝化,EJB对象是用...

    java开源包6

    jared是一个用来操作Windows注册表的 Java 类库,你可以用来对注册表信息进行读写。 GIF动画制作工具 GiftedMotion GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列...

    java开源包9

    jared是一个用来操作Windows注册表的 Java 类库,你可以用来对注册表信息进行读写。 GIF动画制作工具 GiftedMotion GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列...

    java开源包4

    jared是一个用来操作Windows注册表的 Java 类库,你可以用来对注册表信息进行读写。 GIF动画制作工具 GiftedMotion GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列...

    java开源包5

    jared是一个用来操作Windows注册表的 Java 类库,你可以用来对注册表信息进行读写。 GIF动画制作工具 GiftedMotion GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列...

    成百上千个Java 源码DEMO 3(1-4是独立压缩包)

    Calendar万年历 1个目标文件 EJB 模拟银行ATM流程及操作源代码 6个目标文件,EJB来模拟银行ATM机的流程及操作:获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,并将当前的计数器初始化,调用每一个...

    java开源包8

    jared是一个用来操作Windows注册表的 Java 类库,你可以用来对注册表信息进行读写。 GIF动画制作工具 GiftedMotion GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列...

    java开源包10

    jared是一个用来操作Windows注册表的 Java 类库,你可以用来对注册表信息进行读写。 GIF动画制作工具 GiftedMotion GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列...

    平安科技Java一百道面试题

    `Collection`是Java集合框架中最基础的接口之一,它代表了一个对象的集合。`Collection`接口的主要子接口包括: - **List**:有序集合,允许重复元素,如`ArrayList`、`LinkedList`。 - **Set**:无序且不允许重复...

    java学习之路

    - **IOC/DI**: 控制反转 (Inversion of Control) 和依赖注入 (Dependency Injection) 是Spring框架的核心特性之一。 - **Spring配置**: 使用XML或注解来配置Spring容器。 - **AOP及Spring AOP**: 面向切面编程 ...

Global site tag (gtag.js) - Google Analytics