`
sysu_zeh
  • 浏览: 28679 次
  • 性别: Icon_minigender_1
  • 来自: 广州
最近访客 更多访客>>
社区版块
存档分类
最新评论

java获取网页主信息之二:辅助操作

阅读更多

1.栈操作

  1. package Source;   
  2.   
  3. import java.util.LinkedList;   
  4.   
  5. //用List定义一个栈   
  6. public class Stack   
  7. {   
  8.     //构造方法   
  9.     public Stack()   
  10.     {   
  11.         list = new LinkedList();   
  12.         isEmpty = true;   
  13.     }   
  14.     //入栈   
  15.     public void push(Object node)   
  16.     {   
  17.         list.add(node);   
  18.         if(isEmpty) isEmpty = false;   
  19.     }   
  20.     //出栈   
  21.     public Object pop()   
  22.     {   
  23.         if(!isEmpty)   
  24.         {   
  25.             Object node = list.getLast();   
  26.             list.removeLast();   
  27.             if(list.size() == 0) isEmpty = true;   
  28.             return node;   
  29.         }    
  30.         else return null;   
  31.     }   
  32.     //获取栈顶元素   
  33.     public Object getTop()   
  34.     {   
  35.         if(!isEmpty) return list.getLast();   
  36.         else return null;   
  37.     }   
  38.     //获取栈的元素个数   
  39.     public int getSize()   
  40.     {   
  41.         return list.size();   
  42.     }   
  43.        
  44.     //获取指定元素   
  45.     public Object getElement(int index)   
  46.     {   
  47.         int size = getSize();   
  48.         if(index < 0 || index > size) return null;   
  49.         else return list.get(index);   
  50.     }   
  51.     //删除元素   
  52.     public void remove(int index)   
  53.     {   
  54.         list.remove(index);   
  55.     }   
  56.     //置栈空   
  57.     public boolean empty()   
  58.     {   
  59.         return isEmpty;   
  60.     }   
  61.     //打印栈内元素   
  62.     public void print()   
  63.     {   
  64.         int size = list.size();   
  65.         for(int i = size - 1; i >= 0; i--)   
  66.             System.out.print((new StringBuilder(String.valueOf(list.get(i).toString()))).append(" ").toString());   
  67.   
  68.     }   
  69.   
  70.     private LinkedList list;   
  71.     private boolean isEmpty;   
  72. }   

2.符号集合

  1. package Source;   
  2.   
  3.   
  4. //定义一些需特殊处理的html标识   
  5. public class Symbol   
  6. {   
  7.     public static String jump[] =    
  8.     {   
  9.         "span""select""script""h""ul""li""TEXTAREA""style"  
  10.     };   
  11.     public static String ignore[] =    
  12.     {   
  13.         "/p""br""form""/form""param""/img""p""img""hr""!",    
  14.         "input"  
  15.     };   
  16.     public static String remove[] =    
  17.     {   
  18.         "&nbsp;""&gt;"  
  19.     };   
  20. }   

 

分享到:
评论

相关推荐

    java获取网页主信息之五:测试

    标题“java获取网页主信息之五:测试”暗示了这是一个关于Java获取网页信息系列教程的第五部分,重点可能放在测试和验证已经实现的代码功能上。在这个阶段,开发者通常会编写单元测试或者集成测试,确保代码能够正确...

    JAVA辅助工具

    Java辅助工具是一款重要的软件,主要用于在计算机上安装和运行JAVA模拟器。JAVA模拟器是一种能够让你在不支持原生Java环境的系统上运行Java应用程序的软件。它通过模拟Java虚拟机(JVM)来实现这一功能,使得开发者...

    java二维图像绘制

    总之,基于Java的Web统计图表引擎结合了Java二维图像绘制的强大功能、JSP的动态网页生成能力和JavaBean的数据处理优势,为Web应用程序提供了灵活、高效、直观的数据可视化解决方案。无论是气象数据的监控,还是其他...

    Java开发技术大全(500个源代码).

    showOrder_1.java 演示操作数求值顺序示例1 showOrder_2.java 演示操作数求值顺序示例2 sign.java 用条件运算实现符号函数示例 signByIF.java 用if语句实现符号函数示例 triangleStar.java 输出一个由*组成的...

    基于JAVA技术的网页内容智能抓取.doc

    《基于JAVA技术的网页内容智能抓取》 在信息技术领域,网页内容的抓取是一项重要的技术,它使得我们可以从互联网的海量数据中提取有价值的信息。本文档主要探讨了基于JAVA技术实现网页内容智能抓取的方法、架构以及...

    基于java的供求信息网

    【基于Java的供求信息网】是一个使用JSP(JavaServer Pages)和Servlet技术构建的在线平台,主要用于发布、查看和管理各类供求信息。这个系统具备用户分层功能,提供了不同的访问权限,使得不同类型的用户能够根据...

    java获取邮箱联系人库文件

    总结来说,Java获取邮箱联系人库文件是一个涉及网络编程、HTML解析和网页模拟的复杂过程。借助如`flyerhzm-contactlist-855a71f`这样的工具库和辅助调试工具,如httpwatch,开发者可以更高效地完成这一任务。在实际...

    基于JAVA技术的网页内容智能抓取

    【基于JAVA技术的网页内容智能抓取】是一个利用Java编程语言实现的网页内容抓取系统,它结合了XML解析、HTML解析以及多种开源组件来高效地获取和处理网络上的信息。核心技术和组件包括: 1. **XML解析**:DOM4J被...

    Java爬虫汽车之家图片

    Java爬虫是一种使用Java编程语言实现的网络爬虫技术,它主要用于自动抓取互联网上的信息,如网页内容、图片等。在本案例中,项目组利用Java爬虫从汽车之家网站获取了12万张汽车图片,用于训练人工智能的图片识别模型...

    java开发的网页bbs登录页面

    ### Java 开发的网页BBS登录页面解析 #### 一、概述 本篇文章将深入探讨一个基于Java开发的网页BBS(Bulletin Board System)登录页面的相关实现细节和技术要点。通过分析给定的代码片段,我们可以了解到该登录...

    java 利用jexcelapi操作Excel

    本教程将深入探讨如何利用JExcelAPI在Java应用程序中操作Excel。 首先,我们来了解一下`jxl.jar`,这是JExcelAPI的核心库文件。在你的项目中,你需要将这个jar文件添加到类路径(classpath)中,以便能够使用...

    java项目之都市供求信息网.rar

    【标题】"Java项目之都市供求信息网"是一款基于Java技术开发的毕业设计项目,旨在构建一个线上平台,实现城市内的商品供求信息交流。这个项目可能涵盖了电子商务、信息发布、用户管理等多个功能模块,为用户提供方便...

    java开源包6

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    基于java酒店管理系统源码Java源码

    【压缩包子文件的文件名称列表】中的三个文件提供了项目相关的辅助信息: 1. **下载及使用说明.txt**:这个文件通常包含如何获取和运行源码的详细步骤,可能包括环境配置、依赖安装、数据库连接设置等,对于初学者来...

    java开源包9

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包4

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包101

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java语言设计讲义-ppt

    15. **Java反射机制**:解释如何在运行时动态地获取类的信息并操作对象。 16. **JDBC**:介绍如何使用Java数据库连接技术访问数据库,包括加载驱动、建立连接、执行SQL语句和处理结果集。 17. **Java Annotation**...

    java开源包5

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    Java网络爬虫简单实现.pdf

    - 文件操作:例如创建文件、写入内容。 - 判断是否满足保存条件。 ##### 3. HrefOfPage.java 该类主要负责从页面源代码中提取所有的链接信息。 - **功能**:使用正则表达式或其他方式从HTML中提取所有链接地址。...

Global site tag (gtag.js) - Google Analytics