`
liuxinglanyue
  • 浏览: 561737 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

java获取网页主信息之二:辅助操作(转)

阅读更多

1.栈操作

package Source;   
  
import java.util.LinkedList;   
  
//用List定义一个栈   
public class Stack   
{   
    //构造方法   
    public Stack()   
    {   
        list = new LinkedList();   
        isEmpty = true;   
    }   
    //入栈   
    public void push(Object node)   
    {   
        list.add(node);   
        if(isEmpty) isEmpty = false;   
    }   
    //出栈   
    public Object pop()   
    {   
        if(!isEmpty)   
        {   
            Object node = list.getLast();   
            list.removeLast();   
            if(list.size() == 0) isEmpty = true;   
            return node;   
        }    
        else return null;   
    }   
    //获取栈顶元素   
    public Object getTop()   
    {   
        if(!isEmpty) return list.getLast();   
        else return null;   
    }   
    //获取栈的元素个数   
    public int getSize()   
    {   
        return list.size();   
    }   
       
    //获取指定元素   
    public Object getElement(int index)   
    {   
        int size = getSize();   
        if(index < 0 || index > size) return null;   
        else return list.get(index);   
    }   
    //删除元素   
    public void remove(int index)   
    {   
        list.remove(index);   
    }   
    //置栈空   
    public boolean empty()   
    {   
        return isEmpty;   
    }   
    //打印栈内元素   
    public void print()   
    {   
        int size = list.size();   
        for(int i = size - 1; i >= 0; i--)   
            System.out.print((new StringBuilder(String.valueOf(list.get(i).toString()))).append(" ").toString());   
  
    }   
  
    private LinkedList list;   
    private boolean isEmpty;   
}   

 2.符号集合

package Source;   
  
  
//定义一些需特殊处理的html标识   
public class Symbol   
{   
    public static String jump[] =    
    {   
        "span", "select", "script", "h", "ul", "li", "TEXTAREA", "style"  
    };   
    public static String ignore[] =    
    {   
        "/p", "br", "form", "/form", "param", "/img", "p", "img", "hr", "!",    
        "input"  
    };   
    public static String remove[] =    
    {   
        "&nbsp;", "&gt;"  
    };   
}   
 
分享到:
评论

相关推荐

    java获取网页主信息之五:测试

    标题“java获取网页主信息之五:测试”暗示了这是一个关于Java获取网页信息系列教程的第五部分,重点可能放在测试和验证已经实现的代码功能上。在这个阶段,开发者通常会编写单元测试或者集成测试,确保代码能够正确...

    java获取邮箱联系人库文件

    总结来说,Java获取邮箱联系人库文件是一个涉及网络编程、HTML解析和网页模拟的复杂过程。借助如`flyerhzm-contactlist-855a71f`这样的工具库和辅助调试工具,如httpwatch,开发者可以更高效地完成这一任务。在实际...

    JAVA辅助工具

    Java辅助工具是一款重要的软件,主要用于在计算机上安装和运行JAVA模拟器。JAVA模拟器是一种能够让你在不支持原生Java环境的系统上运行Java应用程序的软件。它通过模拟Java虚拟机(JVM)来实现这一功能,使得开发者...

    Java开发技术大全(500个源代码).

    showOrder_1.java 演示操作数求值顺序示例1 showOrder_2.java 演示操作数求值顺序示例2 sign.java 用条件运算实现符号函数示例 signByIF.java 用if语句实现符号函数示例 triangleStar.java 输出一个由*组成的...

    java二维图像绘制

    总之,基于Java的Web统计图表引擎结合了Java二维图像绘制的强大功能、JSP的动态网页生成能力和JavaBean的数据处理优势,为Web应用程序提供了灵活、高效、直观的数据可视化解决方案。无论是气象数据的监控,还是其他...

    java pdf转html

    Java中的PDF转HTML是一项常见的需求,特别是在数据处理、文档转换和网页展示的场景下。PDF是一种流行的文件格式,用于保存格式化的文档,而HTML则广泛应用于网页制作。将PDF转换为HTML可以使得内容更容易在网络上...

    基于JAVA技术的网页内容智能抓取.doc

    3. 执行抓取任务:依据配置文件中的规则,发起HTTP请求获取网页内容。 4. 内容解析与处理:解析抓取到的HTML,根据预设规则提取目标内容并进行进一步的处理。 四、目前缺陷功能描述 尽管系统具有一定的实用性,但也...

    基于java的供求信息网

    【基于Java的供求信息网】是一个使用JSP(JavaServer Pages)和Servlet技术构建的在线平台,主要用于发布、查看和管理各类供求信息。这个系统具备用户分层功能,提供了不同的访问权限,使得不同类型的用户能够根据...

    基于JAVA技术的网页内容智能抓取

    【基于JAVA技术的网页内容智能抓取】是一个利用Java编程语言实现的网页内容抓取系统,它结合了XML解析、HTML解析以及多种开源组件来高效地获取和处理网络上的信息。核心技术和组件包括: 1. **XML解析**:DOM4J被...

    Java爬虫汽车之家图片

    Java爬虫是一种使用Java编程语言实现的网络爬虫技术,它主要用于自动抓取互联网上的信息,如网页内容、图片等。在本案例中,项目组利用Java爬虫从汽车之家网站获取了12万张汽车图片,用于训练人工智能的图片识别模型...

    java开发的网页bbs登录页面

    ### Java 开发的网页BBS登录页面解析 #### 一、概述 本篇文章将深入探讨一个基于Java开发的网页BBS(Bulletin Board System)登录页面的相关实现细节和技术要点。通过分析给定的代码片段,我们可以了解到该登录...

    Java网络爬虫简单实现.pdf

    - 文件操作:例如创建文件、写入内容。 - 判断是否满足保存条件。 ##### 3. HrefOfPage.java 该类主要负责从页面源代码中提取所有的链接信息。 - **功能**:使用正则表达式或其他方式从HTML中提取所有链接地址。...

    java 利用jexcelapi操作Excel

    本教程将深入探讨如何利用JExcelAPI在Java应用程序中操作Excel。 首先,我们来了解一下`jxl.jar`,这是JExcelAPI的核心库文件。在你的项目中,你需要将这个jar文件添加到类路径(classpath)中,以便能够使用...

    JAVA上百实例源码以及开源项目源代码

    Calendar万年历 1个目标文件 EJB 模拟银行ATM流程及操作源代码 6个目标文件,EJB来模拟银行ATM机的流程及操作:获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,并将当前的计数器初始化,调用每一个...

    自己做的java简易浏览器

    这个项目可能是一个简单的Java应用程序,它能够解析并显示HTML网页内容,同时提供了后退、前进和转到特定URL的功能,这些都是现代浏览器的基础操作。 【描述】提到的“只能显示html网页”意味着该程序可能没有实现...

    基于java酒店管理系统源码Java源码

    【压缩包子文件的文件名称列表】中的三个文件提供了项目相关的辅助信息: 1. **下载及使用说明.txt**:这个文件通常包含如何获取和运行源码的详细步骤,可能包括环境配置、依赖安装、数据库连接设置等,对于初学者来...

    java项目之都市供求信息网.rar

    【标题】"Java项目之都市供求信息网"是一款基于Java技术开发的毕业设计项目,旨在构建一个线上平台,实现城市内的商品供求信息交流。这个项目可能涵盖了电子商务、信息发布、用户管理等多个功能模块,为用户提供方便...

    网页源码下载工具

    其中,`GetURLText.java` 文件很可能是这个工具的核心类,它可能包含了获取网页源码的主要逻辑。在Java中,我们可以使用`java.net.URL` 和 `java.net.HttpURLConnection` 类来建立与目标网页的连接,并通过`...

    java开源包6

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java语言设计讲义-ppt

    15. **Java反射机制**:解释如何在运行时动态地获取类的信息并操作对象。 16. **JDBC**:介绍如何使用Java数据库连接技术访问数据库,包括加载驱动、建立连接、执行SQL语句和处理结果集。 17. **Java Annotation**...

Global site tag (gtag.js) - Google Analytics