1.所需文件
param.txt:存放需要提取信息的网页路径
TestPage:存放需要提取信息的网页
Out.txt:输出的网页内容
2.测试程序
- package test;
-
- import java.io.*;
- import Source.*;
-
-
- public class ETest{
-
- public static void main(String args[])
- {
-
- String out = "out.txt";
- File outfile = new File(out);
-
- HTML2Tree h2t = new HTML2Tree();
- String file = getFilename();
- h2t.main(file);
- HTree tree = h2t.getTree();
-
- double th = 0.79;
-
- ChooseBlock cb = new ChooseBlock(th);
-
- String str = cb.getContent(tree);
- if(str == null)
- {
- System.out.println("文件为空");
- System.exit(1);
- }
- try
- {
- PrintWriter p = new PrintWriter(new BufferedWriter(new FileWriter(outfile)));
- p.println(str);
- p.close();
- }
- catch(IOException e)
- {
- System.out.println(e);
- System.exit(1);
- }
- }
-
- private static String getFilename()
- {
- String file = "";
- try
- {
- File f = new File("param.txt");
- BufferedReader fis = new BufferedReader(new FileReader(f));
- String s;
- while((s = fis.readLine()) != null)
- if(!s.equalsIgnoreCase(""))
- {
- file = s;
- break;
- }
- }
- catch(IOException e)
- {
- System.out.println(e);
- System.exit(1);
- }
- return file;
- }
- }
- IE.rar (86.4 KB)
- 描述: 附件:完整源程序与可执行文件
- 下载次数: 214
分享到:
相关推荐
在Java实现网页截图时,我们首先创建一个`Robot`实例,然后使用`createScreenCapture()`方法来获取整个屏幕或特定区域的图像。此外,为了确保网页完全加载后再进行截图,通常会使用`delay()`方法来进行延时。 #### ...
在Java编程环境中,生成网页快照是一项常见的需求,主要用于数据抓取、网页存档或测试自动化等场景。这里我们关注的焦点是如何利用Java实现整张网页的快照功能。通过标题"java 实现整张网页快照"和描述,我们可以...
在这个项目中,我们关注的是使用Java和Jsoup库来爬取1688网站的信息。这是一个非常实用的技术,它可以帮助我们自动化地获取网页上的数据,如商品名称、价格、评价等,为数据分析或构建电商平台的模拟系统提供基础。 ...
在本项目中,"纯Java实现整个网页截图项目源代码" 是一个利用Java编程语言来实现的实用程序,它能够捕获整个网页的图像并将其保存为图片文件。这个项目的核心在于利用DJNativeSwing组件,这是一个开源的Java库,它...
在Java编程环境中,实现网页截图技术是一项常见的需求,特别是在自动化测试、数据分析或者生成网页快照等场景中。本文将深入探讨如何使用Java来捕获网页的屏幕快照,并结合提供的标签"源码"和"工具",给出具体的实现...
### 使用Java快速判断网页链接是否有效 在互联网应用开发中,经常会遇到需要验证网页链接有效性的情况。例如,在爬虫程序中需要确保所抓取的链接是有效的,或者是在网站维护过程中检查外部链接的有效性等。本文将...
总的来说,这个例子展示了如何利用Java和相关库来自动化获取网页上的信息,这对于数据分析、市场研究、新闻监控等各种应用场景都非常有用。理解并实践这样的示例,能够提升你在数据获取和处理方面的技能,为后续的...
Java获取网页中的图片资源,启动线程,智能解析URL,加载图片资源,显示图片数据,测试时候请用IE打开useTrackedImage.html 文件,载入图像文件,并获取该图像文件。本Java例子主要是利用java.awt.MediaTracker 类来...
通过以上几个方面的详细介绍,我们可以看出,Java在网页版魔方游戏的开发过程中扮演着非常重要的角色,不仅可以实现稳定高效的后台逻辑处理,还可以结合前端技术提供良好的用户体验。希望这些知识点能够帮助您更好地...
Java抓取网页的爬虫是一种自动化程序,用于从互联网上收集和处理大量数据。它模拟浏览器行为,通过...通过以上技术和概念的掌握,开发者可以构建出功能强大、高效的Java网页爬虫,实现对互联网信息的自动获取和处理。
这个【标题】"java将网页保存成mht格式文件"指向的是一个Java项目,其目的是将网页转换为MHT格式,以便离线查看或保存网页的原始状态。 在Java中实现这个功能,通常需要以下步骤: 1. **抓取网页内容**:首先,你...
本篇文章将详细探讨如何使用Java进行网页信息采集,并将所需数据存储到数据库的相应字段中。 首先,我们需要了解网页采集的基本步骤: 1. **网络请求**:使用HTTP协议发送请求到目标网页,如使用`java.net.URL`和`...
WebDriver支持多种编程语言,Java是其中之一,因此我们可以用Java编写测试脚本来驱动浏览器执行任务。 **1. Selenium与Java结合** 在Java中使用Selenium,首先需要引入对应的依赖库,通常通过Maven或Gradle来管理...
【基于Java的旅游信息管理系统的设计与实现】 随着全球市场经济管理水平的飞速提升,旅游行业得到了前所未有的发展机遇。在这个背景下,旅游信息管理系统成为了一个至关重要的工具,它能够有效地整合和管理日益增长...
Java 网页浏览器组件是Java编程中一个重要的部分,它允许开发者在Java应用程序中嵌入网页浏览功能。这样的组件通常被称为Java Web Start(JWS)或JavaFX WebView,它们为用户提供了一种在不依赖外部浏览器的情况下...