- 浏览: 1538231 次
- 性别:
- 来自: 杭州
文章分类
- 全部博客 (525)
- SEO (16)
- JAVA-EE-Hibernate (6)
- JAVA-EE-Struts (29)
- JAVA-EE-Spring (15)
- Linux (37)
- JAVA-SE (29)
- NetWork (1)
- CMS (14)
- Semantic Research (3)
- RIA-Flex (0)
- Ajax-Extjs (4)
- Ajax-Jquery (1)
- www.godaddy.com (0)
- SSH (34)
- JavaScript (6)
- SoftwareEngineer (9)
- CMMI (0)
- IDE-Myeclipse (3)
- PHP (1)
- Algorithm (3)
- C/C++ (18)
- Concept&Items (2)
- Useful WebSite (1)
- ApacheServer (2)
- CodeReading (1)
- Socket (2)
- UML (10)
- PowerDesigner (1)
- Repository (19)
- MySQL (3)
- SqlServer (0)
- Society (1)
- Tomcat (7)
- WebService (5)
- JBoss (1)
- FCKeditor (1)
- PS/DW/CD/FW (0)
- DesignPattern (11)
- WebSite_Security (1)
- WordPress (5)
- WebConstruction (3)
- XML|XSD (7)
- Android (0)
- Project-In-Action (9)
- DatabaseDesign (3)
- taglib (7)
- DIV+CSS (10)
- Silverlight (52)
- JSON (7)
- VC++ (8)
- C# (8)
- LINQ (1)
- WCF&SOA (5)
- .NET (20)
- SOA (1)
- Mashup (2)
- RegEx (6)
- Psychology (5)
- Stock (1)
- Google (2)
- Interview (4)
- HTML5 (1)
- Marketing (4)
- Vaadin (2)
- Agile (2)
- Apache-common (6)
- ANTLR (0)
- REST (1)
- HtmlAnalysis (18)
- csv-export (3)
- Nucth (3)
- Xpath (1)
- Velocity (6)
- ASP.NET (9)
- Product (2)
- CSS (1)
最新评论
-
lt26w:
理解成门面模式应该比较容易明白吧
FacadePattern-Java代码实例讲解 -
lt26w:
看下面的例子比较明白.
FacadePattern-Java代码实例讲解 -
javaloverkehui:
这也叫文档,别逗我行吗,也就自己看看。
HtmlCleaner API -
SE_XiaoFeng:
至少也应该写个注释吧。
HtmlCleaner API -
jfzshandong:
...
org.springframework.web.filter.CharacterEncodingFilter 配置
先下载依赖的相关JAR包:http://sourceforge.net/projects/htmlunit/files/
示例1:获取javaeye网站的title
<!-- <br />
<br />
Code highlighting produced by Actipro CodeHighlighter (freeware)<br />
http://www.CodeHighlighter.com/<br />
<br />
-->import
com.gargoylesoftware.htmlunit.FailingHttpStatusCodeException;
import com.gargoylesoftware.htmlunit.WebClient;
import com.gargoylesoftware.htmlunit.html.HtmlPage;
public static void getHomeTile() throws FailingHttpStatusCodeException, MalformedURLException, IOException{
final WebClient webClient = new WebClient();
final HtmlPage htmlPage = webClient.getPage( " http://www.iteye.com " );
System.out.println(htmlPage.getTitleText());
System.out.println(htmlPage.getTextContent());
}
import com.gargoylesoftware.htmlunit.WebClient;
import com.gargoylesoftware.htmlunit.html.HtmlPage;
public static void getHomeTile() throws FailingHttpStatusCodeException, MalformedURLException, IOException{
final WebClient webClient = new WebClient();
final HtmlPage htmlPage = webClient.getPage( " http://www.iteye.com " );
System.out.println(htmlPage.getTitleText());
System.out.println(htmlPage.getTextContent());
}
可以看见打印出:JavaEye Java编程 Spring框架 AJAX技术 Agile敏捷软件开发 ruby on rails实践 - JavaEye做最棒的软件开发交流社区
和javaeye首页的title属性一样
示例二:获取一个特定的浏览器版本
<!-- <br />
<br />
Code highlighting produced by Actipro CodeHighlighter (freeware)<br />
http://www.CodeHighlighter.com/<br />
<br />
-->public
void
homePage_Firefox()
throws
Exception {
final WebClient webClient = new WebClient(BrowserVersion.FIREFOX_2);
final HtmlPage page = webClient.getPage( " http://htmlunit.sourceforge.net " );
assertEquals( " HtmlUnit - Welcome to HtmlUnit " , page.getTitleText());
}
final WebClient webClient = new WebClient(BrowserVersion.FIREFOX_2);
final HtmlPage page = webClient.getPage( " http://htmlunit.sourceforge.net " );
assertEquals( " HtmlUnit - Welcome to HtmlUnit " , page.getTitleText());
}
示例三:获取特定ID的DIV或者锚链接
<!-- <br />
<br />
Code highlighting produced by Actipro CodeHighlighter (freeware)<br />
http://www.CodeHighlighter.com/<br />
<br />
-->public
void
getElements()
throws
Exception {
final WebClient webClient = new WebClient();
final HtmlPage page = webClient.getPage( " http://some_url " );
final HtmlDivision div = page.getHtmlElementById( " some_div_id " );
final HtmlAnchor anchor = page.getAnchorByName( " anchor_name " );
}
final WebClient webClient = new WebClient();
final HtmlPage page = webClient.getPage( " http://some_url " );
final HtmlDivision div = page.getHtmlElementById( " some_div_id " );
final HtmlAnchor anchor = page.getAnchorByName( " anchor_name " );
}
实例四:模拟页面提交一个form
<!-- <br />
<br />
Code highlighting produced by Actipro CodeHighlighter (freeware)<br />
http://www.CodeHighlighter.com/<br />
<br />
-->public
void
submittingForm()
throws
Exception {
final WebClient webClient = new WebClient();
// Get the first page
final HtmlPage page1 = webClient.getPage( " http://some_url " );
// Get the form that we are dealing with and within that form,
// find the submit button and the field that we want to change.
final HtmlForm form = page1.getFormByName( " myform " );
final HtmlSubmitInput button = form.getInputByName( " submitbutton " );
final HtmlTextInput textField = form.getInputByName( " userid " );
// Change the value of the text field
textField.setValueAttribute( " root " );
// Now submit the form by clicking the button and get back the second page.
final HtmlPage page2 = button.click();
}
final WebClient webClient = new WebClient();
// Get the first page
final HtmlPage page1 = webClient.getPage( " http://some_url " );
// Get the form that we are dealing with and within that form,
// find the submit button and the field that we want to change.
final HtmlForm form = page1.getFormByName( " myform " );
final HtmlSubmitInput button = form.getInputByName( " submitbutton " );
final HtmlTextInput textField = form.getInputByName( " userid " );
// Change the value of the text field
textField.setValueAttribute( " root " );
// Now submit the form by clicking the button and get back the second page.
final HtmlPage page2 = button.click();
}
发表评论
-
HTMLParser的两种使用方法
2010-04-15 16:37 5414HTMLParser的两种使用方法 ... -
HtmlCleanner结合xpath用法
2010-04-15 13:24 3579文章分类:Java编程 ... -
基于Htmlparser的天气预报程序(续)
2010-04-14 13:53 1103zz:http://www.iteye.com/topic/6 ... -
httpclient(校内网)
2010-04-13 15:10 1325Java code <!-- C ... -
httpclient(校内网)
2010-04-13 15:10 1439httpclient(校内网),大家帮忙看看我的 http ... -
HTTPClient模拟登陆人人网
2010-04-13 14:58 1918zz: 目的: http://www.iteye. ... -
HtmlCleaner API
2010-04-13 13:40 4533HtmlCleaner API Create cleaner ... -
htmlcleaner惯用法
2010-04-13 13:39 1477Common usage Tipically the f ... -
htmlcleaner惯用法
2010-04-13 13:39 1549Common usage Tipically t ... -
htmlcleaner 使用示例.
2010-04-13 13:10 10058原文出处:http://blog.chenlb.com/200 ... -
http://htmlparser.com.cn/
2010-04-12 16:20 1070http://htmlparser.com.cn/ ... -
开源网络蜘蛛spider(转载)
2010-04-12 15:42 1350spider是搜索引擎的必须 ... -
基于Spindle的增强HTTP Spider
2010-04-12 15:33 1492zz:http://www.iteye.com/news ... -
Cobra: Java HTML 解析器
2010-04-12 15:32 2971Cobra 简介: Cobra是一个 ... -
用htmlparser分析并抽取正文
2010-04-12 15:26 1567我这次要介绍的是如何抽取正文,这部分是最为核心的.因为如果不能 ... -
HtmlParser初步研究
2010-04-12 15:18 947目的是快速入手,而不 ... -
基于Htmlparser的天气预报程序
2010-04-12 15:16 1089htmlparser是一个纯的java写的html解析的库,它 ...
相关推荐
通过htmlunit 下载网站资源的简单示例 htmlunit 是一款开源的java 页面分析工具,读取页面后,可以有效的使用htmlunit分析页面上的内容。 项目可以模拟浏览器运行,被誉为java浏览器的开源实现。是一个没有界面的...
3. 文档和示例:可能包含API文档、用户指南以及示例代码,帮助开发者快速理解和使用HTMLUnit。 4. 测试类和资源:用于验证库功能的JUnit测试类和相关的测试资源。 使用HTMLUnit进行网页爬虫开发时,你可以: 1. ...
5. **HtmlunitTest.java**:这看起来是一个测试类,可能包含了使用HTMLUnit进行网页测试或爬虫的示例代码。通过这个文件,你可以学习如何初始化`WebClient`,加载网页,执行JavaScript,以及如何提取和处理网页上的...
HtmlUnit测试工具的推出,创意非常好。是一款给java开发用的browser。说它是browser,其实它是对html建模并且提供API来访问页面,点击链接等等的java类库。 这样的测试工具有这样几个优点: 运行起来没有界面,...
8. **示例代码**: 创建一个简单的HTMLUnit测试用例可能如下所示: ```java import org.openqa.selenium.htmlunit.HtmlUnitDriver; public class HtmlUnitTest { public static void main(String[] args) { ...
提供的开发文档中应该包含多个示例源码,这些示例涵盖了各种使用场景,可以帮助你更好地理解和使用HtmlUnit。 7. **依赖管理** 在构建项目时,确保正确添加了HtmlUnit及其所有依赖到你的classpath。官方文档的...
三、API使用示例 1. **创建WebClient**: ```java WebClient webClient = new WebClient(); ``` 2. **设置浏览器配置**: ```java webClient.getOptions().setJavaScriptEnabled(true); webClient....
3. 文档和示例:为了帮助用户理解和使用HTMLUnit,压缩包可能包含API文档、用户指南以及一些示例代码。 4. 构建工具配置:可能包含构建文件(如pom.xml,用于Maven项目),方便用户将HTMLUnit集成到自己的开发环境中...
在使用HtmlUnit 2.22时,开发者可以参考API文档中的示例代码来了解如何初始化WebClient、导航到URL、查找和操作页面元素,以及处理JavaScript事件。例如,使用`WebClient`的`getPage(String url)`方法获取指定URL的...
结合`HtmlUnitTest`这个压缩包中的文件,可能是包含一些示例测试用例或演示如何使用HTMLUnit进行实战操作的代码。通过阅读这些文件,你可以更深入地了解HTMLUnit的具体用法,并学习如何将其应用于实际项目中。在测试...
2. 文档:可能包含API文档、用户指南和示例代码,帮助开发者了解如何使用HTMLUnit。 3. 示例:可能提供一些示例代码,展示如何初始化浏览器对象,加载网页,执行JavaScript,以及进行其他交互操作。 4. 依赖库:...
10. **社区支持**:HTMLUnit有一个活跃的开源社区,提供持续的更新和支持,用户可以通过查阅官方文档、示例代码和社区论坛来获取帮助。 了解以上知识点后,你可以开始探索"htmlunit-2.9"中的源代码,理解其内部实现...
在实际使用中,你可以将"htmlunit-2.31.jar"添加到你的Java项目的类路径中,然后通过以下代码示例开始使用HTMLUnit: ```java import org.htmlunit.*; public class HtmlUnitTest { public static void main...
这个"HtmlUnit爬虫Demo"可能是一个示例项目,展示了如何利用HtmlUnit库进行网络爬虫开发。以下是对HtmlUnit库及其在爬虫中的应用进行的详细说明。 **HtmlUnit简介** HtmlUnit是一个无头浏览器,意味着它没有图形...
要使用这个库,开发者需要将"htmlunit-2.33-bin"解压,将相关的jar文件添加到项目的类路径中,并根据官方文档或示例代码学习如何编写测试脚本。 总的来说,HTMLUnit-2.33是一个强大且灵活的工具,对于需要自动化...
10. **学习资源**:要学习和使用HTMLUnit,可以参考官方文档、GitHub上的示例代码,以及在线社区(如Stack Overflow)中的问题和解答。 总之,HTMLUnit是一个强大的工具,对于自动化测试和网页抓取任务,尤其是处理...
这个"giat-htmlunit_test.rar"压缩包显然包含了与使用HTMLUnit进行JavaScript交互和网页抓取相关的代码示例或测试用例。在本文中,我们将深入探讨HTMLUnit的用途、如何使用它来访问和修改网页上的JavaScript,以及...
这些文件通常包括HTMLUnit的核心库、依赖的第三方库以及可能的配置或示例代码。 在`d5fca8e87033460ebec6c7ffc96b8cd7`这个文件名中,看起来是一个哈希值,这通常是用来确保文件完整性的标识符。在下载或分发软件包...
解压后,开发者将找到库的源代码、文档、示例代码以及必要的JAR文件,以便在自己的项目中集成和使用HTMLUnit。 使用HTMLUnit,开发者可以构建高效的网络爬虫,特别是在需要处理JavaScript渲染的网页时。此外,由于...