`
ssxxjjii
  • 浏览: 953698 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论
文章列表
package rssTest;      import java.io.BufferedReader;  
  import java.util.regex.Matcher;   import java.util.regex.Pattern;   import org.apache.commons.httpclient.HttpClient;  
          关于dhtmlxtree 节点实现超链接功能问题详解   看了下api发现 有这样一个功能 <script> tree.attachEvent("onClick",function(id){ window.open(tree.getUserData(id,"href")); return true; }); </script>  当异步加载XML的时候,在xml中设置类似 <userdat ...
使用XML加载数据 <script>     tree=new dhtmlXTreeObject('treeBox',"100%","100%",0);     tree.setXMLAutoLoading("http://127.0.0.1/xml/tree.xml");     tree.loadXML("http://127.0.0.1/xml/tree.xml");//load root level from xml </script> ...
http://www.blogjava.net/lishunli/archive/2010/03/11/315055.html
HttpClient程序包是一个实现了 HTTP 协议的客户端编程工具包,要想熟练的掌握它,必须熟悉 HTTP协议。一个最简单的调用如下:  01.import java.io.IOException; 02.import org.apache.http.HttpResponse; 03.import org.apache.http.client.ClientProtocolException; 04.import org.apache.http.client.HttpClient; 05.import org.apache.http.client.m ...
需要手动处理redirect。 (以获得中间过程的 Location, 有时中间这个转向在URL中包含了某个参数)HttpClient4.0的GET方法完全redirect,POST方法部分支持redirect,也就是说,我们在大部分情况下爬网页时中间的一些redirect过程可以当作是透明的,输入一个URL得到的是redirect后的最终结果页。 刚好,我需要redirect过程中的一个临时页面的一些信息,而HttpClient4.0 "自作主张"地帮我忽略了,如何手动处理呢? 结过查看其内部源码,HttpClient默认是通过DefaultRedirectHandler来 ...
1.可以在任何.net语言中使用(C#,VB.net,J#等)2.可以解析几乎所有的Html标签,并且可以通过标签类别、属性或正则表达式来搜索标签。有些甚至在Java版本中无法支持的标签也在这个版本中得到了支持。3.设置可扩展的过滤器来过滤结果集中不需要的标签。4.高性能的API接口使得你能处理许多常见的问题,如:哪些是页面中的外部链接?哪些是图片?哪些是不同的表格?页面中有错误的链接吗等等问题。5.一个基于Http协议引擎的配置文件使得你能通过一个指定的URL地址来获得该页面内容。该爬虫可以遵循robot.txt协议文件来获得组织和允许访问的列表。6.Http协议引擎能够完整地处理来自任何站点 ...
摘自 :http://zhangjunhd.blog.51cto.com/113473/36838   JavaBean的属性与一般Java程序中所指的属性,或者说与所有面向对象的程序设计语言中对象的属性是一个概念,在程序中的具体体现就是类中的变量。在JavaBean的设计中,按照属性的不 ...
http://itbiji.net/2010/05/httpclient401/ http://itbiji.net/2010/05/httpcomponents-client/
摘自 :http://hi.baidu.com/kinsonhe/blog/item/4a77d411ff00288a6538db96.html 1、HttpClient使用GET方式通过代理服务器读取页面的例子 import java.io.BufferedReader; import java.io.InputStreamReader; import org.apache.http.HttpEntity; import org.apache.http.HttpHost; import org.apache.http.HttpResponse; import org.apache ...
一,数据组织分析: HtmlParser主要靠Node、AbstractNode和Tag来表达Html,因为Remark和Text相对简单,此处就将其忽略了。 Node是形成树结构表示HTML的基础,所有的数据表示都是接口Node的实现,Node定义了与页面树结构所表达的页面Page对 ...
struts2配合log4j打印异常栈信息   关于配置struts2全局异常后控制台无法打印异常信息问题   <global-results> <result name="error">/exception/error.jsp</result> </global-results> <global-exception-mappings> <exception-mapping exception="java.lang.Exceptions" ...
关于navicat 显示乱码问题 导入导出乱码解决方案   今天数据移植换了个navicat版本,,不知道怎么搞的数据插入乱码,真晕。多次尝试终于搞定了   特将方法记录如下: 在“连接属性”的设置中,高级-“使用mysql字符集”去掉钩,并且将编码改为10008-GB2312. 然后进入navicat的控制台后,show variables like 'char%';命令后如下: +--------------------------+---------------------------------------+ | Variable_name            | Va ...
遇到的WARN JDBCException Reporter:100- SQL Error 0,sqlstate: 08003 数据库报错问题。 经过网上查询发现原因是:Tomcat服务器与MySQL服务器之间已经失去连接。 原来MySQL wait timeout的值默认是28800 (3600*8),即一个连接在8小时内没有活动,就会自动断开该连接。 wait timeout的值可以设定,但最多只能是32767,不能再大了。 然后搜到解决这个问题的一个办法是在hibernate.cfg.xml中,在url的连接后加上autoReconnect=true。但是MySQL官方不推荐使 ...
Global site tag (gtag.js) - Google Analytics