java 正则表达式抓取网页中的新闻

博客分类：

正则表达式

正则表达式 Java XP .net Google

package rssTest; import java.io.BufferedReader;

2010-08-04 22:02
浏览 2445
评论(0)
分类:编程语言

正则表达式学习 ---- 抓取远程网页并解析HTML

博客分类：

正则表达式

正则表达式 HTML Apache

import java.util.regex.Matcher; import java.util.regex.Pattern; import org.apache.commons.httpclient.HttpClient;

2010-08-04 22:01
浏览 4190
评论(0)
分类:编程语言

dhtmlxtree 节点超链功能

博客分类：

javascript

XML

关于dhtmlxtree 节点实现超链接功能问题详解看了下api发现有这样一个功能 <script> tree.attachEvent("onClick",function(id){ window.open(tree.getUserData(id,"href")); return true; }); </script> 当异步加载XML的时候，在xml中设置类似 <userdat ...

2010-08-04 12:53
浏览 2735
评论(0)
分类:Web前端

使用XML加载数据 <script> tree=new dhtmlXTreeObject('treeBox',"100%","100%",0); tree.setXMLAutoLoading("http://127.0.0.1/xml/tree.xml"); tree.loadXML("http://127.0.0.1/xml/tree.xml");//load root level from xml </script> � ...

2010-07-30 14:49
浏览 1608
评论(0)
分类:Web前端

spring3 使用Annotation并对DAO层封装具有分页功能的S2SH整合实例

博客分类：

spring

DAO .net HTML

http://www.blogjava.net/lishunli/archive/2010/03/11/315055.html

2010-07-27 11:35
浏览 1480
评论(0)
分类:企业架构

HttpClient4.x应用指南

博客分类：

httpclient

网络应用应用服务器网络协议 Apache HTML

HttpClient程序包是一个实现了 HTTP 协议的客户端编程工具包，要想熟练的掌握它，必须熟悉 HTTP协议。一个最简单的调用如下： 01.import java.io.IOException; 02.import org.apache.http.HttpResponse; 03.import org.apache.http.client.ClientProtocolException; 04.import org.apache.http.client.HttpClient; 05.import org.apache.http.client.m ...

2010-07-26 15:18
浏览 3252
评论(1)
分类:编程语言

HttpClient4.0手动处理redirect

博客分类：

httpclient

Apache Google Firebug Windows Firefox

需要手动处理redirect。（以获得中间过程的 Location, 有时中间这个转向在URL中包含了某个参数）HttpClient4.0的GET方法完全redirect，POST方法部分支持redirect，也就是说，我们在大部分情况下爬网页时中间的一些redirect过程可以当作是透明的，输入一个URL得到的是redirect后的最终结果页。刚好，我需要redirect过程中的一个临时页面的一些信息，而HttpClient4.0 "自作主张"地帮我忽略了，如何手动处理呢? 结过查看其内部源码，HttpClient默认是通过DefaultRedirectHandler来 ...

2010-07-26 15:04
浏览 3614
评论(0)
分类:编程语言

HtmlParser 解析HTML

博客分类：

htmlparse

HTML 正则表达式 VB VB.NET 搜索引擎

1.可以在任何.net语言中使用（C#,VB.net,J#等）2.可以解析几乎所有的Html标签，并且可以通过标签类别、属性或正则表达式来搜索标签。有些甚至在Java版本中无法支持的标签也在这个版本中得到了支持。3.设置可扩展的过滤器来过滤结果集中不需要的标签。4.高性能的API接口使得你能处理许多常见的问题，如：哪些是页面中的外部链接？哪些是图片？哪些是不同的表格？页面中有错误的链接吗等等问题。5.一个基于Http协议引擎的配置文件使得你能通过一个指定的URL地址来获得该页面内容。该爬虫可以遵循robot.txt协议文件来获得组织和允许访问的列表。6.Http协议引擎能够完整地处理来自任何站点 ...

2010-07-16 16:06
浏览 2298
评论(0)
分类:编程语言

在Bean中使用PropertyChangeSupport支持PropertyChangeListeners

博客分类：

java随笔

Bean Blog

摘自：http://zhangjunhd.blog.51cto.com/113473/36838 JavaBean的属性与一般Java程序中所指的属性，或者说与所有面向对象的程序设计语言中对象的属性是一个概念，在程序中的具体体现就是类中的变量。在JavaBean的设计中，按照属性的不� ...

2010-07-16 09:13
浏览 1135
评论(0)
分类:编程语言

HttpClient的例子链接

博客分类：

httpclient

.net

http://itbiji.net/2010/05/httpclient401/ http://itbiji.net/2010/05/httpcomponents-client/

2010-07-13 17:49
浏览 1337
评论(0)
分类:非技术

HttpClient的相关例子

博客分类：

httpclient

Apache Socket .net Windows JSP

摘自：http://hi.baidu.com/kinsonhe/blog/item/4a77d411ff00288a6538db96.html 1、HttpClient使用GET方式通过代理服务器读取页面的例子 import java.io.BufferedReader; import java.io.InputStreamReader; import org.apache.http.HttpEntity; import org.apache.http.HttpHost; import org.apache.http.HttpResponse; import org.apache ...

2010-07-13 17:30
浏览 10395
评论(0)
分类:编程语言

htmlparser入门讲解

博客分类：

htmlparse

HTML 数据结构

一，数据组织分析： HtmlParser主要靠Node、AbstractNode和Tag来表达Html，因为Remark和Text相对简单，此处就将其忽略了。 Node是形成树结构表示HTML的基础，所有的数据表示都是接口Node的实现，Node定义了与页面树结构所表达的页面Page对 ...

2010-07-12 22:20
浏览 1224
评论(0)
分类:编程语言

struts2配合log4j打印异常栈信息

博客分类：

struts

log4j Webwork Struts JSP HTML

struts2配合log4j打印异常栈信息关于配置struts2全局异常后控制台无法打印异常信息问题 <global-results> <result name="error">/exception/error.jsp</result> </global-results> <global-exception-mappings> <exception-mapping exception="java.lang.Exceptions" ...

2010-07-06 11:32
浏览 7725
评论(5)
分类:企业架构

navicat 显示乱码问题

博客分类：

mysql

MySQL SQL Server SQL

关于navicat 显示乱码问题导入导出乱码解决方案今天数据移植换了个navicat版本，，不知道怎么搞的数据插入乱码，真晕。多次尝试终于搞定了特将方法记录如下：在“连接属性”的设置中，高级-“使用mysql字符集”去掉钩，并且将编码改为10008-GB2312. 然后进入navicat的控制台后，show variables like 'char%';命令后如下: +--------------------------+---------------------------------------+ | Variable_name | Va ...

2010-05-11 16:09
浏览 6757
评论(0)
分类:数据库

WARN JDBCException Reporter:100- SQL Error 0,sqlstate: 08003

博客分类：

mysql

SQL MySQL Hibernate Tomcat 活动

遇到的WARN JDBCException Reporter:100- SQL Error 0,sqlstate: 08003 数据库报错问题。经过网上查询发现原因是：Tomcat服务器与MySQL服务器之间已经失去连接。原来MySQL wait timeout的值默认是28800 (3600*8)，即一个连接在8小时内没有活动，就会自动断开该连接。 wait timeout的值可以设定，但最多只能是32767，不能再大了。然后搜到解决这个问题的一个办法是在hibernate.cfg.xml中，在url的连接后加上autoReconnect=true。但是MySQL官方不推荐使 ...

2010-03-10 09:16
浏览 4472
评论(0)
分类:数据库

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

java 正则表达式抓取网页中的新闻

正则表达式学习 ---- 抓取远程网页并解析HTML

dhtmlxtree 节点超链功能

dhtmlxtree学习

spring3 使用Annotation并对DAO层封装具有分页功能的S2SH整合实例

HttpClient4.x应用指南

HttpClient4.0手动处理redirect

HtmlParser 解析HTML

在Bean中使用PropertyChangeSupport支持PropertyChangeListeners

HttpClient的例子链接

HttpClient的相关例子

htmlparser入门讲解

struts2配合log4j打印异常栈信息

navicat 显示乱码问题

WARN JDBCException Reporter:100- SQL Error 0,sqlstate: 08003

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>