`
李丹.杭州
  • 浏览: 15791 次
  • 性别: Icon_minigender_2
  • 来自: 杭州
文章分类
社区版块
存档分类
最新评论
文章列表
1,用于抓取时间date的 但是时间的格式多变 import java.util.regex.Matcher; import java.util.regex.Pattern;  Pattern p = Pattern.compile("\\bon\\b"); Matcher m = p.matcher(str); if(m.find()){ str = m.group() } 2,去掉article中的属性是数字开头的 import java.util.regex.Matcher import java.util.regex.Pattern strReg = ...
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.List; import org.apache.commons.httpclient.HttpClient; import org.apache.commons.httpclient.NameValuePair; import org.apache.commons.h ...
1.list转set Java代码 复制代码    1. Set set =  new  HashSet( new  ArrayList());     Java代码 复制代码    1. Set set =  new  HashSet( new  ArrayList());     Set set = new HashSet(new ArrayList());  2.set转list Java代码 复制代码    1. List list =  new  ArrayList( new  HashSet());     Java代码 复制代码    1. List li ...
Gzip压缩了,用压缩输入流GZIPInputStream gzin = new GZIPInputStream(fin); // 得到压缩输入流   public static void unGZipFile(File source, String target) throws Exception {      FileInputStream fin = new FileInputStream(source); // 得以文件输入流       GZIPInputStream gzin = new GZIPInputStream(fin); // 得到压缩输入流       FileO ...
            content=content.replaceAll("</?[^>]+>","");   //剔出了<html>的标签             content=content.replace("&nbsp;","");             content=content.replace(".","");             content=content.replace("\"&quo ...
项目用到 转来存着 谢谢 HTMLParser遍历了网页的内容以后,以树(森林)结构保存了结果。HTMLParser访问结果内容的方法有两种。使用Filter和使用Visitor。 (一)Filter类 顾名思义,Filter就是对于结果进行过滤,取得需要的内容。HTMLParser在org.htmlparser.filters包之内一共定义了16个不同的Filter,也可以分为几类。 判断类Filter: TagNameFilter HasAttributeFilter HasChildFilter HasParentFilter HasSiblingFilter IsEqualFilter ...
项目用到 转来存着 谢谢 HTMLParser将解析过的信息保存为一个树的结构。Node是信息保存的数据类型基础。 请看Node的定义: public interface Node extends Cloneable; Node中包含的方法有几类: 对于树型结构进行遍历的函数,这些函数最容易 ...
因为在项目中用到 然后转来存着 在研究搜索引擎的开发中,对于HTML网页的处理是核心的一个环节。网上有很多开源的代码,对于Java来说,HTMLParser是比较著名并且得到广泛应用的一个。HTMLParser的主页是http://htmlparser.sourceforge.net/ ...
1 . 逻辑关系:与或非 AndFilter()           Creates a new instance of an AndFilter. AndFilter(NodeFilter[] predicates)           Creates an AndFilter that accepts nodes acceptable to all given filters. AndFilter(NodeFilter left, NodeFilter right)           Creates an AndFilter that accepts nodes acceptable to ...
Http学习之使用HttpURLConnection发送post和get请求 2010-02-23 16:08 Http学习之使用HttpURLConnection发送post和get请求 最常用的Http请求无非是get 和post,get请求可以获取静态页面,也可以把参数放在URL字串后面,传递给servlet,post与get的不同之处在于post的参数不是放在URL字串里面,而是放在http请求的正文内。 在Java中可以使用HttpURLConnection发起这两种请求,了解此类,对于了解 soap,和编写servlet的自动测试代码都有很大的帮助。 下面的代码简单描述了如何使用Ht ...
1.创建文件夹 //import java.io.*; File myFolderPath = new File(%%1); try { if (!myFolderPath.exists()) myFolderPath.mkdir(); } catch (IOException e) { System.err.println("新建目录操作出错"); } 2.创建文件 //import java.io.*; File myFilePath = new File(%%1); try { if (!myFilePath.exists()) myFilePath.createNe ...
声明: 转自软件信雅达 很早就在Groovy语言的官方文档上看到了“Load my Resource”模式,却一直没有在意,可能是因为它不是GOF的经典模式中的一种。最近又不经意的看到了它,却鬼使神差的大概看了一遍,当略略有点明白它的意思时,就有点惊奇于它的功能了,当再一次阅读时,静下心来想一想,就真正感叹于它的思想了。 总体来说,这个模式主要是针对一些资源的使用来的。这些资源包括文件操作、网络资源操作、针对Excel和pdf的一些API、数据库资源、ftp的读取等等,很多这样的资源。这些资源的使用过程中典型的特点是:我们的目的是为了读或者写数据到资源中,为了完成这个任务,我们必须要进行打开 ...
从Window -> preferences -> Java -> Editor -> Content assist -> Auto-Activation下,我们可以在"."号后面加入我们需要自动提示的首字幕,比如"west"。 在"."后面随便输入几个字符,比如"abij",然后回到开发环境,File -> export -> general -> preferences -> 选一个地方保存你的首选项,比如C:\a.epf 用任何文本编辑器打开a.epf,查 ...
声明:转自 软件信雅达 在Groovy语言中,对String对象的操作就像操作List对象一样的方便。比如我们在Java语言中,对String对象的操作用得比较多的是substring方法。如下:        String str = "abcdefg";           System.out.pr ...
声明:转自:软件信雅达 Groovy语言里有很多看起来不起眼的小玩意,但使用以后,我们却常常会惊异于它的巨大能量,Gstring就是其中之一。 Java的String对象是我们最最常用的对象,却也是诟病最多的对象。一句话来说,String使用起来非常不方便。而Gstring不但使用方便,而且更是Groovy语言动态性的基础。 所谓Gstring,是指通过双引号引起来的、带有占位表达式的字符串,如:def str = “${name}’s dog is ${dog.name}”,其中由美元符号括起来的部分就是占位表达式,而str就是一个Gstring对象。 这里试着列出其中的一些常用方法。 1 ...
Global site tag (gtag.js) - Google Analytics