- 浏览: 799788 次
- 性别:
- 来自: 上海
最新评论
-
xueweiabcok:
PowerDesigner15官方正式版+注册补丁 -
春天好:
博主写的很好,赞一个,多谢分享 *(^-^*)分享一个免费好用 ...
爬虫技术 -
零度弥合:
每天进步1%,那你一百天就成神啦。
Linux下Grails开发环境变量配置 -
dajian0822:
问下,那你显示存储CKEditor文本存储后,在用CKEdit ...
CKEditor学习笔记 -
mengfei86:
...
爬虫技术
文章列表
windows xp下配置JDK环境变量:
1.安装JDK,安装过程中可以自定义安装目录等信息,例如我们选择安装目录为D:\java\jdk1.5.0_08;
2.安装完成后,右击“我的电脑”,点击“属性”;
3.选择“高级”选项卡,点击“ ...
正则表达式中双引号、单引号的表示
知道正则表达式中用\u4e00-\u9fa5匹配汉字,
知道用\d匹配数字,\w匹配单词,\n换行……,可用什么匹配双引号呢"
有人用\" 来匹配双引号,或则用\'''匹配,可这只能在C#中才能用吧。偶然一天,发现如下方法求得了正则表达式中双引号的值.
第一步,求出字符的asc码。
第二步,把该asc码转换为4位的16进制数,位数不够者,前面加0,比如asc(")=34
(34)10=(22)16 然后22 to 0022
第三步,前面加\u,如 \u0022.
第四步,拿去匹配吧。
我测试了,可以 ...
//**************************************************************
//下面的方法是完成文件后缀名的判断,返回的是后缀名首字母的大写形式
public static String getFileType(String fileName)
{
String fileType=null;
if(fileName.endsWith(.txt)) fileType="T";
if(fileName.endsWith(.html))fileType="H" ...
JSON 即 JavaScript Object Natation,它是一种轻量级的数据交换格式,非常适合于服务器与 JavaScript 的交互。本文将快速讲解 JSON 格式,并通过代码示例演示如何分别在客户端和服务器端进行 JSON 格式数据的处理。
使用JSON,在SERVLET或者STRUTS的ACTION中取得数据时,如果会出现异常:java.lang.NoClassDefFoundError: net/sf/ezmorph/Morpher
是因为需要的类没有找到,一般,是因为少导入了JAR包,
出现java.lang.NoClassDefFoundError: net/s ...
(1):
Java jar包下载地址http://www.docjar.com/
public class Test{
public static void main(String[] args){
char[] data={a,b,c};
String s=new String(data);
System.out.println(s);
}
}
package cn.rg.demo.test;
import java.io.BufferedInputStream;
import java.io.ByteArrayOutputSt ...
使用FileReader读取文件:
FileReader fr = new FileReader("ming.txt");
int ch = 0;
while((ch = fr.read())!=-1 )
{
System.out.print((char)ch);
}
read()方法是比较好费时间的,如果为了提高效率
我们可以使用BufferedReader对Reader进行包装,这样可以提高读取得速度,我们可以一行一行的读取文本,使用readLine()方法。
BufferedReader br ...
最近要做网络信息的采集,解析HTML是必不可少的,查了下这方面的工具还不少,但是不知道哪个好用,似乎HTMLParser是用的多点的,但是从06年开始就不再更新了,大概是已经满足HTML 4的解析了吧,收集了几个看起来不错的,留着备用。
Java Mozilla Html Parser
能够将html解析成Java Document对象。它是一个基于Mozilla Html解析器封装的Html解析类库。因此能够为开发人员提供一个浏览器质量的HTML解析器。
地址:http://mozillaparser.sourceforge.net/
HtmlCleaner
是一个开源的Html文档解析器 ...
本例依据Java自身提供的接口实现,通过监听器(Listener)和定时器(Timer)定时执行某个任务(Task)。
myListener类:
package com.rg.listener;
import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.Date;
import java.util.Timer;
import javax.servlet.ServletContextEvent;
import javax.servlet.ServletContextListene ...
Java定时器(java.util.Timer)有定时触发计划任务的功能,通过配置定时器的间隔时间,在某一间隔时间段之后会自动有规律的调用预先所安排的计划任务(java.util.TimerTask)
必须能让定时器宿主的存活期为整个Web工程生命期,在 ...
package cn.rg.demo.test;
import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;
public class BaseHtmlParser {
public static String changeSymbol(String url){
String url2=url.replaceAll("\\\\","\\\\\\\\");
return url2;
}
public static void m ...
package cn.rg.demo.test;
import java.io.FileReader;
public class BaseHtmlParser{
public static void main(String[] args) {
try {
FileReader fr=new FileReader( "C:/Documents and Settings/iwin/桌面/123/product/detail/2aa67b2f3abb44b082e89bd7de6fbccd.html");
int c=fr.read ...
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.File;
public class ReadFile {
public ReadFile() {
}
/**
* 读取某个文件夹下的所有文件
*/
public static boolean readfile(String filepath) throws FileNotFoundException, IOException {
...
无论是对程序的本地化还是国际化,都会涉及到字符编码的转换的问题。尤其在web应用中常常需要处理中文字符,这时就需要进行字符串的编码转换,将字符串编码转换为GBK或者GB2312。
一、关键技术点:
1、当前流行的字符编码格式有:US-ASCII、ISO-8859-1、UTF-8、UTF-16BE、UTF-16LE、UTF-16、GBK、GB2312等,其中GBK、GB2312是专门处理中文编码的。
2、String的getBytes方法用于按指定编码获取字符串的字节数组,参数指定了解码格式,如果没有指定解码格式,则按系统默认编码格式。
3、String的“String( ...
《html文件》内容如下:
<html>
<head>
<title>无标题文档</title>
<script>
function changecss(){
var css=document.createElement('link');
css.href='123.css';
css.rel="stylesheet";
css.type="text/css";
document.body.appendChild(css);
}
window.onlo ...