- 浏览: 11888 次
- 性别:
- 来自: 广州
最新评论
文章列表
1、 简介
htmlparser是一个纯的java写的html解析的库,它不依赖于其它的java库文件,主要用于改造或提取html。它提供了接口,支持线性和嵌套HTML文本。在实际的项目中只需要将htmlparser.jar 导入classpath中,就可以使用HTMLParser提供的API了。
2、 主要应用
HTML Parser项目主要可以用在以下两个方面:
1. 信息提取
· 文本信息抽取,例如对HTML进行有效信息搜索
· 链接提取,用于自动给页面的链接文本加上链接的标签
· 资源提取,例如对一些图片、声音的资源的处理
· 链接检查,用于检查HTML中的链接是否有效
...
Java提供两种类型的剪贴板:系统的和本地的.
本地剪贴板只在当前虚拟机中有效.Java允许多个本地剪贴板同时存在,可以方便地通过剪贴板的名称来进行存取访问.系统剪贴板与同等操作系统直接关连,允许应用程序与运行在该操作系统下的其它程序之间进行信息交换.
在进一步深入之前,先看看与剪贴板相同的java类,这些类主要包含在java.awt.datatransfer包中,主要有以下几种:
Clipboard类: 处理任何可以被传递的对象.
ClipboardOwner接口: 任何处理剪贴板的类都必须实现该接口.该接口用于剪贴板中的原始数据被替换时发出通知.
...
java.awt.Toolkit类里的
getSystemClipboard();
package com.test;
import com.jacob.activeX.ActiveXComponent;
import com.jacob.com.Dispatch;
import com.jacob.com.Variant;
public class OLETest {
public static void wordToHtml(String docfile, String htmlfile)
throws Exception {
ActiveX ...
敬告:本博客所记录的内容均为自己平时记录所得,随便看看。
//得到当中的超链接
Dispatch one = Dispatch.call(docs, "Item", new Variant(1)).toDispatch();
String xxxx = Dispatch.get(one, "Content").toString();
System.out.println(xxxx);
Dispatch shapes = Dispatch.get(doc, "InLineShapes").toDispatch( ...
jar cvf hello.jar HelloWorld.class config.properties
jar umf MANIFEST.MF hello.jar
java -jar hello.jar
读取jar包中的配置文件
import java.io.IOException;
import java.io.InputStream;
import java.util.Properties;
public class Test {
public String getProper(){
InputStream stream = this.getClass().getCla ...
String fileName = "/config/abcd.config";
InputStream in = getClass().getResourceAsStream(fileName);
BufferedReader br = null;
try{
br = new BufferedReader(new InputStreamReader(in));
String line;
while ((line = br.readLine()) != null){
System. ...
package com.test;
import com.jacob.com.*;
import com.jacob.activeX.*;
import java.io.*;
//取得指定目录下面所有的doc文件名称
public class DirWordToHtml {
// ------------------------------------------------------------------------------
// 方法原型: change(String paths)
// 功能描述: 将指定目录下面所有的doc文件转化为HTML并存储 ...
package com.test;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
public class CopyFileUtil {
/**
* <p>
* 将sourceFolder文件夹下的内容复制到destinationFolder文件夹下
* </p>
* <p>
* 如destinationFolder ...
package com.test;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.PrintWriter;
import ja ...