- 浏览: 31698 次
- 性别:
- 来自: 成都
最新评论
文章列表
public class CopyOfContentExtractor {
private static final int MIN_NODE_TEXT_LENGTH = 20; // //正文的最小长度
private static final int MIN_K = 30; // //有了链接分析,可以设置高一些,粗放一些
private static final double MAX_LINK_RATE = 0.5; // ///最小链接率
private double TEMP_MAX_LENGTH = 0;
private Node targ ...
public class Demo {
public static void main(String[] args) {
Mongo conn = null;
DB db = null;
try {
conn = new Mongo("localhost", 27017);
db = conn.getDB( "test" );
} catch (UnknownHostException e) {
e.printStackTrace();
} catch (MongoException e) {
...
二,MySqL支持的数据类型
1,支持所有的SQL标准类型,包括严格数值类型:INTEGER, SMALLINT,DECIMAL,NUMBERIC
以及近似数值数据类型:FLOAT, REAL, DOUBLE PRECISION
MySqL在此基础上做的扩展,增加了:TINYINT, MEDIUMINT, BIGINT,长度不同而已。
此外还有BIT类型,用来存放位数据。位数据给超高数据量的排序(位图排序)提供了存储基础。
2,整数类型有一个属性:auto_increment。
在需要产生唯一标识符或顺序值时。此时该列定义为PRIMARY KEY, NOT NULL
3, 日期时间类型
...
一、操作my.cnf文件来配置:
通过另存安装目录下的my-***.ini成my.cnf来配置,操作最多的是[mysql]下的内容。
二、图形化配置:
应用方式:
Developer Machine:开发机,使用最小数量的内存
Server Machine: 服务器,使用中等大小的内存
Dedicated Machine: 专用服务器,使用当前可用的最大内存
数据库用途:
Multifunctional Database:多功能数据库,此选项对事务性存储引擎(InnoDB)和非事务性存储引擎(MyISAM)的存取速度都很快
Transactional Database Only: 事务性数据 ...
先定义mail的一个bean:
public class Mail {
private String toAddress; // 邮件接收者
private String nickname; // 收件人昵称
private String subject; // 邮件主题
private String content; // 邮件内容
private String ChartSet; //字符集
private Map<String, String> AttachmentsPath; ...
1,在输入行输入"r":让不错的颜色随机发生。
2,输入行输入:"128,*,128":根据RGB(红绿蓝)顺序,则让红蓝保持,只让绿变动。通配符而已。某一色系的配色,可以让观者不觉花哨和凌乱。
3,如你所见,"*,*,*"命令其实也是全色系随机。:-)
4,Swing的调色板组件也可以调出。
@SuppressWarnings("serial")
public class JColorChooserDemo extends JFrame {
private Container container; ...
动态增加list元素依靠ListModel类来实现。元素值通过properties文件的值保存,以分号间隔
/**
* 添加邮箱地址按钮
*
* **/
private void jButton3ActionPerformed(ActionEvent evt) {
String address = jTextField_addMail.getText().trim();
if (!address.isEmpty()) {
Vector<String> dataVector = new Vector<String>(); ...
public class ParseWork {
private Parser parser;
public ParseWork(String htmlAddress) throws ParserException {
parser = new Parser(htmlAddress);
}
/**
* 获取网页标题和正文组成的文本
* **/
protected String getText(String elementId) throws ParserException{
NodeFilter TitleFilter = new NodeC ...
/**
* 封装对Berkeley DB一般操作的抽象类
* **/
public abstract class AbstractFrontier {
private Environment env;
private static final String CLASS_CATALOG = "java_class_catalog";
protected StoredClassCatalog javaCatalog;
protected Database catalogdatabase;
protec ...
当然,如果事情足够复杂,在ABC剩下的事务中可能是围绕一件事E进行多个实现,那么ABC去implements这个E接口进行不同实现。E是别人提供的一个接口,实现了E就意味着主动接受了外部E的契约。
所以最终的代码就写成: public A extends X implements E(){...}
此外,还有一些观点:
1,interface关注的是外部的使用者,对外指定一种规则,而Abstract Class是针对类自身的,是对内部变化的一种封装。
2,abstract class表示“is-a”的关系,即父类与继承类本质上一致的;
对于interface,并不要求interf ...
现做一个总结:
1,修饰符作用域
四个修饰符(public, protected, friendly, private),四个作用域(class, package, sub-classes, other packages),画成图,发现规律自然就记住。有些东西,死记硬背往往是灵活变通的前提。
public Y Y Y Y
protected Y Y Y N
friendly(默认) Y Y N N
private Y N N N
2,接口和抽象类。
抽象类:抽象类不能创建实例对象,不允许有抽象构造方法或抽象静态方法,其抽象方法必须由其子类去实现或部分实现。
接口:接口 ...
import java.security.MessageDigest;
/* 传入参数:一个字节数组
* 传出参数:字节数组的 MD5 结果字符串
*/
public class MD5 {
public static String getMD5(byte[] source) {
String s = null;
char hexDigits[] = { '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
'a', 'b', 'c', 'd', 'e', 'f' }; // 用来将字节转换成十六进制 ...
/**
* 如何不采集重复的网页?去重可以使用布隆过滤器,每个线程使用一个bitarray,
* 里面保存本批源页面上次抓取的页面的哈希值情况,抓取下来的源页面分析链接后,
* 去这个bitarray里判断以前有没有抓过这个页面,没有的话就抓下来,抓过的话就不管了。
* 假设一个源页面有30个链接,一批10W个源页面,300w个链接的bitarray应该也不会占太大内存。
* 所以有个五六个线程同时处理也是没问题的。
* **/
public class SimpleBloomFilter {
private static final int DEFAULT_S ...
简而言之3点:
1,一个job对应一个处理类(bean),如makeXML4Chart。同时指明调用方法,如execute。
2,一个trigger对应一个job,如makeXMLJob和cronTrigger。
3,最后由triger的管理器类(SchedulerFactoryBean)集中所有trigger以供调度。
<!-- 定时任务,主要用于报表数据的生成-->
<bean id="makeXML4Chart" class="com.huaweisymantec.rmc.quartz.MakeXML4Chart">& ...
NekoHtml版本:nekohtml-1.9.14
Jar文件:nekohtml.jar;xercesImpl.jar;xml-apis.jar
/**将一个文件夹下的一类html文件解析成同名网页正文文本文件存至另一文件夹**/
public class ParseDir {
private File sourceDir;
private File targetDir;
private ParsePage pp;
public void execute(String sourceDir, String targetDir, String ElementId, B ...