`
cesul
  • 浏览: 31653 次
  • 性别: Icon_minigender_1
  • 来自: 成都
文章分类
社区版块
存档分类
最新评论
文章列表
public class CopyOfContentExtractor { private static final int MIN_NODE_TEXT_LENGTH = 20; // //正文的最小长度 private static final int MIN_K = 30; // //有了链接分析,可以设置高一些,粗放一些 private static final double MAX_LINK_RATE = 0.5; // ///最小链接率 private double TEMP_MAX_LENGTH = 0; private Node targ ...
public class Demo { public static void main(String[] args) { Mongo conn = null; DB db = null; try { conn = new Mongo("localhost", 27017); db = conn.getDB( "test" ); } catch (UnknownHostException e) { e.printStackTrace(); } catch (MongoException e) { ...
二,MySqL支持的数据类型 1,支持所有的SQL标准类型,包括严格数值类型:INTEGER, SMALLINT,DECIMAL,NUMBERIC 以及近似数值数据类型:FLOAT, REAL, DOUBLE PRECISION MySqL在此基础上做的扩展,增加了:TINYINT, MEDIUMINT, BIGINT,长度不同而已。 此外还有BIT类型,用来存放位数据。位数据给超高数据量的排序(位图排序)提供了存储基础。 2,整数类型有一个属性:auto_increment。 在需要产生唯一标识符或顺序值时。此时该列定义为PRIMARY KEY, NOT NULL 3, 日期时间类型 ...
一、操作my.cnf文件来配置: 通过另存安装目录下的my-***.ini成my.cnf来配置,操作最多的是[mysql]下的内容。 二、图形化配置: 应用方式: Developer Machine:开发机,使用最小数量的内存 Server Machine: 服务器,使用中等大小的内存 Dedicated Machine: 专用服务器,使用当前可用的最大内存 数据库用途: Multifunctional Database:多功能数据库,此选项对事务性存储引擎(InnoDB)和非事务性存储引擎(MyISAM)的存取速度都很快 Transactional Database Only: 事务性数据 ...
先定义mail的一个bean: public class Mail { private String toAddress; // 邮件接收者 private String nickname; // 收件人昵称 private String subject; // 邮件主题 private String content; // 邮件内容 private String ChartSet; //字符集 private Map<String, String> AttachmentsPath; ...
1,在输入行输入"r":让不错的颜色随机发生。 2,输入行输入:"128,*,128":根据RGB(红绿蓝)顺序,则让红蓝保持,只让绿变动。通配符而已。某一色系的配色,可以让观者不觉花哨和凌乱。 3,如你所见,"*,*,*"命令其实也是全色系随机。:-) 4,Swing的调色板组件也可以调出。 @SuppressWarnings("serial") public class JColorChooserDemo extends JFrame { private Container container; ...
动态增加list元素依靠ListModel类来实现。元素值通过properties文件的值保存,以分号间隔 /** * 添加邮箱地址按钮 * * **/ private void jButton3ActionPerformed(ActionEvent evt) { String address = jTextField_addMail.getText().trim(); if (!address.isEmpty()) { Vector<String> dataVector = new Vector<String>(); ...
public class ParseWork { private Parser parser; public ParseWork(String htmlAddress) throws ParserException { parser = new Parser(htmlAddress); } /** * 获取网页标题和正文组成的文本 * **/ protected String getText(String elementId) throws ParserException{ NodeFilter TitleFilter = new NodeC ...
/** * 封装对Berkeley DB一般操作的抽象类 * **/ public abstract class AbstractFrontier { private Environment env; private static final String CLASS_CATALOG = "java_class_catalog"; protected StoredClassCatalog javaCatalog; protected Database catalogdatabase; protec ...
当然,如果事情足够复杂,在ABC剩下的事务中可能是围绕一件事E进行多个实现,那么ABC去implements这个E接口进行不同实现。E是别人提供的一个接口,实现了E就意味着主动接受了外部E的契约。 所以最终的代码就写成:  public A extends X implements E(){...} 此外,还有一些观点: 1,interface关注的是外部的使用者,对外指定一种规则,而Abstract Class是针对类自身的,是对内部变化的一种封装。 2,abstract class表示“is-a”的关系,即父类与继承类本质上一致的; 对于interface,并不要求interf ...
现做一个总结: 1,修饰符作用域 四个修饰符(public, protected, friendly, private),四个作用域(class, package, sub-classes, other packages),画成图,发现规律自然就记住。有些东西,死记硬背往往是灵活变通的前提。 public Y Y Y Y protected Y Y Y N friendly(默认) Y Y N N private Y N N N 2,接口和抽象类。 抽象类:抽象类不能创建实例对象,不允许有抽象构造方法或抽象静态方法,其抽象方法必须由其子类去实现或部分实现。 接口:接口 ...
import java.security.MessageDigest; /* 传入参数:一个字节数组 * 传出参数:字节数组的 MD5 结果字符串 */ public class MD5 { public static String getMD5(byte[] source) { String s = null; char hexDigits[] = { '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'a', 'b', 'c', 'd', 'e', 'f' }; // 用来将字节转换成十六进制 ...
/** * 如何不采集重复的网页?去重可以使用布隆过滤器,每个线程使用一个bitarray, * 里面保存本批源页面上次抓取的页面的哈希值情况,抓取下来的源页面分析链接后, * 去这个bitarray里判断以前有没有抓过这个页面,没有的话就抓下来,抓过的话就不管了。 * 假设一个源页面有30个链接,一批10W个源页面,300w个链接的bitarray应该也不会占太大内存。 * 所以有个五六个线程同时处理也是没问题的。 * **/ public class SimpleBloomFilter { private static final int DEFAULT_S ...
简而言之3点: 1,一个job对应一个处理类(bean),如makeXML4Chart。同时指明调用方法,如execute。 2,一个trigger对应一个job,如makeXMLJob和cronTrigger。 3,最后由triger的管理器类(SchedulerFactoryBean)集中所有trigger以供调度。 <!-- 定时任务,主要用于报表数据的生成--> <bean id="makeXML4Chart" class="com.huaweisymantec.rmc.quartz.MakeXML4Chart">& ...
NekoHtml版本:nekohtml-1.9.14 Jar文件:nekohtml.jar;xercesImpl.jar;xml-apis.jar /**将一个文件夹下的一类html文件解析成同名网页正文文本文件存至另一文件夹**/ public class ParseDir { private File sourceDir; private File targetDir; private ParsePage pp; public void execute(String sourceDir, String targetDir, String ElementId, B ...
Global site tag (gtag.js) - Google Analytics