`
kankan1218
  • 浏览: 276661 次
  • 性别: Icon_minigender_1
  • 来自: 大连
社区版块
存档分类
最新评论
文章列表
#!/usr/bin/perl use strict; use FindBin qw($Bin); my $websiteName = $ARGV[0]; if (!$websiteName){ die "you need to input the website name as a parameter,run it like this:validationOnremoteserver.pl zeel_jp\n"; } # ALLOW_SPACE_AT_LEAST = xxG my $ALLOW_SPACE_AT_LEAST ...
1、我们想通过构造方法将外部传入的参数赋值给类的成员变量,构造方法的形式参数名称与类的成员变量名相同。例如: class Person { String name; public Person(String name) { this.name = name; } } 2、假设有一个容器类和一个部件类,在容器类的某个方法中要创建部件类的实例对象,而部件类的构造方法要接受一个代表其所在容器的参数。例 ...
use Data::Dumper; use LWP::UserAgent; use URI; use HTTP::Date; use Encode; use HTTP::Cookies; my $cookie_jar = HTTP::Cookies->new(file => "d:cookies.lwp",autosave => 1); my $browser = LWP::UserAgent->new; $browser->cookie_jar( $cookie_jar ); my $res = $brows ...
Windows http://johnbokma.com/perl/https.html Linux http://search.cpan.org/~nanis/Crypt-SSLeay-0.58/SSLeay.pm
更具if modified since更新图片,并且删除陈旧的图片: # --------------------------------------------- # This method will get the document identified by $url and store it in file called $filename. # If the file already exists, then the request will contain an "If-Modified-Since" header matching the modif ...
Linux时间管理                                                                        alkshao@gmail.com     首先介绍一些概念     UTC :世界协调时间(Universal Time Coordinated,UTC), UTC就是0时区的时间,由于北京 在东八区,所以UTC时间比北京时晚八小时。     CST : China Standard Time, UTC+8:00 中国沿海时间(北京时间)。     GMT :(Greenwich Mean Time,格林威治标准 ...
安装的虚拟机,没太注意时区,发现时区比中国上海的慢了16个小时,在网上查找了如下方法,分享给大家:   ---------------------------------   时区的配置文件是/etc/sysconfig/clock。用tzselect命令就可以修改这个配置文件,根据命令的提示进行修改就好了。   但是在实际工作中,发现这种方式是不能够使得服务器上的时间设置马上生效的,而且使用ntpdate去同步时间服务器也不能够更改时间。即使你使用了 date命令手工设置了时间的话,如果使用ntpdate去进行时间同步的话,时间又会被改动到原来的错误时区的时间。而生产的机器往往是非常重要 ...
Mechanize 模块 可以提交form,实现登录功能 : #!/usr/bin/perl BEGIN { # Set our common library path. unshift @INC, './lib'; } require HTTP::Request; require HTTP::Response; require HTTP::Headers; require HTTP::Cookies; require LWP; use WWW::Mechanize; use Data::Dumper; use Encode; #my $ua = L ...
模块推介 取自 PerlChina.org - wiki 跳转到: 导航 , 搜索 这里列有常用模块介绍,几句话即可。如果希望详细介绍,欢迎另起文章撰文。 目录 [隐藏 ] 1 WWW 2 模板 3 网络编程框架 4 系统 5 数据库和数据存储 6 Email
Mechanize使用手册(翻译)。 http://blog.codingmylife.com/?p=51   1,715 views, Ruby , by Allen Dang. 开始使用 [WWW::Mechanize](http://mechanize.rubyforge.org/mechanize/classes/WWW/Mechanize.html) ————————— 本教程的目的是帮助你开始使用 ...
LWP 是 Library for WWW access in Perl 的缩写,用途说得很清楚,就是一个访问Web服务器的Perl包。 利用LWP这个包,我们可以很方便的在我们的perl脚本里面访问外部的Web服务器上面的资源。 为什么要用LWP? 现在的网站应用越做越复杂, ...
1.对于post分页的网站,用正常的在url后面加参数的方法已经不奏效(大多数情况下是可以的)。就需要用到LWP::UserAgent模块去post提交。 2.perl的字符串由2部分组成,utf8—flag开关和数据。编码处理:get下来的内容$str,统一按照网站的编码 decode(ENCODING, $str) 时,字符串被按 ENCODING 解码为 utf8 编码并设置 utf8 flag 为 on ; 3.对于需要登录的网站,保存登录的session Id到cookies里。
package com.bjsxt.indexsearch; import jeasy.analysis.MMAnalyzer; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Document; import org.apache.lucene.index.IndexWriter; import org.apache.lucene.index. ...
lucene的英文分词器主要用到StandardAnalyzer,中文的主要是极易分词MMAnalyzer(需要单独引jar包je-analysis-1.5.3.jar)。 英文分词的过程:1,关键词切分->2,去除停用词(is of)->3,形态还原(ing,ed,复数等)->4,转化为小写 中文分词::1,关键词切分->2,去除停用词(的 着) import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.SimpleAnalyzer; import ...
1.lucene创建索引和搜索,主要用到一下几个类,IndexWriter,Document,Analyzer;IndexSearcher,QueryParser,Query,TopDocs, 2.通过FSDirectory和RAMDirectory的并用,可以提高速度。先把磁盘上的索引文件载入内存,然后在内存操作,免去了IO操作,可以提高效率,最后退出时,要把内存操作的结果保存在磁盘上。 3.fsIndexWriter.optimize();优化索引文件,把多个cfs文件合并成一个 4.建立索引和进行搜索时应该使用同一个分词器。 ps:用到的jar包:/LuceneDemo/lib ...
Global site tag (gtag.js) - Google Analytics