`
jsczxy2
  • 浏览: 1276325 次
  • 性别: Icon_minigender_1
  • 来自: 常州
文章分类
社区版块
存档分类
最新评论
文章列表
本文源自:http://hooopo.iteye.com/blog/993538 工具:imagemagick + tesseract-ocr   Tesseract-ocr据说辨识程度是世界排名第三,可谓神器啊。 准备工作: 1.安装tesseract-ocr Java代码   sudo apt-get install tesseract   2.安装imagemagick
Tcpping 介绍   测试网络延迟最常用方法是使用ping工具,它使用ICMP协定。在某些情况下ICMP是被防火墙阻挡,这使得Ping在这情况下是无法使用的。此 时为了能够继续监控的话,就必需使用TCP / UDP的方式,TCPPING为更容易绕过普通的防火墙规则的第3层测试工具。 这样的一个第3层的测试工具TCPPING 。为了测量延迟, TCPPING采取所谓的半开连接技术,基于TCP三次握手的优势。也就是说,它发送一个TCP SYN包的端口号(默认为80 )远程主机。如果远程主机正在侦听的端口,它会响应的TCP ACK数据包。否则,它会响应的TCP RST包。无论哪种方式, T ...

mysql分表的方式

http://www.blogjava.net/ldd600/archive/2011/02/22/344801.html http://www.blogjava.net/kelly859/archive/2012/06/08/380369.html

Sphinx与mysql

记录用: http://www.cnblogs.com/hushixiu/articles/1295605.html
记录一下 http://www.iteye.com/news/29240-jeewx-jeecg-weixin   论坛:http://www.jeecg.org             官方邮件: scott@jeecg.org             源码下载:http://git.oschina.net/jeecg/jeewx
List list=dao.find("select new com.been.myBean(tabel1.column1,table1.column2) from table1"); class myBean{ myBean(String s1,String s2){} }  纯粹记录 可能需要研究查询缓存相关的新处理方式所需
/** * Convert query result to vo list util class. */ class AliasToBeanResultTransformer implements ResultTransformer { private static final long serialVersionUID = -5199190581393587893L; private final Class<T> resultClass; private Setter[] sette ...
jq(window).bind('beforeunload',function(){ if (true) { //do something return "are you sure leaving" } else { // do something else } }) var tabbarcloseId = parent.xtabbar.tabbar.attachEvent("onTabClose", function(id){ if(id==pare ...
(function(window,localStorage,undefined){ var LS = { set : function(key, value){ //在iPhone/iPad上有时设置setItem()时会出现诡异的QUOTA_EXCEEDED_ERR错误 //这时一般在setItem之前,先removeItem()就ok了 if( this.get(key) !== null ) this.remove(key); localStorage.setItem(key, ...
想让蜘蛛为我所用快速更新网站内容和快照,有很多网站在发布后, 百度谷歌的更新速度很慢, 很多内容页几天,半月甚至一个多月没有收录, 如何让百度, google的蜘蛛能够频繁光临和更新网站度?   一、如何让百度能够快速更新网站!   以自己网站的域名作为互联网上的唯一性关键字做一个单独的页面, 如 www.269z.com 做一个静态页面, 然后在此页面上简单加以描述, 适当的重复一下上面的关键字, 大概在3到4次就好。 然后去百度的知道吧新建此关键字的主题, 进行自问答。 百度的知道是百度每天更新最快的地方。 只要一发上去, 蜘蛛就会顺势访问到你的网站了。 百度的贴吧, 发一张以 ...
 一、网络爬虫的一般作法       (1)基于Socket通信编写爬虫,这是相对最低层的方式,它可以完全控制Input/Output等,但对编程水平有很大考验,一般为了简单其鉴,多是基于第三方封装的网络包来做,而非直接基于socket编程。            ps: socket不是一种通信协议,而是一种实现上下层通信的通讯机制,它衔接着如上层http协议和下层tcp/ip协议的通信与转换,是典型的通讯实现的简化和解耦。很多人在此有误解,特此一提。       (2) 基于HttpURLConnection类编写爬虫,这是java.net包中为解决网络通信封装的核心类,它的底层也是 ...
转载自:http://www.qiexing.com/post/web-seach-spider.html   今天却收到了虚拟主机商的报告:说当月流量已经超出15G! 登录到后台的统计才发现,正常的网站浏览产生的流量才1G多,而搜索引擎爬虫(也称蜘蛛:spider等)产生的流量却达14G之多!有图为证:
http://jquerymobile.com/
http://kendoui.cn/Web/Default.aspx
http://www.iteye.com/news/29043
Global site tag (gtag.js) - Google Analytics