- 浏览: 33009 次
- 性别:
- 来自: 苏州
最近访客 更多访客>>
最新评论
-
jiangsha:
做技术的不能使用google真的很烦呢
可恶的百度什么也搜不到,可怜的谷歌老是被dns劫持 -
sweat89:
开门,查水表!
可恶的百度什么也搜不到,可怜的谷歌老是被dns劫持 -
hiblue:
那个恶心的百毒也用同样的方法搞死Wiki
永远记住他们的罪恶! ...
可恶的百度什么也搜不到,可怜的谷歌老是被dns劫持 -
besy:
真心期待谷歌回归啊!
可恶的百度什么也搜不到,可怜的谷歌老是被dns劫持 -
jackjobs:
搞我们it的人就有深刻体会了,只要是搜什么技术,打死那几个国内 ...
可恶的百度什么也搜不到,可怜的谷歌老是被dns劫持
文章列表
必应、谷歌、百度、搜狗、有道、奇虎主流搜索对比
- 博客分类:
- 搜索
必应:http://cn.bing.com/search?q=chocolate-wp
谷歌:https://www.google.com.hk/#q=chocolate-wp
百度http://www.baidu.com/s?wd=chocolate-wp
搜狗http://www.sogou.com/web?query=chocolate-wp
有道http://www.youdao.com/search?q=chocolate-wp
奇虎http://so.360.cn/s?q=chocolate-wp
百度搜的什么狗屁东西,我需要你给我翻译了吗?
有道搜的,我想要带wp的啊,你给我那么多 ...
我经常遇到下面的情况:遇到一个问题,上google搜(百度一般搜不到),结果出来的几个链接全是一样的(百度更是如此),有从别的网站爬的(网站炒网站,可恶至极),有炒别人网站上的(个人炒网站上的,然后归为自己的博客,恶心),更可恶的是没一个是我想要的答案。
你们说气愤不气愤,有意思吗?网站炒网站,没告你侵权算客气了。人炒网站,整个网络就是个大数据库,你建个小数据库有意思,你好无聊哦。
我就是来发发牢骚的
引用
百度操作Google事件的经过:2001年中,百度的一个副总即开始与政府有关部门谈Google中"有害信息"的问题,但当时百度接触的人级别比较低,百度的想法也只是想通过政府向使用Google的一些中文网 ...
一句话:trac的plugin很多很强大
引用
Trac使用超链接方式把软件缺陷数据库、版本控制系统和wiki内容结合起来,并作为版本控制系统的web接口,支持的版本控制系统包括Subversion, Git, Mercurial, Bazaar, Perforce, Darcs. 在0.11版本之前,Trac的web展示前端由ClearSilver web模板系统提供,自0.11开始,由其自行开发的Genshi模板系统提供,但保持了对ClearSilver及其插件的兼容。
其他功能:
项目管理 (Roadmap, Milestones, 等)
追踪系统 (缺陷追踪、任务 等)
细粒度权限支持 ...
关于网站登录这个功能,你觉得简单吗?
我觉得简单,可我也觉得很复杂
简单:username+pwd提交
复杂点:加个验证码
再复杂点:多台server
再再复制点:域名间共享登录
再再再复杂点:重复登录
再再再再复杂点:第三方登录
最后:登录控件
或许还有更复杂的。。。。
个人认为有两种方式来解决:
1.session共享
2.sso单点登录
具体内容不多说了,long story
两者都用过,不过现在我只用nginx
1.nginx配置简单
2.nginx抗并发
3.nginx处理静态文件快
就这么多,apache有啥优点你们去说吧
我就说我用nginx的感觉
DDS是一个基于python语言的爬虫,是对django和scrapy的一个整合,现在还处于aphla阶段,相信不久就将发布beta版。
支持interval和crontab
使用django的admin后台,配合chrome的xpathonclick插件,配置规则时非常方便
话不多说了,附上官方链接http://django-dynamic-scraper.readthedocs.org
第一次在iteye上写博客,这个程序是根据公司的需求+个人的想法=针对商品信息抽取的第一个版本
源代码地址:https://github.com/txf7337/dabao-spider
基本配置
jdbc数据库 //mysql测试过
文件下载,文字识别的线程数以及线程爬取的间隔
任务周期
文件保存目录
代理的配置
<host>主机名
<port>端口号
<auth>用户名密码(如果需要的话)
数据源配置
线程数、线程爬取的间隔、是否使用代理
数据源种子
<seed url="http://www.ok ...