- 浏览: 1625186 次
- 性别:
- 来自: 上海
-
最新评论
-
wahahachuang5:
web实时推送技术使用越来越广泛,但是自己开发又太麻烦了,我觉 ...
使用 HTML5 WebSocket 构建实时 Web 应用 -
秦时明月黑:
Jetty 服务器架构分析 -
chenghaitao111111:
楼主什么时候把gecko源码分析一下呢,期待
MetaQ技术内幕——源码分析(转) -
qqggcc:
为什么还要写代码啊,如果能做到不写代码就把功能实现就好了
快速构建--Spring-Boot (quote) -
yongdi2:
好厉害!求打包代码
Hadoop日志文件分析系统
文章列表
一、 淘宝首页的搜索
1、无关排名因素
排名先后与售出量、浏览量、价格、卖家好评率、先行赔付、所在地、商品页面的排版布局和单一关键字在商品名称中出现的先后顺序、次数等因素基本无关。
2、影响排名因素
影响商品排名的关键因素有两个,分别是“剩余时间”和“是否推荐商品”。其中的剩余时间=宝贝有效期-(当前时间-发布时间)。宝贝有效期有两种取值,分别是14和7,对应与产品发布时选择的有效期,发布时间就是你的宝贝上架的时间。“推荐商品”这个因素对应于我们发布商品时的“橱窗推荐”选项。搜索结果根据是否“橱窗推荐”商品这个因素,被划分为两个区段,无论剩余时间是多少,推荐商品的区段排名都在未推荐商 ...
来自雅虎的优化网站性能的14条规则(Best Practices for Speeding Up Your Web Site)。
雅虎提出的优化网站性能规则为:
Minimize HTTP Requests(减少HTTP请求数)
Use a Content Delivery Network(使用CDN网路)
Add an Expires or a Cache-Control Header(添加Expires 头或Cache-control)
Gzip Components(Gzip的使用)
Put Stylesheets at the Top(将CSS文件放在页面上方)
Put ...
利用 Lucene,在创建索引的工程中你可以充分利用机器的硬件资源来提高索引的效率。当你需要索引大量的文件时,你会注意到索引过程的瓶颈是在往磁盘上写索引文件的过程中。为了解决这个问题, Lucene 在内存中持有一块缓冲 ...
在构建能够灵活地进行水平扩展、高可用性的Java Web应用程序时候,对http session的处理策略很大程度决定了应用程序的扩展性、可用性。一般而言对http session有如下的处理方案: 1、在服务器端不保存Session,完全无状态 ...
Schema Design Considerations indexed fields indexed fields 的数量将会影响以下的一些性能: 索引时的时候的内存使用量 索引段的合并时间 优化时间 索引的大小 我们可以通过 将 omitNorms=“true” 来减少indexed fields数量增加所带来的影响。 stored fields Retrieving the stored fields 确实是一种开销。这个开销,受每个文档所存储的字节影响很大。每个文档的所占用的空 ...
为节省存储空间和提高搜索效率,搜索引擎在索引页面或处理搜索请求时会自动忽略某些字或词,这些字或词即被称为Stop Words(停用词)。
Stop Words大致为如下三类:
应用十分广泛,在Internet上随处可见的词,比如“Web”一 ...
两年半以前,我们描述了8种由技术带动的商业趋势,这些趋势正在彻底重塑众多产业的战略格局。我们还展示了新兴的互联网技术、不断提高的计算能力,以及快速、普及的数字通讯的综合影响正在如何催生管理人才和资产的新方式,以及关于组织结构的新理念。
自那时以来,这些技术领域仍在持续快速发展,在短短的两年中,Facebook的规模扩大了5倍,形成了一个超过5亿用户的庞大网络。现在,世界各地有40多亿人在使用手机,其中有4.5亿人正在体验移动互联网的魅力。信息技术的格局也在发生变化,一些新的技术进步(如虚拟化和云计算)重新定义了技术成本和应用模式,为个人消费者获取商品和服务创造了全新的方式,同时也为企业家和 ...
必须面对的问题有:用户不喜欢提交表单。然我们的目的是让用户愿意提交表单。
下面是一个关于web表单设计的调查报告
原文地址:
http://www.smashingmagazine.com/2008/07/04/web-form-design-patterns-sign-up-forms/
http://www.smashingmagazine.com/2008/07/08/web-form-design-patterns-sign-up-forms-part-2/
注册表单设计调查
1.表单的安置
尤其是第一次玩“黑苹果”的童鞋,可能碰到的第一个问题就是,如何将Mac OS的DMG镜像转换成标准的ISO镜像。因为并不是所有的PC机都支持安装“黑苹果”,所有自然而然地想到使用VMware或VirtualBox等虚拟化软件来安装Mac OS。
在VeryCD网站上很容易搜索到Mac OS的镜像文件,但大部分都是DMG格式的。我下的一个就是Mac_OSX_Mountain_Lion_v10.8.dmg,虚拟机是不能够识别该格式的镜像的,需要使用其他工具进行镜像格式的转换。UltraISO则首当其冲,因为它太常见了。
1:首先打开UltraISO,选项“文件”,打开已经下载的dmg格式的镜 ...
1、文章页与相关内容页的链接 传奇世界私服 文章页面没有导出链接的权重是最高的,但是这样对于整站权重的提高是不可取的。内页的导出链接一定要遵从相关原则,比如当前的文章内容主要是关于颈椎病的,那么内页的相关文章可以以“专题页面”的形式把颈椎病的早起症状、治疗方法、危害列出来,这些是大类的。其次,针对每个类别,列出相关文章列表,这里用问答的形式展示,比如颈椎痛怎么办?颈椎病应该注意什么?挂什么科等等。这些方面建议大家可以多学习下百度产品的页面设置,仔细看看百度知道的做法,在每个问题页面都聚合了一大批相关问题,分为两类:一类是问题主关键词的聚合列表,一类是相似问题列表。基本上扫光了相关关键词, ...
Drupal 7 可以处理简单的中文搜索,如果你需要一个更灵活的搜索功能,想要更高的效率与更准确的搜索结果,可以试试 search_api + facetapi + search_api_solr + IKAnalyzer 。
Search API
搜索了非常灵活的搜索方式,它是一个搜索框架,你可以定制需要索引的字段,流程等等,安装以后,你要先创建搜索服务器,服务器需要安装其它的模块来提供,比如数据库类型的搜索服务器,Apache Solr 搜索服务器,有了搜索服务器,再去创建索引。
Search API Solr
这个模块为 Search API 提供了一种搜索服务器,整合了 A ...
笔者经过研究查阅solr官方相关资料经过两周的研究实现了毫秒级百万数据的搜索引擎的搭建并引入到企业门户。现将实施心得和步骤分享一下。
1. jdk1.6
安装jdk1.6到系统默认目录下X:\qc\Java目录下(注意要点:配置好环境变量)。
2. tomcat安装
a) 安装tomcat到X:\qc\tomcat6目录下。
b) 配置server.xml
Connector port="80" protocol="HTTP/1.1" connectionTimeout="20000&qu ...
Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文检索工具包。
...
架构概览
图一显示了 Lucene 的索引机制的架构。Lucene 使用各种解析器对各种不同类型的文档进行解析。比如对于 HTML 文档,HTML 解析器会做一些预处理的工作,比如过滤文档中的 HTML 标签等等。HTML 解析器的输出的是文本内容,接着 Lucene 的分词器(Analyzer)从文本内容中提取出索引项以及相关信息,比如索引项的出现频率。接着 Lucene 的分词器把这些信息写到索引文件中。
图一:Lucene 索引机制架构
用Lucene索引文档
接下来我将一步一步的来演示如何利用 Lucene 为你的文档创建索引。只要你能将要索引的文件转化成文本格式, ...
<? function get_naps_bot()
{
$useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
if (strpos($useragent, 'googlebot') !== false){
return 'Google';
}
if (strpos($useragent, 'baiduspider') !== false){
return 'Baidu';
}
if (strpos($useragent, 'msnbot') !== false){
return 'Bing';
} ...