`
tangfl
  • 浏览: 20254 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论
文章列表
12530 PC客户端音乐搜索项目一期的总结和思考。 SlideShare 上的 pdf: 音乐搜索的极致 View more documents from fulin tang. PPT 的文字内容: 音乐搜索的极致 唐福林 tangfulin@gmail.com http://blog.fulin.org 目录  项目简介  需求描述  搜索实现  查询示例  持续改进 项目简介 (1/3)  中国移动  12530  咪咕  Miniportal  搜索  Out source : edadao 项目简介 (2/3)  时间: 2 ...
12530 PC客户端 咪咕 (页面最下方有一个很不显眼的下载链接) 搜索 原本计划是今天上线内测,20号正是随资源库后台一起上线,其实昨晚就已经替换掉了正式服务器上原来的接口。正因为昨晚悄无声息的上线,原本已经下班走到家门口的我们,又被电话叫回公司,来解决一个刚刚发现的bug。 音乐搜索,第一期还没有特别做歌词的搜索,只对歌手名,歌曲名,专辑名做优化,加上数据量本身就很小(一共才不到100万首歌),只好在查询上做文章。我们当前一共设置了十层查询 Query: 1。精确匹配:歌手,歌曲,专辑,不分词字段,去掉前后多余空格,精确匹配 2。过滤后的精确匹配:歌手,歌曲,专辑,过滤字段,去掉所有 ...
音乐搜索属于垂直搜索的一种,但它又有着自己独特的一些需求。 首先,几乎所有的音乐搜索都实现了用户输入时的关键词提示功能。但在网上搜索相关的技术文章,大多是讲如何用 Js 实现前台表现层的功能,少有的几篇关于后台技术实现的文章,也都太过简单。标准的办法是使用 Trie 树,但太过晦涩,不够直观。我们打算直接使用 Lucene 的前缀查询来实现,并且计划在项目上线后写一个比较详细的说明。 其次,很多的音乐搜索都提供了拼音查询的功能。比如说用户输入 “liudehua”,关键词提示里会给出 “刘德华”,但即使用户不理会提示,直接点击提交,在服务器端,还是可以查询到关于 “刘德华” 的条目。甚至,用 ...
离职倒计时,三,二,一。 回想在手机之家的这半年,有两件事情是值得感谢的:一是转到了自己喜欢的方向:搜索,二是认识了一帮很好的同事。这大概都是在新浪,腾讯之类的大公司里无法做到的吧。在大公司的流水线上,很少可以任由自己选择喜欢的方向,独当一面的历练,就更难得了。至于同事,很多时候就只是同事。新浪还好一些,因为环境比较宽松,大家还可以有工作之余的生活时间,而腾讯,早晚的班车,按天安排的任务,让人觉得就像在一台上满发条的大机器中一样,被胁裹着往前,没有了个人的存在。 Brightcove (http://www.brightcove.com/en/)那种典型的外企风格,对纯粹做技术的人来说,诱惑 ...
Most Popular 这些是微软最重要的产品和战略 ·Bing 必应搜索引擎,微软未来几年最重要的战略 ·Bing cashback 搜索引擎bing的用户现金反馈计划 ·Internet Explorer IE浏览器。目前最新版是8.0 ·Microsoft Advertising 微软广告联盟 ·Office 办公软件。版本号: 95-2007 包括Word, Excel, PowerPoint, Access, Outlook, FrontPage, InfoPath, OneNote, Project, Publisher, SharePoint, Visio, Commu ...
本文 只是简单的翻译,原文 在 http://wiki.apache.org/lucene-java/ImproveIndexingSpeed * Be sure you really need to speed things up. Many of the ideas here are simple to try, but others will necessarily add some complexity to your application. So be sure your indexing speed is indeed too slow and the slowness is ...
本文 为简单翻译,原文在: http://wiki.apache.org/lucene-java/ImproveSearchingSpeed * Be sure you really need to speed things up. Many of the ideas here are simple to try, but others will necessarily add some complexity to your application. So be sure your searching speed is indeed too slow and the slowness is ...
imobile 站内搜索 —— 基于 lucene 的站内搜索,阶段性成果介绍 基于Lucene的站内搜索 View more Keynote presentations from Fulin Tang.
文字的韵味,加上美食的诱惑, hoto 团子在芒种这一天,开始内测了! 欢迎 follow 团子的 twitter: @projectdango 关于 hoto 团子: http://www.hoto.cn/about 慢隐于市,你是否有坐下来看时光消逝的勇气? 你是否怀念这样的晨? 在市场里踩着从竹筐里漏下的时蔬的新露水, 栀子花和小菜叶被快手翻拣的大妈拨倒在地上, 身边的老太太慢吞吞张望地散发着慈祥的香味, 小女孩钻进人群捡起一只和猫妈失散的小绒球, 吆喝的大叔夫妇在砧板前互相擦着油亮的手。 你是否拥有这样的爱? 她/他正在那个橘色灯光的喷香小厨房里忙碌, 小砂煲里 ...
在 linux shell 下经常使用的一个命令组合: grep [-v] "filter" filePath | tail -n needLines,用来查看文件中符合条件的最后 n 行记录,尤其在监控 server 的 log 的时候。 现在有一个需求:从 web 管理后台向 search server 发送一个 stat 命令,查看搜索索引的各项统计信息,其中就包括索引更新,查询的 log 的最后 n 条记录。于是需要在 search server 里实现这样一个功能。 PS:如果是 php,我肯定会选用 exec 一条外部 shell 命令,获取命令的输出 的方式 ...
20号从 paypal 上直接付美元 $50,但抢注的那个gg一直没有给转域名。26号终于收到邮件,通知去 MaxRegistrar.com 完成域名转移确认。顺便给续费到了 2019 年 (Cost:$84.51,但招行通知扣了 $82.56 ?) 接下来需要找一个靠谱点的 nameserver ,然后把域名 cname 到 tangfl.yo2.cn 上来。 whois: Domain ID:D155788332-LROR Domain Name:FULIN.ORG Created On:02-Apr-2009 14:30:36 UTC Last Updated On:26-Ma ...
测试代码:http://code.google.com/p/fulin/source/browse/JAVA/lucene/imobile/search2/src/search/test/IndexTest.java 结论: 1。lucene 索引删除条目的时候(不 调用 optimize),会修改索引目录的以下文件:segments.gen, segments_N, ***.del 2。lucene 索引目录发生改变后,如果不 reopen index reader,则改变对于 searcher 来说是不可见的。(甚至可以将 idx 目录删除,searcher 仍然能返回结果。测试:id ...
有道难题之解迷游戏(http://www.youdao.com/nanti/mi/),老高昨天给我发链接的时候稍微看了看,可是不太擅长于做这种脑筋急转弯类的题目,所以也就没有深究。唯一让我有点兴趣的,无非是好奇后面那些题目都是些什么罢了(初始状态下只能看到开头3道题目,每解出一道,就能多看一道)。 因为好奇,所以想了想这样的情况该如何解决。首先,肯定不能按部就班的猜迷——如果能猜谜,我还想这么多干嘛;接下考虑的就是如何破解。题目是 flash 格式的,那么无非有两种情况:1,答案就在加密了的客户端内部;2,每次回答都 post 到服务器端进行验证。用 httpFox 抓了一下包,没有发现 po ...
Lucene 索引滚动流程设计 TangFulin <tangfulin@gmail.com> 一. Index Writer: 1. 这里的 Writer 包括 Index Updater 和 Index Rebuilder ,但 Rebuilder 产生的索引文件不直接传送给 Searcher 使用, 而是覆盖 Updater 的索引,由 Updater 统一处理后续的流程 2. IndexUpdaterScheduler 每隔一段时间会设置 copy out timer 标识。 3. Updater 每次处理完一批 xml 文件后会查看 copy out timer ...
机器配置: uname -a : Linux eshequn-SV06-A11 2.6.21.5-smp #1 SMP Sun Jan 27 23:51:02 CST 2008 i686 Intel(R) Xeon(TM) CPU 3.06GHz GenuineIntel GNU/Linux cpuinfo: processor        : 2 model name    : Intel(R) Xeon(TM) CPU 3.06GHz meminfo: MemTotal:      6234308 kB disk info: /dev/sda1 on / type rei ...
Global site tag (gtag.js) - Google Analytics