- 浏览: 2663793 次
- 来自: 杭州
文章分类
- 全部博客 (1188)
- webwork (4)
- 网摘 (18)
- java (103)
- hibernate (1)
- Linux (85)
- 职业发展 (1)
- activeMQ (2)
- netty (14)
- svn (1)
- webx3 (12)
- mysql (81)
- css (1)
- HTML (6)
- apache (3)
- 测试 (2)
- javascript (1)
- 储存 (1)
- jvm (5)
- code (13)
- 多线程 (12)
- Spring (18)
- webxs (2)
- python (119)
- duitang (0)
- mongo (3)
- nosql (4)
- tomcat (4)
- memcached (20)
- 算法 (28)
- django (28)
- shell (1)
- 工作总结 (5)
- solr (42)
- beansdb (6)
- nginx (3)
- 性能 (30)
- 数据推荐 (1)
- maven (8)
- tonado (1)
- uwsgi (5)
- hessian (4)
- ibatis (3)
- Security (2)
- HTPP (1)
- gevent (6)
- 读书笔记 (1)
- Maxent (2)
- mogo (0)
- thread (3)
- 架构 (5)
- NIO (5)
- 正则 (1)
- lucene (5)
- feed (4)
- redis (17)
- TCP (6)
- test (0)
- python,code (1)
- PIL (3)
- guava (2)
- jython (4)
- httpclient (2)
- cache (3)
- signal (1)
- dubbo (7)
- HTTP (4)
- json (3)
- java socket (1)
- io (2)
- socket (22)
- hash (2)
- Cassandra (1)
- 分布式文件系统 (5)
- Dynamo (2)
- gc (8)
- scp (1)
- rsync (1)
- mecached (0)
- mongoDB (29)
- Thrift (1)
- scribe (2)
- 服务化 (3)
- 问题 (83)
- mat (1)
- classloader (2)
- javaBean (1)
- 文档集合 (27)
- 消息队列 (3)
- nginx,文档集合 (1)
- dboss (12)
- libevent (1)
- 读书 (0)
- 数学 (3)
- 流程 (0)
- HBase (34)
- 自动化测试 (1)
- ubuntu (2)
- 并发 (1)
- sping (1)
- 图形 (1)
- freemarker (1)
- jdbc (3)
- dbcp (0)
- sharding (1)
- 性能测试 (1)
- 设计模式 (2)
- unicode (1)
- OceanBase (3)
- jmagick (1)
- gunicorn (1)
- url (1)
- form (1)
- 安全 (2)
- nlp (8)
- libmemcached (1)
- 规则引擎 (1)
- awk (2)
- 服务器 (1)
- snmpd (1)
- btrace (1)
- 代码 (1)
- cygwin (1)
- mahout (3)
- 电子书 (1)
- 机器学习 (5)
- 数据挖掘 (1)
- nltk (6)
- pool (1)
- log4j (2)
- 总结 (11)
- c++ (1)
- java源代码 (1)
- ocr (1)
- 基础算法 (3)
- SA (1)
- 笔记 (1)
- ml (4)
- zokeeper (0)
- jms (1)
- zookeeper (5)
- zkclient (1)
- hadoop (13)
- mq (2)
- git (9)
- 问题,io (1)
- storm (11)
- zk (1)
- 性能优化 (2)
- example (1)
- tmux (1)
- 环境 (2)
- kyro (1)
- 日志系统 (3)
- hdfs (2)
- python_socket (2)
- date (2)
- elasticsearch (1)
- jetty (1)
- 树 (1)
- 汽车 (1)
- mdrill (1)
- 车 (1)
- 日志 (1)
- web (1)
- 编译原理 (1)
- 信息检索 (1)
- 性能,linux (1)
- spam (1)
- 序列化 (1)
- fabric (2)
- guice (1)
- disruptor (1)
- executor (1)
- logback (2)
- 开源 (1)
- 设计 (1)
- 监控 (3)
- english (1)
- 问题记录 (1)
- Bitmap (1)
- 云计算 (1)
- 问题排查 (1)
- highchat (1)
- mac (3)
- docker (1)
- jdk (1)
- 表达式 (1)
- 网络 (1)
- 时间管理 (1)
- 时间序列 (1)
- OLAP (1)
- Big Table (0)
- sql (1)
- kafka (1)
- md5 (1)
- springboot (1)
- spring security (1)
- Spring Boot (3)
- mybatis (1)
- java8 (1)
- 分布式事务 (1)
- 限流 (1)
- Shadowsocks (0)
- 2018 (1)
- 服务治理 (1)
- 设计原则 (1)
- log (0)
- perftools (1)
最新评论
-
siphlina:
课程——基于Python数据分析与机器学习案例实战教程分享网盘 ...
Python机器学习库 -
san_yun:
leibnitz 写道hi,我想知道,无论在92还是94版本, ...
hbase的行锁与多版本并发控制(MVCC) -
leibnitz:
hi,我想知道,无论在92还是94版本,更新时(如Puts)都 ...
hbase的行锁与多版本并发控制(MVCC) -
107x:
不错,谢谢!
Latent Semantic Analysis(LSA/ LSI)算法简介 -
107x:
不错,谢谢!
Python机器学习库
我看了一下业界(人人,新浪,facebook,Twitter)关于“动态”timeline的设计,主要有pull和push两种,我个人觉得pull比push要简单。 push这种模式比较麻烦:1.要考虑明星这种拥有巨量粉丝的情况,比如一个拥有100W粉丝的用户,push的数量非常大,而且还存在浪费(有些用户根本不会登录看到,push给他也没有用)
pull这种模式就比较简单,用户登录的时候再去pull其关注产生的内容,虽然必须很快返回数据,但关注人数有限,比如之前豆瓣的关注人数上限是200个,这个数量甚至用sql也能搞定。
单用一个不行,要两者结合的
其实哦
完全用一种模式做所有的问题会有限制
不过呢,如果其中一些暂时如果不成大患,可以简单点搞
蒋云鹏 18:44:34
恩,我也喜欢简单,大道至简。
老轮子 18:44:52
恩,目前我们的inbox我是只基于pull的
不过由于我们关注上限是1000
而且历史数据有些极端情况
所以pull的算法需要稍稍优化下的
蒋云鹏 18:51:19
有些点我可能还没考虑到,比如我现在还不能理解你为什么要用到“25匹赛马,5个跑道算法”问题,你不用告诉我答案,我再想想看。
老轮子 18:51:27
哈哈
恩,我的意思是说,如果你跑个全量比的话
两两对比
那是很大量的
因为如果类比一下的话
25匹马,类似于所有的blog feeds
5个跑道意味着有限次的对比
老轮子 18:53:56
相对于所有的blog
老轮子 18:54:16
默认按时间取,就是一次性的问题
老轮子 18:54:36
但是25个blog可能会分散在各个跑道上
老轮子 18:54:44
就是不同的关注维度
老轮子 18:55:57
再换个维度想
老轮子 18:56:29
如果一开始所有的blog都是按时间排在那边的,我们一一往下找,根据是否我关注的人来决定要不要这个blog
老轮子 18:56:36
那么这是一个很大的遍历
蒋云鹏 18:56:54
恩,是的。
老轮子 18:57:03
比如走了1000个,其中只有4个是我关注的人发的
老轮子 18:57:23
要尽可能少的遍历
老轮子 18:57:49
所以即使我们关注的blog最终给出的结果是按timeline排序的
老轮子 18:58:02
可是取这些结果的时候,一定不是按这个维度去取的
老轮子 18:58:22
只是取出来之后,比如取出了24个之后,再按时间排序的
相关推荐
本节重点讨论拉取模式下的核心数据结构、流程以及优缺点。 #### 拉取模式(读扩散)的核心数据结构与流程 在拉取模式下,系统通过维护用户间的关注关系和用户发布的Feed数据来实现Feed流的构建。以ABCD四个用户为...
总的来说,这个基于Java的抽象库为开发复杂社交功能提供了强大的工具,包括时间线模式的实现、数据流分发、消息推送、feed流管理和基础的IM通讯。对于那些希望构建类似应用的开发者来说,这是一个宝贵的资源,可以...
需要注意的是,由于安全设置,某些Chrome版本可能需要开启“开发者模式”才能安装.crx格式的插件。 总的来说,HN Feed-crx插件是科技爱好者和Hacker News社区成员的理想工具,它将HN的实时资讯融入到日常的网络浏览...
新功能方面,Branch引入了活动流(activity feed),使话题发起者能跟踪讨论动态,包括谁围观了话题、谁高亮了哪些句子以及浏览量等数据。同时,Branch整合了Spotify和Soundcloud,以支持与音乐相关的讨论,未来可能...
9. **编程最佳实践**:源码可能遵循特定的编码规范和设计模式,以提高代码质量。 10. **编译与运行**:对于需要编译的语言,需要了解编译器或解释器,以及如何通过命令行或IDE来编译和运行源码。 要深入理解这个...
文章《Stochastic Weight Update on Feed-Forward Neural Networks》以及部分内容提及的《Stochastic Weight Update in The Backpropagation Algorithm on Feed-Forward Neural Networks》探讨了这一重要主题,并...
6. 共享与讨论:集成分享功能,用户可以将有价值的文章一键分享到社交媒体或与同学、同事讨论。 总结来说,"Quick Feed-开源"是一个专为教育打造的开源RSS聚合器,它通过开源特性提供高度的可定制性和社区支持,...
- 根据查询效率,推模式更适合Feed系统,因为它能更有效地处理大量实时数据。 4. **Feed System构成**: - Dispatch:负责数据分发。 - NewsFeed Index Cache:缓存索引,提高查询速度。 - User interaction ...
具体而言,Feed流面临的挑战包括如何有效处理十亿级、百万级甚至千万级的读扩散(纯拉模式)、写扩散(纯推模式)以及两者的结合。在这些模式中,社交关系结构,尤其是大V用户的粉丝数量,是一个重要的影响因素。 ...
此外,还讨论了如何使浏览器能够读取和显示这些RSS Feed文件,确保用户能够方便地获取信息。 最后,论文进行了系统测试,验证了RSS图书信息发布子系统的功能性和稳定性,证明了该系统能够有效解决购书门户的信息推...
同时,书中也会讲解如何使用Zend_Feed处理RSS和Atom feed,方便信息聚合。 测试是保证代码质量的关键环节,《Zend Framework in Action》也不会忽视这一点。书中会介绍如何利用Zend_Test和PHPUnit进行单元测试、...
1. **界面设计**:使用ASP.NET的Web Forms或MVC模式创建用户友好的界面,显示RSS源列表,条目内容,以及订阅和管理功能。 2. **RSS源获取**:使用HTTP请求获取RSS feed,这可以通过ASP.NET的HttpWebRequest或...
本文讨论了全局负采样存在的一个缺陷,即可能采样到的feed是用户感兴趣的,但是没给用户曝光。为解决这个问题,本文提出了在用户曝光序列进行负采样的解决方案。 八、结论 美图个性化Push Notification的技术实现...
9. **Zend_Feed**:处理RSS和Atom feed,便于内容聚合。 **四、安装与使用** 下载 ZendFramework-1.10.3 压缩包后,解压到项目目录,可以通过配置自动加载器来启用框架。然后,根据项目需求创建控制器、模型、视图...
同时,它利用了Model-View-Controller(MVC)设计模式,这种模式有助于分离业务逻辑、数据处理和用户界面,从而提高了代码的可维护性和可扩展性。 JForum3的主要特性包括: 1. **多语言支持**:JForum3支持多种...
自动微分部分则涵盖了计算图(Computational Graphs)、自动微分的前向模式(Forward Mode of Automatic Differentiation)和反向模式(Reverse Mode of Automatic Differentiation),以及前馈和循环架构(Feed-...
- **技术博客与教程**:Medium、Dev.to、Vue.js Feed 等平台上有众多开发者分享 Vue.js 相关的文章和教程。这些资源内容丰富,包括基础知识、进阶技巧、性能优化等方面,适合不同层次的学习者。 ##### 工具与辅助库...
转换”和“feed v. 吃东西,进食”可能暗示AI在农业领域的应用,如精准农业,通过自动化的系统来提高农作物产量。而“ambition n. 野心;抱负”可能描述了AI开发者和研究者的雄心壮志,他们致力于创建更智能、更有益...
在公司概况中,上海致远绿色能源股份有限公司被定义为一个从事绿色能源领域的公司,涉及离网供电和并网供电模式,同时也关注微电网和分布式发电技术。离网供电是指在无电网连接的情况下,通过独立的发电设施为特定...
它提供了一个平台,让学生能够分享他们在作业中遇到的问题,并让其他同学或教师参与讨论,提供解答,从而促进学习互动。 ### 一、React技术栈 React.js是Facebook开发的一个用于构建用户界面的JavaScript库,以其...