- 浏览: 14099 次
- 性别:
- 来自: 南京
最新评论
文章列表
准备Android开发环境
常见问题及解决过程:
(1)android.os.NetworkOnMainThreadException异常
http://k-beta.com/android-os-networkonmainthreadexception.html
(2)Android 启动模拟器是出现“Failed to allocate memory: 8”错误提示的原因及解决办法
http://blog.csdn.net/aminfo/article/details/7902098
(3) Android,HTTP请求中文乱码
替换获取网页代码程序,通过预先识别编码格式完成
(4) ...
教你如何迅速秒杀掉:99%的海量数据处理面试题
爬虫程序
爬虫抓取策略介绍
StreamGobbler的详细解释
HashMap在并发下出现CPU高的问题
java线程池
Wikipedia
WikiPedia 技术架构学习分享
YouTube
YouTube 的架构扩展
Internet Archive 的海量存储浅析
LinkedIn 架构笔记
Tailrank 网站架构
Twitter 的架构扩展: 100 倍性能提升
财帮子(caibangzi.com)网站架构
Yupoo! 的网站技术架构
37Signals 架构
Fl ...
mongodb:对mongodb进行java编程
小试MongoDB及Java的CRUD
Memcached Java客户端编程
zookeeper的部署和使用
Memcached FAQ(2) 集群架构方面的问题
在windows下安装memcache的相关文章推荐
http://blog.csdn.net/hqin6/archive/2011/01/27/6166750.aspx
路径为:/home/xxx/
工具为:apxs
框架搭建:
1、准备工作:安装apache对应的httpd-devel,主要是为了安装apxs。
2、生成一个apache的模块框架:cd /home/xxx/; apache module:apxs -g -n mytest
这里的myt ...
Hadoop
十道海量数据处理面试题与十个方法大总结
海量数据战争——谁能赢得未来?
1. QCon北京2011大会
大会日程:2011年4月8日-4月10日
培训日程:2011年4月6日-4月7日
qcon 北京
2. 云计算大会
腾讯网科技中心总监程苓峰曾在《IT经理世界》上发表过一篇文章《腾讯的瓶颈
》,通过与分析师对话的形式,分析了腾讯当前所面临发展瓶颈,并表示
在领先业务上,腾讯擅长的微创新没问题;但在一个新业务上面对 ...
背景介绍:
目前大量的技术网站都采用主动推荐产品或者广告的行为,个性化推荐技术始于个性化建站技术(包括Blog技术);Google adwords广告系统采用识别用户输入串或者邮件内容向用户推荐匹配的广告的;Google引入的suggest技术,也是通过输入框提前感知用户的查询目的;百度提出的框计算也又一次证明了开发以及服务集成的思路以便更好地理解用户。
技术所要达到的目的为非在合适的地方展现合适的内容。
通常有下面的一些技术:
(1).协同过滤(Collaborative Filtering)技术
(2).自然语言理解技术
人与人交道使用的是人类语言(基本由词汇及约定俗成的含义构成) ...
网络爬虫,又有名称spider,crawler,网络蜘蛛等名称(下文中采用spider说明)
记得自己学java时的第一个规模稍大的程序就是爬虫系统,从此迈开了搜索引擎学习的第一步。
当时使用的是Heritrix,加上有一本书《网络机器人Java编程指南》,环境使用的是eclipse2.1版本。
(一)互联网资源结构分析:
我们知道互联网资源对应唯一的url,而资源之间通过链接的方式进行关联的,这样互联网上的资源会组织起一张庞大的资源网。给定某网址,展现给访问者的是资源的集合,除html页面本身外,html代码中还包含引用的图片资源,javascript,css资源。
刚开发出来的网站没有外部链 ...