资讯月刊下载
[操作系统] 选择合适的推荐系统模型
我们的机器学习工程师一直忙于构建GraphLab farm。这篇博客针对一个特殊的应用难题:怎样从GraphLab Create recommender toolkit的众多模型和选项中选择一个合适的推荐模型。 这完全取决于你现有的数据类型以及你评估结果的方式。 (注意:这里使用的是GraphLab Create 0.9 的API。GraphLab Create 1.0 支持通过recommen ...
[企业架构] Facebook是如何存储每天20亿张照片的——Cold Storage ...
Facebook的庞大帝国需要存储的数据时刻都在不断爆炸。比方说,现在它每天要分享20亿张照片,而且需求还在不断增加,唯有靠不断建设扩充存储和数据中心才能满足。 此前我们曾多次介绍过Facebook的数据中心(见Facebook新数据中心揭秘、再探Facebook数据中心),包括俄勒冈的Prineville、北卡罗来纳州的Forest和瑞典的吕勒奥以及爱荷华州的阿尔图纳拥等不仅如此,Faceboo ...
[企业架构] 微信红包金额分配算法
虽然春节已经过去一段时间,但不少微信群里面依旧乐此不疲的在玩发红包活动,用户自发的将最初的一个春节拜年的场景功能慢慢演化成一个长尾功能。 用户在微信中抢红包时分成抢包和拆包两个操作。抢包决定红包是否还有剩余金额,但如果行动不够迅速,在拆包阶段可能红包已经被其他用户抢走的情况。 红包的金额是在什么时候算? 据某架构群腾讯财付通专家反馈,红包的金额是拆的时候实时计算,而不是预先分配,实时计算基于内存 ...
[开源软件] 开源力量125期公开课:提升3D游戏品质-GPU编程开发技 ...
开源力量125期公开课:提升3D游戏品质-GPU编程开发技术 时间: 2015-05-07 20:00 2小时,在线直播 形式: 线上公开课 直播地址:http://www.osforce.cn/openclass/166/show 课程背景 当前从事游戏开发的人员越来越多,不管在PC端还是在移动端3D游戏已经成为主流开发,随着硬件的提升,一般的游戏画质已经不能满足玩家的需求,提升游戏画质已成为 ...
[编程语言] 关于垃圾回收被误解的7件事
对Java垃圾回收最大的误解是什么?它实际又是什么样的呢? 当 我还是小孩的时候,父母常说如果你不好好学习,就只能去扫大街了。但他们不知道的是,清理垃圾实际上是很棒的一件事。可能这也是即使在Java的世界中, 同样有很多开发者对GC算法产生误解的原因——包括它们怎样工作、GC是如何影响程序运行和你能对它做些什么。因此我们找到了Java性能调优专家Haim Yadid,并把名为Java perfor ...
[研发管理] 看待逻辑回归的12种方式
逻辑回归(Logistic regression)是一种最流行的分类技术。实际上,它是如此流行,以至于各个领域都对其有独到见解。因此他们既可以使用,也可以在相同理论框架下比较逻辑回归和他们正在研究的技术。我试着复述我听说过的一些理解,鉴于我并不精于以下全部领域,所以可能会丢失一些细节。 经典统计学学派解释。你的分类标签是基于样本特征通过二项分布产生的,你想要估计这个分布。 贝叶斯统计学派解释。在前 ...
[企业架构] Google调整移动搜索算法
Google将于当地时间4月21日实施移动友好的更新,而这一举措也被社区称为Mobilegeddon。这次更新是对移动搜索算法进行调整。 简单的来说,这次更新可能会让Google移动搜索结果中移动友好页面的排名得到提升。所影响的对象只有移动智能手机,对桌面或平板搜索不会产生影响。并且这次更新只对核心Web搜索结果产生影响,这里不包括Google新闻、当地结果、新闻报道、视频或其他垂直搜索(直到 ...
[编程语言] PHP实现四种基本排序算法
许多人都说算法是程序的核心,算法的好坏决定了程序的质量。作为一个初级phper,虽然很少接触到算法方面的东西。但是对于基本的排序算法还是应该掌握的,它是程序开发的必备工具。这里介绍冒泡排序,插入排序,选择排序,快速排序四种基本算法,分析一下算法的思路。 前提:分别用冒泡排序法,快速排序法,选择排序法,插入排序法将下面数组中的值按照从小到大的顺序进行排序。 $arr(1,43,54,62,21,66 ...
[企业架构] 几种监督式学习算法的比较
【编者按】本文的作者是计算机工程师Kevin Markham;热衷烹饪,痴迷戏剧,偶尔参加铁人三项运动;为 General Assembly 讲授为期11周的数据科学课程,在 SlideRule 指导学生学习数据科学,还是约翰·霍普金斯大学数据科学Coursera专项课程 的社区教学助理(CTA);业余时间制作 视频教程 参加 Kaggle 的比赛。日前他撰文谈及了几种监督式学习算法的比较,值得一看 ...
[互联网] 机器学习实践中应避免的七种常见错误
【编者按】在机器学习领域,每个给定的建模问题都存在几十种解法,每个模型又有难以简单判定是否合理的不同假设。在这种情况下,大多数从业人员倾向于挑选他们熟悉的建模算法,本文作者则认为,模型算法的假设并不一定适用于手头的数据;在追求模型最佳性能时,重要的是选择适合数据集(尤其是“大数据”)的模型算法。 以下为正文: 统计建模和工程开发很相似。 在工程开发中,人们有多种方法搭建一套键-值存储系统,每种 ...
[企业架构] 美团推荐算法实践:机器学习重排序模型成亮点
编者按:在用户意图明确时,我们通常用搜索引擎来解决互联网时代的信息过载问题,但当用户的意图不明确或者很难用清晰的语义表达,搜索引擎就无能为力。此时,借助推荐系统通过用户行为的分析理解其意图,为其推送个性化的结果,便成为一种更好的选择。美团作为国内发展较快的O2O网站,有着大量的用户和丰富的用户行为,这些为推荐系统的应用和优化提供了很好的条件。本文由美团技术团队成员撰写,介绍其推荐系统的构建和优化过程 ...
[研发管理] 如何更好地学习机器学习?
Metacademy的创始人Colorado Reed发布过一篇名为“机器学习练级攻略”,文中回答了初学者经常问他的一个问题:如何才能更好地学习机器学习?这篇文章将总结Colorado的建议并分步讲解他文中的路线图。 如何更好地掌握机器学习 Colorado是伯克利大学的在读博士,同时也是Metacademy的创始人。Metacademy是一个优秀的开源平台,许多专业人员共同在这个平台上编 ...
[操作系统] Linux之父Linus说:并行计算基本上就是浪费大家的时 ...
并行计算有什么好的? 硬件的性能无法永远提升,当前的趋势实际上趋于降低功耗。那么推广并行技术这个灵丹妙药又有什么好处呢?我们已经知道适当的乱序CPU是必要的,因为人们需要合理的性能,并且乱序执行已被证明比顺序执行效率更高。 推崇所谓的“并行”极大地浪费了大家的时间。“并行更高效”的高大上理念纯粹是扯淡。大容量缓存可以提高效率。在一些没有附带缓存的微内核上搞并行毫无意义,除非是针对大量的规则 ...
[编程语言] C++之父:C++ 的五个普遍误解(3)
为了增加您冬天阅读的乐趣,我们很荣幸地奉上Bjarne Stroustrup大神的这个包含3个部分的系列文章。第一部分在这里;第二部分在这里。 5. 误解4:“为了效率,你必须编写底层代码” 许多人相信高效率的代码必须是底层代码。一些人甚至认为底层代码天生就是高效的(“如果代码很丑陋,那它一定很高效!一定有人花费了大量时间和精力来优化它!”)。当然,你仅仅使用底层代码是可以写出高效代码的,并且有 ...
[研发管理] mlpack:可伸缩C++机器学习库
摘要:mlpack是一个可伸缩C++机器学习库,它的目的是让新用户通过简单、一致的API使用机器学习,同时为专业用户提供C++的高性能和最大灵活性。 mlpack是一个直观、快速、可伸缩的C++机器学习库,旨在为机器学习研究者提供更广泛的机器学习方法和函数。它的目的是让新用户通过简单、一致的API使用机器学习,同时为专业用户提供C++的高性能和最大灵活性。 mlpack官网还提供了大量的学 ...
[编程语言] 我是如何解决SQL Server CPU占100%的
遇到的问题 有同事反应服务器CPU过高,一看截图基本都是100%了,my god,这可是大问题,赶紧先看看。 让同事查看系统进程,发现是SQLServer的CPU占用比较高。首先想到的是不是报表生成的时候高,因为这块之前出现过问题,关掉服务程序,还是高。难道是客户端程序引发的?但是这么多的客户端连接,难不成每个都叫人关闭,很简单,把网络断开即可。网络断开之后,CPU立马下降。那么问题到底在哪 ...
[非技术] 让程序员精神分裂的9件事
在外行人眼里,软件开发工作就跟看天书一样难——但是程序员往往会一脸苦哈哈地表示“还有更难的呢!”在最近Quora上面的一个讨论中,我们总结了9件最让程序员糟心的事——简直就是分分钟让我们精神分裂啊!!! 9.设计解决方案 任务:给出一系列要求,设计出可实施的方案,包括设计数据和代码结构、功能算法和应用程序流程。 难点:确保你设计的解决方案得满足客户的要求,并且按时完成。 网友的话: 引用 ...
[操作系统] 如何研究学习一个机器学习算法
机器学习算法都是一个个复杂的体系,需要通过研究来理解。学习算法的静态描述是一个好的开始,但是这并不足以使我们理解算法的行为,我们需要在动态中来理解算法。 机器学习算法的运行实验,会使你对于不同类型问题得出的实验结论,并对实验结论与算法参数两者的因果关系有一个直观认识。 在这篇文章中,你将会知道怎么研究学习一个机器学习算法。你将会学到5个简单步骤,你可以用来设计和完成你的第一个机器学习算法实验 ...