`
poson
  • 浏览: 362229 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论
文章列表
  我们学习了概率,知道对于一个总体有一个分布,假设中国人的身高是一个正态分布。但是这个正态分布的参数(均值和方差)是不知道的,因此我们需要估计这两个参数。我们不可能统计所有中国人的身高,然后再计算这个参数。那么我们只能抽样,例如统计10万人的升高去估计着两个参数。在抽样的时候,必须放在抽样数据是有偏的,即与总体的分布不一致的。因此,需要慎重的考虑抽样的方法。得到样本之后,我们就可以估计整个分布的参数。
酉矩阵 http://zh.wikipedia.org/wiki/%E9%85%89%E7%9F%A9%E9%98%B5   在晶体学里,酉变换叫做幺正变换,也就是将空间(可以是任意维的)中一组基矢做一个旋转操作,不改变矢量的大小和内积。而在量子力学里面,这个用处就更大了,本质 ...
http://www.aiaccess.net/English/Glossaries/GlosMod/e_gm_covariance_matrix.htm马氏距离 对normalized Euclidean distance的扩展。 两种特殊情况: 一:如果是单位矩阵 If the covariance matrix is the identity matrix, the Mahalanobis distance reduces to the Euclidean distance.   二:如果是协方差矩阵式对角矩阵 If the covariance matrix is dia ...
我们要分析数据,当面对大量数据的时候,不可能每个数据都看一遍,就需要用到一些采样方法。通过采样得到的数据了解数据的规律和特征。   1、平均随机抽样      有10000个数据,任意随机抽取100条。 2、分类抽样      有10000个数据,有10个类目,每类1000条,可以考虑每个种类抽取50条。   3、分类、按照百分比抽样     如果有10000个数据。假如是身高数据,按照正态分布。那么根据正态分布,对每个高度取一定的样本,做分析。
统计每天的销售额;每天销售商品数量;每天商品购物人数;分布画出波动的曲线,让人一目了然。 根据购物人数,调整收费人员的休息时间,在周末、节假日安排更多的人上班;在购物低谷的时候维修收费 pos 机器。 分类商品数量、购物数量。 超市热点分析、分析哪些位置是超市的热点,优化购物者行走路线。超市有没有死角?超市的有些地方我们从来都不会去的。提供商品陈列的依据。 分析top消费类目,长尾的消费类目。分析商品销售量,为进货管理提供参考。 长期没有人消费的类目,或者消费量底下的类目。这些类目是不是应该取消。 哪些商品同时销售的可能性高。购物车分析,关联规则分析,推荐算法。 节假日分析,为节假 ...
  考虑:查询信息需要的时间。 各种发明的时间。   一:工业时代   面对面的传播 杂志、报纸 图书馆 电话 电报 信件 电视     二:信息时代     通过Internet上面传播信息 信息传播的方式多种多样 1.0:网站、论坛、搜索引擎   2.0时代:blog   特点:自由传播   3.0时代:twitter   特点:传播快速   趋势:   twitter 信息量很大,那么其分类显得非常必要了。 我flow的信息,希望能够只要我需要的信息,对于我不想看的信息,就不需要得到。      
    做了几天代理的scrum master,发现这个工作其实并不是那么容易做的。     需要每天早上召开晨会,了解大家的工作进度和已有的问题。大多数时候,大家都说的不是很清楚,像是各个负责人和scrum master在说暗语,其他人很难听懂别人的工作内容。如果我们稍微说的详细一些,多说一些名词,大家或许都可以听懂,至少大家知道出了同样的问题的时候,知道应该去找谁。晨会的时候,我们比较难说出潜在的问题、或者问题的规模。毕竟对未知的东西我们很难把握。    在晨会之后,需要经常了解每个人的工作。和每个人讨论问题的详细细节,虽然你并没有参与到具体的实现。在讨论的过程中,进一步了解工作的进度、问题 ...
作者Sawyer的想法:让剧中的人看见自己的未来,然后在这个过程中去发掘人性。 西方科学文化是建立在欧几里得的基础上。首先提出一些假设、公理,然后在这个假设的基础上做推理。欧洲的科学理论是建立在这个逻辑基础之上的。 而科幻电影也是如此,先提供一系列的假设,然后再这个基础上发展剧情。这些假设可能看起来非常的荒谬,但正是这些迷人的假设让想象得到的场景非常地引人入胜。

跳槽的成本

最近很多人换工作。 仔细想想,换工作并不一定是是划算的事情。特别是要到另外一个城市工作的话。不过,当你对一个工作感到厌恶的时候,可能不会考虑太多的东西,只想赶紧换一个环境。这种情况另当别论。 到新的工作岗位,要学习一些新的基本技能。 需要花时间融入新的团队。 了解自己的同事和上司的风格。 熟悉自己的工作,做好本职工作。 要学习新的知识,做出超出期望的成果。 一般换一个新的工作,就需要租新的房间。也需要花不少的时间。 新工作的工作强度,工作压力,是否有利于发展都是应该考虑的问题。 换工作虽然有不少挑战,但是更多的工资、更多的机会,却总是诱人的。
indent -bad -bap -bbb -bbo -nbc -bl -bli0 -bls -c33 -cd33 -ncdb -ncdw -nce -cli0 -cp33 -cs -d0 -nbfda -di2 -nfc1 -nfca -hnl -ip5 -l75 -lp -pcs -nprs -psl -saf -sai -saw -nsc -nsob -nss -i4 -ts4 -ut  *.cpp *.h 函数后面不要空格: indent -bad -bap -bbb -bbo -nbc -bl -bli0 -bls -c33 -cd33 -ncdb -ncdw -nce -cli ...
-------yahoo 真是大公无私,发表了n多的论文。 本论文只有两页。 首先是提取特征,包括编辑距离、符号重叠度。 类似hubble的关键词和点击页面的关系。 广告特征。 位置特征 然后用TED做分析。 基本上就是一个线性回归,求两个query之间的相关度。 使用误差分析的方法,使整体的误差最小。 看了论文,还没有办法用到实践上面。
因为大多数互联网用户不会玩复杂的游戏,比如一些中年人、很多女性用户。 而这种简单、网络交互性的游戏正好满足了这些人的需求。 给他们一个容易接触到得游戏,他们很容易就去试玩。并通过口碑相传,形成规模效应。

最大似然估计

参考: 设f(y, θ)为随机变量Y的概率密度函数(PDF),θ为该PDF的参数,Y1、Y2、…、Yn为观测到的一个随机样本,则θ的最大似然估计量(Maximum Likelihood Estimator简记为MLE)就是具有产生该观察样本的最大概率的那个θ估计量。换言之,θ的MLE是使密度函数f(y, θ)最大的那个θ的估计量。 当我们对Yi的分布未做具体规定而在回归分析里被称为“弱假定”;为了进一步考察回归模型,引入关于Yi服从正态分布的假设,成为“强假定”。 求矩估计和最大似然估计时,什么是关键?关键是判断值的选择 最小平方法(又稱最小二乘法) ,可以直接求出参数。
excel 可以做简单的数据处理,排序等。 editplus 按照列切割 gvim 查看linux下的文件 硬盘搜索 :快速找到需要的文档。也可以对论文做索引。 winscp:传输文件 windows svn :tortoise beyond compare:代码比对工具。
地球上物种的多样性让我们非常的感叹造物者的神奇。 进化论告诉我们,这许多的物种是几十亿年前从海洋里面进化来的。突然又一个很奇怪的想法,就是上帝拿很多参数在哪里调整,然后我们输出了许多许多的物种。参数可能有: 1、有没有羽毛 2、能否飞行 3、有几条腿 4、雌雄 5、能否说话 6、眼睛什么颜色 7、皮肤的颜色 等等 当上帝在调整这些参数的时候,调整一次,就产生了一次物种。最终出现了人类…… 但是物种可能还在进一步的产生当中。 想起量子力学的科普书《上帝掷骰子吗?》,看起来上帝是很喜欢掷骰子的。
Global site tag (gtag.js) - Google Analytics