- 浏览: 362228 次
- 性别:
- 来自: 杭州
最新评论
-
guji528:
很好,清晰明了!
(8)python教程:几行代码搞定python 设计模式 -
poson:
为什么踩啊?
三言两语谈团队合作 -
andyhelberg:
你好,想请教一下关于应用敏捷开发在软件维护过程的经验。欢迎与我 ...
对scrum开发的感受 -
poson:
chenwq 写道可以提供behavior targeting ...
最近公司培训的算法 -
chenwq:
可以提供behavior targeting 相关材料不?先谢 ...
最近公司培训的算法
文章列表
不能攀比。
应该要买房。
多和家人联系。
价值观是会改变的。
有些人是喜欢说大话。
周围有人开始默默创业。
多花10%的时间,做好自己的事情。
多看书,少说话。
没有把握的话,不能随便承诺。
努力不一定成功,不努力肯定不会成功。
对马云可以用两个成语评价:“天马行空,腾云驾雾”。天马行空是指其做事不守陈规,腾云驾雾是指其善于借势。
hadoop ,行与行的乘法。
http://carbon.cudenver.edu/csprojects/CSC5809S01/Simd/parmult.html
一直很奇怪矩阵的乘法怎么在hadoop上面实现。看了上面的演示,才发现其实事情很简单。
矩阵M*N=A,受到习惯思维的影响,矩阵的一个元素Aij是M的一行与N的一列相乘。但是实际上可以转换为M的一列中的每一个数和N中每一行相乘,然后累加起来,就是最后的矩阵A。
PageRank算法可以整理为矩阵的乘法,最后也就化解为map-reduce的计算方法。
svd分解的并行算法:
《Parallel Algorithms for th ...
线性空间有了范数,就能够计算两个向量的距离;有了距离就可以定义极限;有了极限就有收敛;同时也就有了cauchy不等式。
做分类、聚类的时候,关键就是要找到一组特征,一个距离计算方法(即相似性计算方法);找到了这两点,一切就都OK了。
一组特征必须要能够衡量两个对象a、b之间的距离;距离计算方法,必须要能够合适的表示两个对象的距离(相似性)。
可列个可列集的并集仍然是可列集。注意构造不相交的集合。
可列集的核心是可以按照一个规则排列所有的元素。
现代数学是在集合论的基础上发展来的。任何的数学对象都是用集合来定义的。
使用模拟退火算法,解决组合优化问题。 注意模拟退火的步骤。
S= [0 0 0 0 0 1 0 0 0 ;
0 0 0 0 0 1 1 0 0;
0 0 0 0 0 1 1 0 0;
0 0 0 0 0 0 1 0 0 ;
0 0 0 0 0 0 0 1 1;
1 1 1 0 0 0 0 0 0 ;
0 1 1 1 0 0 0 0 0 ;
0 0 0 0 1 0 0 0 0;
0 0 0 0 1 0 0 0 0];
count=9;
I=eye(count);
x=[1 1 1 1 1 1 1 1 1];
b=eye(count);
P=ones(count);
for i=1:cou ...
三格化粪池,发酵,过滤,可以用作肥料。
才发现我们农村其实也可以搞化粪池这种东西啊。
杭州农村生活污水有了"植物疗法"。人工湿地清楚污染。建造人工湿地最关键的环节就是要把石块码放出层次。
(1)无动力厌氧工程处理模式:地势平坦共有一定落差的村庄,通过统一建设地埋式大型净化沼气池,将全村生活污水通过管道网络格栅井收集汇流沼气池,采取无动力厌氧工程实行统一处理。
(2)微动力好氧工程处理模式:村内轻污染家庭工业或养殖场污水采取微动力好氧处理模式。即在无动力厌氧工程处理的基础上配套做动力曝气设施。
(3)小型沼气池处理模式:村庄内地势较复杂。不易统一铺设污水管道的村,实好 ...
另外一篇论文证明关键词和竞价词之间随机的分配,最大的竞争率是1 - 1/e.
这个随机分配里面包括了最优的分配方式。
i.i.d 是独立同分布的意思:
independent and identically distributed
《Mechanism Design via Machine Learning》
其中的一个公式:
EM algorithm
behavior targeting
a survey of recommendation algorithm
我讲了k-l transformation 。
1、搜索的算法
2、考虑从多个点开始搜索
3、考虑方块减掉之后方块的变化
4、计算能够减少最多方块的方法
5、增加一些定式,如果按照定式应该安装什么顺序去消去方块。
6、每次要把连续的方块索引起来,把靠近目标的考虑移动方块
7、要考虑走几步之后的效果。要考虑总的收益最大。不能考虑一次消减的最多。
8、考虑从游戏上面搞几个图下来。作为测试样例。
9、最开始不考虑任务。
10、把距离作为 损失函数。如果距离为0,那么损失最小。
11、合理使用可以变色的块。
12、考虑最后块数,每种颜色的奇偶数。
变量是严格的使用匈牙利命名法么?指在公司,而不是个人写的小程序。
个人不喜欢这种命名,虽然看起来好看。但是很多开源的经典代码读没有这种要求。
循环内部的变量一定要放在循环外部么?记得有人说变量声明尽量靠近变量的使用。
很疑惑,请大家讨论一下公司的标准。
数据结构需要布尔代数、图论。
图形处理需要矩阵运算。
图像处理需要矩阵运算,统计、信息论(墒的应用)、微分方程、最优化理论,信号处理(特别是傅里叶变换、小波变换等)、变分法等。
分类、预测问题需要线性回归、最优化、线性空间。
HMM 隐马尔科夫需要需要学习随机过程,用于分词,语音识别。
Bayesian(贝叶斯),分类需要学习概率,用于邮件分类,人群分类等等。
SVM需要学习线性代数,可以用于手写识别等等。
- 2009-12-02 09:19
- 浏览 1211
- 评论(0)
如何证明两个网站的统计是有偏的还是无偏的?
- 博客分类:
- 数学
由于不同的网站有不同的访问人群,因此可能一个网站的调查结果不能表明整个人群对一个事情的态度,而必须综合考虑多个网站的调查结果,才能证明整个人群对一个事件的调查结果。
需要证明。
下面又两个图,不过还不能证明这个问题。
- 2009-11-29 10:53
- 浏览 997
- 评论(0)
没事可以多走走。
星期一到五工作,星期六去超市。生活还是很规律的。
多锻炼身体,多打电话。
少议论别人。注意说话。很多时候自己不在意的事情,会冒犯别人。
超市买的东西尽量买量大的。
少上网,多看书。
注意生活的细节。
多花10%的时间,做好自己的事情。
多听纯音乐。