`
pesome
  • 浏览: 68648 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

结合openfans谈算法的重要性

阅读更多

不经意看到了程序员的一期算法专题,细细研读多位高手(包括李开复)的文字之后,对算法的重要性重新进行了反思。我研究生毕业 2 年,一直从事 J2EE 开发,由于项目的原因,很少需要自己去设计算法,甚至 stack tree 这些数据结构都很少使用。还好自己也不甘于平淡,如 Effective Java Practical Java Refactory Design Pattern 等等这些流行书还是抽空学习,这些书的确很是经典,对我的编码风格,模式的理解,设计能力都起到了很好的促进。也快速的由一个程序员成长为架构师(只是公司的,离真正的架构师还差得远)。

因为项目需要,去年下半年开始全面接触开源软件,使用了 spring maven hibernate ibatis 等众多开源软件,也对开源软件产生了浓厚的兴趣,于是拿这些开源软件做了 openfans ,一方面是推进开源软件在中国的使用的交流,一方面也为自己在实践中更多使用这些软件(因为没有项目和利益因素,可以做想做的事,用想用的软件)。使用这些开源软件倒很是顺利,很多软件拿来就能用,都有 sample ,简单使用还是不难的。

但一些关键的问题一直悬而未决!比如 tag 的设计:我现在简单的使用平铺的模型, tag 没有层次之分, tag 间产生双向关联。但这样是最符合 tag 特性的模型吗?如何对这些 tag 进行分类,如何定义 tag 的多级关联(如 spring hibernate 有关联, hibernate 又与持久层关联, spring 是否与持久层有间接关联,依次类推)。。。。。。而做出一个好的 tag 模型,可能就需要图论方面的知识。再比如用户相似度设计(号称是豆瓣的核心,难以复制):每个用户拥有了一些 tag ,如何根据这些 tag 定义用户的相似度,一个用户有 spring hibernate 2 tag ,一个用户有 spring ibatis 2 tag ,他们相似度为多少,如果每个人 tag 都很多,再加上权重的概念,问题又复杂的多。简单的做法就是每个用户 tag 一个个匹配,匹配的越多相似度越大,但这样设计一是不准确,二是时间复杂度很大,最坏情况为 n*n*m*m n 为用户数, m 为每个用户的 tag 数。

这些都需要扎实的算法基础。而我的基础就很薄弱:本科学的比文科还文科的专业,研究生又学的比较上层的东西( UML RUP PM 等,也都一知半解),选修了一门算法导论,又被 1000 多页的经典英文教材吓趴下了,上了几次课就直接放弃,没敢参加最后考试。现在想临时抱佛脚,谈何容易。

所以算法也并非没有用处,关键要看你在做什么,想做什么。想去 google 、百度不用会 spring ,算法基础扎实,只会 c 语言都行;一些行业如电信、金融也很是需要算法高手。而国内更多的企业做企业应用,一般是连连数据库,写写页面,最多引入些开源框架和软件,如 spring hibernate struts 等。这方面的需求较大,会了 spring ,省了公司的培训成本,自然还是给找工作加了一些砝码。

所以有时听到某些人对某项技术不以为然,说“这些东西有什么是我在几个星期学不会的”的时候,一方面是对其狂妄进行些鄙视,一方面也真要问问自己,我的核心价值到底在哪。这个问题很重要,涉及面很广,选择也很多,而我也只是有些模糊的答案,等以后再仔细写写。

不管如何,我是要开始研究算法了,得解决问题阿!先在 openfans 开个算法的 tag ,一边学一边积累,对算法有兴趣的同学也可以跟我一块进步。

PS :做个广告, blogjava 很多好的 bloger ,能否到 www.openfans.net 导入下 blog ,跟大家分享下你的感悟,谢谢!

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics