论坛首页 Java企业应用论坛

通过搜索引擎构建网站BI---欢迎讨论

浏览 3421 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2012-12-13   最后修改:2012-12-13
初步分析
场景:做一个中小型互联网项目,需要提供商业智能,支撑推荐功能+CRM+广告系统等
思路如下:
1.用来来网站的每一次行为,进行log
2.对行为进行分类,提取不同的关键信息
3.不同行为导致不同的权重比例
4.每次的行为都放入搜索引擎文档,利用引擎来检索,如果不考虑不同行为的打分,效率等,数据库也是可以的

一段时间后,用户就会积累很多记录,那么我们根据不同行为的积累分析信息,利用搜索引擎特点,进行各种高效的关键字排名,权重打分排名

关键点:1.每次行为的提取--用户行为的分析,这直接导致了BI是否有效
        2.搜索引擎文档的合理设计
   发表时间:2012-12-14   最后修改:2012-12-14
我实在不解 为什么不用hadoop来解决。
0 请登录后投票
   发表时间:2012-12-14  
我们采用亚马逊购物网站的方式,通过顾客每个浏览的页面进行埋点,然后根据不同的渠道过来进行打分,数据采集,分析后进行的load
0 请登录后投票
   发表时间:2012-12-14  
SonofGod 写道
我实在不解 为什么不用hadoop来解决。

优劣对比,能详细说下,不要谈分布式,我们没有那么大规模,场景是中小型互联网项目
0 请登录后投票
   发表时间:2012-12-14  
简单的说,应该是类似于收集用户的访问信息,以做后期分析,然后提供相关的推荐之类的吧。这方面,我也好奇。不过,我更好奇的是,分析的规则是怎么样的?
0 请登录后投票
   发表时间:2012-12-14  
freezingsky 写道
简单的说,应该是类似于收集用户的访问信息,以做后期分析,然后提供相关的推荐之类的吧。这方面,我也好奇。不过,我更好奇的是,分析的规则是怎么样的?

目前基本是这样
用户细分,用户行为按照大类分拆,小类别具体行为设计使用再拆分绑定相关行为操作资源
0 请登录后投票
   发表时间:2012-12-14  
这本来就是和架构无关的..主要看你的需求合理分配检索的字段....既然是小规模的..其实连检索都用不到吧....按照人做主键....把纬度高的弄成一个数字..ps:如果线性的解决不了..用用svm多纬度来算..应该是考虑模型而不是考虑查询...数据也不要求实事性..隔段时间更新下就好.
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics