- 浏览: 37089 次
- 性别:
- 来自: 杭州
最新评论
-
bing1983333:
不要泄露机密哦~
学习退款数据分析思路 -
bing1983333:
hive文件存储格式小记 -
bing1983333:
两个字精辟而富有内涵~简单而充满活力~好文~
第一篇博客 -
liwx2000:
好文,顶~~受益良多
第一篇博客
文章列表
tomcat内存溢出设置JAVA_OPTS
- 博客分类:
- 学习总结
eclipse中安装tomcat插件
http://blog.csdn.net/seuxiaoqi/article/details/6003549
应用启动tomcat时报错:
org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'commonProcessBean': Autowiring of fields failed; nested exception is org.springframework.beans.factory.BeanCreati ...
问题现象?
在运行工程eclipse.bat时报错:
解决方案:
1 查看内存:
workspace/.metadata/.plugins/org.eclipse.core.runtime/.settings/org.eclipse.ui.prefs,在里面加上SHOW_MEMORY_MONITOR=true,重启eclipse,就可以在其左下角看到内存使用情况。
2 修改内存:
方法一:
找到eclipse/eclipse.ini,打开,在其上加上
-vmargs-Xms128m
hive的map结果压缩
- 博客分类:
- 学习总结
map的中间结果也可以启用压缩,而且中间结果对输出结果是没有影响的:
hadoop-site.xml中:
<property>
<name>mapred.compress.map.output</name>
<value>true</value>
<description>Should the outputs of the maps be compressed before being
sent across the network. Uses Sequen ...
HIVE使用技巧(一)--union all
- 博客分类:
- 学习总结
HIVE语法中对于UNION ALL的使用是非常常见的,主要用于多表合并的场景。UNION ALL要求各表SELECT出的字段类型必须完全匹配。
在实际使用过程中,经常会出现对多表且不同字段的结果表进行合并操作。
例如:以下六张表中除selle ...
学习退款数据分析思路
- 博客分类:
- 学习总结
------样本取值
1:圈定数据分析的样本取值范围(要做数据清理和去噪)
-----总体分析
2:买家和卖家的占比分析
3:订单类型分析(主子订单)
4:业务类型分析
-----在圈定了重点分析对象后,再细致分析(重点分析对象是订单数量大于10笔的卖家,因为他们占据了来电的25%)
5:大于10笔订单卖家星级分布(和全网占比做横向比较,看运营可行性)
6:小于10笔订单卖家星级分布(长尾分析,反向分析)
-----分析之前得出运营重点之外的可能性因素买家
7:订单数和买家的关系
8:会龄和买家的关系
-----结合具体业务分析退款来电(类目下的退款分布)
hive文件存储格式小记
- 博客分类:
- 学习总结
hive文件存储格式包括以下几类:•TEXTFILE•SEQUENCEFILE•RCFILE•自定义格式SEQUENCEFILE:SequenceFile是Hadoop API提供的一种二进制文件支持,其具有使用方便、可分割、可压缩的特点。SequenceFile支持三种压缩选择:NONE, RECORD, BLOCK。 Record压缩率低,一般建议使用BLOCK压缩。示例:stored as rcfilelocation '/group/tbdataapplication/mirror/r_auction_auctions_mirror_rc/';RCFILERCFILE是一种行列存储相结合 ...