`
love敏小仪
  • 浏览: 37089 次
  • 性别: Icon_minigender_2
  • 来自: 杭州
社区版块
存档分类
最新评论
文章列表
  eclipse中安装tomcat插件 http://blog.csdn.net/seuxiaoqi/article/details/6003549   应用启动tomcat时报错: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'commonProcessBean': Autowiring of fields failed; nested exception is org.springframework.beans.factory.BeanCreati ...
问题现象? 在运行工程eclipse.bat时报错:  解决方案: 1 查看内存: workspace/.metadata/.plugins/org.eclipse.core.runtime/.settings/org.eclipse.ui.prefs,在里面加上SHOW_MEMORY_MONITOR=true,重启eclipse,就可以在其左下角看到内存使用情况。 2 修改内存: 方法一: 找到eclipse/eclipse.ini,打开,在其上加上 -vmargs-Xms128m
  map的中间结果也可以启用压缩,而且中间结果对输出结果是没有影响的: hadoop-site.xml中:   <property> <name>mapred.compress.map.output</name> <value>true</value> <description>Should the outputs of the maps be compressed before being sent across the network. Uses Sequen ...
HIVE语法中对于UNION ALL的使用是非常常见的,主要用于多表合并的场景。UNION ALL要求各表SELECT出的字段类型必须完全匹配。 在实际使用过程中,经常会出现对多表且不同字段的结果表进行合并操作。 例如:以下六张表中除selle ...
------样本取值 1:圈定数据分析的样本取值范围(要做数据清理和去噪) -----总体分析 2:买家和卖家的占比分析 3:订单类型分析(主子订单) 4:业务类型分析 -----在圈定了重点分析对象后,再细致分析(重点分析对象是订单数量大于10笔的卖家,因为他们占据了来电的25%) 5:大于10笔订单卖家星级分布(和全网占比做横向比较,看运营可行性) 6:小于10笔订单卖家星级分布(长尾分析,反向分析) -----分析之前得出运营重点之外的可能性因素买家 7:订单数和买家的关系 8:会龄和买家的关系 -----结合具体业务分析退款来电(类目下的退款分布)
hive文件存储格式包括以下几类:•TEXTFILE•SEQUENCEFILE•RCFILE•自定义格式SEQUENCEFILE:SequenceFile是Hadoop API提供的一种二进制文件支持,其具有使用方便、可分割、可压缩的特点。SequenceFile支持三种压缩选择:NONE, RECORD, BLOCK。 Record压缩率低,一般建议使用BLOCK压缩。示例:stored as rcfilelocation '/group/tbdataapplication/mirror/r_auction_auctions_mirror_rc/';RCFILERCFILE是一种行列存储相结合 ...
开博!
Global site tag (gtag.js) - Google Analytics