- 浏览: 292960 次
- 性别:
- 来自: 杭州
最新评论
-
onlyamoment:
请问为什么要限制不合并文件呢?事实上,用动态分区写表时候容易出 ...
HIVE动态分区参数配置 -
alexss1988:
请问楼主,RCFILE由于列式存储方式,数据加载时性能消耗较大 ...
HIVE文件存储格式的测试比较 -
空谷悠悠:
jersey文档中提到:Client instances ar ...
自整理手册Jersey Client API -
bottle1:
我也遇到FileNotFoundException这个问题,发 ...
Hadoop 中使用DistributedCache遇到的问题 -
yongqi:
hi hugh.wangp: 请教您一个问题,我现在也在被 ...
Hadoop 中使用DistributedCache遇到的问题
文章列表
HIVE作为在Hadoop分布式框架下的数据仓库技术,处理大数据量是最基本的诉求,这种海量处理是基于分布式框架,利用分布式存储,分布式计算,利用大集群的资源并行处理海量数据。但是一旦我们不能利用这种分布式并 ...
自己学习排序和二次排序的知识整理如下。
1.Hadoop的序列化格式介绍:Writable
2.Hadoop的key排序逻辑
3.全排序
4.如何自定义自己的Writable类型
5.如何实现二次排序
1.Hadoop的序列化格式介绍:Writable
要了解和编写MR实现排序必须要知道的第一个知识点就是Writable相关的接口和类,这些是HADOOP自己的序列化格式。更多的可能是要关注他的Subinterfaces:WritableComparable<T>。他是继承Writable和Comparable<T>接口,继而Writabl ...
请关注
微信公共账号:数据夜谈
一个数据人互相分享的小圈子!
摘要:
数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。这是比较 ...
请关注
微信公共账号:数据夜谈
来往公共账号:数据夜谈
一个数据人互相分享的小圈子!
摘要:
年前比较忙. 这篇开始会对大数据的具体应用场景和产品做个分享。因为笔者所在行业为互联网中的电子商务行业,所以会从电商的数据场景和产品开始。
请关注
微信公共账号:数据夜谈
来往公共账号:数据夜谈
一个数据人互相分享的小圈子!
摘要
上篇从正面分析了大数据的发展,本篇看一看大数据在发展过程中的泡沫
正文
作者:
请关注
微信公共账号:数据夜谈
来往公共账号:数据夜谈
一个数据人互相分享的小圈子!
作者:
宋贵亮(凤超)
摘要:
大数据时代的数据是基于多源异构、跨域关联的海量数据分析所产生的决策流程、商业模式、 ...
请关注
微信公共账号:数据夜谈
来往公共账号:数据夜谈
一个数据人互相分享的小圈子!
摘要
我们看看一个转型成功的公司是如何利用互联网思维成功的。
正文
一个以用户为中心而转型的公司如何成功的,这个公司就是使星巴克也有点黯然失色的绿山咖啡。
绿山咖啡一直兢兢业业地卖自己的品牌的特制咖啡,在超市、麦当劳、加油站。赚钱很容易,但增长却存在天花板,大型超市进不去,麦当劳和加油站也不可能在大范围推广绿山品牌。然而它的新起步和成功却是从加入和收购Keurig开始的,表面上看,绿山的盈利主要靠:Keurig的保有量;每台机器上K杯的消费
请关注
微信公共账号:数据夜谈
来往公共账号:数据夜谈
一个数据人互相分享的小圈子!
摘要
抓住用户的痛点,专注于自身的产品,迭代地把产品或者服务做到极致,解决用户的痛点,超越用户的期望
正文
在解决用户核心痛点的情况下,基于用户、市场的需求,分阶段迭代推进,使我们的服务更加精益、完美。
为什么需要通过迭代来完成呢?在互联网时代,用户的需求是分散的,个性化的,同时用户意见反馈的成本很低,这样就给了我们试错和逐步完善的机会,在完成核心功能的基础上,通过用户的参与和不断反馈,逐步完善服务。像传统行业,必须给用户一个完善的成品才能推向市场的模式,慢慢就不能适应用户 ...
请关注
微信公共账号:数据夜谈
来往公共账号:数据夜谈
一个数据人互相分享的小圈子!
摘要
从传统的经营产品转为经营用户。一切围绕着用户展开,不管是产品、营销、运营、服务,一切的一切都以用户为中心
正文
所有的企业都会说顾客都是上帝,但以前的企业重视顾客更多是为了兜售产生利润的产品,而互联网思维中重视用户,肯定是为了解决用户某个痛点,后续才是利用大量的用户价值区产生商业价值。如果绕不过这个弯,做什么都不是具有互联网思维。
传统的信息不对称,导致市场是由商家主导的,但是互联网消除了信息的不对称,用户不一定比商家知道的少。商家必须从市场定位、产品研发,生产销售 ...
请关注
微信公共账号:数据夜谈
来往公共账号:数据夜谈
一个数据人互相分享的小圈子!
摘要
互联网思维的讯息,整理汇集于此,一起看看互联网上如何说互联网思维
正文
题外话:辞旧迎新的一天,我们开始"数据夜谈",从13年到14年,我们期望"数据夜谈"能陪伴大家1314
互联网思维就像大数据一样,这几个名词已经被炒成泡沫了。但是确实有很多企业、个人利用不同于传统的思想得到了成功,这个思想可能是互联网思维,也可能是什么思维。之所以不能把他们的成功完全归结于互联网思维,很大程度上,互联网思维这个名词每个人的理解都不一样。
...
Map的遍历
Map的排序
Map的遍历
Map<String, Integer> INPUTMAP = new HashMap<String, Integer>() {
{
put("a", 1);
put("c", 3);
put("b", 2);
put("d", 4);
put("e", 5);
}
};
Iterator it = INPUTMAP.entrySet().iterator();
...
在JAVA中使用Cypher涉及到org.neo4j.cypher.javacompat包的两个类.
类名
方法名
说明
ExecutionEngine
public ExecutionResult execute(String query)
执行query返回存储结果集的一个迭代器(ExecutionResult)
(用于执行Cypher Query)
public ExecutionResult execute(String query, Map<String,Object> params)
执行query返回存储 ...
断言函数(Predicate functions)
函数名称
函数说明
ALL(identifier in collection WHERE predicate)
判断一个断言(predicate)是否满足集合(collection)里的所有元素
ANY(identifier in collection WHERE predicate)
判断一个断言(predicate)是否至少满足集合(collection)里的一个元素
NONE(identifier in collection WHERE predicate)
如果集合(collection)里的元素不满 ...
模式是Cypher非常核心的东西,它在很多地方被用到。利用模式,你可以描述你要找的数据是什么样子。模式是被用在MATCH子句中。路径模式是表达式。Since these expressions are collections, they can also be used as predicates (a non-empty collection signifies true)。他们被用来CREATE/CREATE UNIQUE一个图。
所以,理解模式非常重要。
当你申明一个模式时,Cypher会指出怎么获取数据。想法是编写查询,指定你想要的模式,你就能够利用这些值创建你想要的结果。
模 ...
更新图数据库
Cypher可以用于查询图,同时也可以更新图。
更新语句的结构
Quick info
一个Cypher的查询块不能同时匹配和更新
任何一个查询块可以读取和匹配图,或者更新图
如果你从图中读取数