将博客搬至CSDN

ITEYE不维护了，是时候搬家到CSDN了

2020-08-22 23:34
浏览 317
评论(0)
分类:非技术

a http://www.cnblogs.com/daizhuacai/archive/2013/01/17/2865132.html 首先用adduser命令添加一个普通用户，命令如下：#adduser tommy //添加一个名为tommy的用户#passwd tommy //修改密码方法二：修改 /etc/sudoers 文件，找到下面一行，在root下面添加一行，如下所示：## Allow root to run any commands anywhereroot ALL=(ALL) ALLtommy ALL=(ALL) ALL修改完毕 ...

2017-03-12 08:57
浏览 469
评论(0)
分类:开源软件

OpenTSDB相关

好文章: https://dzone.com/articles/building-rest-service-scala http://liubin.org/blog/2016/03/05/tsdb-opentsdb/ ehcache.xml <?xml version="1.0" encoding="UTF-8"?> <ehcache xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLo ...

2017-01-02 18:03
浏览 840
评论(0)
分类:开源软件

Alluxio介绍

博客分类：

Alluxio

附件参考资料:http://blog.csdn.net/lipeng_bigdata/article/details/50947891

2016-12-25 20:51
浏览 619
评论(0)
分类:开源软件

基于SAML2 SSO的调研

参考资料: 原理流程 http://www.ibm.com/developerworks/cn/websphere/library/techarticles/1111_luol_sso/1111_luol_sso.html http://blog.csdn.net/csethcrm/article/details/20694993 opensaml插件 https://wiki.shibboleth.net/confluence/display/OpenSAML/Home/ 代码实现 http://www.tuicool.com/articles/muAbQ3 ...

2016-11-22 21:44
浏览 628
评论(0)
分类:开源软件

将博客搬至CSDN

最近准备把上面写的东西搬到CSDN上了

2016-10-07 17:43
浏览 489
评论(0)
分类:非技术

SQLServer数据库文件mdf和ldf的导入及导出

博客分类：

SQLServer

SQLServer2008 mdf ldf

通常导出SQLServer数据库的方式有两种: 1.以SQL文件的方式导出 2.以mdf和ldf数据库文件的方式导出 SQL文件的导出方式，通常需要自定义列与列之间的分隔符，因为默认的分隔符","，很可能出现在列的值中下面介绍一下导出和导入mdf和ldf的方式在sqlserver management studio进行如下操作 1.导出数据库 1.1 脱机，(选择的数据库右键 tasks -> take offline )注意这会导致数据库当前不可用 1.2 到数据库的数据路径，拷贝出mdf,ldf文件 sqlserver默认的数据 ...

2016-10-03 09:01
浏览 8646
评论(0)
分类:数据库

Spark将RDD转换成DataFrame的两种方式

博客分类：

Spark

Spark Spark RDD Spark DataFrame

介绍一下Spark将RDD转换成DataFrame的两种方式。 1.通过是使用case class的方式，不过在scala 2.10中最大支持22个字段的case class,这点需要注意 2.是通过spark内部的StructType方式，将普通的RDD转换成DataFrame 装换成DataFrame后，就可以使用SparkSQL来进行数据筛选过滤等操作下面直接代码说话 package spark_rdd import org.apache.spark._ import org.apache.spark.sql._ import org.apache.spark.sql. ...

2016-10-01 22:32
浏览 20759
评论(0)
分类:开源软件

机器学习工程师需要了解的十种算法

博客分类：

机器学习

机器学习 spark mllib

记录一下，有时间的时候研究，挺感兴趣的 http://www.iteye.com/news/31803

2016-09-18 10:31
浏览 800
评论(0)
分类:开源软件

Spark之RDD基础

博客分类：

Spark

Spark Spark RDD

RDD概念: RDD是只读的，分区记录的集合 RDD支持基于工作集的应用，同时具有数据流模型的特点：自动容错位置感知性调度可伸缩性速度快的原因:RDD允许用户在执行多个查询时显式的将工作集缓存在内存中，后续的查询能够重用工作集 RDD的5个主要属性 1.一组分片(Partition),数据集的基本组成单位. 每个Partition都会被逻辑映射成BlockManager的一个Block, 而这个Block会被一个Task负责计算。 2.一个计算每个分区的函数compute 3.RDD之间的依赖关系。在部分数据丢失时，Spark可以通过依赖关系重新计算丢失的分区数据 4 ...

2016-09-18 10:29
浏览 1119
评论(0)
分类:开源软件

Flume-ng 1.6启动过程源码分析(二)

博客分类：

flume

java flume 日志采集

阅读Flume源码后发现，Flume有两个顶级的接口： 1. ConfigurationProvider接口，提供了getConfiguration()方法，用于获取不同组件的配置。 2. LifecycleAware接口，提供了三个方法，start() stop()和getLifecycleState()，分别用于组件的启动停止以及组件在生命周期中处的状态，可以说这个接口贯穿于整个Flume中。继续Flume-ng启动过程的源码分析，Flume启动类org.apache.flume.node.Application,所有组件加载完毕后会调用start方法。下面的代码中可以看到，star ...

2016-09-04 11:25
浏览 1551
评论(0)
分类:开源软件

Flume-ng 1.6启动过程源码分析(一)

博客分类：

flume

启动部分主要分为四块命令行参数的载入，这部分用的common cli实现对于可选的zk配置的加载对于flume-ng配置的加载，这里利用EventBus实现配置文件动态加载组件的启动简单介绍下EventBus，它是Guava提供的消息发布-订阅类库，机制与观察者模式类似。下面主要介绍上面提到的第3和4部分。首先

2016-08-22 19:36
浏览 1241
评论(0)
分类:开源软件

flume使用hdfs sink时需要注意的几点

博客分类：

flume

flume hdfs sink

最近接触了flume，这个日志收集器在扩展性方面确实很便捷，相信这与其架构的设计有密切的关系。书归正传，这次用到了hdfs sink在使用时还是有几点需要注意的，在此和大家分享一下。第一部分windows下搭建单机的hdfs 如果你和我一样没有linux的测试环境，想在windows搭建hdfs，可以参考下面的链接，笔者就是参照这篇文章进行部署的 http://blog.csdn.net/jiutianhe/article/details/17709717 需要注意的是windows下使用hdfs需要依赖hadoop.dll winutils.exe等，此处有两点需要注意 1 ...

2016-08-20 21:14
浏览 3379
评论(0)
分类:开源软件

基于flume-ng抓取mysql数据到kafka

博客分类：

flume

flume 日志采集

flume是一个日志收集器，更多详细的介绍可以参照官网:http://flume.apache.org/ 在apache flume的官网上没有找到sql数据源数据抓取的source，可以利用github上的plugin插件:https://github.com/keedio/flume-ng-sql-source,1.4.3版本基于hibernate实现，已可以适配所有的关系型数据库。目前的实验环境是在windows下，所以kafka在windows下相关的配置使用，参考了http://blog.csdn.net/linsongbin1/article/details/480 ...

2016-08-14 19:17
浏览 13199
评论(1)
分类:开源软件

利用scala的trait特性实现简单AOP

博客分类：

scala

最近开始系统的研究下scala trait字面意思是特质或者特征，这里翻译成特征比较合适。 scala中trait的意义和java中接口很类似，但是trait支持实现，也就是说在scala的trait中方法可以是抽象方法，也可以是带实现的非抽象方法。另一个重要的与java interface的不同点，scala可以在一个class实例化的时候通过with关键字混合进一个trait。with关键字用来实现包装器的功能。利用上面提到的特性，来实现一个简单的AOP 定义一个SchoolTrait，添加一个抽象方法，不需要将方法声明为abstract,特征中未被实现的方法默认就是抽象的 ...

2016-06-30 14:38
浏览 2014
评论(0)
分类:编程语言

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

将博客搬至CSDN

HDP

OpenTSDB相关

Alluxio介绍

基于SAML2 SSO的调研

将博客搬至CSDN

SQLServer数据库文件mdf和ldf的导入及导出

Spark将RDD转换成DataFrame的两种方式

机器学习工程师需要了解的十种算法

Spark之RDD基础

Flume-ng 1.6启动过程源码分析(二)

Flume-ng 1.6启动过程源码分析(一)

flume使用hdfs sink时需要注意的几点

基于flume-ng抓取mysql数据到kafka

利用scala的trait特性实现简单AOP

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>