解决conda下载慢的问题

博客分类：

Python

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --set show_channel_urls yes

2017-07-06 15:06
浏览 1635
评论(0)
分类:编程语言

海量数据处理的常用思路和方法(转)

博客分类：

大数据

大数据

最近在研究个性化推荐系统，基础很是薄弱，没有海量数据处理相关经验，这篇文章算是分享了一些经验。若想将个性化推荐技术运用于互联网中，必须面对增量计算和可拓展性问题，即能够进行分布式部署于服务器集群中，这� ...

2017-06-27 09:59
浏览 408
评论(0)
分类:行业应用

1、下载python3.5 wget https://www.Python.org/ftp/python/3.5.0/Python-3.5.0.tgz 注：如果在Linux中下载较慢，可以在Windows操作系统中去Python官网下载：https://www.python.org/downloads/release/python-350/ 注意要下载Gzipped source tarball版本的，然后使用WinSCP将下载好的文件Python-3.5.0.tgz拖拽到Linux中，后续步骤还是不变的。 2、解压 tar zxvf Python-3.5.0.tgz 3、进入Python-3. ...

2017-05-23 09:56
浏览 670
评论(0)
分类:研发管理

RocketMQ与Kafka对比【转】

博客分类：

Kafka
RocketMQ

中间件 kafka RocketMQ

转自：https://github.com/alibaba/RocketMQ/wiki/rmq_vs_kafka 引用淘宝内部的交易系统使用了淘宝自主研发的Notify消息中间件，使用MySQL作为消息存储媒介，可完全水平扩容，为了进一步降低成本，我们认为存储部分可以进一步优化，2011年初，Linkin开源了Kafka这个优秀的消息中间件，淘宝中间件团队在对Kafka做过充分Review之后，Kafka无限消息堆积，高效的持久化速度吸引了我们，但是同时发现这个消息系统主要定位于日志传输，对于使用在淘宝交易、订单、充值等场景下还有诸多特性不满足，为此我们重新用Java语言编写了RocketMQ ...

2017-05-08 16:41
浏览 472
评论(0)
分类:企业架构

Scala 框架选择

博客分类：

Scala

scala 框架

我所知道的Scala持久层框架有： 1、Slick （typesafe出品） 2、Squeryl 3、Anorm（Play的持久层） 4、ScalaActiveRecord （基于Squeryl之上） 5、circumflex-orm 6、activate-framework（不只是scala版的hibernate，支持async db） web框架的话 1、Spray（build on akka，完全异步，非阻塞，非常有前景，适合REST后端程序） 2、Play（还不是很习惯） 3、Scalatra（对akka，squeryl等都有现成集成，适合需要view层的） ...

2017-05-06 15:55
浏览 853
评论(0)
分类:编程语言

mesos下载、准备安装环境、编译以及测试(转)

博客分类：

Mesos

mesos linux centos

参考网址：http://mesos.apache.org/gettingstarted/ 实验环境：mesos版本：0.21.0、操作系统：Red Hat 6 为了了解Spark的三种部署standalone、mesos和YARN。所以想尝试部署下mesos集群。我根据自己的需求，参考了官方文档的如下步骤： Downloading Mesos There are different ways you can get Mesos: Download the latest stable release from Apache (Recommended) $ wget http:// ...

2017-05-06 14:46
浏览 1182
评论(0)
分类:企业架构

Python 安装

博客分类：

Python

python linux

在centos6.5下安装python3.5.3 下载python3.5.3.tar.gz ./configure make && make install make的时候发生错误提示INFO: Can't locate Tcl/Tk libs and/or headers 安装tcl 和tk包直接用yum install tcl , yum install tk 安装完毕后任然出错，仔细看python.org/topics/tkinter/给出的指导： You may have to install Tcl and Tk(when using RP ...

2017-05-06 11:10
浏览 1290
评论(1)
分类:开源软件

在window7中使用Intellij IDEA 提交job到Spark Yarn (模式)

博客分类：

Spark

idea spark hadoop yarn

使用window提交到Spark cluster中出现下面错误： Exit code: 1 Exception message: /bin/bash: line 0: fg: no job control Stack trace: ExitCodeException exitCode=1: /bin/bash: line 0: fg: no job control at org.apache.hadoop.util.Shell.runCommand(Shell.java:538) at org.apache.hadoop.util.Shell.run(Shell.java:455) at org ...

2017-05-05 16:39
浏览 2644
评论(0)
分类:企业架构

Hadoop YARN中内存的设置

博客分类：

大数据

hadoop

在hadoop 以yarn运行spark一个很简单的程序时，报错： java.lang.IllegalStateException: Spark context stopped while waiting for backend at org.apache.spark.scheduler.TaskSchedulerImpl.waitBackendReady(TaskSchedulerImpl.scala:614) at org.apache.spark.scheduler.TaskSche ...

2017-05-05 09:25
浏览 1767
评论(0)
分类:行业应用

CentOS yum升级GCC到4.8

博客分类：

Linux

gcc

wget http://people.centos.org/tru/devtools-2/devtools-2.repo mv devtools-2.repo /etc/yum.repos.d yum install devtoolset-2-gcc devtoolset-2-binutils devtoolset-2-gcc-c++ mv /usr/bin/gcc /usr/bin/gcc-4.4.7 mv /usr/bin/g++ /usr/bin/g++-4.4.7 mv /usr/bin/c++ /usr/bin/c++-4.4.7 ln -s /opt/rh/devtoolset- ...

2017-05-04 15:39
浏览 1677
评论(0)
分类:操作系统

大数据常见错误解决方案（转载）

博客分类：

大数据

hadoop scala

大数据常见错误解决方案（转载） 1、用./bin/spark-shell启动spark时遇到异常：java.net.BindException: Can't assign requested address: Service 'sparkDriver' failed after 16 retries! 解决方法：add export SPARK_LOCAL_IP="127.0.0.1" to spark-env.sh 2、java Kafka producer error:ERROR kafka.utils.Utils$ - fetching topic metadata ...

2017-04-28 16:22
浏览 3596
评论(0)
分类:企业架构

Sed详解

博客分类：

Linux

sed 正则表达式脚本

Sed命令调用sed命令有两种形式： * sed [options] 'command' file(s) * sed [options] -f scriptfile file(s) a\ 在当前行后面加入一行文本。 b lable 分支到脚本中带有标记的地方，如果分支不存在则分支到脚本的末尾。 c\ 用� ...

2017-04-27 22:41
浏览 444
评论(0)
分类:操作系统

sed & awk & grep 专题( 转载）

博客分类：

Linux

LInxu

grep, sed 与 awk 相当有用 ! gerp 查找, sed 编辑, awk 根据内容分析并处理. awk(关键字:分析&处理) 一行一行的分析处理 awk '条件类型1{动作1}条件类型2{动作2}' filename, awk 也可以读取来自前一个指令的 standard input 相对于sed常常用于 ...

2017-04-27 21:46
浏览 482
评论(0)
分类:操作系统

Linux 常用命令

博客分类：

Linux

Linxu grep

grep linux grep命令 1.作用 Linux系统中grep命令是一种强大的文本搜索工具，它能使用正则表达式搜索文本，并把匹配的行打印出来。grep全称是Global Regular Expression Print，表示全局正则表达式版本，它的使用权限是所有用户。 2.格式 grep [options] 3.主要参数 [options]主要参数：－c：只输出匹配行的计数。－I：不区分大小写(只适用于单字符)。－h：查询多文件时不显示文件名。－l：查询多文件时只输出包含匹配字符的文件名。－n：显示匹配行及行号。－s：不显示不存在或无匹配文本的错误信息。－v：显示不包 ...

2017-04-27 21:24
浏览 419
评论(0)
分类:操作系统

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

解决conda下载慢的问题

海量数据处理的常用思路和方法(转)

CentOS python升级到3.5(转)

RocketMQ与Kafka对比【转】

Scala 框架选择

mesos下载、准备安装环境、编译以及测试(转)

Python 安装

在window7中使用Intellij IDEA 提交job到Spark Yarn (模式)

Hadoop YARN中内存的设置

CentOS yum升级GCC到4.8

大数据常见错误解决方案（转载）

Sed详解

sed & awk & grep 专题( 转载）

Linux 常用命令

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>