`
文章列表
Spark 还有两个很实用的功能。   一个是广播(broadcast)变量。有些数据,如lookup表,可能会在多个作业间反复用到;这些数据比RDD要小得多,不 宜像RDD那样在节点之间划分。解决之道是提供一个新的语言结构——广播变量,来修饰此类数据。Spark运行时把广播变量修饰的内容发到各个节点,并保 存下来,未来再用时无需再送。相比Hadoop的distributed cache,广播内容可以跨作业共享。Spark提交者Mosharaf师从P2P的老法师Ion Stoica,采用了BitTorrent(没错,就是下载电影的那个BT)的简化实现。有兴趣的读者可以参考SIGCOMM' ...
  下面这段在网上拷贝的   宽依赖 和窄依赖   说明该操作是 是否有shuffler 操作   成长(lineage )的来源         最有趣的部分是DAGScheduler。下面详解它的工作过程。RDD的数据结构里很重要的一个域是对父RDD的依赖。如图3所示,有两类依赖:窄(Narrow)依赖和宽(Wide)依赖。    图3 窄依赖和宽依赖 窄依赖指父RDD的每一个分区最多被一个子RDD的分区所用,表现为一个父RDD的分区对应于一个子RDD的分区,和两个父RDD的分区对应于一个子RDD 的分区。图3中,map/filter和union属于第一类,对输入进行协 ...
RDD 值查看   初学习spark ,瞄对象的值可以帮助我们理解    var file = sc.textFile("data.txt")  file.foreach(println)   就可以了
sudo apt-get install build-essential libgtk2.0-dev libjpeg-dev libtiff4-dev libjasper-dev libopenexr-dev cmake python-dev python-numpy python-tk libtbb-dev libeigen2-dev yasm libfaac-dev libopencore-amrnb-dev libopencore-amrwb-dev libtheora-dev libvorbis-dev libxvidcore-dev libx264-dev libqt4-dev li ...
1 修改背景 general editors  text editors backgroudcolor       这个苹果绿,或者称豆沙绿,的具体色彩值是:色调(Hue)84、饱和度(Sat)91、亮度(Lum)205。对应RGB值为(204, 232, 207),对应网页色彩值为#CCE8CF。这个色彩参数,可以根据个人的喜好稍作修改,让自己用电脑的候感觉到最舒服为宜。把浏览器和窗口背景调成这个颜色,据说对眼睛有好处,尤其是用计算机时间比较长的人。     2 默认文件方式 GENERAL  CONTENT TYPES  选择文件方式  在下面选择 对应的文件格式
眼睛的保护色   #CCE8CF

mysql 相关

1、查看链接数明细 mysqladmin -uroot processlist   1、查看链接数明细概要  mysqladmin -uroot status  
vpn  anycall 后linux 无法上网    是由于  cisco anycall 后 改变了 resole.conf   找不到dns  所以无法上网了

eclipse

eclipse +  hadoop     main class org.apache.hadoop.util.RunJar   index  v1.jar key  keyinput    output1000000   vm   -Dproc_jar -Xmx1000m -Dhadoop.log.dir=/home/hadoop/hadoop/hadoop-1.0.4/libexec/../logs -Dhadoop.log.file=hadoop.log -Dhadoop.home.dir=/home/hadoop/hadoop/hadoop-1.0.4/libexec ...

phash jni

phash jni   只需要图片的支持   jni 的支持 需要安装 cimg ./configure  --enable-video-hash=no --enable-audio-hash=no  --enable-java make sudo make install ldconfig 装玩后 phash 出错 报告sh  gm 没有   sh gm no found sudo apt-get install graphicsmagick   安装后 正常
# apt-get update——在修改/etc/apt/sources.list或者/etc/apt/preferences之後运行该命令。此外您需要定期运行这一命令以确保您的软件包列表是最新的。 # apt-get install packagename——安装一个新软件包(参见下文的aptitude) # apt-get remove packagename——卸载一个已安装的软件包(保留配置文件) # apt-get --purge remove packagename——卸载一个已安装的软件包(删除配置文件) 
今天,把windows下的工程导入到了Linux下eclipse中,由于以前的工程代码,都是GBK编码的,而Ubuntu默认是不支持GBK编码的。所以,首先我们要先让Ubuntu支持GBK,方法如下: 修改/var/lib/locales/supported.d/local文件,在文件中添加 zh_CN.GBK GBK zh_CN.GB2312 GB2312 sudo dpkg-reconfigure --force locales 然后在输出的结果中会出现 zh_CN.GB2312 done zh_CN.GBK done   这样, Ubuntu就支持GBK ...
转 http://wangchengtai.blog.hexun.com/39388948_d.html     Unix/Linux 磁盘 I/O 性能监控命令 磁盘 I/O 性能监控指标和调优方法 在介绍磁盘 I/O 监控命令前,我们需要了解磁盘 I/O 性能监控的指标,以及每个指标的所揭示的磁盘某方面的性能。磁盘 I/O 性能监控的指标主要包括: 指标 1:每秒 I/O 数(IOPS 或 tps) 对于磁盘来说,一次磁盘的连续读或者连续写称为一次磁盘 I/O, 磁盘的 IOPS 就是每秒磁盘连续读次数和连续写次数之和。当传输小块不连续数据时,该指标有重要参考意义。 指标 ...
转自 http://nosql-db.com/topic/51556970ca60a10d420148e4 之前装过,忘了 ,找了篇博客 COPY作记录     MongoDB python和MongoDB c++驱动安装   java 简单,略过。python $ git clone git://github.com/mongodb/mongo-python-driver.git pymongo $ cd pymongo/ $ python setup.py install
ubuntu 12.04  vmware player 安装后加载虚拟机死机   异常信息   system_call_fastpath+ 。。。。。。。。。。。 打补丁后运行正常   补丁见附件。。
Global site tag (gtag.js) - Google Analytics