- 浏览: 28083 次
- 性别:
- 来自: 长沙
最新评论
-
wuqi198772:
perl -i.bak -lpe "BEGIN{ ...
批量处理数据 -
朱辉辉33:
打开客户端是在命令提示符里输入telnet localhost ...
socket聊天室之服务器搭建
文章列表
排序算法—python
- 博客分类:
- python
归并排序:
def merge(a, b):
c = []
i, j = 0, 0
while i < len(a) and j < len(b):
if a[i] < b[j]:
c.append(a[i])
i += 1
else:
c.append(b[j])
j += 1
if i == len(a):
c.extend(b[j:])
else:
c.extend(a[i:])
return c
def merge_sort(lists):
if len(lists) & ...
今晚写机器学习回归算法时,需要先预处理一下txt数据,原数据之间隔了不等个空格,需要处理成以逗号分隔,用Python写了一个小脚本批量处理。
原数据 处理后的数据
源代码如下
#!/usr/bin/python
# -*- coding: utf-8 -*-
#为了可以添加中文注释
file = 'C:\Users\zhuhuihui\Desktop\data3.txt' #原始数据目录
file_write = 'C:\Users\zhuhuihui\Desktop\data4.txt' #新写入数据目录
f = open(file,'r') #只读模式打 ...
Python安装完Numpy,SciPy和MatplotLib后,可以成为非常犀利的科研利器。本人搜索诸多安装教程后才找到正确的资源来配置,共享下。
安装环境:64位python2.7
下载http://pan.baidu.com/s/1c1Phqko中三个库的exe,因为MatplotLib的使用需要以Numpy的支持,所以先点击安装Numpy,其次是Scipy,最后是MatplotLib,一路点击next即可。
安装时如果出现了Python 2.7 was not found in the registry的错误信息,则新建一个register.py,复制下 ...
在Eclipse中导入Java程序
在 Eclipse 中导入 Java 程序,分导入Java Project和导入Java源程序 两种情况,简述如下。
情况一:导入 Java Project
Step1 、 File -> Import,
Step2 、选择 Existing Projects into Workspace, 并点击 Next 。
Step3 、点击 Select root directory 后的 Browser ,选择你要导入的 Project ,
点击确定后,你要导入的工程就会出现
堆排序集合了插入排序和归并排序的优点,即时间复杂度为nlogn,同时也具备空间原址性:任何时候都只需要常数个额外的元素空间存储临时变量。
它所采用的(二叉)堆是一个数组,可以看出一个近似的完整二叉树,除了最底层,其他都是充满的,所以我们很容易计算出一个结点i的父结点(i/2)、左右孩子结点(2i,2i+1)。
首先创建一个函数maxHeapify(),它的作用是维护堆的性质,输入为一个数组a和一个下标i,我们假设根结点为left(i)和right(i)的二叉树都是最大堆,但a[i]可能小于其左右子结点,所以要让a[i]的值逐级下降至合适的位置,从而从新构成一个最大堆。在 ...
插入排序的算法原理比较简单,通过构建有序序列来达到排序的目的。比如给出一个数组a,那么首先会将第一个元素作为一个已经排序的序列,然后从第二个元素开始向已经排序的序列(就是第一个元素)从后向前扫描,如果比这个序列中的元素小的话,就插入到相应元素的前面,然后第三个元素再从这两个元素组成的有序序列的后面扫描,找到比它小的位置后就插入,否则结束扫描,以此类推。时间复杂度为O(n*n).
归并排序的时间效率为O(n * log n),归并排序(MergeSort)的基本思想是:将待排序文件看成为n个长度为1的有序子文件,把这些子文件两两归并,使得到「n/2」个长度为2的有序 ...
卫星资源分配模型采用三层结构:子目标任务层、资源层和Agent层。子目标任务层是语义解析部分与资源分配部分的接口,负责接受语义解析后的子目标任务,并管理分配资源后的元任务。资源层包括了所有的卫星实体,是待 ...
基于自然语言的用户卫星应用需求,包括三个部分:任务描绘、应用环境、平台。其中任务描绘是用户本身对需求属性的刻画,应用环境指的是用户对卫星应用范畴的理解,平台则指的是用户期望使用的卫星载荷信息。其中,任务描绘包含任务紧急程度、观察分辨率要求等信息;应用环境包括具体卫星应用的背景、卫星任务的观察范围等信息。
根据现有的不同的航天系统的功能性,我们将子目标任务分为:成像任务、电子探测任务、天基预警任务、测绘保障任务、气象保障任务、通信保障任务和导航定位任务这七类。这七类的任务都可以抽象为形如(任务标识,任务目标,执行约束,任务要求)的形式。因此,语义解析的过程可以描述为将复杂任务分解为 ...
(1)平面式路由(flat routing)算法。网络中的所有节点都处于同一层次上,各节点在网络中获得的路由信息基本相同。优点是不存在特殊的集中控制节点,系统可靠性较高,缺点是没有移动性管理任务,协议的扩展性较差,比较适用于中小网络。
平面式路由协议包括:AODV, DSR, ABR, DSDV,WRP,TORA, FSLS,OSLR, FSR, SSR等路由议。按照具体的寻址规则,一般又可划分为表驱动路由协议和按需路由协议。
表驱动路由协议:节点通过周期性广播路由分组信息,在节点发送数据时,只要有到目的节点的路由存在,就可以直接发送分组,时延小。缺点是移动节点之间要交换整个路由表的 ...
正在使用的内部网关路由协议有以下几种:RIP-1,RIP-2,IGRP,EIGRP,IS-IS和OSPF。其中前3种路由协议采用的是距离向量算法,IS-IS和OSPF采用的是链路状态算法,EIGRP是结合了链路状态和距离矢量型路由选择协议的Cisco私有路由协议。
...
Ad hoc网络是一种多跳、无中心、自组织无线网络,没有固定的基础设施,采用计算机网络的分组交换机制,主机通过分布式协议互联,可快速建立,具有一定的抗自毁性。
它的特性和它所使用的主动的、按需驱动的路 ...
SQL语句的解析顺序
简单的说一个sql语句是按照如下的顺序解析的:
1. FROM FROM后面的表标识了这条语句要查询的数据源。和一些子句如,(1-J1)笛卡尔积,(1-J2)ON过滤,(1-J3)添加外部列,所要应用的对象。FROM过程之后会生成一个虚拟表VT1。
(1-J1)笛卡尔积 这个步骤会计算两个相关联表的笛卡尔积(CROSS JOIN) ,生成虚拟表VT1-J1。
(1-J2)ON过滤 这个步骤基于虚拟表VT1-J1这一个虚拟表进行过滤,过滤出所有满足ON 谓词条件的列,生成虚拟表VT1-J2。
(1-J3)添加外部行 如果使用了外连接,保留表中的不符合ON条件的列也 ...
现在有如下这样一个表:
A表
ID Name time
------------------------------
0001 aaa 2006-11-18
0002 ccc 2006-11-18
0003 eee 2006-11-18
0004 aaa 2006-11-18
0005 eee 2006-11-18
0004 aaa 2006-11-18
0002 ccc 2006-11-19
我现想实现的统计结果如下表
按日期当天(2006-11-18)统计后为:
Name 次数 排名(按出现的次数)
------------------------------- ...
Debug:
1、
A = LOAD '/user/hue/task.txt' USING PigStorage(' ')
AS (col1,col2,col3);
DUMP A;
//输出结果前几行示例:
(>ggsnPDPRecord(21),,)
(-->recordType(0),,)
(-->networkInitiation(1),,)
(-->servedIMSI(3),,)
(-->ggsnAddress(4),,)
(---->iPTextV4Address(2),,)
//只显示了第一列,后面两列是空的,因为第一列和第二、三列之间间隔 ...
今天在诺基亚第一天开始培训大数据,因为之前没接触过Linux,所以这次一起学了,任务量还是蛮大的。
首先下载安装了Xshell软件,然后公司给了账号密码连接上了河南郑州那边的服务器,接下来开始按照给的资料学习,全英文的,头也不讲解,说锻炼我们的学习能力,然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧.
在hdfs下,运行hadoop fs -mkdir /user/hadoop/dir32 //在集群里创建文件夹dir32
在root或者hdfs下,运行hadoop fs -ls /user/hadoop/dir //查看集群下文件夹dir32的文件
在roo ...