`
xdlliutao
  • 浏览: 37862 次
  • 性别: Icon_minigender_2
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

Linux培训教程 linux系统下分割大文件的方法

阅读更多

在linux中分割大文件,比如一个5gb日志文件,需要把它分成多个小文件,分割后以利于普通的文本编辑器读取。

  有时,需要传输20gb的大文件,Linux培训

教程件到另一台服务器,也需要把它分割成多个文件,这样便于传输数据。

  以下通过五个不同的例子,来讲解Linux下分割大文件的方法,供大家参考。

  例1、以每个文件1000行分割

  split命令分割文件成每个文件1000行,并且文件名依次为 [前缀]aa,[前缀]ab, [前缀]ac等,默认的前缀是X,每个文件的行数为1000行。

  命令:

  复制代码代码如下:

  $ split mylog -l 1000

  $ wc -l *

  4450 mylog

  1000 xaa

  1000 xab

  1000 xac

  1000 xad

  450 xae

  例2、以每个文件20MB分割

  分割文件为多个20MB的文件,附带-b选项。

  命令:

  复制代码代码如下:

  $ split -b 20M logdata

  $ ls -lh | tail -n +2

  -rw------- 1 sathiyasathiya 102M Jul 25 18:47 logdata

  -rw------- 1 sathiyasathiya 20M Jul 25 19:20 xaa

  -rw------- 1 sathiyasathiya 20M Jul 25 19:20 xab

  -rw------- 1 sathiyasathiya 20M Jul 25 19:20 xac

  -rw------- 1 sathiyasathiya 20M Jul 25 19:20 xad

  -rw------- 1 sathiyasathiya 20M Jul 25 19:20 xae

  -rw------- 1 sathiyasathiya 1.6M Jul 25 19:20 xaf

  例3、以每个文件50MB指定前缀分割

  使用–bytes选项把文件分割成多个50MB的文件,–bytes类似-b选项,在第二个参数指定前缀。

  命令:

  复制代码代码如下:

  $ split --bytes=50M logdatamydatafile

  $ ls -lh

  total 204M

  -rw------- 1 sathiyasathiya 102M Jul 25 18:47 logdata

  -rw------- 1 sathiyasathiya 50M Jul 25 19:23 mydatafileaa

  -rw------- 1 sathiyasathiya 50M Jul 25 19:23 mydatafileab

  -rw------- 1 sathiyasathiya 1.6M Jul 25 19:23 mydatafileac

  例4、基于行数分割文件

  使用-l选项指定行数来把文件分割成多个行数相同的文件。

  命令:

  复制代码代码如下:

  $ wc -l testfile

  2591 testfile

  $ split -l 1500 testfileimportantlog

  $ wc -l *

  1500 importantlogaa

  1091 importantlogab

  2591 testfile

  例5、以数字后缀命名分割文件

  使用-d选项可以指定后缀为数字,如00,01,02..,而不是aa,ab,ac。

  命令:

  复制代码代码如下:

  $ split -d testfile

  $ ls

  testfile x00 x01 x02

  可用选项

  复制代码代码如下:

  短选项 长选项 选项描述

  -b –bytes=SIZE SIZE 值为每一输出档案的大小,单位为 byte。

  -C –line-bytes=SIZE 每一输出档中,单行的最大 byte 数。

  -d –numeric-suffixes 使用数字作为后缀。

  -l –lines=NUMBER NUMBER 值为每一输出档的列数大小。</p> <p>短选项 长选项 选项描述

  -b –bytes=SIZE SIZE 值为每一输出档案的大小,单位为 byte。

  -C –line-bytes=SIZE 每一输出档中,单行的最大 byte 数。

  -d –numeric-suffixes 使用数字作为后缀。

  -l –lines=NUMBER NUMBER 值为每一输出档的列数大小。


分享到:
评论

相关推荐

    嵌入式系统清华培训教程(书)包括嵌入式硬件,操作系统,LINUX,交叉编译

    - **Linux的文件系统管理**:支持多种文件系统格式。 ##### 4.3 用户界面 - **图形用户界面** - **基本知识**:包括窗口、菜单等元素。 - **关键技术**:实现图形用户界面的技术手段。 - **智能化用户界面** -...

    正点原子配套源码2linux.rar

    正点原子是一家知名的嵌入式系统开发培训机构,他们提供各种教程和实践项目,帮助学习者掌握Linux系统的底层开发技能。这个压缩包可能是他们在教学过程中使用的实例代码或者实验项目,旨在帮助学员理解并实践Linux...

    ARM培训教程

    综上所述,《ARM培训教程》涵盖了嵌入式系统中触屏工作原理、内存管理、调度方式以及交叉编译原理等多个方面的重要知识点。通过对这些内容的学习,可以帮助读者深入了解嵌入式系统的硬件和软件工作原理,掌握嵌入式...

    unix 培训教程

    **UNIX培训教程** UNIX操作系统是计算机科学领域历史悠久且极具影响力的一种多用户、多任务操作系统,由贝尔实验室在1969年开发。本教程旨在帮助初学者和有经验的用户深入理解和掌握UNIX系统的核心概念、命令行界面...

    清华大学ARM培训教材

    - **2.2.5.6 Linux的文件系统管理** - Linux文件系统的特点。 **2.3 用户界面** - **2.3.1 图形用户界面** - **2.3.1.1 基本知识** - GUI的基本元素,如窗口、菜单等。 - **2.3.1.2 关键技术** - GUI开发的...

    清华大学ARM培训教材.pdf

    - **2.2.5.6 Linux的文件系统管理** - Linux如何管理文件系统。 **2.3 用户界面** - **2.3.1 图形用户界面** - **2.3.1.1 基本知识** - GUI的概念和发展历史。 - **2.3.1.2 关键技术** - 窗口管理、菜单、...

    fastran教程以及并行设置集合

    本教程集合将详细介绍Fastran的使用方法,特别是其并行计算的配置和优化,帮助用户充分利用多核处理器资源,提高计算效率。 1. **Fastran基本概念** - **Fastran架构**:Fastran基于有限体积法,采用全隐式时间...

    ruby语言基础教程.pptx(共17页,携程内部培训版)

    - **列出目录**: 使用 `Dir.entries` 或 `Dir.glob` 方法列出目录下的文件和子目录。 - **删除目录**: 使用 `Dir.delete` 方法删除目录及其内容。 以上内容涵盖了从Ruby的基础语法到高级特性的各个方面,对于初学...

    大数据应用案例 大数据培训视频教程-大数据高并发架构实战案例.docx

    学员将学习如何利用虚拟化技术,如CentOS系统下的防火墙配置和转发规则设置,以及LVS(Linux Virtual Server)的主备复制配置,实现负载均衡和高可靠性。此外,还将深入理解Nginx的高级配置,包括动静分离、URL转发...

    常用的shell命令.pptx

    27. **cut**: 分割文件内容。 28. **colrm**: 删除指定列。 29. **sort**: 对文件进行排序,可以结合`awk`一起使用。 30. **top**: 实时查看系统进程状态。 31. **free**: 查看内存使用情况。 32. **uptime**: 显示...

    硬件工程师培训教程09.rar-综合文档

    【硬件工程师培训教程09.rar】是一个综合性的文档,针对硬件工程师的专业技能提升进行深入讲解。这个教程可能包含了多个章节,旨在帮助初入硬件工程领域的人员或者希望进一步提升技术能力的工程师掌握关键知识和技能...

    简介 GIT、Github 和 Atom.pdf

    - **分屏编辑**:支持在一个窗口内分割编辑多个文件。 - **智能提示**:提供了自动补全、语法高亮等功能,提高编程效率。 ### 学习资源推荐 对于初学者来说,学习 Git 可能会有一些挑战,但通过以下资源可以快速...

    Darwin streaming server

    - **HTTP Live Streaming (HLS)**: 是Apple提出的一种基于HTTP的流媒体协议,适用于移动设备和互联网,通过将大媒体文件分割成小段HTTP可下载的TS文件来实现流式传输。 - **RTSP**: 用于控制多媒体数据的播放速度...

    Esri-2010年IDL培训教材(基于IDL7.1)

    - **跨平台**:可以在多个操作系统上运行,如Windows、Linux和Mac OS等。 #### 二、IDL的使用 这部分内容主要介绍了IDL的基本使用方法,包括安装过程、工作台的基本操作以及如何编写IDL程序。 ##### IDL的安装 -...

    (错发,发现不用分割,无法删除,请下载完整版)UBUNTU桌面培训10.04 简体中文PDF版(part1)

    培训前准备和检查 ............................................. 33 教学方法 ..................................................... 34 一些教学提示和指导方针 ....................................... ...

    C#微软培训教材下载

    本教程是微软官方推出的C#培训教材,旨在帮助初学者和有一定基础的学习者深入理解和掌握C#语言的核心概念和技术。 在C#微软培训教材中,你将学习到以下几个关键知识点: 1. **基础语法**:C#的基础包括变量、数据...

    ffmpeg中文文档.zip

    这个“ffmpeg中文文档.zip”压缩包包含了两个文件:ffmpeg中文文档.pdf 和 ffmpeg中文文档.txt,它们提供了FFmpeg的中文指南和教程,帮助用户理解和掌握FFmpeg的使用方法。 1. FFmpeg 基本概念: - FFmpeg 是一套...

Global site tag (gtag.js) - Google Analytics