您好,欢迎来到图艺博知识网。
搜索
您的当前位置:首页Linux 大文件如何切割与合并?

Linux 大文件如何切割与合并?

来源:图艺博知识网

往往是因为网络传输的,导致很多时候,我们需要在 Linux 系统下进行大文件的切割。这样将一个大文件切割成为多个小文件,进行传输,传输完毕之后进行合并即可。

  • Linux 大文件的分割与合并

  • Linux 学习–文件分割与合并

Linux下大文件切割与合并


1. 文件切割 - split


# -a: 指定输出文件名的后缀长度(默认为2个:aa,ab…)

# -d: 指定输出文件名的后缀用数字代替

# -l: 行数分割模式(指定每多少行切成一个小文件;默认行数是1000行)

# -b: 二进制分割模式(支持单位:k/m)

# -C: 文件大小分割模式(切割时尽量维持每行的完整性)

split [-a] [-d] [-l <行数>] [-b <字节>] [-C <字节>] [要切割的文件] [输出文件名]

# 行切割文件

$ split -l 300000 users.sql /data/users_

# 使用数字后缀

$ split -d -l 300000 users.sql /data/users_

# 按字节大小分割

$ split -d -b 100m users.sql /data/users_

# 帮助信息

$ split --help

Usage: split [OPTION]… [FILE [PREFIX]]

Output pieces of FILE to PREFIXaa, PREFIXab, …;

default size is 1000 lines, and default PREFIX is ‘x’.

With no FILE, or when FILE is -, read standard input.

Mandatory arguments to long options are mandatory for short options too.

-a, --suffix-length=N   generate suffixes of length N (default 2)            后缀名称的长度(默认为2)

–additional-suffix=SUFFIX  append an additional SUFFIX to file names

-b, --bytes=SIZE        put SIZE bytes per output file                       每个输出文件的字节大小

-C, --line-bytes=SIZE   put at most SIZE bytes of records per output file    每个输出文件的最大字节大小

-d                      use numeric suffixes starting at 0, not alphabetic   使用数字后缀代替字母后缀

–numeric-suffixes[=FROM]  same as -d, but allow setting the start value

-e, --elide-empty-files  do not generate empty output files with ‘-n’        不产生空的输出文件

–filter=COMMAND    write to shell COMMAND; file name is $FILE           写入到shell命令行

-l, --lines=NUMBER      put NUMBER lines/records per output file             设定每个输出文件的行数

-n, --number=CHUNKS     generate CHUNKS output files; see explanation below  产生chunks文件

-t, --separator=SEP     use SEP instead of newline as the record separator;  使用新字符分割

‘\0’ (zero) specifies the NUL character

-u, --unbuffered        immediately copy input to output with ‘-n r/…’     无需缓存

–verbose           print a diagnostic just before each                  显示分割进度

output file is opened

–help     display this help and exit                                    显示帮助信息

–version  output version information and exit                           显示版本信息

The SIZE argument is an integer and optional unit (example: 10K is 10*1024).

Units are K,M,G,T,P,E,Z,Y (powers of 1024) or KB,MB,… (powers of 1000).

CHUNKS may be:

N       split into N files based on size of input

K/N     output Kth of N to stdout

l/N     split into N files without splitting lines/records

l/K/N   output Kth of N to stdout without splitting lines/records

r/N     like ‘l’ but use round robin distribution

r/K/N   likewise but only output Kth of N to stdout

GNU coreutils online help: 

Full documentation at: 

or available locally via: info ‘(coreutils) split invocation’


2. 文件合并 - cat


在 Linux 系统下使用 cat 命令进行多个小文件的合并也很方便

# -n: 显示行号

# -e: 以$字符作为每行的结尾

# -t: 显示TAB字符(^I)

cat [-n] [-e] [-t] [输出文件名]

# 合并文件

$ cat /data/users_* > users.sql

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Java工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Java开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,真正体系化!

如果你觉得这些内容对你有帮助,可以扫码获取!!(备注Java获取)

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuoyibo.net 版权所有 湘ICP备2023021910号-2

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务