10_Linux基础_简单的文本处理命令

这篇博客介绍了Linux系统中常用的文本处理命令,包括cut用于打印特定字段,grep用于查找匹配字符串,wc进行简单计数,sort进行排序,uniq进行去重,tr删除或转换字符,col转换Tab为空格,join合并相同内容的行,以及paste命令用于不对比数据的文件合并。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录
1.cut 打印每一行的某个字段
2.grep 查找匹配字符串
3.wc 简单计数工具
4.sort 排序
5.uniq 去重
6. tr 删除或转换
7.col命令
8. join 合并

1.cut 打印每一行的某个字段

# 前五个(包含第五个)
$ cut /etc/passwd -c -5

# 前五个之后的(包含第五个)
$ cut /etc/passwd -c 5-

# 第五个
$ cut /etc/passwd -c 5

# 2到5之间的(包含第五个)
$ cut /etc/passwd -c 2-5

2.grep 查找匹配字符串

grep [命令选项]... 用于匹配的表达式 [文件]...

3.wc 简单计数工具

wc 命令用于统计并输出一个文件中行、单词和字节的数目.
在这里插入图片描述
还能分别只输出行数、单词数、字节数、字符数和输入文本中最长一行的字节数

# 行数
$ wc -l /etc/passwd

# 单词数
$ wc -w /etc/passwd

# 字节数
$ wc -c /etc/passwd

# 字符数
$ wc -m /etc/passwd

# 最长行字节数
$ wc -L /etc/passwd

4.sort 排序

cat /etc/passwd | sort			//按字典顺序显示passwd的各行内容

cat /etc/passwd | sort -r		//反转排序

cat /etc/passwd | sort -t':' -k 3	//按特定字段排序
上面的-t参数用于指定字段的分隔符,这里是以":"作为分隔符;
-k 字段号用于指定对哪一个字段进行排序。

在这里插入图片描述
观察第3个字段,即第二个冒号后,是按数字排序的。

5.uniq去重

history | cut -c 8- | cut -d ' ' -f 1 | uniq		//过滤掉重复行

# 输出重复过的行(重复的只输出一个)及重复次数
history | cut -c 8- | cut -d ' ' -f 1 | sort | uniq -dc

# 输出所有重复的行
history | cut -c 8- | cut -d ' ' -f 1 | sort | uniq -D

6. tr 删除或转换

tr [option]...SET1 [SET2]

-d	  删除和set1匹配的字符,注意不是全词匹配也不是按字符顺序匹配
-s    去除set1指定的在输入文本中连续并重复的字符

# 删除 "hello shiyanlou" 中所有的'o','l','h'
$ echo 'hello shiyanlou' | tr -d 'olh'

# 将"hello" 中的ll,去重为一个l
$ echo 'hello' | tr -s 'l'

# 将输入文本,全部转换为大写或小写输出
$ echo 'input some text here' | tr '[:lower:]' '[:upper:]'
# 上面的'[:lower:]' '[:upper:]'你也可以简单的写作'[a-z]' '[A-Z]',当然反过来将大写变小写也是可以的

7.col命令

col 命令可以将Tab换成对等数量的空格键,或反转这个操作。

-x	将Tab转换为空格
-h	将空格转换为Tab(默认选项)

# 查看 /etc/protocols 中的不可见字符,可以看到很多 ^I ,这其实就是 Tab 转义成可见字符的符号
$ cat -A /etc/protocols

# 使用 col -x 将 /etc/protocols 中的 Tab 转换为空格,然后再使用 cat 查看,你发现 ^I 不见了
$ cat /etc/protocols | col -x | cat -A

在这里插入图片描述

8. join 合并

这个命令就是用于将两个文件中包含相同内容的那一行合并在一起。

join [option]... file1 file2

-t	指定分隔符,默认为空格
-i	忽略大小写的差异
-1	指明第一个文件要用哪个字段来对比,默认对比第一个字段
-2	指明第二个文件要用哪个字段来对比,默认对比第一个字段

在这里插入图片描述

9.paste合并

paste这个命令与join 命令类似,它是在不对比数据的情况下,简单地将多个文件合并一起,以Tab隔开。

paste [option] file...

-d	指定合并的分隔符,默认为Tab
-s	不合并到一行,每个文件为一行

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值