前言:
今天小伙伴们对“linux 全文检索”大体比较注意,朋友们都需要了解一些“linux 全文检索”的相关资讯。那么小编同时在网摘上网罗了一些关于“linux 全文检索””的相关文章,希望兄弟们能喜欢,大家一起来了解一下吧!请关注本头条号,每天坚持更新原创干货技术文章。
如需学习视频,请在微信搜索公众号“智传网优”直接开始自助视频学习
1. 前言
本文主要讲解在Linux系统下有哪些搜索文件的命令,以及他们的用法。本文主要讲解find、grep命令,他们是Linux运维工作中最常用的命令工具之一,我几乎每天都要用到他们。
2. `find`搜索命令介绍
find是最常用的Linux之一,用于搜索Linux文件系统上任意的文件,支持搜索任意的文件类型。find命令可以根据文件的类型、文件的时间、文件的权限、文件所属的用户和组、文件大小搜索文件。下面我们就列举一些实用案例,让大家直观了解find命令的使用方法。
2.1 `find`命令的一般形式
man文档中给出的find命令的一般形式为:
find命令的常用形式可以简化为:
find [path…] [expression]
2.2 `find`命令常用选项及实用搜索案例
选项-name
按照文件名查找文件。
在/etc目录及其子目录下面查找名字为zcwyou.txt的文件
[root@zcwyou ~]# find /etc -name zcwyou.txt
在当前目录及其子目录(用“.”表示)中查找任何扩展名为“c”的文件
[root@zcwyou ~]# find . -name "*.c"
选项-user,按照文件属主来查找文件。
使用案例
在
[root@zcwyou ~]# find ~ -user sam –print
按照文件所属的组来查找文件。
在/usr目录下查找属于zcwyou用户组的文件
选项-group
[root@zcwyou ~]# find /usr -group zcwyou –print
选项-mtime -n +n ,按照文件的更改时间来查找文件, - n表示文件更改时间距现在n天以内,+ n表示文件更改时间距现在n天以前。
使用案例
在系统根目录下查找更改时间在5日以内的文件
[root@zcwyou ~]# find / -mtime -5 –print
在/var/adm目录下查找更改时间在3日以前的文件
[root@zcwyou ~]# find /var/adm -mtime +3 -print
选项-nogroup查找无有效所属组的文件,即该文件所属的组在/etc/groups中不存在。
[root@zcwyou ~]# find / -nogroup -print
选项-nouser查找无有效属主的文件,即该文件的属主在/etc/passwd中不存在。
使用案例:在/home目录下查找
[root@zcwyou ~]# find /home -nouser -print
查找更改时间比文件file1新但比文件file2旧的文件。
-newer file1 ! file2
查找某一类型的文件,诸如:
-type
b - 块设备文件。
d - 目录。
c - 字符设备文件。
p - 管道文件。
l - 符号链接文件。
f - 普通文件。
在/etc目录下查找所有的目录
[root@zcwyou ~]# find /etc -type d -print
在当前目录下查找除目录以外的所有类型的文件
[root@zcwyou ~]# find . ! -type d -print
在/etc目录下查找所有的符号链接文件
[root@zcwyou ~]# find /etc -type l -print
-size n:[c] 查找文件长度为n块的文件,带有c时表示文件长度以字节计。
在当前目录下查找文件长度大于1 M字节的文件
[root@zcwyou ~]# find . -size +1000000c print
在/home/apache目录下查找文件长度恰好为100字节的文件
[root@zcwyou ~]# find /home/apache -size 100c -print
在当前目录下查找长度超过10块的文件(一块等于512字节)
[root@zcwyou ~]# find . -size +10 -print
find命令把匹配到的文件传递给xargs命令,而xargs命令每次只获取一部分文件而不是全部,不像-exec选项那样。这样它可以先处理最先获取的一部分文件,然后是下一批,并如此继续下去。
在有些系统中,使用-exec选项会为处理每一个匹配到的文件而发起一个相应的进程,并非将匹配到的文件全部作为参数一次执行;这样在有些情况下就会出现进程过多,系统性能下降的问题,因而效率不高;
而使用xargs命令则只有一个进程。另外,在使用xargs命令时,究竟是一次获取所有的参数,还是分批取得参数,以及每一次获取参数的数目都会根据该命令的选项及系统内核中相应的可调参数来确定。
来看看xargs命令是如何同find命令一起使用的,并给出一些例子。
查找系统中的每一个普通文件,然后使用xargs命令来测试它们分别属于哪类文件
[root@zcwyou ~]# find . -type f -print | xargs file
在整个系统中查找内存信息转储文件(core dump) ,然后把结果保存到/tmp/core.log 文件中:
[root@zcwyou ~]# find / -name "core" -print | xargs echo "" >/tmp/core.log
用grep命令在所有的普通文件中搜索hostname这个词
[root@zcwyou ~]# find . -type f -print | xargs grep "hostname"
删除3天以前的所有东西
[root@zcwyou ~]# find ./ -mtime +3 -print | xargs rm -f -r
删除文件大小为零的文件
[root@zcwyou ~]# find ./ -size 0 | xargs rm -f &
find命令配合使用exec和xargs可以使用户对所匹配到的文件执行几乎所有的命令。
3. 使用强大grep命令搜索文件内容
grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。
3.1 grep命令的一般选项及实例
grep [OPTIONS] PATTERN [FILE…]
grep [OPTIONS] [-e PATTERN | -f FILE] [FILE…]
grep命令用于搜索由Pattern参数指定的模式,并将每个匹配的行写入标准输出中。这些模式是具有限定的正则表达式,它们使用ed或egrep命令样式。如果在File参数中指定了多个名称,grep命令将显示包含匹配行的文件的名称。对 shell 有特殊含义的字符 (HOME目录中查找文件属主为sam的文件¨G2G按照文件所属的组来查找文件。在/usr目录下查找属于zcwyou用户组的文件选项¨C10C¨G3G选项¨C11C−n+n,按照文件的更改时间来查找文件,−n表示文件更改时间距现在n天以内,+n表示文件更改时间距现在n天以前。使用案例在系统根目录下查找更改时间在5日以内的文件¨G4G在/var/adm目录下查找更改时间在3日以前的文件¨G5G选项¨C12C查找无有效所属组的文件,即该文件所属的组在/etc/groups中不存在。¨G6G选项¨C13C查找无有效属主的文件,即该文件的属主在/etc/passwd中不存在。使用案例:在/home目录下查找¨G7G查找更改时间比文件file1新但比文件file2旧的文件。¨C14Cfile1!file2查找某一类型的文件,诸如:¨C15Cb−块设备文件。d−目录。c−字符设备文件。p−管道文件。l−符号链接文件。f−普通文件。在/etc目录下查找所有的目录¨G8G在当前目录下查找除目录以外的所有类型的文件¨G9G在/etc目录下查找所有的符号链接文件¨G10G−sizen:[c]查找文件长度为n块的文件,带有c时表示文件长度以字节计。在当前目录下查找文件长度大于1M字节的文件¨G11G在/home/apache目录下查找文件长度恰好为100字节的文件¨G12G在当前目录下查找长度超过10块的文件(一块等于512字节)¨G13Gfind命令把匹配到的文件传递给xargs命令,而xargs命令每次只获取一部分文件而不是全部,不像−exec选项那样。这样它可以先处理最先获取的一部分文件,然后是下一批,并如此继续下去。在有些系统中,使用−exec选项会为处理每一个匹配到的文件而发起一个相应的进程,并非将匹配到的文件全部作为参数一次执行;这样在有些情况下就会出现进程过多,系统性能下降的问题,因而效率不高;而使用xargs命令则只有一个进程。另外,在使用xargs命令时,究竟是一次获取所有的参数,还是分批取得参数,以及每一次获取参数的数目都会根据该命令的选项及系统内核中相应的可调参数来确定。来看看xargs命令是如何同find命令一起使用的,并给出一些例子。查找系统中的每一个普通文件,然后使用xargs命令来测试它们分别属于哪类文件¨G14G在整个系统中查找内存信息转储文件(coredump),然后把结果保存到/tmp/core.log文件中:¨G15G用grep命令在所有的普通文件中搜索hostname这个词¨G16G删除3天以前的所有东西¨G17G删除文件大小为零的文件¨G18Gfind命令配合使用exec和xargs可以使用户对所匹配到的文件执行几乎所有的命令。![linux命令常用选项及实用搜索案例](−search−command−usage−guide/linux−search−command−usage−guide−03.jpg−1)¨K38Kgrep(globalsearchregularexpression(RE)andprintouttheline,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。![linux使用强大grep命令搜索文件内容](−search−command−usage−guide/linux−search−command−usage−guide−04.png−1)¨K39Kgrep[OPTIONS]PATTERN[FILE...]grep[OPTIONS][−ePATTERN∣−fFILE][FILE...]grep命令用于搜索由Pattern参数指定的模式,并将每个匹配的行写入标准输出中。这些模式是具有限定的正则表达式,它们使用ed或egrep命令样式。如果在File参数中指定了多个名称,grep命令将显示包含匹配行的文件的名称。对shell有特殊含义的字符(, *, [, |, ^, (, ), \ ) 出现在 Pattern参数中时必须带双引号。如果 Pattern参数不是简单字符串,通常必须用单引号将整个模式括起来。在诸如 [a-z], 之类的表达式中,-(减号)cml 可根据当前正在整理的序列来指定一个范围。整理序列可以定义等价的类以供在字符范围中使用。如果未指定任何文件,grep会假定为标准输入。
3.2 grep正则表达式元字符集(基本集)
^ 锚定行的开始 如:'^grep'匹配所有以grep开头的行。
'匹配所有以grep结尾的行。
. 匹配一个非换行符的字符 如:'gr.p'匹配gr后接一个任意字符,然后是p。
匹配零个或多个先前字符 如:' grep'匹配所有一个或多个空格后紧跟grep的行。 .一起用代表任意字符。
[] 匹配一个指定范围内的字符,如'[Gg]rep'匹配Grep和grep。
[^] 匹配一个不在指定范围内的字符,如:'[^A-FH-Z]rep'匹配不包含A-F和H-Z的一个字母开头,紧跟rep的行。
(..) 标记匹配字符,如:'(love)',love被标记为1。
< 锚定单词的开始,如:'<grep'匹配包含以grep开头的单词的行。
\> 锚定单词的结束,如'grep\>'匹配包含以grep结尾的单词的行。
x{m} 连续重复字符x,m次,如:'o{5}'匹配包含连续5个o的行。
x{m,} 连续重复字符x,至少m次,如:'o{5,}'匹配至少连续有5个o的行。
x{m,n} 连续重复字符x,至少m次,不多于n次,如:'o{5,10}'匹配连续5--10个o的行。
\w 匹配一个文字和数字字符,也就是[A-Za-z0-9],如:'G\w*p'匹配以G后跟零个或多个文字或数字字符,然后是p。
\W w的反置形式,匹配一个非单词字符,如点号句号等。\W*则可匹配多个。
\b 单词锁定符,如: '\bgrep\b'只匹配grep,即只能是grep这个单词,两边均为空格。
3.3 grep命令的常用选项及实例
同时显示匹配行上下的?行,如:grep -2 pattern filename同时显示匹配行的上下2行。
-?
打印匹配行前面打印该行所在的块号码。
-b,--byte-offset
只打印匹配的行数,不显示匹配的内容。
-c,--count
从文件中提取模板。空文件中包含0个模板,所以什么都不匹配。
-f File,--file=File
当搜索多个文件时,不显示匹配文件名前缀。
-h,--no-filename
忽略大小写差别。
-i,--ignore-case
取消显示,只返回退出状态。0则表示找到了匹配的行。
-q,--quiet
打印匹配模板的文件清单。
-l,--files-with-matches
打印不匹配模板的文件清单。
-L,--files-without-match
在匹配的行前面打印行号。
-n,--line-number
不显示关于不存在或者无法读取文件的错误信息。
-s,--silent
反检索,只显示不匹配的行。
-v,--revert-match
如果被<和\>引用,就把表达式做为一个单词搜索。
-w,--word-regexp
显示grep软件版本信息。
-V,--version
通过管道过滤ls -l输出的内容,只显示以a开头的行。
[root@zcwyou ~]# ls -l | grep '^a'
显示所有以d开头的文件中包含test的行
[root@zcwyou ~]# grep 'test' d*
显示在aa,bb,cc文件中匹配test的行
[root@zcwyou ~]# grep 'test' aa bb cc
显示所有包含每个字符串至少有5个连续小写字符的字符串的行。
[root@zcwyou ~]# grep '[a-z]' aa
如果west被匹配,则es就被存储到内存中,并标记为1,然后搜索任意个字符(.),这些字符后面紧跟着另外一个es(),找到就显示该行。如果用egrep或grep -E,就不用""号进行转义,直接写成'w(es)t.'就可以了。
[root@zcwyou ~]# grep 'w(es)t.*' aa
不区分大小写地搜索。默认情况区分大小写
[root@zcwyou ~]# grep -i pattern file
只列出匹配的文件名
[root@zcwyou ~]# grep -l pattern files
列出不匹配的文件名
[root@zcwyou ~]# grep -L pattern files
只匹配整个单词,而不是字符串的一部分(如匹配‘magic’,而不是‘magical’),
[root@zcwyou ~]# grep -w pattern files
匹配的上下文分别显示[number]行
[root@zcwyou ~]# grep -C number pattern files
显示匹配 pattern1 或 pattern2 的行
[root@zcwyou ~]# grep pattern1 | pattern2 files
显示既匹配 pattern1 又匹配 pattern2 的行
[root@zcwyou ~]# grep pattern1 files | grep pattern
4. 总结
find命令允许用户搜索文件并对其执行操作。它是“findutils”软件包的一部分,并与所有发行版捆绑在一起。它非常灵活,允许您根据各种条件查找文件和目录。或者,它还允许您对结果采取不同类型的操作。
grep命令用于搜索文本。它在给定文件中搜索包含与给定字符串或单词匹配的行。它是Linux和类Unix系统上最有用的命令之一。让我们看看如何在Linux或类似Unix的系统上使用grep。
本文已同步至博客站,尊重原创,转载时请在正文中附带以下链接:
点击了解更多,快速查看更多的技术文章列表。
标签: #linux 全文检索 #linux 全文检索命令 word #linux文件中搜索 #linux文件中搜索字符串命令是什么 #linux操作系统的查找和搜索命令