龙空技术网

awk与sed序列(5)awk条件、循环和数组

最全钢琴谱 427

前言:

今天看官们对“oracle定义多维数组”可能比较关注,姐妹们都想要学习一些“oracle定义多维数组”的相关内容。那么小编同时在网上搜集了一些关于“oracle定义多维数组””的相关文章,希望各位老铁们能喜欢,大家快快来了解一下吧!

今天介绍一下awk里面的条件、循环和数组相关的基础知识

条件语句

语法如下:

if(expression){ action1; action2;}[else action]

注:expression 为空或者0时,表达式为假条件操作符

awk中提供的条件操作符可以在C语言中找到,它的形式为:

expr?action1:action2

当expr为真时,执行action1,为假时执行action2。

循环

循环是一种用于重复执行一个或者多个操作的结构。在awk中循环结构可以用while、do或for语句指定。

While循环

while循环语法:

while (condition){ action}

Do循环

Do循环语法为:

do actionwhile(condition)

For循环

For循环语法:

for(set_counter;test_counter;increment_counter){ action}

for循环由3个表达式组成:

set_counter:设置计数器变量的初值。

test_counter:描述在循环开始时要测试的条件。

increatment_counter:每次在循环底部递增计数器,且恰好在重新测试test_counter之前。

影响流控制的其他语句

在一个循环中有两个可以影响控制流,break和continue。

break语句顾名思义就是退出循环,这样将不再继续执行循环。

continue语句在到达循环底部之前终止当前的循环,并从循环的顶部开始一个新的循环。

有两个语句能影响主输入循环,next和exit。

next语句能够导致读入下一个输入行,并返回到脚本顶部。这个可以避免对当前输入行执行其他的操作过程。

exit语句是主输入循环退出并将控制转移到END规则,如果END存在的话。如果没有定义END规则,或在END中应用exit语句,则终止脚本的执行。

另外,它可以使用一个表达式作为参数,该表达式将作为awk的退出状态返回,如果没有提供表达式,那么将返回0。如果为exit语句设置一个初值,然后在END中再次调用没有参数的exit,则使用第一个值。

数组

在awk中不必指明数组的大小,只需要为数组指定标识符。

$awk 'BEGIN{arr[1]="ouhanzhong";print arr[1]}'$ouhanzhong

还可以和awk内置变量联系起来用。如NR,记录编号。

关联数组

awk中,所有的数组都是关联数组。关联数组的独特之处在于它的下标可以是一个字符串或者一个数值。

有一个特殊的循环语法可以访问关联数组的所有元素,它是for循环的一个版本

 for(variable in array){ do something with array[variable]}

array是一个数组名字。variable是一个变量,可以将它看作和普通for循环计数器一样递增的临时变量。该变量在每次循环时被赋予一个特殊的下标。

重要的是需要记住awk中的所有数组下标都是字符串类型。即使使用数字作为下标,awk将自动将它们转换为字符串。

测试数组中的成员资格

关键词in也是一个操作符,用在条件表达式中来测试一个下标是否是数组的成员,表达式为:

 item in array

如果array[item]存在则返回1,不存在则返回0。

用split()创建数组

内置函数split()能够将任何字符串分解到数组的元素中。这个函数对于从字段中提取“子字段”是很有用的。

函数split()的语法为:

 n = split(string,array,separator)

string是要被分解到名字为array的元素中的输入字符串。数组的下标从1开始到n,n即为数组中元素的个数。元素根据指定的separate分隔符来分解。

[oracle@centos ~]$ echo "Ou Han Zhong tet ttt"|awk -F' ' '{n=split($0,y," ");print n}'输出:5[oracle@centos ~]$ echo "Ou Han Zhong"|awk -F' ' '{n=split($0,y," ");print y[n-1]}'输出:Han

删除数组元素

awk提供了一个语句用于从数组中删除一个元素。语法是:

 delete array[subscript]

这里的方括号是必须的。这个语句将删除array中下标为subscript的元素。

多维数组

需要注意,awk数组是关联数组,只要通过数组引用它的key,就会自动创建改序列。如下:

[oracle@centos ~]$ awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";if(tB["c"]!="1"){print "no found";};for(k in tB){print k,tB[k];}}'输出:no founda a1b b1c

上面代码 tB[“c”] 会自动创建序列。

awk的多维数组在本质上是一维数组,更确切一点,awk在存储上并不支持多维数组。awk提供了逻辑上模拟二维数组的访问方式。

例如,array[2,4] = 1这样的访问是允许的。awk使用一个特殊的字符串SUBSEP (\034)作为分割字段,在上面的例子中,关联数组array存储的键值实际上是2\0344。

类似一维数组的成员测试,多维数组可以使用if ( (i,j) in array)这样的语法,但是下标必须放置在圆括号中。

类似一维数组的循环访问,多维数组使用 for ( item in array )这样的语法遍历数组。与一维数组不同的是,多维数组必须使用split()函数来访问单独的下标分量。split ( item, subscr, SUBSEP)

[oracle@centos ~]$ awk 'BEGIN{> for(i=1;i<=9;i++){> for(j=1;j<=9;j++){> tarr[i,j]=i*j;> print i,"*",j,"=",tarr[i,j];> }> }> }'1 * 1 = 11 * 2 = 21 * 3 = 31 * 4 = 41 * 5 = 51 * 6 = 61 * 7 = 71 * 8 = 8....9 * 7 = 639 * 8 = 729 * 9 = 81

作为系统变量的数组

awk中提供了两个系统变量,他们是数组。

ARGV

这是一个命令行参数的数组,不包括脚本本身和任何调用awk指定的选项。这个数组中的元素的个数可以从ARGC中获得。数组中的第一个元素的下标是0(和awk中的其他数组不同,而和C一致),最后一个下标是ARGC-1。

ENVIRON

一个环境变量数组,数组中的每个元素时当前环境变量的值,而其下标是环境变量的名字。

命令行参数数组

注意,如果你在shell脚本中调用了awk,命令行的参数将传递给shell而不是传递给awk。你必须将shell脚本的命令行参数,传递给在shell脚本中的awk程序。例如你可以用“$*”将shell脚本中的所有命令行参数传递给awk。如下所示:

awk ' BEGIN{ for(x=0;x<ARGC;==x){ print ARGV[x]; print ARGC; }' $*

在特殊情况下,如果ARGV的元素的值是一个空串(“ “),awk将跳过它并继续处理下一个元素。

环境变量数组

awk 'BEGIN{> for (env in ENVIRON)> print env "=" ENVIRON[env];> }'输出:AWKPATH=.:/usr/share/awkSSH_ASKPASS=/usr/libexec/openssh/gnome-ssh-askpassLANG=en_US.UTF-8HISTSIZE=1000...jpg=01;35:*.gif=01;35:*.bmp=01;35:*.xbm=01;35:*.xpm=01;35:*.png=01;35:*.tif=01;35:ORACLE_SID=ORCL

可以使用变量名作为数组的下标访问任意元素:

ENVIRON["HISTSIZE"]

也可以修改数组ENVRION中的任意元素:

ENVRION["HISTSIZE"]=100

但是这个改变并不改变用户的真实环境。

相关资料

1. sed与awk编程语言

标签: #oracle定义多维数组