基本的
返回值
每个命令都有一个返回值(返回状态或者退出状态)。命令执行成功的返回值总是0
(零值),执行失败的命令,返回一个非0值(错误码)。错误码必须是一个1到255之间的整数。
在编写脚本时,另一个很有用的命令是exit
。这个命令被用来终止当前的执行,并把返回值交给shell。当exit
不带任何参数时,它会终止当前脚本的执行并返回在它之前最后一个执行的命令的返回值。
一个程序运行结束后,shell将其返回值赋值给$?
环境变量。因此$?
变量通常被用来检测一个脚本执行成功与否。
与使用exit
来结束一个脚本的执行类似,我们可以使用return
命令来结束一个函数的执行并将返回值返回给调用者。当然,也可以在函数内部用exit
,这 _不但_ 会中止函数的继续执行,_而且_ 会终止整个程序的执行。
注释
脚本中可以包含 _注释_。注释是特殊的语句,会被shell
解释器忽略。它们以#
开头,到行尾结束。
1 |
|
变量
Bash中没有数据类型。变量只能包含数字或者由一个或多个字符组成的字符串
你可以创建三种变量:局部变量,环境变量以及作为 位置参数 的变量。
局部变量
局部变量 是仅在某个脚本内部有效的变量。它们不能被其他的程序和脚本访问。
局部变量可以用=
声明(作为一种约定,变量名、=
、变量的值之间 不应该 有空格),
其值可以用$
访问到。举个例子:
1 | username="denysdovhan" # 声明变量 |
也可以用local
关键字声明属于某个函数的局部变量,这样声明的变量会在函数结束时消失。
1 | local local_var="I'm a local value" |
环境变量
环境变量 是对当前shell会话内所有的程序或脚本都可见的变量.
创建它们跟创建局部变量类似,但使用的是export
关键字。
1 | export GLOBAL_VAR="I'm a global variable" |
bash中有 非常多 的环境变量。你会非常频繁地遇到它们,这里有一张速查表,记录了在实践中最常见的环境变量。
Variable | Description |
---|---|
$HOME |
当前用户的用户目录 |
$PATH |
用分号分隔的目录列表,shell会到这些目录中查找命令 |
$PWD |
当前工作目录 |
$RANDOM |
0到32767之间的整数 |
$UID |
数值类型,当前用户的用户ID |
$PS1 |
主要系统输入提示符 |
$PS2 |
次要系统输入提示符 |
位置参数
位置参数 是在调用一个函数并传给它参数时创建的变量。下表列出了在函数中,位置参数变量和一些其它的特殊变量以及它们的意义。
Parameter | Description |
---|---|
$0 |
脚本名称 |
$1 … $9 |
第1个到第9个参数列表 |
${10} … ${N} |
第10个到N个参数列表 |
$* or $@ |
除了$0 外的所有位置参数 |
$# |
不包括$0 在内的位置参数的个数 |
$FUNCNAME |
函数名称(仅在函数内部有值) |
在下面的例子中,位置参数为:$0='./script.sh'
,$1='foo'
,$2='bar'
:
./script.sh foo bar
变量可以有 _默认_ 值。我们可以用如下语法来指定默认值:
1 | # 如果变量为空,赋给他们默认值 |
Shell扩展
_扩展_ 发生在一行命令被分成一个个的 记号(tokens) 之后。换言之,扩展是一种执行数学运算的机制,还可以用来保存命令的执行结果,等等。
大括号扩展
大括号扩展让生成任意的字符串成为可能。它跟 文件名扩展 很类似,举个例子:
1 | echo beg{i,a,u}n # begin began begun |
大括号扩展还可以用来创建一个可被循环迭代的区间。
1 | echo {0..5} # 0 1 2 3 4 5 |
命令置换
命令置换允许我们对一个命令求值,并将其值置换到另一个命令或者变量赋值表达式中。当一个命令被1
2
3
4
5
6
7
```bash
now=`date +%T`
# or
now=$(date +%T)
echo $now # 19:08:26
算数扩展
在bash中,执行算数运算是非常方便的。算数表达式必须包在$(( ))
中。算数扩展的格式为:
1 | result=$(( ((10 + 5*3) - 7) / 2 )) |
在算数表达式中,使用变量无需带上$
前缀:
1 | x=4 |
单引号和双引号
单引号和双引号之间有很重要的区别。在双引号中,变量引用或者命令置换是会被展开的.
在单引号中是不会的。双引号中, 对于变量可以扩展, 但是不用于扩展通配符; 单引号都
展开,举个例子:
1 | echo "Your home: $HOME" # Your home: /Users/<username> |
当局部变量和环境变量包含空格时,它们在引号中的扩展要格外注意。随便举个例子,假如我们用echo
来输出用户的输入:
1 | INPUT="A string with strange whitespace." |
调用第一个echo
时给了它5个单独的参数 —— $INPUT被分成了单独的词,echo
在每个词之间打印了一个空格。第二种情况,调用echo
时只给了它一个参数(整个$INPUT的值,包括其中的空格)。
来看一个更严肃的例子:
1 | FILE="Favorite Things.txt" |
尽管这个问题可以通过把FILE重命名成Favorite-Things.txt
来解决,但是,假如这个值来自某个环境变量,来自一个位置参数,或者来自其它命令(find
, cat
, 等等)呢。因此,如果输入 可能 包含空格,务必要用引号把表达式包起来。
数组
跟其它程序设计语言一样,bash中的数组变量给了你引用多个值的能力。在bash中,数组下标也是从0开始,也就是说,第一个元素的下标是0。
跟数组打交道时,要注意一个特殊的环境变量IFS
。IFS,全称 Input Field Separator,保存了数组中元素的分隔符。它的默认值是一个空格IFS=' '
。
数组声明
在bash中,可以通过简单地给数组变量的某个下标赋值来创建一个数组:
1 | fruits[0]=Apple |
数组变量也可以通过复合赋值的方式来创建,比如:
1 | fruits=(Apple Pear Plum) |
数组扩展
单个数组元素的扩展跟普通变量的扩展类似:
1 | echo ${fruits[1]} # Pear |
整个数组可以通过把数字下标换成*
或@
来扩展:
1 | echo ${fruits[*]} # Apple Pear Plum |
上面两行有很重要(也很微妙)的区别,假设某数组元素中包含空格:
1 | fruits[0]=Apple |
为了将数组中每个元素单独一行输出,我们用内建的printf
命令:
1 | printf "+ %s\n" ${fruits[*]} |
为什么Desert
和fig
各占了一行?尝试用引号包起来:
1 | printf "+ %s\n" "${fruits[*]}" |
现在所有的元素都跑去了一行 —— 这不是我们想要的!为了解决这个痛点,${fruits[@]}
闪亮登场:
1 | printf "+ %s\n" "${fruits[@]}" |
在引号内,${fruits[@]}
将数组中的每个元素扩展为一个单独的参数;数组元素中的空格得以保留。
数组切片
除此之外,可以通过 _切片_ 运算符来取出数组中的某一片元素:
1 | echo ${fruits[@]:0:2} # Apple Desert fig |
在上面的例子中,${fruits[@]}
扩展为整个数组,:0:2
取出了数组中从0开始,长度为2的元素。
向数组中添加元素
向数组中添加元素也非常简单。复合赋值在这里显得格外有用。我们可以这样做:
1 | fruits=(Orange "${fruits[@]}" Banana Cherry) |
上面的例子中,${fruits[@]}
扩展为整个数组,并被置换到复合赋值语句中,接着,对数组fruits
的赋值覆盖了它原来的值。
从数组中删除元素
用unset
命令来从数组中删除一个元素:
1 | unset fruits[0] |
流,管道以及序列
Bash有很强大的工具来处理程序之间的协同工作。使用流,我们能将一个程序的输出发送到另一个程序或文件,因此,我们能方便地记录日志或做一些其它我们想做的事。
管道给了我们创建传送带的机会,控制程序的执行成为可能。
学习如何使用这些强大的、高级的工具是非常非常重要的。
流
Bash接收输入,并以字符序列或 字符流 的形式产生输出。这些流能被重定向到文件或另一个流中。
有三个文件描述符:
代码 | 描述符 | 描述 |
---|---|---|
0 |
stdin |
标准输入 |
1 |
stdout |
标准输出 |
2 |
stderr |
标准错误输出 |
重定向让我们可以控制一个命令的输入来自哪里,输出结果到什么地方。这些运算符在控制流的重定向时会被用到:
Operator | Description |
---|---|
> |
重定向输出 |
&> |
重定向输出和错误输出 |
&>> |
以附加的形式重定向输出和错误输出 |
< |
重定向输入 |
<< |
Here文档 语法 |
<<< |
Here字符串 |
以下是一些使用重定向的例子:
1 | # ls的结果将会被写到list.txt中 |
管道
我们不仅能将流重定向到文件中,还能重定向到其它程序中。管道 允许我们把一个程序的输出当做另一个程序的输入。
在下面的例子中,command1
把它的输出发送给了command2
,然后输出被传递到command3
:
command1 | command2 | command3
这样的结构被称作 管道。
在实际操作中,这可以用来在多个程序间依次处理数据。在下面的例子中,ls -l
的输出被发送给了grep
,来打印出扩展名是.md
的文件,它的输出最终发送给了less
:
ls -l | grep .md$ | less
管道的返回值通常是管道中最后一个命令的返回值。shell会等到管道中所有的命令都结束后,才会返回一个值。如果你想让管道中任意一个命令失败后,管道就宣告失败,那么需要用下面的命令设置pipefail选项:
set -o pipefail
命令序列
命令序列是由;
,&
,&&
或者||
运算符分隔的一个或多个管道序列。
如果一个命令以&
结尾,shell将会在一个子shell中异步执行这个命令。换句话说,这个命令将会在后台执行。
以;
分隔的命令将会依次执行:一个接着一个。shell会等待直到每个命令执行完。
1 | # command2 会在 command1 之后执行 |
以&&
和||
分隔的命令分别叫做 _与_ 和 _或_ 序列。
与序列 看起来是这样的:
1 | # 当且仅当command1执行成功(返回0值)时,command2才会执行 |
或序列 是下面这种形式:
1 | # 当且仅当command1执行失败(返回错误码)时,command2才会执行 |
_与_ 或 _或_ 序列的返回值是序列中最后一个执行的命令的返回值。
条件语句
跟其它程序设计语言一样,Bash中的条件语句让我们可以决定一个操作是否被执行。结果取决于一个包在[[ ]]
里的表达式。
条件表达式可以包含&&
和||
运算符,分别对应 _与_ 和 _或_ 。除此之外还有很多有用的表达式。
共有两个不同的条件表达式:if
和case
。
基元和组合表达式
由[[ ]]
(sh
中是[ ]
)包起来的表达式被称作 检测命令 或 基元。这些表达式帮助我们检测一个条件的结果。在下面的表里,为了兼容sh
,我们用的是[ ]
。这里可以找到有关bash中单双中括号区别的答案。
跟文件系统相关:
基元 | 含义 |
---|---|
[ -e FILE ] |
如果FILE 存在 (exists),为真 |
[ -f FILE ] |
如果FILE 存在且为一个普通文件(file),为真 |
[ -d FILE ] |
如果FILE 存在且为一个目录(directory),为真 |
[ -s FILE ] |
如果FILE 存在且非空(size 大于0),为真 |
[ -r FILE ] |
如果FILE 存在且有读权限(readable),为真 |
[ -w FILE ] |
如果FILE 存在且有写权限(writable),为真 |
[ -x FILE ] |
如果FILE 存在且有可执行权限(executable),为真 |
[ -L FILE ] |
如果FILE 存在且为一个符号链接(link),为真 |
[ FILE1 -nt FILE2 ] |
FILE1 比FILE2 新(newer than) |
[ FILE1 -ot FILE2 ] |
FILE1 比FILE2 旧(older than) |
跟字符串相关:
基元 | 含义 |
---|---|
[ -z STR ] |
STR 为空(长度为0,zero) |
[ -n STR ] |
STR 非空(长度非0,non-zero) |
[ STR1 == STR2 ] |
STR1 和STR2 相等 |
[ STR1 != STR2 ] |
STR1 和STR2 不等 |
算数二元运算符:
基元 | 含义 |
---|---|
[ ARG1 -eq ARG2 ] |
ARG1 和ARG2 相等(equal) |
[ ARG1 -ne ARG2 ] |
ARG1 和ARG2 不等(not equal) |
[ ARG1 -lt ARG2 ] |
ARG1 小于ARG2 (less than) |
[ ARG1 -le ARG2 ] |
ARG1 小于等于ARG2 (less than or equal) |
[ ARG1 -gt ARG2 ] |
ARG1 大于ARG2 (greater than) |
[ ARG1 -ge ARG2 ] |
ARG1 大于等于ARG2 (greater than or equal) |
条件语句可以跟 组合表达式 配合使用:
Operation | Effect |
---|---|
[ ! EXPR ] |
如果EXPR 为假,为真 |
[ (EXPR) ] |
返回EXPR 的值 |
[ EXPR1 -a EXPR2 ] |
逻辑 _与_, 如果EXPR1 和(and)EXPR2 都为真,为真 |
[ EXPR1 -o EXPR2 ] |
逻辑 _或_, 如果EXPR1 或(or)EXPR2 为真,为真 |
当然,还有很多有用的基元,在Bash的man页面能很容易找到它们。
使用if
if
在使用上跟其它语言相同。如果中括号里的表达式为真,那么then
和fi
之间的代码会被执行。fi
标志着条件代码块的结束。
1 | # 写成一行 |
同样,我们可以使用if..else
语句,例如:
1 | # 写成一行 |
有些时候,if..else
不能满足我们的要求。别忘了if..elif..else
,使用起来也很方便。
看下面的例子:
1 | if [[ `uname` == "Adam" ]]; then |
使用case
如果你需要面对很多情况,分别要采取不同的措施,那么使用case
会比嵌套的if
更有用。使用case
来解决复杂的条件判断,看起来像下面这样:
1 | case "$extension" in |
在每次循环的过程中,arg
依次被赋值为从elem1
到elemN
。这些值还可以是通配符或者大括号扩展。
当然,我们还可以把for
循环写在一行,但这要求do
之前要有一个分号,就像下面这样:
1 | for i in {1..5}; do echo $i; done |
还有,如果你觉得for..in..do
对你来说有点奇怪,那么你也可以像C语言那样使用for
,比如:
1 | for (( i = 0; i < 10; i++ )); do |
当我们想对一个目录下的所有文件做同样的操作时,for
就很方便了。举个例子,如果我们想把所有的.bash
文件移动到script
文件夹中,并给它们可执行权限,我们的脚本可以这样写:
1 |
|
while
循环
while
循环检测一个条件,只要这个条件为 _真_,就执行一段命令。被检测的条件跟if..then
中使用的基元并无二异。因此一个while
循环看起来会是这样:
1 | while [[ condition ]] |
跟for
循环一样,如果我们把do
和被检测的条件写到一行,那么必须要在do
之前加一个分号。
比如下面这个例子:
1 |
|
until
循环
until
循环跟while
循环正好相反。它跟while
一样也需要检测一个测试条件,但不同的是,只要该条件为 _假_ 就一直执行循环:
1 | until [[ condition ]]; do |
select
循环
select
循环帮助我们组织一个用户菜单。它的语法几乎跟for
循环一致:
1 | select answer in elem1 elem2 ... elemN |
select
会打印elem1..elemN
以及它们的序列号到屏幕上,之后会提示用户输入。通常看到的是$?
(PS3
变量)。用户的选择结果会被保存到answer
中。如果answer
是一个在1..N
之间的数字,那么语句
会被执行,紧接着会进行下一次迭代 —— 如果不想这样的话我们可以使用break
语句。
一个可能的实例可能会是这样:
1 |
|
这个例子,先询问用户他想使用什么包管理器。接着,又询问了想安装什么包,最后执行安装操作。
运行这个脚本,会得到如下输出:
1 | $ ./my_script |
循环控制
我们会遇到想提前结束一个循环或跳过某次循环执行的情况。这些可以使用shell内建的break
和continue
语句来实现。它们可以在任何循环中使用。
break
语句用来提前结束当前循环。我们之前已经见过它了。
continue
语句用来跳过某次迭代。我们可以这么来用它:
1 | for (( i = 0; i < 10; i++ )); do |
运行上面的例子,会打印出所有0到9之间的奇数。
函数
在脚本中,我们可以定义并调用函数。跟其它程序设计语言类似,函数是一个代码块,但有所不同。
bash中,函数是一个命令序列,这个命令序列组织在某个名字下面,即 函数名 。调用函数跟其它语言一样,写下函数名字,函数就会被 _调用_ 。
我们可以这样声明函数:
1 | my_func () { |
我们必须在调用前声明函数。
函数可以接收参数并返回结果 —— 返回值。参数,在函数内部,跟非交互式下的脚本参数处理方式相同 —— 使用位置参数。返回值可以使用return
命令 _返回_ 。
下面这个函数接收一个名字参数,返回0
,表示成功执行。
1 | # 带参数的函数 |
我们之前已经介绍过返回值。不带任何参数的return
会返回最后一个执行的命令的返回值。上面的例子,return 0
会返回一个成功表示执行的值,0
。
Debugging
shell提供了用于debugging脚本的工具。如果我们想以debug模式运行某脚本,可以在其shebang中使用一个特殊的选项:
1 | #!/bin/bash options |
options是一些可以改变shell行为的选项。下表是一些可能对你有用的选项:
Short | Name | Description |
---|---|---|
-f |
noglob | 禁止文件名展开(globbing) |
-i |
interactive | 让脚本以 _交互_ 模式运行 |
-n |
noexec | 读取命令,但不执行(语法检查) |
-t |
— | 执行完第一条命令后退出 |
-v |
verbose | 在执行每条命令前,向stderr 输出该命令 |
-x |
xtrace | 在执行每条命令前,向stderr 输出该命令以及该命令的扩展参数 |
举个例子,如果我们在脚本中指定了-x
例如:
1 | #!/bin/bash -x |
这会向stdout
打印出变量的值和一些其它有用的信息:
1 | $ ./my_script |
有时我们需要debug脚本的一部分。这种情况下,使用set
命令会很方便。这个命令可以启用或禁用选项。使用-
启用选项,+
禁用选项:
1 |
|
更多资料
- Bash的man页面。在Bash可以运行的众多环境中,通过运行
man bash
可以借助帮助系统man
来显示Bash的帮助信息。 - “Bourne-Again SHell manual”