bash, zsh学习记录

基本的

返回值

每个命令都有一个返回值返回状态或者退出状态)。命令执行成功的返回值总是0(零值),执行失败的命令,返回一个非0值(错误码)。错误码必须是一个1到255之间的整数。

在编写脚本时,另一个很有用的命令是exit。这个命令被用来终止当前的执行,并把返回值交给shell。当exit不带任何参数时,它会终止当前脚本的执行并返回在它之前最后一个执行的命令的返回值。

一个程序运行结束后,shell将其返回值赋值给$?环境变量。因此$?变量通常被用来检测一个脚本执行成功与否。

与使用exit来结束一个脚本的执行类似,我们可以使用return命令来结束一个函数的执行并将返回值返回给调用者。当然,也可以在函数内部用exit,这 _不但_ 会中止函数的继续执行,_而且_ 会终止整个程序的执行。

注释

脚本中可以包含 _注释_。注释是特殊的语句,会被shell解释器忽略。它们以#开头,到行尾结束。

1
2
3
#!/bin/bash
# This script will print your username.
whoami

变量

Bash中没有数据类型。变量只能包含数字或者由一个或多个字符组成的字符串
你可以创建三种变量:局部变量,环境变量以及作为 位置参数 的变量。

局部变量

局部变量 是仅在某个脚本内部有效的变量。它们不能被其他的程序和脚本访问。

局部变量可以用=声明(作为一种约定,变量名、=、变量的值之间 不应该 有空格),
其值可以用$访问到。举个例子:

1
2
3
username="denysdovhan"  # 声明变量
echo $username # 输出变量的值
unset username # 删除变量

也可以用local关键字声明属于某个函数的局部变量,这样声明的变量会在函数结束时消失。

1
local local_var="I'm a local value"

环境变量

环境变量 是对当前shell会话内所有的程序或脚本都可见的变量.
创建它们跟创建局部变量类似,但使用的是export关键字。

1
export GLOBAL_VAR="I'm a global variable"

bash中有 非常多 的环境变量。你会非常频繁地遇到它们,这里有一张速查表,记录了在实践中最常见的环境变量。

Variable Description
$HOME 当前用户的用户目录
$PATH 用分号分隔的目录列表,shell会到这些目录中查找命令
$PWD 当前工作目录
$RANDOM 0到32767之间的整数
$UID 数值类型,当前用户的用户ID
$PS1 主要系统输入提示符
$PS2 次要系统输入提示符

查看更多

位置参数

位置参数 是在调用一个函数并传给它参数时创建的变量。下表列出了在函数中,位置参数变量和一些其它的特殊变量以及它们的意义。

Parameter Description
$0 脚本名称
$1 … $9 第1个到第9个参数列表
${10} … ${N} 第10个到N个参数列表
$* or $@ 除了$0外的所有位置参数
$# 不包括$0在内的位置参数的个数
$FUNCNAME 函数名称(仅在函数内部有值)

在下面的例子中,位置参数为:$0='./script.sh'$1='foo'$2='bar'

./script.sh foo bar

变量可以有 _默认_ 值。我们可以用如下语法来指定默认值:

1
2
3
4
5
 # 如果变量为空,赋给他们默认值
: ${VAR:='default'}
: ${$1:='first'}
# 或者
FOO=${FOO:-'default'}

Shell扩展

_扩展_ 发生在一行命令被分成一个个的 记号(tokens) 之后。换言之,扩展是一种执行数学运算的机制,还可以用来保存命令的执行结果,等等。

shell扩展的更多细节

大括号扩展

大括号扩展让生成任意的字符串成为可能。它跟 文件名扩展 很类似,举个例子:

1
echo beg{i,a,u}n # begin began begun

大括号扩展还可以用来创建一个可被循环迭代的区间。

1
2
echo {0..5} # 0 1 2 3 4 5
echo {00..8..2} # 00 02 04 06 08

命令置换

命令置换允许我们对一个命令求值,并将其值置换到另一个命令或者变量赋值表达式中。当一个命令被

```或`$()`包围时,命令置换将会执行。举个例子:
1
2
3
4
5
6
7

```bash
now=`date +%T`
# or
now=$(date +%T)

echo $now # 19:08:26

算数扩展

在bash中,执行算数运算是非常方便的。算数表达式必须包在$(( ))中。算数扩展的格式为:

1
2
result=$(( ((10 + 5*3) - 7) / 2 ))
echo $result # 9

在算数表达式中,使用变量无需带上$前缀:

1
2
3
4
5
x=4
y=7
echo $(( x + y )) # 11
echo $(( ++x + y++ )) # 12
echo $(( x + y )) # 13

单引号和双引号

单引号和双引号之间有很重要的区别。在双引号中,变量引用或者命令置换是会被展开的.
在单引号中是不会的。双引号中, 对于变量可以扩展, 但是不用于扩展通配符; 单引号都
展开,举个例子:

1
2
echo "Your home: $HOME" # Your home: /Users/<username>
echo 'Your home: $HOME' # Your home: $HOME

当局部变量和环境变量包含空格时,它们在引号中的扩展要格外注意。随便举个例子,假如我们用echo来输出用户的输入:

1
2
3
INPUT="A string  with   strange    whitespace."
echo $INPUT # A string with strange whitespace.
echo "$INPUT" # A string with strange whitespace.

调用第一个echo时给了它5个单独的参数 —— $INPUT被分成了单独的词,echo在每个词之间打印了一个空格。第二种情况,调用echo时只给了它一个参数(整个$INPUT的值,包括其中的空格)。

来看一个更严肃的例子:

1
2
3
FILE="Favorite Things.txt"
cat $FILE # 尝试输出两个文件: `Favorite` 和 `Things.txt`
cat "$FILE" # 输出一个文件: `Favorite Things.txt`

尽管这个问题可以通过把FILE重命名成Favorite-Things.txt来解决,但是,假如这个值来自某个环境变量,来自一个位置参数,或者来自其它命令(find, cat, 等等)呢。因此,如果输入 可能 包含空格,务必要用引号把表达式包起来。

数组

跟其它程序设计语言一样,bash中的数组变量给了你引用多个值的能力。在bash中,数组下标也是从0开始,也就是说,第一个元素的下标是0。

跟数组打交道时,要注意一个特殊的环境变量IFSIFS,全称 Input Field Separator,保存了数组中元素的分隔符。它的默认值是一个空格IFS=' '

数组声明

在bash中,可以通过简单地给数组变量的某个下标赋值来创建一个数组:

1
2
3
fruits[0]=Apple
fruits[1]=Pear
fruits[2]=Plum

数组变量也可以通过复合赋值的方式来创建,比如:

1
fruits=(Apple Pear Plum)

数组扩展

单个数组元素的扩展跟普通变量的扩展类似:

1
echo ${fruits[1]} # Pear

整个数组可以通过把数字下标换成*@来扩展:

1
2
echo ${fruits[*]} # Apple Pear Plum
echo ${fruits[@]} # Apple Pear Plum

上面两行有很重要(也很微妙)的区别,假设某数组元素中包含空格:

1
2
3
fruits[0]=Apple
fruits[1]="Desert fig"
fruits[2]=Plum

为了将数组中每个元素单独一行输出,我们用内建的printf命令:

1
2
3
4
5
printf "+ %s\n" ${fruits[*]}
# + Apple
# + Desert
# + fig
# + Plum

为什么Desertfig各占了一行?尝试用引号包起来:

1
2
printf "+ %s\n" "${fruits[*]}"
# + Apple Desert fig Plum

现在所有的元素都跑去了一行 —— 这不是我们想要的!为了解决这个痛点,${fruits[@]}闪亮登场:

1
2
3
4
printf "+ %s\n" "${fruits[@]}"
# + Apple
# + Desert fig
# + Plum

在引号内,${fruits[@]}将数组中的每个元素扩展为一个单独的参数;数组元素中的空格得以保留。

数组切片

除此之外,可以通过 _切片_ 运算符来取出数组中的某一片元素:

1
echo ${fruits[@]:0:2} # Apple Desert fig

在上面的例子中,${fruits[@]}扩展为整个数组,:0:2取出了数组中从0开始,长度为2的元素。

向数组中添加元素

向数组中添加元素也非常简单。复合赋值在这里显得格外有用。我们可以这样做:

1
2
fruits=(Orange "${fruits[@]}" Banana Cherry)
echo ${fruits[@]} # Orange Apple Desert fig Plum Banana Cherry

上面的例子中,${fruits[@]}扩展为整个数组,并被置换到复合赋值语句中,接着,对数组fruits的赋值覆盖了它原来的值。

从数组中删除元素

unset命令来从数组中删除一个元素:

1
2
unset fruits[0]
echo ${fruits[@]} # Apple Desert fig Plum Banana Cherry

流,管道以及序列

Bash有很强大的工具来处理程序之间的协同工作。使用流,我们能将一个程序的输出发送到另一个程序或文件,因此,我们能方便地记录日志或做一些其它我们想做的事。

管道给了我们创建传送带的机会,控制程序的执行成为可能。

学习如何使用这些强大的、高级的工具是非常非常重要的。

Bash接收输入,并以字符序列或 字符流 的形式产生输出。这些流能被重定向到文件或另一个流中。

有三个文件描述符:

代码 描述符 描述
0 stdin 标准输入
1 stdout 标准输出
2 stderr 标准错误输出

重定向让我们可以控制一个命令的输入来自哪里,输出结果到什么地方。这些运算符在控制流的重定向时会被用到:

Operator Description
> 重定向输出
&> 重定向输出和错误输出
&>> 以附加的形式重定向输出和错误输出
< 重定向输入
<< Here文档 语法
<<< Here字符串

以下是一些使用重定向的例子:

1
2
3
4
5
6
7
8
9
10
11
# ls的结果将会被写到list.txt中
ls -l > list.txt

# 将输出附加到list.txt中
ls -a >> list.txt

# 所有的错误信息会被写到errors.txt中
grep da * 2> errors.txt

# 从errors.txt中读取输入
less < errors.txt

管道

我们不仅能将流重定向到文件中,还能重定向到其它程序中。管道 允许我们把一个程序的输出当做另一个程序的输入。

在下面的例子中,command1把它的输出发送给了command2,然后输出被传递到command3

command1 | command2 | command3

这样的结构被称作 管道

在实际操作中,这可以用来在多个程序间依次处理数据。在下面的例子中,ls -l的输出被发送给了grep,来打印出扩展名是.md的文件,它的输出最终发送给了less

ls -l | grep .md$ | less

管道的返回值通常是管道中最后一个命令的返回值。shell会等到管道中所有的命令都结束后,才会返回一个值。如果你想让管道中任意一个命令失败后,管道就宣告失败,那么需要用下面的命令设置pipefail选项:

set -o pipefail

命令序列

命令序列是由;&&&或者||运算符分隔的一个或多个管道序列。

如果一个命令以&结尾,shell将会在一个子shell中异步执行这个命令。换句话说,这个命令将会在后台执行。

;分隔的命令将会依次执行:一个接着一个。shell会等待直到每个命令执行完。

1
2
3
4
5
6
# command2 会在 command1 之后执行
command1 ; command2

# 等同于这种写法
command1
command2

&&||分隔的命令分别叫做 _与_ 和 _或_ 序列。

与序列 看起来是这样的:

1
2
# 当且仅当command1执行成功(返回0值)时,command2才会执行
command1 && command2

或序列 是下面这种形式:

1
2
# 当且仅当command1执行失败(返回错误码)时,command2才会执行
command1 || command2

_与_ 或 _或_ 序列的返回值是序列中最后一个执行的命令的返回值。

条件语句

跟其它程序设计语言一样,Bash中的条件语句让我们可以决定一个操作是否被执行。结果取决于一个包在[[ ]]里的表达式。

条件表达式可以包含&&||运算符,分别对应 _与_ 和 _或_ 。除此之外还有很多有用的表达式

共有两个不同的条件表达式:ifcase

基元和组合表达式

[[ ]]sh中是[ ])包起来的表达式被称作 检测命令基元。这些表达式帮助我们检测一个条件的结果。在下面的表里,为了兼容sh,我们用的是[ ]。这里可以找到有关bash中单双中括号区别的答案。

跟文件系统相关:

基元 含义
[ -e FILE ] 如果FILE存在 (exists),为真
[ -f FILE ] 如果FILE存在且为一个普通文件(file),为真
[ -d FILE ] 如果FILE存在且为一个目录(directory),为真
[ -s FILE ] 如果FILE存在且非空(size 大于0),为真
[ -r FILE ] 如果FILE存在且有读权限(readable),为真
[ -w FILE ] 如果FILE存在且有写权限(writable),为真
[ -x FILE ] 如果FILE存在且有可执行权限(executable),为真
[ -L FILE ] 如果FILE存在且为一个符号链接(link),为真
[ FILE1 -nt FILE2 ] FILE1FILE2新(newer than)
[ FILE1 -ot FILE2 ] FILE1FILE2旧(older than)

跟字符串相关:

基元 含义
[ -z STR ] STR为空(长度为0,zero)
[ -n STR ] STR非空(长度非0,non-zero)
[ STR1 == STR2 ] STR1STR2相等
[ STR1 != STR2 ] STR1STR2不等

算数二元运算符:

基元 含义
[ ARG1 -eq ARG2 ] ARG1ARG2相等(equal)
[ ARG1 -ne ARG2 ] ARG1ARG2不等(not equal)
[ ARG1 -lt ARG2 ] ARG1小于ARG2less than)
[ ARG1 -le ARG2 ] ARG1小于等于ARG2less than or equal)
[ ARG1 -gt ARG2 ] ARG1大于ARG2greater than)
[ ARG1 -ge ARG2 ] ARG1大于等于ARG2greater than or equal)

条件语句可以跟 组合表达式 配合使用:

Operation Effect
[ ! EXPR ] 如果EXPR为假,为真
[ (EXPR) ] 返回EXPR的值
[ EXPR1 -a EXPR2 ] 逻辑 _与_, 如果EXPR1和(and)EXPR2都为真,为真
[ EXPR1 -o EXPR2 ] 逻辑 _或_, 如果EXPR1或(or)EXPR2为真,为真

当然,还有很多有用的基元,在Bash的man页面能很容易找到它们。

使用if

if在使用上跟其它语言相同。如果中括号里的表达式为真,那么thenfi之间的代码会被执行。fi标志着条件代码块的结束。

1
2
3
4
5
6
7
# 写成一行
if [[ 1 -eq 1 ]]; then echo "true"; fi

# 写成多行
if [[ 1 -eq 1 ]]; then
echo "true"
fi

同样,我们可以使用if..else语句,例如:

1
2
3
4
5
6
7
8
9
# 写成一行
if [[ 2 -ne 1 ]]; then echo "true"; else echo "false"; fi

# 写成多行
if [[ 2 -ne 1 ]]; then
echo "true"
else
echo "false"
fi

有些时候,if..else不能满足我们的要求。别忘了if..elif..else,使用起来也很方便。

看下面的例子:

1
2
3
4
5
6
7
if [[ `uname` == "Adam" ]]; then
echo "Do not eat an apple!"
elif [[ `uname` == "Eva" ]]; then
echo "Do not take an apple!"
else
echo "Apples are delicious!"
fi

使用case

如果你需要面对很多情况,分别要采取不同的措施,那么使用case会比嵌套的if更有用。使用case来解决复杂的条件判断,看起来像下面这样:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
case "$extension" in
"jpg"|"jpeg")
echo "It's image with jpeg extension."
;;
"png")
echo "It's image with png extension."
;;
"gif")
echo "Oh, it's a giphy!"
;;
*)
echo "Woops! It's not image!"
;;
esac
`sh中的循环也是只要控制条件为真就一直迭代执行的代码块。

Bash中有四种循环:`for`,`while`,`until`和`select`。

## `for`循环

`for`与它在C语言中的姊妹非常像。看起来是这样:

```bash
for arg in elem1 elem2 ... elemN
do
# 语句
done

在每次循环的过程中,arg依次被赋值为从elem1elemN。这些值还可以是通配符或者大括号扩展

当然,我们还可以把for循环写在一行,但这要求do之前要有一个分号,就像下面这样:

1
for i in {1..5}; do echo $i; done

还有,如果你觉得for..in..do对你来说有点奇怪,那么你也可以像C语言那样使用for,比如:

1
2
3
for (( i = 0; i < 10; i++ )); do
echo $i
done

当我们想对一个目录下的所有文件做同样的操作时,for就很方便了。举个例子,如果我们想把所有的.bash文件移动到script文件夹中,并给它们可执行权限,我们的脚本可以这样写:

1
2
3
4
5
6
#!/bin/bash

for FILE in $HOME/*.bash; do
mv "$FILE" "${HOME}/scripts"
chmod +x "${HOME}/scripts/${FILE}"
done

while循环

while循环检测一个条件,只要这个条件为 _真_,就执行一段命令。被检测的条件跟if..then中使用的基元并无二异。因此一个while循环看起来会是这样:

1
2
3
4
while [[ condition ]]
do
# 语句
done

for循环一样,如果我们把do和被检测的条件写到一行,那么必须要在do之前加一个分号。

比如下面这个例子:

1
2
3
4
5
6
7
8
#!/bin/bash

# 0到9之间每个数的平方
x=0
while [[ $x -lt 10 ]]; do # x小于10
echo $(( x * x ))
x=$(( x + 1 )) # x加1
done

until循环

until循环跟while循环正好相反。它跟while一样也需要检测一个测试条件,但不同的是,只要该条件为 _假_ 就一直执行循环:

1
2
3
until [[ condition ]]; do
# 语句
done

select循环

select循环帮助我们组织一个用户菜单。它的语法几乎跟for循环一致:

1
2
3
4
select answer in elem1 elem2 ... elemN
do
# 语句
done

select会打印elem1..elemN以及它们的序列号到屏幕上,之后会提示用户输入。通常看到的是$?PS3变量)。用户的选择结果会被保存到answer中。如果answer是一个在1..N之间的数字,那么语句会被执行,紧接着会进行下一次迭代 —— 如果不想这样的话我们可以使用break语句。

一个可能的实例可能会是这样:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
#!/bin/bash

PS3="Choose the package manager: "
select ITEM in bower npm gem pip
do
echo -n "Enter the package name: " && read PACKAGE
case $ITEM in
bower) bower install $PACKAGE ;;
npm) npm install $PACKAGE ;;
gem) gem install $PACKAGE ;;
pip) pip install $PACKAGE ;;
esac
break # 避免无限循环
done

这个例子,先询问用户他想使用什么包管理器。接着,又询问了想安装什么包,最后执行安装操作。

运行这个脚本,会得到如下输出:

1
2
3
4
5
6
7
8
$ ./my_script
1) bower
2) npm
3) gem
4) pip
Choose the package manager: 2
Enter the package name: bash-handbook
<installing bash-handbook>

循环控制

我们会遇到想提前结束一个循环或跳过某次循环执行的情况。这些可以使用shell内建的breakcontinue语句来实现。它们可以在任何循环中使用。

break语句用来提前结束当前循环。我们之前已经见过它了。

continue语句用来跳过某次迭代。我们可以这么来用它:

1
2
3
4
for (( i = 0; i < 10; i++ )); do
if [[ $(( i % 2 )) -eq 0 ]]; then continue; fi
echo $i
done

运行上面的例子,会打印出所有0到9之间的奇数。

函数

在脚本中,我们可以定义并调用函数。跟其它程序设计语言类似,函数是一个代码块,但有所不同。

bash中,函数是一个命令序列,这个命令序列组织在某个名字下面,即 函数名 。调用函数跟其它语言一样,写下函数名字,函数就会被 _调用_ 。

我们可以这样声明函数:

1
2
3
4
5
my_func () {
# 语句
}

my_func # 调用 my_func

我们必须在调用前声明函数。

函数可以接收参数并返回结果 —— 返回值。参数,在函数内部,跟非交互式下的脚本参数处理方式相同 —— 使用位置参数。返回值可以使用return命令 _返回_ 。

下面这个函数接收一个名字参数,返回0,表示成功执行。

1
2
3
4
5
6
7
8
9
10
11
12
# 带参数的函数
greeting () {
if [[ -n $1 ]]; then
echo "Hello, $1!"
else
echo "Hello, unknown!"
fi
return 0
}

greeting Denys # Hello, Denys!
greeting # Hello, unknown!

我们之前已经介绍过返回值。不带任何参数的return会返回最后一个执行的命令的返回值。上面的例子,return 0会返回一个成功表示执行的值,0

Debugging

shell提供了用于debugging脚本的工具。如果我们想以debug模式运行某脚本,可以在其shebang中使用一个特殊的选项:

1
#!/bin/bash options

options是一些可以改变shell行为的选项。下表是一些可能对你有用的选项:

Short Name Description
-f noglob 禁止文件名展开(globbing)
-i interactive 让脚本以 _交互_ 模式运行
-n noexec 读取命令,但不执行(语法检查)
-t 执行完第一条命令后退出
-v verbose 在执行每条命令前,向stderr输出该命令
-x xtrace 在执行每条命令前,向stderr输出该命令以及该命令的扩展参数

举个例子,如果我们在脚本中指定了-x例如:

1
2
3
4
5
#!/bin/bash -x

for (( i = 0; i < 3; i++ )); do
echo $i
done

这会向stdout打印出变量的值和一些其它有用的信息:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
$ ./my_script
+ (( i = 0 ))
+ (( i < 3 ))
+ echo 0
0
+ (( i++ ))
+ (( i < 3 ))
+ echo 1
1
+ (( i++ ))
+ (( i < 3 ))
+ echo 2
2
+ (( i++ ))
+ (( i < 3 ))

有时我们需要debug脚本的一部分。这种情况下,使用set命令会很方便。这个命令可以启用或禁用选项。使用-启用选项,+禁用选项:

1
2
3
4
5
6
7
#!/bin/bash

echo "xtrace is turned off"
set -x
echo "xtrace is enabled"
set +x
echo "xtrace is turned off again"

更多资料

  • Bash的man页面。在Bash可以运行的众多环境中,通过运行man bash可以借助帮助系统man来显示Bash的帮助信息。
  • “Bourne-Again SHell manual”