## 定义函数

**什么是函数**

**定义**：为实现一个操作或特定功能而集合在一起的语句集。

**好处**：避免代码复制带来的错误或漏洞，不仅可以实现代码的复用，还可以保证代码的一致性。

**如何定义函数**

<div align=center>
<img width="550" height="550" src="https://raw.githubusercontent.com/zhangjianzhang/programming_basics/master/files/codes/imgs/function.png?raw=true">
</div>

定义函数：函数头，函数体

- 函数头为`def max(a, b)`

- 函数体为：

```python
if a > b:
  return a
else:
  retur
```

函数头：函数名，参数列表

- 函数名为`max`

- 参数列表为`(a, b)`

函数体：缩进语句块，返回值（return）

- 缩进语句块，缩进正确才能对齐

- 返回值为`a`或`b`

<b><font color=blue>注意：</font></b>

- 即使函数没有参数，也要保留括号；

- 没有`return`语句，则默认返回空值`None`；

- 注意**冒号**，**缩进**，**对齐**三原则

**调用函数**

对于一个函数，可以通过`函数名(参数列表)`这样的语法来调用函数；

如果函数有返回值，则可以在函数调用的同时将返回值传递出来，此时这个函数调用可以当作一个值来处理；

函数也可以通过一条语句调用而不接收任何值，这种情况一般应用于无返回值的函数，实际上，如果函数有返回值，也可以当作语句被调用，此时函数返回值会被忽略；

`main`函数：一般作为程序的入口函数。

<b><font color=Chocolate>拓展学习：</font></b>

- <a href="https://www.liaoxuefeng.com/wiki/1016959663602400/1017455068170048" target="_blank">使用模块</a>

- <a href="https://www.cnblogs.com/yymn/p/11299805.html" target="_blank">python全局变量引用与修改</a>

In [1]:
# 定义一个求矩形面积的函数

def compute_area(width, height):
    area = width * height
    return area

In [2]:
# 定义main函数

def main():
    width = 3
    height = 9
    # 调用compute_area函数
    # compute_area函数有返回值
    # 调用该函数时，会将其返回值传递出来
    # 此处我们把其返回值赋值给变量area
    area = compute_area(3, 9)
    print("The area of the square is {}".format(area))

In [3]:
# 调用main函数

# 函数也可以通过一条语句调用而不接收任何值
# 通常函数没有返回值的时候
# 我们会像下面一样调用函数
# 即使有返回值（就是函数里面有return语句）
# 如果你接下来不用它的返回值
# 你也可以这样调用哦
main()

The area of the square is 27


## 变量的作用域

**局部变量**：在函数内部定义的变量称为局部变量，局部变量只能在函数内部被访问，其作用域从**创建变量的地方开始**，到包含该局部变量的**函数结束为止**。

函数`compute_area`和函数`main`中的变量`area`就是局部变量，除了其作用域，该变量便不可被调用。

In [4]:
# 在局部变量的作用域外调用，会出错哦
# print(area)

**全局变量**：在所有函数之外创建的变量被称为全局变量，可以被所有函数访问，全局变量可以在程序的任意位置访问，而如果试图在作用域外访问局部变量就会造成错误。

In [5]:
# 此处定义的a就是一个全局变量
a = 0

In [6]:
# 定义一个函数cool
def cool():
    global a  # “呼叫”全局变量，其实正规翻译是“声明全局变量”
    a += 1
    return a

In [7]:
for i in range(10):
    print(cool())

1
2
3
4
5
6
7
8
9
10


In [8]:
# 定义一个函数not_cool
def not_cool():
    # 此处要修改全局变量a，但是没有“呼叫”，调用该函数会出错哦
    # 因为此时会把a作为一个局部变量处理
    # 那么a作为一个局部变量，被创建了吗，没有吧
    # 所以会报错local variable 'a' referenced before assignment
    a += 1
    return a

In [9]:
# 函数内修改全局变量，但是没有“呼叫”，所以会出错哦
# for i in range(10):
#     print(not_cool())

In [10]:
# 定义一个函数another_cool
def another_cool():
    # 此处没“呼叫”全局变量，那么默认会把a作为一个局部变量对待
    # 所以此处创建了一个局部变量a
    a = 100
    a += 1
    return a

In [11]:
# 局部变量的作用域是 创建处-至-函数结束处
# 所以调用10次，每次都是打印101
for i in range(10):
    print(another_cool())

101
101
101
101
101
101
101
101
101
101


In [12]:
# 调用一下全局变量看看
# 上面我们呼叫过一次全局变量a
# 然后对它进行了修改
# 你觉得此处的a的值是什么

# a

通过上面的小栗子，可以看出局部变量和全局变量是可以重名的，但是<b><font color=blue>全局变量和局部变量尽量，不要，不要，不要，重名</font></b>

<b><font color=red>思考题：</font></b>如何在函数内部定义一个全局变量

**答案**：函数内部只能定义局部变量，不能定义全局变量；但可以声明全局变量（也就是用 global），`global`的语法是`global var_name`，不能在声明的时候赋值。

In [13]:
# 定义一个全局变量global_list
global_list = []

In [14]:
# 定义一个函数very_cool
def very_cool(item):
    global_list.append(item) # del global_list 就是报错了哦
    return global_list

In [15]:
for i in range(10):
    print(very_cool(i))

[0]
[0, 1]
[0, 1, 2]
[0, 1, 2, 3]
[0, 1, 2, 3, 4]
[0, 1, 2, 3, 4, 5]
[0, 1, 2, 3, 4, 5, 6]
[0, 1, 2, 3, 4, 5, 6, 7]
[0, 1, 2, 3, 4, 5, 6, 7, 8]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


<b><font color=blue>注意：</font></b>引用全局变量，不需要`golbal`声明，修改全局变量，需要使用`global`声明，特别地，**列表、字典**等如果只是**修改其中元素的值**，可以直接使用全局变量，不需要`global`声明。

<b><font color=blue>再强调一遍，平时在jupyter-notebook里写的代码，函数外面的一般都是全局变量，所以，为了避免不必要的错误，请你：</font></b>

- **局部变量和全局变量尽可能不要重名**

- **不要在函数里修改全局变量**

- **尽量不要在函数里访问全局变量**

## 函数的参数

**形式参数（形参）**：在`def`语句中，位于函数名后面的变量通常称为形参。

**实际参数（实参）**：调用函数时提供的**值**。

```python
def change(my_obj):
    my_obj *= 2
    return my_obj


result = change(2)

a = 10

result = change(a)

result = change([1, 2])

b = [1, 2]

result = change(b)
```

上面代码中`my_obj`是形参，`2`和`[1, 2]`是实参。

### 基本的参数传递机制

- 值传递：在调用函数时将实际参数复制一份传递到函数中，这样在函数中如果对参数进行修改，将不会影响到实际参数。

- 引用传递：在调用函数时将实际参数的地址直接传递到函数中，那么在函数中对参数所进行的修改，将影响到实际参数。

### Python的参数传递机制：传对象引用

需要对Python的对象按照内容是否可变划分为可变对象和不可变对象。所谓可变对象指的是对象的内容是可变的，而不可变对象指的是对象内容不可变。

- **传不可变对象**，如数字（int、float），布尔值（boolean），元组（tuple），字符串（string）

- **传可变对象**，如列表（list），字典（dict），集合（set）

In [16]:
def increament_int(x):
    x += 1

In [17]:
def increament_list(x):
    x += [1]

In [18]:
a = 3
b = [2, 3, 4]
increament_int(a)
print(a) # a的内容为int，a是不可变对象，原实参内容不变
increament_list(b)
print(b) # b的内容为list，b是可变对象，原实参内容会发生变化

3
[2, 3, 4, 1]


<b><font color=red>思考题</font></b>：下面代码运行后，变量`c`的值将会如何变化

```
def new_change(my_obj):
    print(my_obj)
    return 666

c = {1:'a', 2:'b'}

new_change(c)
```

<b><font color=red>思考题</font></b>：下面代码运行后，变量`c`的值将会如何变化

```
def new_change(my_obj):
    print(my_obj)
    return 666


c = {1:'a', 2:'b'}

c = new_change(c)
```

<b><font color=red>思考题</font></b>：下面代码运行后，变量`c`的值将会如何变化

```
def new_change(my_obj):
    my_obj.clear()
    return 666


c = {1:'a', 2:'b'}

new_change(c)
```

<b><font color=red>思考题</font></b>：下面代码运行后，变量`a`的值和变量`b`的值将会如何变化

```
def new_change(my_obj):
    my_obj *= 2
    return my_obj


a = '000'
b = [1,2]

new_change(a)
new_change(b)
```

↓↓↓↓↓↓↓↓↓↓<b><font color=red>下面内容，课下练习，加深理解</font></b>↓↓↓↓↓↓↓↓↓↓

In [19]:
# def change(my_obj):
#     my_obj *= 2
#     return my_obj

    
# a = 1

`my_obj`是形式参数，变量`a`此时指向不可变对象（因为`type(a) == int`），所以函数调用语句`change(a)`是在进行值传递，`change(a)`的运行结果与`change(1)`的运行结果相同，这里的相同包含两层含义：
- 两条函数调用语句执行后，变量`a`的值都不发生变化，依然是整数1；
- 两条函数调用语句的返回值一样。

In [20]:
# print('执行语句change(1)之前a的值',a)
# print('change(1)的返回值是      ',change(1))
# print('执行语句change(1)之后a的值',a)

In [21]:
# print('执行语句change(a)之前a的值',a)
# print('change(a)的返回值是      ',change(a))
# print('执行语句change(a)之后a的值',a)

In [22]:
# 因为变量a指向的是一个不可变对象（此处为int）
# 所以change(a)是值传递，不能改变变量a的值，变量a的值依然是1（表达更严谨一点，应该是“变量a仍然指向整数1”）

# a

In [23]:
# b = [1, 2]

`my_obj`是形式参数，变量`b`此时指向不可变对象（因为`type(b) == list`），所以函数调用语句`change(b)`是在进行引用传递，`change(b)`的运行结果与`change([1,2])`的运行结果不同，这里的不同是指：

- `change(b)`执行后，变量`b`的值会发生变化，因为函数内部对变量`b`指向的列表进行了修改；
- `change([1,2])`执行后，不会改变变量`b`的值。

但是，两者的返回值是一样的。

In [24]:
# print('执行语句change([1,2])之前b的值',b)
# print('change([1,2])的返回值是      ',change([1,2]))
# print('执行语句change([1,2])之后b的值',b)

In [25]:
# print('执行语句change(b)之前b的值',b)
# print('change(b)的返回值是      ',change(b))
# print('执行语句change(b)之后b的值',b)

In [26]:
# 因为变量b指向的是一个可变对象（此处为list）
# 所以change(b)能改变变量b的值，因为change函数内部对参数my_obj进行了修改操作
# 所以变量b的值发生了变化（表达更严谨一点，应该是“变量b指向的列表发生了变化”）
# b

In [27]:
def change(my_obj):
    print(id(my_obj))
    my_obj *= 2
    print(id(my_obj))
    return my_obj

In [28]:
a = '000'

In [29]:
print(id(a))

140341685964464


In [30]:
change('000')

140341685964464
140341685982896


'000000'

In [31]:
print(id(a))

140341685964464


In [32]:
change(a)

140341685964464
140341685647792


'000000'

In [33]:
print(id(a))

140341685964464


In [34]:
b = [1,2]

In [35]:
print(id(b))

140341685925056


In [36]:
change([1,2])

140341685649216
140341685649216


[1, 2, 1, 2]

In [37]:
print(id(b))

140341685925056


In [38]:
change(b)

140341685925056
140341685925056


[1, 2, 1, 2]

In [39]:
print(id(b))

140341685925056


↑↑↑↑↑↑↑↑↑↑<b><font color=red>上面内容，课下练习，加深理解</font></b>↑↑↑↑↑↑↑↑↑↑

### 默认参数

Python中的函数允许定义**默认参数**，如果函数调用时**没有传入某些参数的值**，那么**参数的默认值**就会被传递给实参。

In [40]:
# 此处参数b的默认值为42，如果调用my_func函数时
# 不指定参数b的值，则b取默认值42
def my_func(a, b = 42):
    print(a, b)

In [41]:
my_func(a = 7)

7 42


In [42]:
# 此处index参数的默认值为2，
# 调用power函数时，如果不指定index参数的值
# 则index默认取值为2，即求平方
def power(base, index=2):
    return base ** index

In [43]:
power(2)

4

In [44]:
power(2, 3)

8

`power`函数中`base`是非默认参数，在调用`power`函数时，必须，必须，必须，指定参数`base`的值，否则会出错。参数`index`是默认值参数，调用`power`函数时，可以指定其取值，也可以不指定，不指定就取默认值，`index=2`。

In [45]:
# 下面函数调用代码会出错
# power() # 未指定参数base的值

In [46]:
# 下面函数调用代码会出错
# power(index = 3) # 未指定参数base的值

In [47]:
# 此处，a，b，c三个参数均指定了默认值
def my_sum(a = 1, b = 2, c = 3):
    return a**0 + b**1 + c**2

In [48]:
power(2, 5) # 两个参数base和index均传入了非默认实参，

32

In [49]:
power(base = 2, index = 5)

32

In [50]:
power(10) # base参数指定为10，index参数使用默认值2

100

In [51]:
my_sum() # a，b，c三个参数均使用默认值，即a = 1, b = 2, c = 3

12

In [52]:
my_sum(5) # 参数a取值为5，b，c取默认值

12

In [53]:
my_sum(5, 6) # 参数a取值为5，参数b取值为6，参数c取默认值

16

In [54]:
my_sum(5, 6, 7) # 参数a，b，c均传入非默认实参，分别为5，6,7

56

函数如果**混用**默认值参数或非默认值参数，则**非默认值参数**必须**定义在**默认值参数之**前**。

下面这种定义函数的方式会出错，因为默认值参数`base`在非默认值参数`index`之前了。

In [55]:
# def power(base = 10, index):
#     return base ** index

↓↓↓↓↓↓↓↓↓↓<b><font color=red>函数重载的定义了解即可</font></b>↓↓↓↓↓↓↓↓↓↓

**函数重载**（方法重载）：是某些编程语言（如 C++、C#、Java、Swift、Kotlin 等）具有的一项特性，该特性允许创建**多个具有不同实现的同名函数**。对重载函数的调用会运行其**适用于调用上下文的具体实现**，即允许一个函数调用根据上下文执行不同的任务。

重载函数实际上只是一组具有相同名称的不同函数，具体调用使用哪个函数是在编译期决定的。
例如，重载函数 `Print(text_object T)`和`Print(image_object P)`分别用于打印文本和图像，在程序中打印某种类型的对象时，函数调用语句始终是`Print(something)`，在编译时，编译器会根据传入对象`something`的类型，选择使用重载函数`Print(text_object T)`还是
`Print(image_object P)`。

↑↑↑↑↑↑↑↑↑↑<b><font color=red>函数重载的定义了解即可</font></b>↑↑↑↑↑↑↑↑↑↑

**Python不支持函数重载**。

### 位置参数和关键字参数

使用位置参数要求参数按照函数定义时的顺序进行传递。

In [56]:
# my_sum定义时，参数的前后位置是a，b，c
# 所以调用时，参数值5,6,7分别对应参数a, b, c
my_sum(5, 6, 7) # 5**0 + 6**1 + 7**2

56

In [57]:
5**0 + 6**1 + 7**2

56

使用关键字参数调用函数，可以通过类似`name=value`的格式传递每个参数，**全部使用关键词参数时**，参数位置对应关系不再起作用，看看下面例子：

In [58]:
my_sum(b = 6, a = 5, c = 7)

56

In [59]:
my_sum(a = 5, c = 7, b = 6)

56

In [60]:
my_sum(c = 7, a = 5, b = 6)

56

当函数的参数有默认值时，使用关键字参数能够选择其中某些参数传入，其他参数传递其默认值，看下面例子：

In [61]:
my_sum(c = 7) # 1**0 + 2**1 +7**2

52

In [62]:
1**0 + 2**1 +7**2

52

In [63]:
my_sum(c = 7, b = 3) # 1**0 + 3**1 +7**2

53

In [64]:
1**0 + 3**1 +7**2

53

位置参数和关键字参数可以**混合使用**。

In [65]:
# 位置参数和关键词参数混合使用
my_sum(7, c = 7, b = 3) # 7**0 + 3**1 +7**2

53

**位置参数** **不能** 出现在任何关键字参数之**后**，你看下面例子不就错了：

In [66]:
# 关键字参数在前，位置参数在后，不行，报错了
# my_sum(a = 7, b = 3, 9)

位置参数和关键字参数**不能传给一个形参**。

In [67]:
# 位置参数和关键词参数混用
# 位置参数在前，关键词参数在后，没毛病
# 通过位置参数给参数a赋值7，又通过关键字参数给参数a赋值3
# 不行啊，多重赋值，出错了呀
# my_sum(7, a = 3, c = 9)

### 可变长度参数

**可变长度参数**：指的是在函数定义时可以使用**个数不确定的参数**，同一函数可以使用不同个数的参数调用。直接看下面例子：

`*args`：可变长度参数元组。Python使用类似`*parameter`的语法来表示可变长度参数，在函数体内可以使用for循环来访问可变长度参数中的内容。

In [68]:
def hello_args(para1, *args):
    print("para1 :", para1)
    
    print("type(args):", type(args))
    print("args :", args)
    for idx,arg in enumerate(args):
        print("args{}:".format(idx+1), arg)

In [69]:
# para1这个参数必须指定哦
# 此处采用的是位置参数哦
hello_args('hello')

para1 : hello
type(args): <class 'tuple'>
args : ()


In [70]:
# para1这个参数必须指定哦，不信你试试下面代码，会出错
# hello_args()

In [71]:
# 除了para1参数指定为hello外，我们又指定了三个参数值
hello_args('hello', 'this', 'is', 'mc.zhang')

para1 : hello
type(args): <class 'tuple'>
args : ('this', 'is', 'mc.zhang')
args1: this
args2: is
args3: mc.zhang


In [72]:
# 除了para1参数指定为hello外，我们又指定了六个参数值
hello_args('hello', 'python', 'course', 'is', 'useful', 'and', 'interesting')

para1 : hello
type(args): <class 'tuple'>
args : ('python', 'course', 'is', 'useful', 'and', 'interesting')
args1: python
args2: course
args3: is
args4: useful
args5: and
args6: interesting


在上面例子中，`para1 = hello`之后的多个参数会被当做参数元组`args`中的元素，`args`是可变长度的，其中可以包含0个，1个，或者多个元素。再通过下面例子深入理解一下，可变长度元组参数。

In [73]:
def hello_variable_args(*paras):
    print("type(args):", type(paras))
    print("args :", paras)
    for idx,arg in enumerate(paras):
        print("args{}:".format(idx+1), arg)

In [74]:
hello_variable_args()

type(args): <class 'tuple'>
args : ()


In [75]:
hello_variable_args('hello', 'this', 'is', 'mc.zhang')

type(args): <class 'tuple'>
args : ('hello', 'this', 'is', 'mc.zhang')
args1: hello
args2: this
args3: is
args4: mc.zhang


In [76]:
hello_variable_args('hello', 'python', 'course', 'is', 'useful', 'and', 'interesting')

type(args): <class 'tuple'>
args : ('hello', 'python', 'course', 'is', 'useful', 'and', 'interesting')
args1: hello
args2: python
args3: course
args4: is
args5: useful
args6: and
args7: interesting


`**kwargs`：可变长度参数字典，Python还支持另一种形式的可变长度参数的用法，即，使用类似`**parameter`的语法来表示参数，在调用时使用**类似关键字参数**的格式进行传递，或者，使用**字典**传递参数。看下面例子：

In [77]:
def hello_kwargs(para1, **kwargs):
    print("para1 :", para1)
    print("type(kwargs):", type(kwargs))
    print("kwargs:", kwargs)
    for key, value in kwargs.items():
        print("{0} = {1}".format(key, value))

In [78]:
hello_kwargs("hello", kwarg_1='this', kwarg_2='is', kwarg_3='mc.zhang')

para1 : hello
type(kwargs): <class 'dict'>
kwargs: {'kwarg_1': 'this', 'kwarg_2': 'is', 'kwarg_3': 'mc.zhang'}
kwarg_1 = this
kwarg_2 = is
kwarg_3 = mc.zhang


In [79]:
kwargs_dict = {'kwarg_1': 'this', 'kwarg_2': 'is', 'kwarg_3': 'mc.zhang'}
hello_kwargs("hello", **kwargs_dict)

para1 : hello
type(kwargs): <class 'dict'>
kwargs: {'kwarg_1': 'this', 'kwarg_2': 'is', 'kwarg_3': 'mc.zhang'}
kwarg_1 = this
kwarg_2 = is
kwarg_3 = mc.zhang


在函数定义时，一般使用`*args`表示可变长度参数元组，`**kwargs`表示可变长度参数字典，当然你可以可以把`args`和`kwargs`替换为任何你喜欢的字符串，比如`*parameter_tuple`，`**parameter_dict`，但是我十分不建议你这么做。

### 可变长度参数实例

In [80]:
# 打印参数元组中的每一个参数元素
def my_print(*args):
    for item in args:
        print(item)

In [81]:
list_1 = ["a","b","c"]

# 此处，list_1，123，"abc"均为为参数元组中的元素
my_print(list_1,123,"abc")

['a', 'b', 'c']
123
abc


In [82]:
list_2=["a","b","c"]

In [83]:
# 此处，list_2是参数元组中的一个元素，参数元组中只包含一个元素
my_print(list_2)

['a', 'b', 'c']


In [84]:
# 星号表示解包，此处，将list_2解包后，把list_2中的元素作为参数传入
# 所以，list_2中的每个元素就变成了参数元组中的元素
my_print(*list_2)

a
b
c


In [85]:
my_print(*list_2, 'abc')

a
b
c
abc


In [86]:
my_print("a","b","c", 'abc')

a
b
c
abc


In [87]:
my_print('abc',*list_2)

abc
a
b
c


In [88]:
my_print('abc', "a","b","c")

abc
a
b
c


In [89]:
# 此处定义的函数有固定个数的参数
# 在调用时，必须传入两个参数值才行哦
def print_fixed_para(arg1, arg2):
    print("{}-----{}".format(arg1, arg2))

In [90]:
print_fixed_para('a', 'b')

a-----b


In [91]:
list_3 = ['c', 'd']

In [92]:
# 此处，按照位置传参，只传了一个参数，显然错误
# print_fixed_para(list_3)

In [93]:
# 此处按照位置传参，传了两个参数
# 没问题，可以正常调用函数
print_fixed_para(list_3, list_3)

['c', 'd']-----['c', 'd']


In [94]:
# 此处采用列表解包的形式，按位置传递了两个参数值
# 当然可以正常调用函数
print_fixed_para(*list_3)

c-----d


从上面的例子可以得出：在调用函数的时候，可以使用`*`对列表（或者元组）进行解包，解包的结果可以用于按位置传参。

上面的例子，都是解包列表，解包元组同样可以，简单用下面小栗子演示一下：

In [95]:
arg_tuple = ('good', 'boy')
my_print(*arg_tuple)

good
boy


In [96]:
my_print(*arg_tuple, 'nice', 'girl')# 'nice', 'girl'

good
boy
nice
girl


In [97]:
my_print('nice', 'girl', *arg_tuple)

nice
girl
good
boy


In [98]:
print_fixed_para(*arg_tuple)

good-----boy


<b><font color=red>思考题：</font></b>下面代码的运行结果是什么

`arg_set = {'good', 'boy'}`

`print_fixed_para(*arg_set)`

`my_print(*arg_set)`

字典传参与列表（元组）传参非常类似，下面，直接看小栗子：

In [99]:
# 定义了一个具有固定个数参数的函数，用来求分数平均值
def avg_grade(chinese = 80, math = 85):
    return (chinese + math)/2

In [100]:
grade_dict = {'chinese':88,
             'math':99}

# 对字典进行解包后，按关键字进行参数传递，字典无序哦
avg_grade(**grade_dict)

93.5

上面的例子对字典解包后，按关键字传参，调用函数`avg_grade`，所以，grade_dict中的key必须，必须，必须，与函数定义中的参数关键字同名，一个字母也不能差。不信，你试试下面例子：

In [101]:
# 想一下，为什么下面代码运行出错
# grade_dict = {' chinese':88,
#              'math':99}

# avg_grade(**grade_dict)

In [102]:
# 定义了一个具有可变个数参数的函数，用来求分数平均值
def avg_grade_mul(chinese = 80, math = 85, **kwargs):
    return (chinese + math + sum(kwargs.values()))/(2+len(kwargs))

In [103]:
grade_dict = {'english':88,'history':90}


# 对字典解包后，按关键字参数调用函数
# 此时的参数有四个，求四科成绩的平均值
avg_grade_mul(**grade_dict)

85.75

In [104]:
grade_dict = {'chinese':88,
             'math':99}

# 对字典解包后，按关键字参数调用函数
# 此时的参数有两个
# 字典中的keys与函数的有默认值参数重名
# 用解包后的结果，对默认参数值进行更新
avg_grade_mul(**grade_dict)

93.5

`*`是解包元组，`**`是解包字典。

无论是列表（元组）传参还是字典传参，都可用于调用**有固定个数参数的函数**和**有可变个数参数的函数**，字典传参的时候，keys要与函数的参数名一样哦。

### 不同类型参数定义顺序

位置参数，默认值参数，可变参数，命名参数，可变命名参数。

先看例子：

In [105]:
def my_func(a, b, c = 0, *args, d, **kwargs):
    print('a:      {}'.format(a),
          'b:      {}'.format(b),
          'c:      {}'.format(c),
          'args:   {}'.format(args),
          'd:      {}'.format(d),
          'kwargs: {}'.format(kwargs),
          sep='\n')

In [106]:
my_func('a', 'b', 88, *[-1, -2, -3], d ='d', **{'name':'Tom','age':'18'})

a:      a
b:      b
c:      88
args:   (-1, -2, -3)
d:      d
kwargs: {'name': 'Tom', 'age': '18'}


`my_func(a, b, c = 0, *args, d, **kwargs)`中：

- `a`，`b`是位置参数，位置参数一定是在最前面；

- `c=0`是默认值参数，它有默认值，在调用时不是必须传参数值的；

- `*args`是可变参数，可以通过解包元组（或列表）来按照位置传参；

- `d`是命名参数，传参数时，必须带上参数名，你看上面的参数调用语句中`d = 'd'`；

- `**kwargs`是可变命名参数，可以通过解包字典来按照关键字传参。

自己运行下面的函数`my_func_1`至函数`my_func_5`的定义，根据运行结果加深对上述**参数定义顺序**的理解：

In [107]:
# def my_func_1(a, b, c = 0, d, *args,**kwargs):
#     print('a:      {}'.format(a),
#           'b:      {}'.format(b),
#           'c:      {}'.format(c),
#           'args:   {}'.format(args),
#           'd:      {}'.format(d),
#           'kwargs: {}'.format(kwargs),
#           sep='\n')

In [108]:
# def my_func_2(a, b, c = 0, *args, **kwargs, d):
#     print('a:      {}'.format(a),
#           'b:      {}'.format(b),
#           'c:      {}'.format(c),
#           'args:   {}'.format(args),
#           'd:      {}'.format(d),
#           'kwargs: {}'.format(kwargs),
#           sep='\n')

In [109]:
# def my_func_3(**kwargs, a, b, c = 0, *args, d):
#     print('a:      {}'.format(a),
#           'b:      {}'.format(b),
#           'c:      {}'.format(c),
#           'args:   {}'.format(args),
#           'd:      {}'.format(d),
#           'kwargs: {}'.format(kwargs),
#           sep='\n')

In [110]:
# def my_func_4(a, b, c = 0, d, **kwargs, *args):
#     print('a:      {}'.format(a),
#           'b:      {}'.format(b),
#           'c:      {}'.format(c),
#           'args:   {}'.format(args),
#           'd:      {}'.format(d),
#           'kwargs: {}'.format(kwargs),
#           sep='\n')

In [111]:
# def my_func_5(d, a, b, c = 0, *args, **kwargs):
#     print('a:      {}'.format(a),
#           'b:      {}'.format(b),
#           'c:      {}'.format(c),
#           'args:   {}'.format(args),
#           'd:      {}'.format(d),
#           'kwargs: {}'.format(kwargs),
#           sep='\n')

In [112]:
# def my_func_6(*args, a, b, c = 0, d, **kwargs):
#     print('a:      {}'.format(a),
#           'b:      {}'.format(b),
#           'c:      {}'.format(c),
#           'args:   {}'.format(args),
#           'd:      {}'.format(d),
#           'kwargs: {}'.format(kwargs),
#           sep='\n')

## 函数实例

函数是组织好的，可重复使用的，用来实现单一或相关联功能的代码段。函数通过对常用功能进行封装，能提高程序的模块性和代码的重复利用率。直接看例子吧：

**第一个例子是**：

检查用户键盘输入的年月日是否合法。

In [113]:
# 定义一个检测年份是否为闰年的函数
def is_leap_year(year):
    if (year % 4 == 0 and year % 100 != 0) or (year % 400 == 0):
        return True
    else:
        return False

目前使用的格里高利历闰年规则如下：

- 公元年份为4的倍数但非100的倍数，为闰年；
- 公元年份为400的倍数，为闰年。

In [114]:
# 根据年份和月份，返回该月份的天数
def get_days_in_month(month, year):
    if month in [1, 3, 5, 7, 8, 10, 12]:
        return 31
    elif month in [4, 6, 9, 11]:
        return 30
    elif is_leap_year(year):
        return 29
    else:
        return 28

In [115]:
def validate_year(year):
    return year > 0

In [116]:
def validate_month(month):
    if 0< month < 13:
        return True
    else:
        return False

In [117]:
def validate_day(year, month, day):
    return 0 <= day <= get_days_in_month(month, year) 

In [118]:
def validate_date(year, month, day):
    return all([validate_year(year),
                validate_month(month), 
                validate_day(year, month, day)])

In [119]:
def main():
    year = int(input('Year: '))
    month = int(input('Month: '))
    day = int(input('Day: '))
    if is_date_validate(year, month, day):
        print('Valid')
    else:
        print('Invalid')

In [120]:
# main()

**第二个例子是**：

课件身份证号校验例题：给定一个身份证号，验证其是否合法：(1) 总体校验；(2) 校验地区；(3) 校验日期。

https://www.dute.org/fake-id-card-number

In [121]:
def verify_char_length(ids):
    if len(ids) != 18:
        return False
    if not ids[:-1].isdigit():
        return False
    if ids[-1] not in '0123456789X':
        return False
    return True

In [122]:
def verify_last_num(ids):
    ids_17 = ids[:-1]
    weights = [7, 9, 10, 5, 8, 4, 2, 1, 6, 3, 7, 9, 10, 5, 8, 4, 2]
    S = sum([int(num)*weight for num,weight in zip(list(ids_17),weights)])
    T = S % 11
    R = (12 - T) % 11
    if R == 10:
        last_num = 'X'
    else:
        last_num = R
    if ids[-1] == str(last_num):
        return True
    else:
        return False

In [123]:
def verify_area(ids):
    import _locale
    _locale._getdefaultlocale = (lambda *args: ['zh_CN', 'utf8'])
    with open('./area_dict.json') as f:
        area_dict = eval(f.read())
    if ids[:6] not in area_dict.keys():
        return False
    else:
        return True

In [124]:
def is_leap_year(year):
    if (year % 4 == 0 and year % 100 != 0) or (year % 400 == 0):
        return True
    else:
        return False

In [125]:
def verify_date(ids):
    year = int(ids[6:10])
    if year > 2022 or year < 1900:
        return False
    month = int(ids[10:12])
    if month > 12 or month < 1:
        return False
    day = int(ids[12:14])
    if month in [1,3,5,7,8,10,12]:
        if day > 31 or day < 1:
            return False
    elif month in [4,6,9,11]:
        if day > 30 or day < 1:
            return False
    else:
        if is_leap_year(year):
            if day > 29 or day < 1:
                return False
        else:
            if day > 28 or day < 1:
                return False
    return True

In [126]:
def verify_id(ids):
    if verify_char_length(ids):
        if all([verify_last_num(ids),verify_area(ids),verify_date(ids)]):
            print("VALID")
            return True
        else:
            print("INVALID")
            return False
    else:
        print("INVALID")
        return False

In [127]:
verify_id(ids = "110113198702121018")

VALID


True

In [128]:
verify_id(ids = "110113198703121018")

INVALID


False

## 匿名函数

lambda表达式用于创建一个**匿名**函数，即**没有与标识符绑定**的函数。

写法：`lambda 参数列表：表达式`； 

- lambda表达式以`lambda`关键字开始，参数列表与一般函数的参数列表的语法格式相同，参数间用逗号隔开，允许参数有默认值；

- 表达式为匿名函数的返回值，但**只能由一个表达式组成**，不能有其他的复杂结构；

- 通常而言，可**将lambda表达式赋值给一个变量**，这个变量就可以作为函数使用，此时就把lambda表达式和变量绑定在一起了；
- 调用lambda表达式的语法**与调用函数**完全**相同**。

下面看几个小栗子来理解上面的理论内容：

In [129]:
my_sum = lambda x, y:x+y

上面定义了一个两个数求和的匿名函数赋值给了变量`my_sum`；

来来来，看一下匿名函数的三个部分啊，

- 第一部分是关键字`lambda`；

- 第二部分是参数列表，可以是多个，此处为`x, y`；

- 第三部分是表达式，只能有一个，一个，一个，哦，此处为`x+y`；

- 变量和表达式之间要有冒号哦，类似于定义函数时，参数列表后有冒号。

In [130]:
my_sub = lambda y, x=10: x- y

In [131]:
my_sub(1)

9

上面定义了一个求两个数减法的匿名函数，被减数默认值为10。同时，把定义的匿名函数赋值给了变量`my_sub`，之后就像函数调用那样去调用了定义的匿名函数，`my_sub(1)`。

In [132]:
my_list = list(range(10, 24))

In [133]:
my_list

[10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23]

In [134]:
import random

In [135]:
random.shuffle(my_list)

In [136]:
my_list

[13, 22, 20, 12, 11, 14, 16, 15, 19, 17, 23, 18, 10, 21]

In [137]:
my_sort_key = lambda item:item

In [138]:
sorted(my_list, key = my_sort_key, reverse=True)

[23, 22, 21, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10]

In [139]:
my_list

[13, 22, 20, 12, 11, 14, 16, 15, 19, 17, 23, 18, 10, 21]

再来看一下待条件表达式的lambda函数：

In [140]:
my_max = lambda x, y:x if x>y else y

In [141]:
my_min = lambda x, y:x if x<y else y

In [142]:
my_max(1, 10)

10

In [143]:
my_min(1, 10)

1

仔细看看上面两个lambda表达式冒号后面的条件表达式写法，跟之前在哪里用到的条件表达式写法很像，是不是推导式啊，列表推导式，字典推导式，集合推导式。有木有，那你再想想，推导式的基本写法是什么，包括哪几个部分。

<b><font color=red>思考题</font></b>：

写一个列表推导式，将`my_list`中奇数元素对应的位置为1，偶数对应的位置为0，将列表推导式生成的新列表赋值给变量`my_new_list`。

In [144]:
# 直接输出匿名函数的结果
(lambda x, y:x**y)(2,3)

8

##  map、reduce、filter 函数

**map函数**

`map`函数**遍历** **序列** **每个值**进行操作，返回一个**`map`对象**。

语法：`map(function, sequence, ....)`

- `function`：函数
- `sequence`：序列

In [145]:
def my_square(x):
    return x**2

In [146]:
list_6 = [1, 2, 3]
list_7 = [4, 5, 6, 7]
list_8 = [8, 9, 10, 11, 12]

In [147]:
result = map(my_square, list_6)

In [148]:
type(result)

map

In [149]:
next(result)

1

In [150]:
next(result)

4

In [151]:
next(result)

9

上面对一个序列进行map操作，并使用`next`方法逐个访问返回的`map`对象。下面使用`for`循环访问map结果。

In [152]:
result = map(my_square, list_6)

In [153]:
for item in result:
    print(item)

1
4
9


In [154]:
result = map(lambda x,y:x*y, list_6, list_7)

In [155]:
type(result)

map

In [156]:
list(result)

[4, 10, 18]

`len(list_6) < len(list_7)`，所以最终结果的长度是`min(len(list_6), len(list_7))`

In [157]:
list(map(lambda x,y,z:x*y, list_6, list_7, list_8))

[4, 10, 18]

<b><font color=blue>注意</font></b>：`function`的参数个数，与后面的序列个数要一致哦。

**filter函数**

`filter`函数，过滤出序列中的元素。

- 语法：`filter(function, iterable)`；

- `function`，判断函数；

- `iterable`，可迭代对象；

- 返回filter对象。

In [158]:
str_1 = 'aHbDkLuY'

In [159]:
import string

In [160]:
# 过滤出字符串中的大写字母
result = filter(lambda char:char in string.ascii_uppercase, str_1)

In [161]:
type(result)

filter

In [162]:
list(result)

['H', 'D', 'L', 'Y']

使得`function`返回True（或等价于True）的元素被取出来，看下面例子：

In [163]:
list(filter(lambda char:None, str_1))

[]

In [164]:
list(filter(lambda char:char, str_1))

['a', 'H', 'b', 'D', 'k', 'L', 'u', 'Y']

In [165]:
list(filter(lambda char:'', str_1))

[]

In [166]:
list(filter(lambda char:[], str_1))

[]

In [167]:
list(filter(lambda char:char.lower(), str_1))

['a', 'H', 'b', 'D', 'k', 'L', 'u', 'Y']

`function`最好是显示地定义返回布尔值。

**reduce函数**

`reduce`函数会对参数序列中元素进行**累积**，返回一个值。

函数将一个数据对象（列表，元组等）中的所有数据进行下列操作：用传给 reduce 中的函数 function（有两个参数）先对集合中的第 1、2 个元素进行操作，得到的结果再与第三个数据用 function 函数运算，最后得到一个结果。

语法：`reduce(function, iterable[, initializer])`

参数：

- function，函数，**有两个参数**；

- iterable，可迭代对象；

- initializer，可选，初始参数。

In [168]:
from functools import reduce

In [169]:
reduce(lambda x, y: x + y, [1,2,3,4,5])

15

In [170]:
reduce(lambda x, y: x + y, [1,2,3,4,5], 100)

115

In [171]:
kua_list = ['眉清目秀', '高大威猛', '英俊潇洒', '风流倜傥', '人见人爱', '花见花开', '车见车栽', '才高八斗', '学富五车']

In [172]:
kua_list

['眉清目秀', '高大威猛', '英俊潇洒', '风流倜傥', '人见人爱', '花见花开', '车见车栽', '才高八斗', '学富五车']

In [173]:
reduce(lambda x, y: x + '、'+ y, kua_list, '你真是')

'你真是、眉清目秀、高大威猛、英俊潇洒、风流倜傥、人见人爱、花见花开、车见车栽、才高八斗、学富五车'

## 递归函数

一个函数在内部也可以**调用自身**。我们将直接或间接调用自身的函数称为递归函数，将使用递归函数来解决问题的编程技巧称为递归。

递归能够将一个大型的、复杂的问题层层转换为一个与原问题相似的小规模问题来求解，给出一个自然、直观、简单的解决方案。

先看例子，在数学上，斐波那契数是以递归的方法来定义：

$F_0 = 0$

$F_1 = 1$

$F_{n} = F_{n-1} + F_{n-2}$

用文字来说，就是斐波那契数列由0和1开始，之后的斐波那契数就是由之前的两数相加而得出。前几个斐波那契数是：

1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377 ,610, 987

**特别指出**：0不是第一项，而是第零项。

定义一个函数，用于输出斐波那契数列的第n项，从第0项开始计数。

In [174]:
def fibo(n):
    if n == 0:
        return 0
    elif n == 1:
        return 1
    else:
        return fibo(n-1) + fibo(n-2)

In [175]:
l = [0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377 ,610, 987]

In [176]:
# 打印斐波那契数列的前几项
for idx, item in enumerate(l):
    print(idx, item)

0 0
1 1
2 1
3 2
4 3
5 5
6 8
7 13
8 21
9 34
10 55
11 89
12 144
13 233
14 377
15 610
16 987


In [177]:
fibo(17) == 610 + 987

True

In [178]:
def my_fibo(n):
    a = 0
    b = 1
    result = 0
    for i in range(n-1): 
        result = a + b
        a = b
        b = result
    return result

my_fibo(15)

610

<b><font color=red>思考题</font></b>：定义函数`my_fact(n)`，求n的阶乘，$n >= 0$，为正整数。

**递归函数的特点**

- 函数会使用**选择结构**将问题分成不同的情况；
- 函数中会有**一个或多个基础情况**用来结束递归；
- 非基础情况的分支会递归调用自身，递归会将原始问题简化为一个或多个子问题，这些子问题与原问题**性质一样但规模更小**；
- 每次递归调用会**不断接近基础情况**，直到变成基础情况，终止递归。

递归函数的优点是定义简单、逻辑清晰，但是一般的递归函数会**占用大量的程序栈**，尤其是当递归深度特别大的时候，有可能导致**堆栈溢出**。

在编写递归函数时，需要仔细考虑**边界情况（基础情况）**，当递归**不能**使全部的问题**简化收敛到边界情况时**，程序就会**无限运行**下去，并且在程序**堆栈溢出**时导致运行时的**错误**。

↓↓↓↓↓↓↓↓↓↓<b><font color=red>堆栈溢出的定义了解即可</font></b>↓↓↓↓↓↓↓↓↓↓

**堆栈溢出**（stack overflow）在计算机科学中是指使用过多的存储器时导致调用堆栈产生的溢出，也是缓冲区溢出中的一种。堆栈溢出的产生是由于过多的函数调用，导致使用的调用堆栈大小**超过事先规划的大小**，覆盖其他存储器内的资料，**一般在递归中产生**。堆栈溢出很可能由无限递归（infinite recursion）产生，但也可能仅仅是过多的堆栈层级。

↑↑↑↑↑↑↑↑↑↑<b><font color=red>堆栈溢出的定义了解即可</font></b>↑↑↑↑↑↑↑↑↑↑

## 生成器

生成器是创建**迭代器对象**的一种简单而强大的工具，生成器的**语法**就像正常的**函数**，只是**返回数据**时需要**使用`yield`**语句而非return语句。

与一般函数不同的是，一般函数在**执行到return**语句时，会**结束函数**的执行；而生成器在**执行到yield**语句时，并不会终止执行，而是**继续**向后执行，直至函数结束。

如果生成器中执行了**多个yield**语句，那么生成器将会把这些yield语句中**所有要返回的值**组成一个**生成器对象**并返回。 

在生成器外部，可以通过**`next`函数** **依次** 获得**每一个值**，也可以将其**转换**为某一类型的**可迭代对象**（如列表、元组等）。

In [179]:
def fibo_generator(n):
    if n == 1:
        yield 0
    elif n == 2:
        yield 0
        yield 1
    else:
        yield 0
        yield 1
        a = 0
        b = 1
        for _ in range(n-2):
            c = a + b
            yield c
            a,b = b,c

In [180]:
for item in fibo_generator(3):
    print(item)
fibo_list = list(fibo_generator(3))

0
1
1


In [181]:
my_gene = fibo_generator(5) # 0, 1, 1, 2, 3, 

In [182]:
type(my_gene)

generator

In [183]:
next(my_gene)

0

In [184]:
next(my_gene)

1

In [185]:
next(my_gene)

1

In [186]:
next(my_gene)

2

In [187]:
next(my_gene)

3

In [188]:
# 迭代完之后，再迭代就会出错哦
# next(my_gene)

In [189]:
# 使用list函数将可迭代对象变为列表
list(fibo_generator(5))

[0, 1, 1, 2, 3]

回忆一下我们之前讲推导式时，顺带讲过的一种生成器创建方法，那就是，用括号把推导式包起来，如下例子：

In [190]:
gene_1 = (i**2 for i in range(10))

In [191]:
type(gene_1)

generator

有列表推导式，中括号包起来推导式，有集合推导式，花括号抱起来推导式，有字典推导式，花括号包起来推导式，但是它的起始位置是`键:值`哦；

没有元组推导式，用圆括号包起来的推导式，是生成器推导式哦；

关于推导式的内容，再去看看`lecture_4.ipynb`.

In [192]:
next(gene_1)

0

In [193]:
next(gene_1)

1

In [194]:
# 也可以使用for循环访问生成器的内容哦
# 在迭代完之后就会自动结束for循环
# 不会像next一样，迭代完，再迭代就会报错stop iteration error
for item in gene_1:
    print(item)

4
9
16
25
36
49
64
81


In [195]:
for item in fibo_generator(5):
    print(item)

0
1
1
2
3


生成器对象一旦迭代完毕，再迭代就不会输出值，除非重新创建一次迭代器对象。你试试下面代码，看看有米有输出：

In [196]:
for item in gene_1:
    print(item)

那你思考一下，为什么下面代码依旧能输出：

In [199]:
for item in fibo_generator(9):
    print(item)

0
1
1
2
3
5
8
13
21


In [198]:
print('END')

END
