## 模块与包的定义

Python 模块(Module)，是一个 Python 文件，以 .py 结尾，包含了 Python 对象定义和Python语句；

模块让你能够有逻辑地组织你的 Python 代码段；

把相关的代码分配到一个模块里能让你的代码更好用，更易懂；

模块能定义函数，类和变量，模块里也能包含可执行的代码；

当把一些相关的代码存放在**一个文件中**时，就创建了**一个模块**。**模块中的定义可以被导入到其他模块中从而被其他模块所使用**，这就使得我们可以在多个程序中使用已经编写好的函数而无需将函数复制到每个程序中。

总的来说，模块就是包含Python定义和声明的文件，文件名就是模块名加上扩展名`.py`。

模块有一些内置属性，用于存储模块的某些信息，如`__name__`，`__doc__`，等等，`__name__`属性用来取得模块的名称。

我们来看看python3自带（内置）的`string`模块。

In [1]:
import string

In [2]:
string.__name__

'string'

In [3]:
string.__doc__

'A collection of string constants.\n\nPublic module variables:\n\nwhitespace -- a string containing all ASCII whitespace\nascii_lowercase -- a string containing all ASCII lowercase letters\nascii_uppercase -- a string containing all ASCII uppercase letters\nascii_letters -- a string containing all ASCII letters\ndigits -- a string containing all ASCII decimal digits\nhexdigits -- a string containing all ASCII hexadecimal digits\noctdigits -- a string containing all ASCII octal digits\npunctuation -- a string containing all ASCII punctuation characters\nprintable -- a string containing all ASCII characters considered printable\n\n'

下面的图片以`Ubuntu`系统为例，`Windows`系统和`Mac OS`系统是类似的：

Python自带的模块位于`python3.7`文件夹中，

<div align=center>
<img width="750" height="550" src="https://raw.githubusercontent.com/zhangjianzhang/programming_basics/master/files/codes/imgs/python_module.jpg?raw=true">

<p><center><font>python内置模块</font></center></p>
</div>

上图显示了文件夹`/usr/local/anaconda3/lib/python3.7`中的部分内容。总体上分为两部分：

- 文件夹表示包（package），如`http`包，`email`包；

- `.py`文件表示模块，如`calendar`模块，`string`模块。

<div align=center>
<img width="750" height="550" src="https://raw.githubusercontent.com/zhangjianzhang/programming_basics/master/files/codes/imgs/string.jpg?raw=true">

<p><center><font>string模块</font></center></p>
</div>

打开`string.py`看看里面的内容：

<div align=center>
<img width="750" height="550" src="https://raw.githubusercontent.com/zhangjianzhang/programming_basics/master/files/codes/imgs/string_file_1.jpg?raw=true">

<p><center><font>string.py的内容</font></center></p>
</div>

从上图可以看到：

- `string.__doc__`返回的内容就是`string.py`文件头部的说明性内容，介绍了该模块包含的内容和功能；

- `string.__name__`就是模块的文件名。

再往下看一看：

<div align=center>
<img width="750" height="550" src="https://raw.githubusercontent.com/zhangjianzhang/programming_basics/master/files/codes/imgs/string_file_2.jpg?raw=true">

<p><center><font>string.py的内容</font></center></p>
</div>

从上图可以看到，`string`模块里定义了函数、类（class），也有对其他包（package）和模块的导入：

- 定义了`capwords`函数；

- 定义了`Template`类；

- 导入了正则表达式模块`re`；

- 导入了`collection`包中的`ChainMap`类。

下面，我们自己定义一个模块，命名为`demo_module.py`，内容如下：

In [4]:
'''
This is a demo module
'''

import string


def my_print(content):
    '''
    print alphabets characters vertically.
    '''
    alphanum_list = list(filter(lambda char:char in string.ascii_letters, content))
    print('\n'.join(alphanum_list))

把上述代码保存在`demo_module.py`文件中，在相同的文件夹中新建一个py文件`test_demo_module.py`，内容如下：

In [5]:
import demo_module

demo_module.my_print('G哈哈o滴滴o棒棒哒d×*%123')

G
o
o
d


<b><font color=Chocolate>拓展学习：</font></b>

- <a href="https://www.liaoxuefeng.com/wiki/1016959663602400/1017455068170048" target="_blank">使用模块</a>

## 包管理

pip：方便的包管理工具

安装pip：

- 下载`get-pip.py`，地址为：https://bootstrap.pypa.io/get-pip.py
- 安装pip，打开命令行，进入到包含`get-pip.py`的文件夹，执行`py get-pip.py`

Python 3.4+ 以上版本都自带pip工具，无需自己安装；

Anaconda也自带了pip工具，无需自己安装。

pip的几种常用方法：

- pip install <PackageName>		安装包
    
- pip show <PackageName>		查看已安装的包信息
    
- pip list 				列出已安装的所有包

- pip list --outdated			列出需要更新的包

- pip install --upgrade <PackageName> 	升级包
    
- pip uninstall <Package>		卸载包

pip工具是在命令行中使用，如Windows系统的CMD中，Linux和Mac OS的terminal中，下图显示了在Ubuntu 16.04系统中，成功安装中文分析工具包`jieba`。

<div align=center>
<img width="650" height="350" src="https://raw.githubusercontent.com/zhangjianzhang/programming_basics/master/files/codes/imgs/pip_jieba.jpg?raw=true">

<p><center><font>使用pip命令安装中文分析工具包jieba</font></center></p>
</div>

部分同学的Windows用户名是中文名，导致jupyter-notebook无法正常运行，报错信息为`Bad file descriptor....`，最快捷的解决办法就是用pip命令降级一个名为`pyzmq`的软件包，如下两行命令即可：

卸载pyzmq高版本

`pip uninstall pyzmq`

安装低版本19.0.2版

`pip install pyzmq==19.0.2 --user`

<b><font color=Chocolate>拓展学习：</font></b>

- <a href="https://www.runoob.com/w3cnote/pip-cn-mirror.html" target="_blank">pip 使用国内镜像源加快安装速度</a>

<b><font color=red>思考题：</font></b>

使用`pip`命令在自己的机器上安装中文分析工具包`jieba`。

## 模块与包的使用

Python以模块为单位来组织代码（一个个`.py`文件）；

Python标准库自身就内置了许多标准模块，还有非常丰富的第三方模块以供用户使用；

用户也可以自己编写模块（如上面的`demo_module.py`）。

要在模块外部使用模块内定义的函数，首先要导入该模块：

使用import语句可以导入一个模块，格式为`import 模块名 [as 别名]`。 

In [6]:
# 导入第三方画图包matplotlib中的pyplot模块，并为其赋予一个别名plt
import matplotlib.pyplot as plt

In [7]:
# 导入自定义的模块，并赋予一个别名dm
import demo_module as dm

dm.my_print('G哈哈o滴滴o棒棒哒d×*%123')

G
o
o
d


如果频繁地使用一个函数而不想总是带着模块名进行调用，则可以将其赋给一个本地变量。

In [8]:
pfunc = dm.my_print

pfunc('G哈哈o滴滴o棒棒哒d×*%123')

G
o
o
d


在import后添加as子句来作为模块的别名，模块全名太长，起一个短的别名，敲起来快捷高效。

Python还支持另外一种语法，即`from 模块名 import 对象名 [as 别名]`，使用这种格式仅导入明确指定的对象，可以减少访问速度，同时不需要使用模块名进行调用。

In [9]:
# 从string模块中导入变量ascii_letters，并赋予一个别名aletters
from string import ascii_letters as aletters

In [10]:
# 直接使用导入的对象名（或别名），不需要加上模块名
aletters

'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'

如果想要使用这一语法导入模块下的全部对象，则可以使用星号`*`来替代对象名。

In [11]:
# string模块中的digits变量没有被导入，所以下面代码运行会出错
# digits

In [12]:
# 把string模块中定义的对象全部导入
from string import *

In [13]:
# string模块中定义的对象已全部导入，下面代码就不会出错了
digits

'0123456789'

**包与包内引用**

- 包（package）是一种用“点式模块名”构造 Python 模块命名空间的方法。例如，模块名 `A.B` 表示包 A 中名为 B 的子模块；

- 可以将这些模块按照某种方式组织在一个目录下，构成一个包结构；

- 用户可以从包中导入单独的模块或模块中的对象。

<div align=center>
<img width="350" height="650" src="https://raw.githubusercontent.com/zhangjianzhang/programming_basics/master/files/codes/imgs/package.png?raw=true">

<p><center><font>包与模块的关系</font></center></p>
</div>

<div align=center>
<img width="250" height="550" src="https://raw.githubusercontent.com/zhangjianzhang/programming_basics/master/files/codes/imgs/package_struc.png?raw=true">

<p><center><font>一个简单的包结构</font></center></p>
</div>

Python3自带的包在`/usr/local/anaconda3/lib/python3.7`中（以Ubuntu系统中的Anaconda3为例，其他系统类似），第三方包在`/usr/local/anaconda3/lib/python3.7/site-packages`中

下面以第三方包`jieba`为例说明包与模块的关系，`jieba`是一个流行的、开源的（popular and open source）中文分析包，源代码见：https://github.com/fxsjy/jieba

jieba包的包结构如下：

<div align=center>
<img width="250" height="650" src="https://raw.githubusercontent.com/zhangjianzhang/programming_basics/master/files/codes/imgs/jieba.jpg?raw=true">

<p><center><font>jieba包结构</font></center></p>
</div>

包是一个**分层次**的文件目录结构，它定义了一个由**模块**及**子包**，和**子包下的子包**等组成的Python的应用环境。

简单来说，包就是**文件夹**，但该文件夹下必须存在 `__init__.py` 文件，该文件的内容可以为空。`__init__.py`，用于标识当前文件夹是一个包。

如上图，包下面可以包括子包（文件夹，如`analyse`）和模块（`.py`文件，如`_compat.py`），子包下面可以包含子包（文件夹）和模块（`.py`文件）。

In [14]:
# 下面代码要想运行，必须先安装jieba包

In [15]:
# 从jieba包中导入子包posseg，并赋予别名pseg
import jieba.posseg as pseg
# 调用posseg子包中的cut函数
words = pseg.cut("我爱北京天安门") 
for word, flag in words:
	print('%s %s' % (word, flag))

Building prefix dict from the default dictionary ...
Dumping model to file cache /tmp/jieba.cache
Loading model cost 0.828 seconds.
Prefix dict has been built successfully.


我 r
爱 v
北京 ns
天安门 ns


In [16]:
# 从jieba包中导入_compat模块，并赋予别名ct
from jieba import _compat as ct
# 调用ct模块中定义的strdecode函数
ct.strdecode('阿里巴巴')

'阿里巴巴'

In [17]:
# 从jieba包的_compat模块中到如resolve_filename函数
from jieba._compat import resolve_filename

In [18]:
resolve_filename(ct)

"<module 'jieba._compat' from '/usr/local/anaconda3/lib/python3.9/site-packages/jieba/_compat.py'>"

In [19]:
resolve_filename(pseg)

"<module 'jieba.posseg' from '/usr/local/anaconda3/lib/python3.9/site-packages/jieba/posseg/__init__.py'>"

**包内引用**

下面以下图中的“简单包结构”为例说明包内**模块之间的互相引用**。

<div align=center>
<img width="250" height="550" src="https://raw.githubusercontent.com/zhangjianzhang/programming_basics/master/files/codes/imgs/package_struc.png?raw=true">

<p><center><font>一个简单的包结构</font></center></p>
</div>

**子模块之间同样需要互相引用**

子包中含有多个模块时（与上图中的effects子包一样），可以使用**绝对导入**和**相对导入**引用当前包中的模块。

例如，要在模块`video.effects.adjustContrast`中使用当前包的`sharpening`模块时：


- 绝对导入，`from video.effects import sharpening`

- 相对导入，`import sharpening`

- 相对导入，`from . import sharpening`

**不在当前子包内的模块互相引用**

包中含有多个子包时（与上图中的`video`包一样），可以使用**绝对导入**和**相对导入**引用兄弟包中的子模块。

例如，要在模块 `video.effects.adjustContrast`中使用`video.formats`包的`mkv`模块时：

- 绝对导入，可以用`from video.formats import mkv`导入；

- 相对导入，还可以用`import`语句的`from module import name`形式执行相对导入，这些导入语句使用前导句点表示相对导入中的当前包（`.`）和父包(`..`)，`from ..formats import mkv`。

## 异常类型

**异常的概念**

**异常**：在程序运行时产生的例外、违例情况被称为异常，如果不能在异常发生时及时妥善地处理它们，程序将崩溃，无法继续运行下去。 

在Python中，异常是以对象的形式实现的。

`BaseException`类是所有异常类的基类，而其子类Exception类则是除了`SystemExit`、`GeneratorExit`和`KeybaordInterrupt`三个**系统级异常**之外所有**内置异常类**和**用户自定义异常类**的**基类**。 

**异常的抛出**

程序在运行过程中出现错误而无法正常运行时，会陷入异常；

Python为用户提供了`raise`关键字以人为地抛出指定类型的异常。

使用`raise`语句手动抛出异常在**程序调试**、**自定义异常**等场景下有诸多应用；

Python不会自动引发自定义异常，这要求程序开发者为自定义的异常**编写合理的异常抛出代码**。

常见异常列表如下：

<div align=center>
<img width="750" height="550" src="https://raw.githubusercontent.com/zhangjianzhang/programming_basics/master/files/codes/imgs/exception.jpg?raw=true">
</div>

## 异常处理

当异常发生时，就需要捕获并处理相应的异常。`try...except`语句是捕获处理异常的常用语句之一，其语法如下：

```
try:
	<语句>
except <异常类型>:
	<语句>
```

其中，`except`子句可以有多个，当try后的语句执行时发生异常，Python就**跳过**try代码段**余下的部分**，执行第一个匹配该异常的except子句，异常处理完毕，控制流就通过整个`try...except`语句（除非在处理异常时又引发新的异常）。 

`except`后面可以放置**多个异常类型**（以逗号分割）以表明若多个异常中至少发生一个，则执行该部分异常处理代码，若**不放置任何异常类型**，则代表可匹配**所有**的异常类型。 

Python还提供了`else`和`finally`两个子句，以用于`try…except`异常处理语句。其语法如下：

```
try:
    可能抛出异常的代码段
except (Exception1, Exception2, ...) as e:
    若发生以上多个异常中的一个，则执行这块代码
 e可以获取解释器传递而来的错误信息
 except可以写多个
else:
    若没有异常，则执行这块代码
finally:
    无论异常是否发生均执行该块代码
```

**自定义异常**

Python如同很多高级程序设计语言一样**允许用户自定义异常**类型，用于描述Python异常体系中没有涉及的异常情况。

通过前面的学习，可知除3个系统级异常外，其他异常类型均是Exception子类；而定义一个自定义异常也十分简单，只需要定义一个继承了Exception类的派生类即可。

Python不会自动为用户抛出或处理任何自定义异常，因而用户需要使用`raise`语句在合理的场合手工触发异常。 

In [20]:
# 自定义异常
class CustomError(Exception):
    def __init__(self, message, status):
        super().__init__(message, status)
        self.message = message
        self.status = status

In [21]:
# 主动抛出异常
# raise CustomError('Connected Failed', 404)

In [22]:
# 捕获自定义异常
try:
    raise CustomError('It failed', 404)
except CustomError as e:
    print(e.status)

404


在使用自定义异常类型时，经常需要在捕获异常的同时获取该异常的实例（例如，上例中的e），以获取存储在异常实例中的数据，这只需要在异常类型后放置一个实例名即可。

## 断言

在程序调试过程中，用户经常希望知道某个条件在运行时是否为真（例如，储蓄账户余额始终为正），并在条件不成立时提示编码者错误出现的位置。Python中提供了断言`assert`语句，以检测某个表达式是否为真，当表达式不成立时，会引发`AssertionError`异常。

同时，还可以通过`assert`语句传递提示信息给`AsserttionError`异常，以提示编码者错误发生的部位和可能的原因。 

## 更多代码实例

作为 Python 初学者，在刚学习 Python 编程时，经常会看到一些报错信息，可以分为两类：

- 语法错误（本质上也是一种异常）；

- 异常。

In [23]:
# 先来看看新手常犯的语法错误

# 把下面代码解除注释运行时会报错
# 语法分析器会指出 出错的一行，并且在最先找到的错误的位置标记了一个小小的箭头。
# i = 0
# while i<10 print('Hello world'); i+=1

上面代码为什么出错，因为没做到冒号、缩进、对齐中的**冒号**，再次强调一下，在写**条件判断**，**循环语句**，**定义函数**等时候，一定记住**冒号，缩进，对齐**。

学到这一讲了，如果遇到`SyntaxError: invalid syntax`，请自己解决，语法错误应该随着你使用python的熟练程度的增加而迅速消失。

再来看几个常见的异常：

In [24]:
# ZeroDivisionError: division by zero
# 10 * (1/0)

In [25]:
# NameError: name 'spam' is not defined
# 4 + spam*3

In [26]:
# TypeError: can only concatenate str (not "int") to str
# '2' + 2

In [27]:
# ModuleNotFoundError: No module named 'kkkkk'
# import kkkkk

In [28]:
# KeyError: 'abc'
# d = {}
# d['abc']

In [29]:
# IndexError: list index out of range
# l = [1, 2, 3]
# l[100]

In [30]:
# AttributeError: 'str' object has no attribute 'llower'
# s = 'kkk'
# s.llower()

使用`try...except`字句处理异常

In [31]:
while True:
    try:
        x = int(input("请输入一个数字: "))
        99/x
        break
    except ValueError:
        print("您输入的不是整数，请再次尝试输入！")
    except ZeroDivisionError:
        print("0不能做除数，请输入非0整数！")

请输入一个数字:  8


上面代码处理两种异常`ValueError`和`ZeroDivisionError`。

下面，我们打印异常实例信息。

In [32]:
while True:
    try:
        x = int(input("请输入一个数字: "))
        break
    except ValueError as e:
        print("您输入的不是整数，请再次尝试输入！")
        print("具体错误信息如下：{}\n".format(e))

请输入一个数字:  8


下面，我们使用`traceback`模块打印异常信息。

In [33]:
import traceback
while True:
    try:
        x = int(input("请输入一个数字: "))
        99/x
        break
    except ValueError:
        err = traceback.format_exc()
        print("您输入的不是整数，请再次尝试输入！")
        print("具体错误信息如下：{}\n".format(err))
    except ZeroDivisionError:
        err = traceback.format_exc()
        print("0不能做除数，请输入非0整数！")
        print("具体错误信息如下：{}\n".format(err))

请输入一个数字:  8


In [34]:
while True:
    try:
        x = int(input("请输入一个数字: "))
        99/x
        break
    except (ValueError, ZeroDivisionError) as e:
        print("错误信息为：{}".format(e))

请输入一个数字:  8


上面代码使用一个`except`字句处理多个异常。

In [35]:
i = 0
while i < 3:
    try:
        x_input = input("请输入一个数字: ")
        x_int = int(x_input)
        break
    except ValueError as e:
        print("您输入的不是整数，请再次尝试输入！")
        print("具体错误信息如下：{}\n".format(e))
        i += 1
        if i == 3:
            print('三次机会已经用完，明天再试吧.')
    else:
        print("恭喜你，输入正确！")
    finally:
        print("你的输入为：{}".format(x_input))

请输入一个数字:  8


你的输入为：8


看下图，辅助理解上面的代码。

<div align=center>
<img width="750" height="550" src="https://raw.githubusercontent.com/zhangjianzhang/programming_basics/master/files/codes/imgs/try_except_else_finally.png?raw=true">
</div>

下面我们练习一下抛出异常：

In [36]:
# x = 10
# if x > 5:
#     raise Exception('x 不能大于 5。x 的值为: {}'.format(x))

In [37]:
# x = 9.0
# if type(x) != int:
#     raise ValueError('x必须是整数啊。x 的值为: {}'.format(x))

再来试试用户自定义异常：

In [38]:
class MyEnameError(Exception):
    def __init__(self, value):
        self.value = value
    def __str__(self):
        return str('''English name can only include alphabet letters and space, your input is: {}'''.format(self.value))

In [39]:
# raise MyEnameError('张三')

In [40]:
import string
i = 3
while i > 0:
    try:
        ename = input("请输入你的英文名: ")
        if set(ename) - set(string.ascii_letters + ' '):
            raise MyEnameError(ename)
        else:
            break
    except MyEnameError as e:
        print(e)
        i -= 1
        print("你还有{}次输入机会".format(i))

请输入你的英文名:  tom


最后，来看看`assert`的用法：

In [41]:
assert 1==1 # 条件为 true 正常执行
print('继续')

继续


In [42]:
# assert False    # 条件为 false 触发异常
# print('继续')

In [43]:
# salary = -100
# assert salary > 0, '工资只能为正数'

上面的代码等价于下面的代码。

In [44]:
# salary = -100
# if not salary > 0:
#     raise AssertionError('工资只能为正数')

In [45]:
print('END')

END
