软件测试方法

(第四部分：软件实现与测试，第10章)

李欣

Created: 2022-06-07 Tue 19:33

0.1. 互动课堂

Click to host the seminar.

0.2. 本次课的目标

第四部分：软件实现与测试

第10章：软件测试方法

软件测试的基本概念
白盒测试的测试用例设计
基本路径覆盖
黑盒测试的测试用例设计
软件测试的策略
人工测试
自动化测试
调试

1. 软件测试的基本概念

1.1. 什么是软件测试

软件测试 是为了发现错误而执行程序的过程。或者说， 软件测试 是根据软件开发各阶段的规格说明和程序的内部结构而精心设计一批测试用例（即输入数据及其预期的输出结果），并利用这些测试用例去运行程序，以发现程序错误的过程。

1.2. 软件测试的目的和原则

Glenford J. Myers 就 软件测试目的 提出以下观点：

测试是程序的执行过程，目的在于发现错误；
一个好的测试用例在于能发现至今未发现的错误；
一个成功的测试是发现了至今未发现的错误的测试。

根据这样的测试目的， 软件测试的原则 应该是：

应当把尽早地和不断地进行软件测试作为软件开发者的座右铭。
测试用例应由测试输入数据和与之对应的预期输出结果这两部分组成。
程序员应避免检查自己的程序。
在设计测试用例时，应当包括合理的输入条件和不合理的输入条件。
充分注意测试中的群集现象。
严格执行测试计划，排除测试的随意性。
应当对每一个测试结果做全面检查。
妥善保存测试计划、测试用例、出错统计和最终分析报告，为未来实施的维护提供方便。

1.3. 软件测试的对象

软件测试 并不等于程序测试。软件测试应贯穿于软件定义与开发的整个期间。

因此，需求分析、概要设计、详细设计以及程序编码等各阶段所得到的 文档资料 ，包括 需求规格说明 、 概要设计规格说明 、 详细设计规格说明 以及 源程序 ，都应成为 软件测试的对象 。

据美国一家公司的统计表明，在查找出的软件错误中，属于需求分析和软件设计的错误约占64%，属于程序编写的错误仅占36%。

到程序的测试为止，软件开发工作已经经历了许多环节，每个环节都可能发生问题。为了把握各个环节的正确性，人们需要进行各种确认和验证工作。

1.4. 测试信息流

测试过程需要三类输入：

软件配置 ：包括软件需求规格说明、软件设计规格说明、源代码等。
测试配置 ：包括测试计划、测试用例、测试驱动程序等。从整个软件工程过程看， 测试配置是软件配置的一个子集 。
测试工具 ：为提高软件测试效率，测试工作需要测试工具的支持，它们的工作是为测试的实施提供某种服务，以减轻人们完成测试任务中的手工劳动。
- 测试数据自动生成程序
- 静态分析程序
- 动态分析程序
- 测试结果分析程序
- 驱动测试的测试数据库
- ……

Figure 1: 测试信息流

1.5. 测试与软件开发各阶段的关系

Figure 2: 软件测试与软件开发过程的关系

1.6. 白盒测试与黑盒测试

黑盒测试 ：已知产品的功能设计规格，可以通过测试证明每个实现了的功能是否符合要求。
白盒测试 ：已知产品的内部工作过程，可以通过测试证明每种内部操作是否符合设计规格要求，所有内部成分是否已经过检查。

1.6.1. 黑盒测试

黑盒测试 方法主要是为了发现：

是否有不正确或遗漏了的功能？
输入能否正确地接受？
能否输出正确的结果？
是否有数据结构错误或外部信息（例如数据文件）访问错误？
性能上是否能够满足要求？
是否有初始化或终止性错误？

用黑盒测试发现程序中的错误，必须在所有可能的输入条件和输出条件中确定测试数据，检查程序是否都能产生正确的输出。

现在假设一个程序 $P$ 有输入量 $X$ 和 $Y$ 及输出量 $Z$ ，在字长为 32位的计算机上运行。如果 $X, Y$ 只取整数，考虑把所有的 $X, Y$ 值都作为测试数据，按黑盒方法进行穷举测试。这样做可能采用的测试数据组为 $(X_i, Y_i)$ ，不同测试数据组合的最大可能数目为 $2^{32} \times 2^{32} = 2^{64}$ 。

如果程序 $P$ 测试一组 $X, Y$ 数据需要1毫秒，而且假定一天工作24小时，一年工作365天，要完成 $2^{64}$ 组测试，需要5亿年。

1.6.2. 白盒测试

软件的 白盒测试 是对软件的过程性细节做细致的检查，它允许测试人员利用程序内部的逻辑结构及有关信息，设计或选择测试用例，对程序所有逻辑路径进行测试。因此白盒测试又称为 结构测试 或 逻辑驱动测试 。

软件人员使用白盒测试方法，主要想对程序模块进行检查：

对程序模块的所有独立的执行路径至少测试一次
对所有的逻辑判定，取真与取假的两种情况都至少测试一次
在循环的边界和运行界限内执行循环体
测试内部数据结构的有效性
……

对于一个具有多重选择和循环嵌套的程序，独立的路径数目可能是天文数字。实行穷举测试，由于工作量过大，需要的时间过长，实施起来是 不现实 的。

2. 白盒测试的测试用例设计

2.1. 逻辑覆盖

逻辑覆盖 是以程序内部的逻辑结构为基础的设计测试用例的技术，它属于白盒测试。

根据覆盖测试的目标不同，逻辑覆盖可分为：

语句覆盖
判定覆盖
条件覆盖
判定-条件覆盖
条件组合覆盖
路径覆盖

Figure 3: 测试用例设计的参考例子

$L_1(a \rightarrow c \rightarrow e)$
$=\{(A > 1) and (B = 0)\} and \{(A = 2) or (\frac{X}{A} > 1)\}$ $=(A > 1) and (B = 0) and (A = 2) or (A > 1) and (B = 0) and (\frac{X}{A} > 1)$ $=(A = 2) and (B = 0) or (A > 1) and (B = 0) and (\frac{X}{A} > 1)$

$L_2(a \rightarrow b \rightarrow d)$
$=\{\overline{(A > 1) and (B = 0)}\} and \{\overline{(A = 2) or (X > 1)}\}$ $=\{(\overline{A > 1}) or (\overline{B = 0})\} and \{(\overline{A = 2}) and (\overline{X > 1})\}$ $=(\overline{A > 1}) and (\overline{A = 2}) and (\overline{X > 1}) or (\overline{B = 0}) and (\overline{A = 2}) and (\overline{X > 1})$ $=(A \le 1) and (X \le 1) or (B \neq 0) and (A \neq 2) and (X \le 1)$

$L_3(a \rightarrow b \rightarrow e)$
$=\{\overline{(A > 1) and (B = 0)}\} and \{(A = 2) or (X > 1)\}$ $=\{(\overline{A > 1}) or (\overline{B = 0})\} and \{(A = 2) or (X > 1)\}$ $=\{(A \le 1) and [(A = 2) or (X > 1)] or (B \neq 0) and [(A = 2) or (X > 1)]\}$ $=(A \le 1) and (X > 1) or (B \neq 0) and (A = 2) or (B \neq 0) and (X > 1)$

$L_4(a \rightarrow c \rightarrow d)$
$=\{(A > 1) and (B = 0)\} and \{\overline{(A = 2) or (\frac{X}{A} > 1)}\}$ $=(A > 1) and (B = 0) and (A \neq 2) and (\frac{X}{A} \le 1)$

2.2. 语句覆盖

语句覆盖 是设计若干个测试用例，运行被测程序，使得每一个可执行语句至少执行一次。

测试用例的设计格式如下：

【输入的 $(A, B, X)$ ，输出的 $(A, B, X)$ 】

满足语句覆盖要求的测试用例是：

参与人数	0
A	0
B	0
C	0
D	0

2.3. 判定覆盖

判定覆盖 是设计若干个测试用例，运行被测程序，使得程序中每个判断的取真分支和取假分支至少经历一次。判定覆盖又称为分支覆盖。

测试用例举例1：

$L_1$ : $[(2, 0, 4), (2, 0, 3)]$
$L_2$ : $[(1, 1, 1), (1, 1, 1)]$

测试用例举例2：

$L_3$ : $[(2, 1, 1), (2, 1, 2)]$
$L_4$ : $[(3, 0, 3), (3, 0, 1)]$

2.4. 条件覆盖

条件覆盖 是设计若干个测试用例，运行被测程序，使得程序中每个判断的每个条件的可能取值至少执行一次。

对于第一个判断：
- 条件 $A>1$ 取真值为 $T_1$ ，取假值为 $\overline{T_1}$ ；
- 条件 $B=0$ 取真值为 $T_2$ ，取假值为 $\overline{T_2}$ ；
对于第二个判断：
- 条件 $A=2$ 取真值为 $T_3$ ，取假值为 $\overline{T_3}$ ；
- 条件 $X>1$ 取真值为 $T_4$ ，取假值为 $\overline{T_4}$ ；

测试用例举例1：

测试用例	通过路径	条件取值	覆盖分支
$[(2, 0, 4), (2, 0, 3)]$	$ace (L_1)$	$T_1 T_2 T_3 T_4$	$c, e$
$[(1, 0, 1), (1, 0, 1)]$	$abd (L_2)$	$\overline{T_1} T_2 \overline{T_3} \overline{T_4}$	$b, d$
$[(2, 1, 1), (2, 1, 2)]$	$abe (L_3)$	$T_1 \overline{T_2} T_3 \overline{T_4}$	$b, e$

测试用例举例2：

测试用例	通过路径	条件取值	覆盖分支
$[(1, 0, 3), (1, 0, 4)]$	$abe (L_3)$	$\overline{T_1} T_2 \overline{T_3} T_4$	$b, e$
$[(2, 1, 1), (2, 1, 2)]$	$abe (L_3)$	$T_1 \overline{T_2} T_3 \overline{T_4}$	$b, e$

2.5. 判定-条件覆盖

判定-条件覆盖 是设计足够的测试用例，使得判断中每个条件的所有可能取值至少执行一次，同时每个判断本身的所有可能判断结果至少执行一次。

测试用例	通过路径	条件取值	覆盖分支
$[(2, 0, 4), (2, 0, 3)]$	$ace (L_1)$	$T_1 T_2 T_3 T_4$	$c, e$
$[(1, 1, 1), (1, 1, 1)]$	$abd (L_2)$	$\overline{T_1} \overline{T_2} \overline{T_3} \overline{T_4}$	$b, d$

2.6. 条件组合覆盖

条件组合覆盖 是设计足够的测试用例，运行被测程序，使得每个判断的所有可能的条件取值组合至少执行一次。

$A > 1, B = 0$ 记作 $T_1 T_2$ ，属第一个判断的取真分支；
$A > 1, B \neq 0$ 记作 $T_1 \overline{T_2}$ ，属第一个判断的取假分支；
$A \le 1, B = 0$ 记作 $\overline{T_1} T_2$ ，属第一个判断的取假分支；
$A \le 1, B \neq 0$ 记作 $\overline{T_1} \overline{T_2}$ ，属第一个判断的取假分支；
$A = 2, X > 1$ 记作 $T_3 T_4$ ，属第二个判断的取真分支；
$A = 2, X \le 1$ 记作 $T_3 \overline{T_4}$ ，属第二个判断的取真分支；
$A \neq 2, X > 1$ 记作 $\overline{T_3} T_4$ ，属第二个判断的取真分支；
$A \neq 2, X \le 1$ 记作 $\overline{T_3} \overline{T_4}$ ，属第二个判断的取假分支。

测试用例	通过路径	覆盖条件	覆盖组合号
$[(2, 0, 4), (2, 0, 3)]$	$ace (L_1)$	$T_1 T_2 T_3 T_4$	$1, 5$
$[(2, 1, 1), (2, 1, 2)]$	$abe (L_3)$	$T_1 \overline{T_2} T_3 \overline{T_4}$	$2, 6$
$[(1, 0, 3), (1, 0, 4)]$	$abe (L_3)$	$\overline{T_1} T_2 \overline{T_3} T_4$	$3, 7$
$[(1, 1, 1), (1, 1, 1)]$	$abd (L_2)$	$\overline{T_1} \overline{T_2} \overline{T_3} \overline{T_4}$	$4, 8$

2.7. 路径覆盖

路径覆盖 是设计足够的测试用例，覆盖程序中所有可能的路径。

测试用例	通过路径	覆盖条件
$[(2, 0, 4), (2, 0, 3)]$	$ace (L_1)$	$T_1 T_2 T_3 T_4$
$[(1, 1, 1), (1, 1, 1)]$	$abd (L_2)$	$\overline{T_1} \overline{T_2} \overline{T_3} \overline{T_4}$
$[(1, 1, 2), (1, 1, 3)]$	$abe (L_3)$	$\overline{T_1} \overline{T_2} \overline{T_3} T_4$
$[(3, 0, 3), (3, 0, 1)]$	$acd (L_4)$	$T_1 T_2 \overline{T_3} \overline{T_4}$

3. 基本路径覆盖

3.1. 程序的控制流图

控制流图 是描述程序的控制流的一种图示方法。

Figure 4: 控制流图的各种图形符号

符号〇称为控制流图的一个结点，它表示一个或多个无分支的 PDL语句或源程序语句。
一条边必须终止于一个结点，但在选择或多分支结构中分支的汇聚处，即使没有执行语句也应该有一个汇聚结点。
边和结点圈定的范围叫做区域，对区域计数时，图形外的范围也应记为一个区域。

Figure 5: 程序流程图与对应的控制流图

当判断中的条件表达式是复合条件时，需要改复合条件为一系列只有单个条件的嵌套的判断。

Figure 6: 复合逻辑下的控制流图

3.2. 程序环路复杂性

对于给定的控制流图 $G$ ，按 McCabe 给出的 环路复杂性 $V(G)$ 的计算方法如下：

环路复杂性定义为控制流程图中的区域数。
设 $E$ 为控制流图的边数， $N$ 为图中的结点数，则 $V(G) = E - N + 2$ 。
设 $P$ 为控制流图中的判定结点数，则 $V(G) = P + 1$ 。

从程序的环路复杂性可导出程序基本路径集合中的独立路径数。

独立路径 是指包括一组 以前没有处理 的语句或条件的一条路径。

path1: 1-11

path2: 1-2-3-4-5-10-1-11

path3: 1-2-3-6-8-9-10-1-11

path4: 1-2-3-6-7-9-10-1-11

3.3. 导出测试用例

以详细设计或源代码作为基础，导出程序的控制流图；
计算得到的控制流图 $G$ 的环路复杂性 $V(G)$ ；
确定线性无关的基本路径集；
生成测试用例，确保基本路径集中每条路径的执行。

4. 黑盒测试的测试用例设计

4.1. 等价类划分

等价类划分 是一种典型的黑盒测试方法，也是一种非常实用的重要测试方法。

步骤：

划分等价类（列出等价类表）
选取测试用例

4.1.1. 划分等价类

等价类 是指每个输入域的 子集合 ，在该 子集合 中，各个输入数据对于揭露程序中的错误都是等效的。

把数目极多的输入数据（有效的和无效的）划分为若干个等价类。并合理地假定：测试某等价类的代表值等价于对这一类其他值的测试。即：

如果用某个 等价类 中的一个数据作为测试数据进行测试查出了错误，则使用 该等价类 中的其他数据进行测试也会查出同样的错误；
如果用某个 等价类 中的一个数据作为测试数据进行测试没有查出错误，则使用 该等价类 中的其他数据进行测试也同样查不出错误。

因此，可以把全部可供输入的数据合理划分为若干等价类，在每一个等价类中取一个数据作为测试的输入，这样就可以用少量代表性测试数据，达到测试的要求。

等价类的划分 有两种不同的情况：

有效等价类 ：是指对于软件的规格说明来说，合理的、有意义的输入数据构成的集合。用于检验程序是否实现了规格说明预先规定的功能和性能。
无效等价类 ：是指对于软件的规格说明来说，不合理的、无意义的输入数据构成的集合。用于检查程序中功能和性能的实现是否有不符合规格说明要求的情况。

在设计测试用例时，要同时考虑有效等价类和无效等价类。软件不能都只接受合理的数据，还要经受意外的考验，检验出无效的或不合理的数据，这样的软件测试才是全面性的。

划分等价类的原则 ：

如果输入数据规定了取值范围或值的个数，则可以确定 一个有效等价类 和 两个无效等价类 。
如果规格说明规定了数据值的集合，或者是规定了必须如何的条件，则可以确定 一个有效等价类 和 一个无效等价类 。
如果规格说明规定了一个条件数据，则可确定 一个有效等价类 和 一个无效等价类 。
如果已划分的等价类中各元素在程序中的处理方式不同，则应将此等价类进一步划分成 更小的等价类 。

4.1.2. 确定测试用例

在确定了等价类之后，建立 等价类表 ，列出所有划分出的等价类：

输入数据	有效等价类	无效等价类
……	……	……
……	……	……

再从划分出的等价类中按以下原则选择测试用例：

为每一个等价类规定一个唯一的编号；
设计一个新的测试用例，使其尽可能多地覆盖 尚未被覆盖的有效等价类 ，重复这一步，直到 所有的有效等价类 都被覆盖为止；
设计一个新的测试用例，使其仅覆盖一个 尚未被覆盖的无效等价类 ，重复这一步，直到 所有的无效等价类 都被覆盖为止。

原则2 是为了把测试工作量减到最小，

原则3 则可把多个错误分开。

4.1.3. 用等价类划分法设计测试用例的实例

在某程序设计语言的语法中规定：

标识符是以字母开头，后跟字母或数字的任意组合而构成的。有效字符数为8个，最大字符数为80个。
标识符必须先说明，再使用。
在同一说明语句中，标识符至少必须有一个。

建立输入等价类表：

输入数据	有效等价类	无效等价类
标识符个数	1个 $^{(1)}$ ，多个 $^{(2)}$	0个 $^{(3)}$
标识符字符数	1~80个 $^{(4)}$	0个 $^{(5)}$ ，>80个 $^{(6)}$
标识符组成	字母 $^{(7)}$ ，数字 $^{(8)}$	非字母数字字符 $^{(9)}$ ，保留字 $^{(10)}$
第一个字符	字母 $^{(11)}$	非字母 $^{(12)}$
标识符使用	先说明后使用 $^{(13)}$	未说明已使用 $^{(14)}$

覆盖所有等价类的测试用例：

①	VAR x, T1234567 : REAL; BEGIN x := 3.414; T1234567 := 2.732; ……	(1), (2), (4), (7), (8), (11), (13)
②	VAR : REAL;	(3)
③	VAR x, : REAL;	(5)
④	VAR T12345…… : REAL;	(6) 多于80个字符
⑤	VAR T$ : CHAR;	(9)
⑥	VAR GOTO : INTEGER;	(10)
⑦	VAR 2T : REAL;	(12)
⑧	VAR PAR : REAL; BEGIN…… PAP := SIN(3.14 * 0.8) / 6;	(14)

4.2. 边界值分析

4.2.1. 边界值分析方法的考虑

边界值分析 也是一种黑盒测试方法，是对等价类划分方法的补充。

人们从长期的测试工作经验中得知，大量的错误是发生在输入或输出范围的边界上，而不是在输入范围的内部。

使用边界值分析方法设计测试用例，首先应分析边界情况。通常输入等价类与输出等价类的边界是需要认真考虑的。应当选取

正好等于边界的值
刚刚大于边界的值
刚刚小于边界的值

作为测试数据，而不是选取等价类中的典型值或任意值作为测试数据。

4.2.2. 选择测试用例的原则

边界值分析方法选择测试用例的原则在很多方面与等价类划分方法类似。

如果输入数据规定了值的范围，则应取刚达到这个范围的边界的值，以及刚刚超越这个范围边界的值作为测试输入数据。
如果输入数据规定了值的个数，则用最大个数、最小个数、比最大个数多1 、比最小个数少1 的数作为测试数据。
根据规格说明的每个输出数据，使用前面的原则1 。
根据规格说明的每个输出数据，使用前面的原则2 。
如果程序的规格说明给出的输入域或输出域是有序集合（如有序表、顺序文件等），则应选取集合的第一个元素和最后一个元素作为测试用例。
如果程序中使用了一个内部数据结构，则应当选择这个内部数据结构的边界上的值作为测试用例。
分析规格说明，找出其他可能的边界条件。

4.2.3. 应用边界值分析方法设计测试用例的实例

程序的输入文件由一些包含80个字符的记录（卡片）组成。输入数据记录格式如图所示：

Figure 7: 学生考卷评分和成绩统计程序输入数据形式（试卷部分）

Figure 8: 学生考卷评分和成绩统计程序输入数据形式（学生答卷部分）

记录可分为3组：

标题。这一组只有一个记录，其内容是成绩报告的名字。
各题的标准答案 。每个记录均在第80个字符处标以数字2。
- 第1个记录：第1~50题
  - 第1~3个字符 ：试题数（取值为1~999）
  - 第10~59个字符 ：第1~50题的标准答案（每个合法字符表示一个答案）
- 第2个记录：第51~100题
- 第3个记录：第101~150题
- ……
学生的答卷 。每个记录均在第80个字符处标以数字3，每个学生的答卷在若干个记录中给出。学生人数不超过200人，试题个数不超过999。
- 某甲的第1个记录：第1~50题
  - 第1~9个字符 ：学生的学号
  - 第10~59个字符 ：列出其所做的第1~50题的解答
- 某甲的第2个记录：第51~100题
- ……

程序的输出有4个报告：

按学号排列的成绩单 ，列出每个学生的成绩（百分制）、名次；
按学生成绩排序的成绩单 ；
平均分数 及 标准偏差的报告 ；
试题分析报告 。按试题号排列，列出各题学生答对的百分比。

输入数据	测试用例
输入文件	【空输入文件】
标题	【没有标题记录】【标题只有一个字符】【标题有80个字符】
试题数	【试题数为1】【试题数为50】【试题数为51】【试题数为100】【试题数为999】【试题数为0】【试题数含有非数字字符】
标准答案记录	【没有标准答案记录，有标题】【标准答案记录多一个】【标准答案记录少一个】
学生人数	【0个学生】【1个学生】【200个学生】【201个学生】
学生答题	【某学生只有一个回答记录，但有两个标准答案记录】【该学生是文件中的第一个学生】【该学生是文件中的最后一个学生（记录数出错的学生）】
	【某学生有两个回答记录，但只有一个标准答案记录】【该学生是文件中的第一个学生（指记录数出错的学生）】【该学生是文件中的最后一个学生】

输出数据	测试用例
学生成绩	【所有学生的成绩都相等】【每个学生的成绩都互不相同】【部分（不是全体）学生的成绩相同（检查是否能按成绩正确排名次）】【有个学生得0分】【有个学生得100分】
输出报告 $^{(1)}$ $^{(2)}$	【有个学生的学号最小（检查按学号排序是否正确）】【有个学生的学号最大（检查按学号排序是否正确）】【适当的学生人数，使产生的报告刚好印满一页（检查打印页数）】【学生人数使报告印满一页尚多出1人（检查打印换页）】
输出报告 $^{(3)}$	【平均成绩为100分（所有学生都得满分）】【平均成绩为0分（所有学生都得0分）】【标准偏差为最大值（有一半学生得0分，其他100分）】【标准偏差为0（所有学生得成绩都相等）】
输出报告 $^{(4)}$	【所有学生都答对了第一题】【所有学生都答错了第一题】【所有学生都答对了最后一题】【所有学生都答错了最后一题】【选择适当的试题数，使第四个报告刚好印满一页】【试题数使报告印满一页后，刚好剩下一题未打】

5. 软件测试的策略

通常 软件测试过程 按4个步骤进行，即

单元测试
组装测试
确认测试
系统测试

Figure 9: 软件测试的过程

5.1. 单元测试

单元测试（unit testing） 又称为模块测试，是针对软件设计的最小单位程序模块进行正确性检验的测试工作。其目的是在于发现各模块内部可能存在的各种差错。

单元测试需要从程序的内部结构出发设计测试用例。多个模块可以平行地独立进行单元测试。

5.2. 组装测试

组装测试（integrated testing） 也叫做集成测试或联合测试。通常，在单元测试的基础上，需要将所有模块按照设计要求组装成为系统。

需要考虑的问题是：

在把各个模块连接起来的时候，穿越模块接口的数据是否会丢失；
一个模块的功能是否会对另一个模块的功能产生不利的影响；
各个子功能组合起来，能否达到预期要求的父功能；
全局数据结构是否有问题；
单个模块的误差累积起来，是否会放大到不能接受的程度。

5.3. 确认测试

确认测试（validation testing） 又称有效性测试。它的任务是验证软件的有效性，即验证软件的功能和性能及其他特性是否与用户的要求一致。

进行有效性测试（黑盒测试）
软件配置复查
$\alpha$ 测试和 $\beta$ 测试
- $\alpha$ 测试是由一个用户在开发环境下进行的测试，也可以是公司内部的用户在模拟实际操作环境下进行的测试。
- $\beta$ 测试是由软件的多个用户在一个或多个用户的实际使用环境下进行的测试。这些用户是与公司签订了支持产品预发行合同的外部客户，他们使用产品，并愿意把所发现的错误信息反馈给开发者。
验收测试（acceptance testing）
确认测试的结果

5.4. 系统测试

系统测试（system testing） 是将通过确认测试的软件，作为整个计算机系统的一个元素，与计算机硬件、外设、某些支持软件、数据和人员等其他系统元素结合在一起，在实际运行（使用）环境下，对计算机系统进行一系列的组装测试和确认测试。

系统测试的目的 在于通过与系统的需求定义做比较，发现软件与系统定义不符合或与之矛盾的地方。

系统测试的测试用例应根据系统的需求规格说明书设计，并在实际使用环境下运行。

5.5. 测试的类型

Figure 10: 各测试步骤中的测试种类

6. 人工测试

人工测试 不要求在计算机上实际执行被测程序，而是以一些人工的模拟技术和一些类似动态分析所使用的方法对程序进行分析和测试。

6.1. 静态分析

静态分析 是要对源程序进行静态检验。通常采用以下方法进行：

生成各种引用表
- 标号交叉引用表
- 变量交叉引用表
- 子程序、宏结构和函数表
- 等价表
- 常数表
静态错误分析 ：用于确定在源程序中是否有某类错误或危险结构，有以下几种：
- 类型和单位分析
- 引用分析
- 表达式分析
- 接口分析

6.2. 人工测试方法

静态分析中进行 人工测试的主要方法 有桌面检查、代码评审和走查。

经验表明，使用这种方法能够有效地发现30%~70%的逻辑设计和编码错误。

7. 自动化测试

7.1. 自动化测试与手工测试

自动化测试 就是使用自动化测试工具或其他手段，按照测试工程师的预定计划对软件进行自动测试，

目的：减少手工测试的工作量，提高测试效率，从而提高软件产品的质量。
基本原理 ：首先识别软件中的各个对象，记录下用户的每一步操作，然后将这些操作转换为测试脚本。
适用情况 ：回归测试、压力测试、并发测试、强度测试、系统调优。
优点：准确可靠、高复用性、永不疲劳、重复测试节省时间，能够缩短测试周期、节省人力资源。
局限性 ：
- 缺乏创造性，难以发现新的缺陷；
- 很难进行界面和用户体验方面的测试；
- 需要做大量的准备工作，测试过程更复杂。

自动化测试不能完全取代手工测试，两者 互为补充 。据统计，自动化测试能够找出约 30% 的缺陷，大多数缺陷仍然需要依靠手工测试来发现。

7.2. 脚本技术

测试脚本 是一组测试工具执行的指令集合，既可以通过录制测试的操作步骤而产生，也可以直接用脚本语言编写。

线性脚本 是通过录制手工测试过程而得到的，只适合简单的测试使用。
结构化脚本 是在线性脚本的基础上加入了控制结构（顺序结构、选择结构和循环结构）以及函数调用功能。结构化脚本具有较好的可读性和复用性，易于维护。
数据驱动脚本 是将测试脚本和测试数据分离，将测试数据存储在独立的文件或数据库中。
关键字驱动脚本 是将测试脚本中的通用功能剥离出来，封装成关键字。

7.3. 自动化测试框架及测试流程

根据使用的脚本类型的不同，可将 自动化测试框架 分为：

线性框架 ：为录制/回放框架，通常不需要编写测试脚本，只需要录制一次测试过程，在以后的测试中回放所录制的结果即可。
数据驱动框架 ：将测试数据和测试脚本分离开来，能够方便地使用不同的测试数据多次测试同一个功能或特性，提高了脚本的复用性和维护性。
关键字驱动框架 ：使用关键字驱动脚本，提高了脚本的编写效率，使得脚本更容易维护，同时关键字在可以在多个测试中复用。

还可以从应用角度对 自动化测试框架 进行分类，例如：

单元测试框架
UI功能测试框架
移动应用测试框架
API测试框架
……

8. 调试

调试（debug） 也称排错或纠错，它是紧跟在测试之后要做的工作。但与测试不同之处在于：

测试在于发现软件中有错，发现异常或软件运行的可疑之处；
调试在于为错误确切地定位，找到出错的根源，并且通过修改程序将其排除。

8.1. 调试的步骤

针对测试提供的信息，分析错误的外部表现形式，确定程序出错的位置；
研究程序的相关部分，找出导致错误的内在原因；
修改相关的程序段，如果是设计导致的错误，则需修改相关的设计，以排除错误；
重复执行以前发现错误的测试，以确认：
- 该错误确已通过修改而消除；
- 这次修改并未引进新的错误。
如果重新测试表明修改无效，发生错误的现象仍然出现，则要撤销上述修改，再次进行信息分析，实施上述过程，直至修改有效为止。

8.2. 调试工作需认真对待的问题

认真分析错误征兆是成功完成调试的关键；
目前已开发出一些商品化调试工具，但应将其当作调试工作的辅助手段，它不可能代替人的思考和判断；
发现一个错误时需认真判断在其附近是否存在另外的错误，规律表明，一些错误的出现有聚集现象；
务必防止一个错误的修改带来新的错误，回归测试一定不可少。

9. 课后作业

（习题10.4） 简要说明白盒测试和黑盒测试的区别。如果认真做了两者之一，还需要再做另一种测试吗？
现在有一个档案管理系统，允许用户通过输入年月对档案文件进行检索，系统对查询条件年月的输入限定为1990年1月-2049年12月，并规定，日期由6位数字组成，前4位表示年，后2位表示月。使用等价类划分法设计测试用例。

根据需求进展分析，找出有哪些输入条件
- 年份： [1990, 2049]
- 月份： [01, 12]
- 字符长度： 6位
- 字符类型：数字

画出等价类

输入条件	有效等价类	边界值分析	无效等价类
年份	[1990, 2049] (1)	1990, 2049 (12); 1989, 2050; 2016	<1990 (2), >2049 (3)
月份	[01, 12] (4)	01, 12 (13); 00, 13; 11	<01 (5), >12 (6)
字符长度	6位 (7)	6; 5, 7; 6	<6 (8), >6 (9)
字符类型	数字 (10)		非数字 (11)

为每个等价类规定一个唯一编号
转换成测试用例
- 有效等价类用例
  - 用例1：201611 (1) (4) (7) (10)
- 无效等价类用例
  - 用例2：198911 (2)
  - 用例3：205011 (3)
  - 用例4：201600 (5)
  - 用例5：201613 (6)
  - 用例6：20161 (8)
  - 用例7：2016113 (9)
  - 用例8：20161a/abcedf (11)
根据边界值分析法分析后补充测试用例
- 用例9：199001 (12)
- 用例10：204912 (13)

测试用例	通过路径	条件取值	覆盖分支
\([(2, 0, 4), (2, 0, 3)]\)	\(ace (L_1)\)	\(T_1 T_2 T_3 T_4\)	\(c, e\)
\([(1, 0, 1), (1, 0, 1)]\)	\(abd (L_2)\)	\(\overline{T_1} T_2 \overline{T_3} \overline{T_4}\)	\(b, d\)
\([(2, 1, 1), (2, 1, 2)]\)	\(abe (L_3)\)	\(T_1 \overline{T_2} T_3 \overline{T_4}\)	\(b, e\)

测试用例	通过路径	条件取值	覆盖分支
\([(1, 0, 3), (1, 0, 4)]\)	\(abe (L_3)\)	\(\overline{T_1} T_2 \overline{T_3} T_4\)	\(b, e\)
\([(2, 1, 1), (2, 1, 2)]\)	\(abe (L_3)\)	\(T_1 \overline{T_2} T_3 \overline{T_4}\)	\(b, e\)

测试用例	通过路径	条件取值	覆盖分支
\([(2, 0, 4), (2, 0, 3)]\)	\(ace (L_1)\)	\(T_1 T_2 T_3 T_4\)	\(c, e\)
\([(1, 1, 1), (1, 1, 1)]\)	\(abd (L_2)\)	\(\overline{T_1} \overline{T_2} \overline{T_3} \overline{T_4}\)	\(b, d\)

测试用例	通过路径	覆盖条件	覆盖组合号
\([(2, 0, 4), (2, 0, 3)]\)	\(ace (L_1)\)	\(T_1 T_2 T_3 T_4\)	\(1, 5\)
\([(2, 1, 1), (2, 1, 2)]\)	\(abe (L_3)\)	\(T_1 \overline{T_2} T_3 \overline{T_4}\)	\(2, 6\)
\([(1, 0, 3), (1, 0, 4)]\)	\(abe (L_3)\)	\(\overline{T_1} T_2 \overline{T_3} T_4\)	\(3, 7\)
\([(1, 1, 1), (1, 1, 1)]\)	\(abd (L_2)\)	\(\overline{T_1} \overline{T_2} \overline{T_3} \overline{T_4}\)	\(4, 8\)

测试用例	通过路径	覆盖条件
\([(2, 0, 4), (2, 0, 3)]\)	\(ace (L_1)\)	\(T_1 T_2 T_3 T_4\)
\([(1, 1, 1), (1, 1, 1)]\)	\(abd (L_2)\)	\(\overline{T_1} \overline{T_2} \overline{T_3} \overline{T_4}\)
\([(1, 1, 2), (1, 1, 3)]\)	\(abe (L_3)\)	\(\overline{T_1} \overline{T_2} \overline{T_3} T_4\)
\([(3, 0, 3), (3, 0, 1)]\)	\(acd (L_4)\)	\(T_1 T_2 \overline{T_3} \overline{T_4}\)

输入数据	有效等价类	无效等价类
标识符个数	1个 \(^{(1)}\) ，多个 \(^{(2)}\)	0个 \(^{(3)}\)
标识符字符数	1~80个 \(^{(4)}\)	0个 \(^{(5)}\) ，>80个 \(^{(6)}\)
标识符组成	字母 \(^{(7)}\) ，数字 \(^{(8)}\)	非字母数字字符 \(^{(9)}\) ，保留字 \(^{(10)}\)
第一个字符	字母 \(^{(11)}\)	非字母 \(^{(12)}\)
标识符使用	先说明后使用 \(^{(13)}\)	未说明已使用 \(^{(14)}\)

输出数据	测试用例
学生成绩	【所有学生的成绩都相等】【每个学生的成绩都互不相同】【部分（不是全体）学生的成绩相同（检查是否能按成绩正确排名次）】【有个学生得0分】【有个学生得100分】
输出报告 \(^{(1)}\) \(^{(2)}\)	【有个学生的学号最小（检查按学号排序是否正确）】【有个学生的学号最大（检查按学号排序是否正确）】【适当的学生人数，使产生的报告刚好印满一页（检查打印页数）】【学生人数使报告印满一页尚多出1人（检查打印换页）】
输出报告 \(^{(3)}\)	【平均成绩为100分（所有学生都得满分）】【平均成绩为0分（所有学生都得0分）】【标准偏差为最大值（有一半学生得0分，其他100分）】【标准偏差为0（所有学生得成绩都相等）】
输出报告 \(^{(4)}\)	【所有学生都答对了第一题】【所有学生都答错了第一题】【所有学生都答对了最后一题】【所有学生都答错了最后一题】【选择适当的试题数，使第四个报告刚好印满一页】【试题数使报告印满一页后，刚好剩下一题未打】