computer network

1. 基本概念

1.1 数据、信号与码元

数据是指传送信息的实体。信号是指数据的电气或电磁表现,是数据在传输过程中的存在形式。数据和信号都可用 “模拟的” 或 “数字的” 来修饰:① 连续变化的数据(或信号)称为模拟数据(或模拟信号);② 取值仅允许为有限的几个离散数值的数据(或信号)称为数字数据(或数字信号)。

数据传输方式可分为串行传输和并行传输。串行传输是指一个一个的比特按照时间顺序传输(出于经济上的考虑,远距离通信通常采用串行传输),并行传输是指多个比特通过多条通信信道同时传输。

码元是指用一个固定时长的信号波形(数字脉冲)表示一位 k 进制数字,代表不同离散数值的基本波形,是数字通信中数字信号的计量单位,这个时长内的信号称为 k 进制码元,而该时长称为码元宽度。1 码元可以携带多个比特的信息量。例如,在使用二进制编码时,只有两种不同的码元:一种表示 0 状态,另一种表示 1 状态。

1.2 信源、信道与信宿

数据通信是指数字计算机或其他数字终端之间的通信。一个数据通信系统主要划分为信源、信道和信宿三部分。

信源是产生和发送数据的源头。信宿是接受数据的重点,它们通常都是计算机或其他数字终端装置。发送端信源发出的信息需要通过变换器转换成适合于在信道上传输的信号,而通过信道传输到接收端的信号先由反变换器转换成原始信息,再发送给信宿。

信道与电路并不等同,信道是信号的传输媒介。一个信道可视为一条线路的逻辑部件,一般用来表示向某个方向传送信息的介质,因此一条通信线路往往包含一条发送信道和一条接受信道。噪音源是信道上的噪音(即对信号的干扰)及分散在通信系统其他各处的噪声的集中表示。

下图是一个单向通信系统的模型。实际的通信系统大多为双向的,即往往包含一个发送信道和一条接受信道,信道可以进行双向通信。

communication system model

信道按传输信号形式的不同可分为传送模拟信号的模拟信道和传送数字信号的数字信道两大类;信道按传输介质的不同可分为无线信道和有线信道。

信道上传送的信号由基带信号和宽带信号之分。几代信号将数字信号 1 和 0 直接用两种不同的电压表示,然后送到数字信道上传输(称为基带传输);宽带信号将基带信号进行调制后形成频分复用模拟信号,然后传送到模拟信道上传输(称为宽带传输)

从通信双方信息的交互方式看,可分为三种基本方式:

  1. 单工通信。只有一个方向的通信而没有反方向的交互,仅需要一条信道。例如,无线电广播、电视广播就属于这种类型。
  2. 半双工通道。通信的双方都可以发送或接收信息,但任何一方都不能同时发送和接收信息,此时需要两条信道。
  3. 全双工通信。通信的双方都可以发送或接收信息,也需要两条信道。

信道的极限容量是指信道的最高码元传输速率或信道的极限信息传输速率。

1.3 速率、波特与带宽

速率也称数据率,指的是数据的传输速率,表示单位时间内传输的数字量。可以用码元传输速率和信息传输速率表示。

  1. 码元传输速率。又称码元速率、波形速率等,它表示单位时间内数字通信系统所传输的码元个数(也可称为脉冲个数或信号变化的次数),单位是波特(Baud)。1 波特表示数字通信系统每秒传输一个码元。这里的码元可以是多进制的,也可以是二进制的,但码元速率与进制数无关。
  2. 信息传输速率。又称信息速率、比特率等。它表示单位时间内数字通信系统传输的二进制码元个数(即比特数),单位是比特/秒(b/s)

注意:波特和比特是两个不同的概念,码元传输速率也称调制速率、波形速率或符号速率。但码元传输速率与信息传输速率在数量上却又有一定的关系。若一个码元携带 n 比特的信息量,则 M 波特率的码元传输速率所对应的信息传输速率为 Mn 比特/秒。

带宽原指信号具有的频带宽度,单位是赫兹(Hz)。在实际网络中,由于数据率是信道最重要的指标之一,而宽带与数据率存在数值上的互换关系,因此常用来表示网络的通信线路所能传输数据的能力。因此,带宽表示单位时间内从网络中的某一点到另一点所能通过的 “最高数据率” 。显然,此时宽带的单位不再是 Hz,而是 b/s 。

2. 奈奎斯特定理与香农定理

2.1 奈奎斯特定理

奈奎斯特(Nyquist)定理又称奈氏准则,它指出在理想低通(没有噪音、带宽有限)的信道中,极限码元传输率为 2W 波特,其中 W 是理想低通信道的带宽,单位为 Hz。若用 V 表示每个码元离散电平的数目(码元的离散电平数目是指有多少种不同的码元,比如有 16 种不同的码元,则需要 4 位二进制位,因此数据传输率是码元传输率的 4 倍),则极限数据率为

理想低通信道下的极限数据传输率 = $2 W\log_2V$ (单位为 b/s)

对于奈氏准则,可以得出以下结论

  1. 在任何信道中,码元传输的速率是有上限的。若传输速率超过此上限,就会出现严重的码间串扰问题(指在接收端收到的信号波形失去了码元之间的清晰界限),使得接收端不可能完全正确识别码元。
  2. 信道的频带越宽(即通过的信号高频分量越多),就可用更高的速率进行码元的有效传输。
  3. 奈氏准则给出了码元传输速率的限制,但并未对信息传输速率给出限制,即未对一个码元可以对应多少个二进制位给出限制。

由于码元的传输速率受奈氏准则的制约,所以要提高数据的传输速率,就必须设法使每个码元携带更多个比特的信息量,此时就需要采用多元制的调制方法。

2.2 香农定理

香农(Shannon)定理给出了带宽受限且有高斯白噪声干扰的信道的极限数据传输率,当用此速率进行传输时,可以做到不产生误差。香农定理定义为

信道的极限数据传输率 = $W\log_2(1+S/N)$ (单位为 b/s)

式中,W 为信道的带宽,S 为信道所传输信号的平均功率,N 为信道内部的高斯噪声功率。S/N 为信噪比,即信号的平均功率与噪声的平均功率之比,信噪比 = $10\lg(S/N)$ (单位为 dB) ,例如当 S/N=10 时,信噪比为 10dB,而当 S/N=1000 时,信噪比为 30 dB 。

对于香农定理,可以得到以下结论:

  1. 信道的带宽或信道的信噪比越大,信息的极限传输速率越高。
  2. 对一定的传输带宽和一定的信噪比,信息传输速率的上限是确定的。
  3. 只要信息的传输速率低于信道的极限传输速率,就能找到某种方法来实现无差错的传输。
  4. 香农定理得出的是极限信息传输速率,实际信道能达到的传输速率要比它低不少。

从香农定理可以看出,若信道带宽 W 或信噪比 S/N 没有上限(实际信道当然不可能这样),则信道的极限信息传输速率也没有上限。

奈氏准则只考虑了带宽与极限码元传输速率的关系,而香农定理不仅考虑到了带宽,也考虑到了信噪比。这从另一个侧面表明,一个码元对应的二进制位数是有限的。

3. 编码与调制

数据无论是数字的还是模拟的,为了传输的目的都必须转变成信号。把数据变换为模拟信号的过程称为调制,把数据变换为数字信号的过程称为编码。

信号是数据的具体表现形式,它和数据有一定的关系,但又和数据不同。数字数据可以通过数字发送器转换为数字信号传输,也可以通过调制器转换为模拟信号传输;同样,模拟数据可以通过 PCM 编码器转换为数字信号传输,也可以通过放大器转换为模拟信号传输。这样,就形成了下列 4 种编码方式。

3.1 数字数据编码为数字信号

数字数据编码用于基带传输中,即在基本不改变数字数据信号频率的情况下,直接传输数字信号,对于这种编码方式,具体用什么样的数字信号表示 0 或 1 就是所谓的编码。编码的规则有多种,只要能有效地把 1 和 0 区分开即可,常用的编码方式有以下几种

digital data coding

  1. 非归零编码

    非归零编码(NRZ)用两个电压来表示两个二进制数字,如用低电压表示 0,用高电压表示 1;或者相反。这种编码虽然容易实现,但没有检错功能,而且也无法判断一个码元的开始和结束,以至于收发双方难以保持同步。

  2. 曼切斯特编码

    曼切斯特编码(Manchester Encoding)将一个码元分成两个相等的间隔,前一个间隔为高电平而后一个间隔为低电平表示码元 1;码元 0 的表示方法正好相反。当然,也可采用相反的规定。该编码的特点是,在每个码元的中间出现电平跳变,位中间的跳变既作为时钟信号(可用于同步),又作为数据信号,但它所占的频带宽度是原始基带宽度的两倍。以太网使用的编码方式就是曼切斯特编码。

  3. 差分曼切斯特编码

    差分曼切斯特编码常用于局域网传输,其规则是:若码元为 1,则前半个码元的电平与上一个码元的后半个码元的电平相同;若码元为 0,则情形相反。该编码的特点是,在每个码元的中间都有一次电平的跳转,可以实现自同步,且抗干扰性较好。

  4. 4B/5B 编码

    将欲发送数据流的每 4 为作为一组,然后按照 4B/5B 编码规则将其转换成相应的 5 位码。5 位码共 32 种组合,但只采用其中的 16 种对于 16 种不同的 4 位码,其他的 16 种作为控制码(帧的开始和结束、线路的状态信息等)或保留。

3.2 数字数据调制为模拟信号

数字数据调制技术在发送端将数字信号转换为模拟信号,而在接收端将模拟信号还原为数字信号,分别对应于调制解调器的调制和解调的过程。基本的调制方法有如下几种:

  1. 幅移键控(ASK)。通过改变载波信号的振幅来表示数字 1 和 0,而载波的频率和相位都不改变。比较容易实现,但抗干扰能力差。

  2. 频移键控(FSK)。通过改变载波信号的频率来表示数字 1 和 0,而载波的振幅和相位都不改变。容易实现,抗干扰能力强,目前应用较为广泛。

  3. 相移键控(PSK)。通过改变载波信号的相位来表示数字 1 和 0,而载波的振幅和频率都不改变。它又分为绝对调相和相对调相。

  4. 正交振幅调制(QAM)。在频率相同的前提下,将 ASK 和 PSK 结合起来,形成叠加信号。设波特率为 B,采用 m 个相位,每个相位有 n 中振幅,则该 QAM 技术的数据传输率 R 为

    $R=B\log_2(mn)$ (单位为 b/s)

下图是二进制幅移键控、频移键控和相移键控的例子。2ASK 中用载波有幅度和无幅度分别表示数字数据的 “1” 和 “0” ;2FSK 中用两种不同的频率分别表示数字数据 “1” 和 “0”;2 PSK 中用相位 0 和相位 $\pi$ 分别表示数据的 “1” 和 “0” ,是一种绝对调相方式。

digital modulation

3.3 模拟数字编码为数字信号

这种编码方式最典型的例子是常用于对音频信号进行编码的脉码调制(PCM)。它主要包括三个步骤,及采样、量化和编码。

先来介绍采样定理:在通信领域,带宽是指信号最高频率于最低频率只差,单位为 Hz。因此,将模拟信号转换成数字信号时,假设原始信号中的最大频率为 f,那么采样频率必须大于等于最大频率 f 的两倍,才能保证采样后的数字信号完整保留原始模拟信号的信息(只需记住结论)。另外,采样定理又称奈奎斯特定理。

  1. 采样是指对模拟信号进行周期性扫描,把时间上连续的信号变成时间上离散的信号。根据采样定理,当采样的频率大于等于模拟数据的频带带宽(最高变化频率)的两倍时,所得的离散信号可以无失真地代表被采样的模拟数据。
  2. 量化就是把采样取得的电平幅值按照一定的分级标度转化为对应的数字值并取整数,这样就把连续的电平幅值转换为了离散的数字量。采样和量化的实质就是分割和转换。
  3. 编码是把量化的结果转换为与之对应的二进制编码。

3.4 模拟数据调制为模拟信号

为了实现传输的有效性,可能需要较高的频率。这种调制方式还可以使用频分复用(FDM)技术,充分利用带宽资源。电话机和本地局交换机采用模拟信号传输模拟数据的编码方式;模拟的声音数据是加载到模拟的载波信号中传输的。

4. 电路交换、报文交换与分组交换

4.1 电路交换

在进行数据传输前,两个结点之间必须先建立一条专用(双方独占)的物理通信路径(由通信双方之间的交换设备和链路逐段连接而成),该路径可能经过许多中间结点。这一路径在整个数据传输期间一直被独占,知道通信结束后才被释放。因此,电路交换技术分为三个阶段:连接建立、数据传输和连接释放。

从通信资源的分配角度来看,“交换” 就是按照某种方式动态地分配传输线路的资源。电路交换的关键点是,在数据传输的过程中,用户始终占有端对端的固定传输带宽。

电路交换的优点如下:

  1. 通信时延小。由于通信线路为通信双方专用,数据直达,因此传输数据的时延非常小。当传输的数据量较大时,这一优点非常明显。
  2. 有序传输。双方通信时按发送顺序传输数据,不存在失序问题。
  3. 没有冲突。不同的通信双方拥有不同的信道,不会出现争用物理信道的问题。
  4. 适用范围广。电路交换既适用于传输模拟信号,又适用于传输数字信号。
  5. 实用性强。通信双方之间的物理通路一旦建立,双方就可以随时通信。
  6. 控制简单。电路交换的交换设备(交换机等)及控制均较简单。

电路交换技术的缺点如下:

  1. 建立连接时间长。电路交换的平均连接建立时间对计算机通信来说太长。
  2. 线路独占,使用效率低。电路交换连接建立后,物理通路被通信双方独占,即使通信线路空闲,也不能供其他用户使用,因而信道利用率低。
  3. 灵活性差。只要在通信双方建立的通路中的任何一点出了故障,就必须重新拨号建立新的连接,这对十分紧急和重要的通信是很不利的。
  4. 难以规格化。电路交换时,数据直达,不同类型、不同规格、不同速率的终端很难相互进行通信,也难以在通信过程中进行差错控制。

注意,电路建立后,除源结点和目的结点外,电路上的任何结点都采用 “直通方式” 接收数据和发送数据,即不会存在存储转发所耗费的时间。

4.2 报文交换

数据交换的单位是报文,报文携带有目标地址、源地址等信息。报文交换在交换结点采用的是存储转发的传输方式。

报文交换技术的优点如下:

  1. 无须建立连接。报文交换不需要为通信双方预先建立一条专用的通信线路,不存在建立连接时延,用户可以随时发送报文。
  2. 动态分配线路。当发送方把报文交给交换设备时,交换设备先存储整个报文,然后选择一条合适的空闲线路,将报文发送出去。
  3. 提高线路可靠性。如果某条传输路径发生故障,那么可重新选择另一条路径传输数据,因此提高了传输的可靠性。
  4. 提高线路利用率。通信双方不是固定占有一条通信线路,而是在不同的时间一段一端地部分占有这条物理通道,因而大大提高了通信线路的利用率。
  5. 提供多目标服务。一个报文可以同时发送给多个目的地址,这在电路交换中是很难实现的。

报文交换技术的缺点如下:

  1. 由于数据进入交换结点后要经历存储、转发这一过程,因此会引起转发时延(包括接收报文、检验正确性、排队、发送时间等)。
  2. 报文交换对报文的大小没有限制,这就要求网络结点需要有较大的缓存空间。

注意:报文交换主要使用在早期的电报通信网中,现在很少使用,通常被较先进的分组交换方式所取代。

4.3 分组交换

同报文交换一样,分组交换也采用存储转发方式,但解决了报文交换中大报文传输的问题。分组交换限制了每次传送的数据块的大小的上限,把大的数据块划分为合理的小数据块,再加上些必要的控制信息(如源地址、目的地址和编号信息等),构成分组(Packet)。网络结点根据控制信息把分组送到下一结点,下一结点接收到分组后,暂时保存并排队等待传输,然后根据分组控制信息选择它的下一个结点,直到到达目的结点。

分组交换的优点如下:

  1. 无建立时延。不需要为通信双方预先建立一条专用的通信线路,不存在连接建立时延,用户可随时发送分组。
  2. 线路利用率高。通信双方不是固定占有一条通信线路,而是在不同的时间一段一段地部分占有这条物理通路,因而大大提高了通信线路的利用率。
  3. 简化了存储管理(相对于报文交换)。因为分组的长度固定,相应的缓冲区的大小也固定,在交换结点中存储器的管理通常被简化为对缓冲区的管理,相对比较容易。
  4. 加速传输。分组是逐个传输的,可以使后一个分组的存储操作与前一个分组的转发并行,这种流水线方式减少了报文的传输时间。此外,传输一个分组所需的缓冲区比传输一次报文所需的缓冲区要小得多,这样缓冲区不足而等待发送的概率及时间也必然少得多。
  5. 减少了出错概率和重发数据量。因为分组较短,其出错概率必然减小,所以每次重发的数据量也就大大减少,这样不仅提高了可靠性,也减少了传输时延。

分组交换的缺点如下:

  1. 存在传输时延。尽管分组交换比报文交换的传输时延少,但相对于电路交换仍存在转发时延,而且其结点交换机必须具有更强的处理能力。
  2. 需要传输额外的信息量。每个小数据块都要加上源地址、目的地址和分组编号等信息,从而构成分组,因此使得传送的信息量增大了 5% ~ 10%,一定程度上降低了通信效率,增加了处理时间,使控制复杂,时延增加。
  3. 当分组交换采用数据报服务时,可能会出现失序、丢失或重复分组,分组到达目的结点时,要对分组按编号进行排序等工作,因此很麻烦。若采用虚电路服务,虽无失序问题,但有呼叫建立、数据传输和虚电路释放三个过程。

下面给出了三种数据交换方式的比较。要传送的数据量很大且其传送时间远大于呼叫时间时,采用电路交换较为合适。端到端的通路由多段链路组成时,采用分组交换传送数据较为合适。从提高整个网络的信道利用率上看,报文交换和分组交换优于电路交换,其中分组交换比报文交换的时延小,尤其适合于计算机之间的突发式数据通信。

5. 数据报与虚电路

分组交换在主要通信子网中进行,进一步分为面向连接的虚电路方式和无连接的数据报方式。这两种方式都是由网络层提供。注意数据报方式和虚电路方式是分组交换的两种方式。

5.1 数据报

报文拆开若干份,加上控制信息和序号,以及地址信息,成为网络层 PDU,每个数据报分组的路线不同。

  1. 不需要建立连接
  2. 尽最大努力交付
  3. 分组自带信息,可独立传输
  4. 排队有时延
  5. 有冗余路径
  6. 时延小,吞吐量大
  7. 不独占链路

5.2 虚电路

数据报方式+电路交换方式

6. 习题

7. 习题答案