工作站机群

科技工作者之家  |   2020-11-17 18:17

随着微处理器性能的不断提高,以微处理器为核心的工作站和台式个人计算机的性能都可以与并行计算机内部的一个处理机的性能相当,集合多台工作站构成工作站集群。

介绍在工作站集群系统中,影响并行计算效率的主要因素是数据通信,其中包括通信软件和硬件互联网络的性能。工作站集群互联网络多采用通信卡结合互联交叉开关构成层次式网络结构, 数据传输率的峰值性能能够达到4.2Gbps (64位66MHz PCI 总线)。随着对互联带宽需求的提高,数据传输技术成为构造高效工作站集群的关键之一。

工作站集群中的互联网络系统设计工作站集群系统中的硬件互联部分主要包括网络接口和交叉开关部分。网络接口是实现数据从计算机内部与外部交换的硬件部件,由于直接利用商用工作站作为计算平台,一般都采用插卡式网络接口部件,与工作站的外部I/O总线连接。网络接口主要完成大量成块数据的DMA直传任务,将计算任务要发送的数据自动从内存取出,成组发送,或将缓冲到达的数据,直接写入内存,CPU仅参与数据发送的启动和接收数据的处理。一般包括一块专用集成电路或微处理器和大容量缓冲存储器。网络交叉开关是连接多台工作站进行工作站间数据交换的硬件。网络交叉开关可以是多级互联构成的层次结构。层次结构模型是比较适合工作站集群的一种拓扑结构,它可以灵活配置、可扩展性好。图1给出了工作站集群一般的拓扑结构、结点机结构和网络接口结构1。

在网络接口部件中,数据在工作站的I/O总线和网络接口控制器之间传输,采用同步数据传输模式。最高性能的PCI总线可以实现66MHz、64位数据传输,数据传输率为4.2Gbps,其物理上的连线长度仅在5cm左右。如果采用这种方式连接网络接口与互联开关存在以下问题:首先是连接距离太短,不适合工作站集群方式下的分布并行体系结构;其次是数据位太宽、影响交叉开关集成电路的实现,如果要构造8*8交叉开关,至少需要1024条I/O引腿,这在实际工程设计中,是无法实现的。因此通常采用时钟域变换技术,通过变窄数据宽度,同时提高时钟频率的方法达到同样的数据传输性能。一般数据为16位宽,如果要达到4.2Gbps的数据传输率,其时钟频率要达到264MHz以上,在实际工程设计中主要的问题是频率高,信号衰减大,传输距离受到限制。主要采用源同步倍频技术结合差分信号传输技术来实现。如果要达到这样高的数据传输率, 同时保证系统连接的灵活性, 支持较长距离数据通信, 必须采用基于串行链路无全局时钟同步的传输技术。

本词条内容贡献者为:

王慧维 - 副研究员 - 西南大学