硬件服务器详解
硬件服务器是数据中心和企业网络的核心设备,硬件服务器是一种专门为网络中的其他计算机(客户端)提供各种服务的高性能计算机设备,具备强大的计算能力、存储能力和网络通信能力,可同时处理大量数据和多任务请求。简单来说,硬件服务器就是一个性能超级强大的计算机。由于硬件服务器需要全年365天,每天24小时不间断的运行,所以硬件服务器的内部硬件不同于普通PC的硬件,如果采用普通PC的硬件,很可能会发生硬件故障导
硬件服务器是数据中心和企业网络的核心设备,硬件服务器是一种专门为网络中的其他计算机(客户端)提供各种服务的高性能计算机设备,具备强大的计算能力、存储能力和网络通信能力,可同时处理大量数据和多任务请求。
简单来说,硬件服务器就是一个性能超级强大的计算机。由于硬件服务器需要全年365天,每天24小时不间断的运行,所以硬件服务器的内部硬件不同于普通PC的硬件,如果采用普通PC的硬件,很可能会发生硬件故障导致服务器宕机(死机)。即使是再牛逼的普通PC硬件,都不足以支持全年365天,每天24小时不间断的运行。

服务器高性能指的是,高核心数CPU和高内存资源硬件服务器:

一、主流硬件服务器厂商
以下是按照国内和国外分类的主流硬件服务器制造商:
1、国内

2、国外

二、硬件服务器和普通PC区别
硬件服务器和普通PC都在开机的时候会进行硬件自检(POST),但是硬件服务器由于检查的非常详细,所以启动速度很慢,普通PC硬件自检比较简单,所以速度很快。
1、硬件服务器
服务器承担着为网络中的众多用户或设备提供各种服务的重任,如数据存储、网络通信、应用程序运行等,任何硬件故障都可能导致严重的业务中断和数据丢失等问题,所以需要极其全面的硬件自检。服务器不仅要检查基本硬件,还要对 RAID 阵列、热插拔部件、冗余电源、专用网卡等进行详细检测,确保硬件能稳定运行。
此外,服务器可能配备了大量的内存、多个 CPU 以及复杂的存储系统等,自检程序需要对这些硬件进行全面的初始化和检测,以保证系统的稳定性和数据的完整性。这一系列细致的检查使得服务器启动时需要处理大量的信息和任务,从而导致启动速度相对较慢。
2、普通 PC
普通 PC 主要是满足个人用户的日常办公、娱乐等需求,对硬件稳定性的要求相对较低,即使某些非关键硬件出现问题,通常也不会造成严重后果。
因此,其自检主要是快速验证基本硬件是否能正常工作,确保系统能顺利启动并为用户提供基本的使用环境。而且普通 PC 的硬件配置相对简单,一般不会像服务器那样有大量的内存、多个 CPU 和复杂的存储系统等,需要检测的硬件设备数量和复杂程度都较低。所以,普通 PC 的硬件自检可以快速完成,进而启动速度相对较快。
三、硬件服务器种类
1、塔式服务器
塔式服务器(Tower Server)应该是见得最多也最容易理解的一种服务器结构类型,因为它的外形以及结构都跟立式PC差不多,当然,由于服务器的主板扩展性较强、插槽也多出一堆,所以个头比普通主板大一些,因此塔式服务器的主机机箱也比标准的ATX机箱要大,一般都会预留足够的内部空间以便日后进行硬盘和电源的冗余扩展。
塔式服务器其实和工作站有一些区别,塔式服务器更多的是提供算力支持(cpu、内存等),所以塔式服务器上通常只需要最基本的显卡即可。工作站是专业人员进行特定的专业计算和设计任务而设计的,像工程师进行 CAD 设计、设计师进行图形图像制作、科研人员进行科学计算等,重点在于满足专业用户对高性能计算和专业图形处理等需求,工作站定制程度更高。
总结来说就是塔式服务器更像是制式高性能计算机,通常只是提供算力支持,而工作站更像是定制高性能计算机,可以根据用户的需求灵活的定制所需的硬件。其实本质上塔式服务器和工作站没有区别,都是计算机。

2、机架式服务器
1993年3月2日,我国接入Internet第一根专线。
1994年,第一台机架式服务器诞生。但机架式服务器要配合机柜使用,且需要专门的机房来统一管理,部署成本较高。在互联网不那么发达的时代,传统的塔式服务器就可以满足企业的日常需求,因此机架式服务器市场低迷。
进入二十一世纪,互联网迅速发展,作为IT基础设置的服务器在企业中的作用越来越重要。早期的塔式服务器体积大,占用空间资源较多,且不便于集中管理,当企业使用多台服务器时,耗费成本过大。与之相比,虽然机架式服务器也有较高的部署成本,但机架式服务器可集中部署,统一管理的特性反而可以降低企业使用服务器的总体成本。因此,大中型企业在选购服务器时会优先考虑机架式服务器。
机架式服务器是工业标准化下的产品,其外观按照统一标准来设计,配合机柜统一使用,以满足企业的服务器密集部署需求。它的外形看来不像计算机,从尺寸上来说,机架式服务器的标准宽度为19英寸,高度以U为单位。
常见的机架服务器有1U、2U以及4U。(1U=1.75英寸=4.445cm)机架式服务器不同于塔式服务器那样可以竖着摆,他一般都需要在机柜上安装匹配的轨道,然后再将机架式服务器安装到机柜滑轨上,然后固定。

在安装机架式服务器之前,需要先准备好合适的机柜,并确保机柜已经安装稳固,电源和网络等基础设施已经就绪。同时,要根据服务器的尺寸和重量,选择合适的机柜轨道,一般机柜轨道会根据服务器的宽度和高度(以U 为单位)来适配。
将匹配的轨道安装到机柜的两侧。轨道通常有可调节的设计,以适应不同深度的服务器。安装时需要使用螺丝刀等工具,将轨道的螺丝孔与机柜上的相应孔位对齐并固定好,确保轨道安装牢固且水平。
将机架式服务器平稳地放置在机柜滑轨上,然后轻轻推入机柜,直到服务器的安装孔与机柜上的固定孔对齐。接着,使用螺丝将服务器固定在机柜上,确保服务器不会晃动或移位。在安装过程中,要注意避免服务器受到碰撞或刮擦,同时要确保服务器的电源线、网线等连接正确。
早期的机架式服务器没有滑轨,都是在机柜上安装一个横板,然后将机架式服务器放在横板上即可,这种方式不需要复杂的滑轨安装过程,只需在机柜内部合适位置安装横板,将服务器放置上去即可,对安装人员的技术要求相对较低。
将服务器安装到滑道中:

在服务器上两侧额外安装轨道固定铁片,以便插入滑轨:

服务器机柜很少配置导轨,一般服务器厂商提供对应的导轨。
相较于传统的塔式服务器,机架式服务器有以下优势:
- 外形规格统一:传统服务器外形大小不一,很难集中上架部署,而机架式服务器有统一的外形标准,可以集中地放置在标准规格的机柜中。
- 便于管理:机架式服务器一般集中放置在机柜中,所有数据线统一放入机柜的线槽,从外面看不到任何数据线。机柜平时锁起来,做到了防尘且整洁,便于管理人员管理。
- 安全性高:机架式服务器一般会由专用的机房来统一部署和管理,并能够设置严密的安保措施,一般人无法接触,安全性高。
3、刀片式服务器
⼑⽚服务器是指在标准⾼度的机架式机箱内可插装多个卡式的服务器单元,是⼀种实现HAHD(High Availability High Density,⾼可⽤⾼密度)的低成本服务器平台,为特殊应⽤⾏业和⾼密度计算环境专⻔设计。⼑⽚服务器就像“⼑⽚”⼀样,每⼀块“⼑⽚”实际上就是⼀块系统主板,它们可以通过本地硬盘启动自己的操作系统,类似于一个个独立的服务器。在这种模式下,每一个主板运行自己的系统,服务于指定的不同用户群。
管理员可以使用系统软件将这些母板集合成一个服务器集群。在集群模式下,所有的母板可以连接起来提供高速的网络环境,并同时共享资源,为相同的用户群服务。在集群中插入新的"刀片",就可以提高整体性能。而由于每块"刀片"都是热插拔的,所以,系统可以轻松地进行替换,并且将维护时间减少到最小。
这些刀片服务器在设计之初都具有低功耗、空间小、单机售价低等特点,同时它还继承发扬了传统服务器的一些技术指标,比如把热插拔和冗余运用到刀片服务器之中,这些设计满足了密集计算环境对服务器性能的需求;有的还通过内置的负载均衡技术,有效地提高了服务器的稳定性和核心网络性能。而从外表看,与传统的机架/塔式服务器相比,刀片服务器能够最大限度地节约服务器的使用空间和费用,并为用户提供灵活、便捷的扩展升级手段。
刀片式服务器已经成为高性能计算集群的主流,在全球超级500 强和国内100 强超级计算机中,许多新增的集群系统都采用了刀片架构。由于采用刀片服务器可以极大减少所需外部线缆的数量,可以大大降低由于线缆连接故障带来的隐患,提高系统可靠性。
10U高度刀箱服务器:

刀片服务器分为全刀和半刀,全刀服务器占用整个10U刀箱的1列,也就高度10U,半刀服务器只占用刀箱服务器高度的一半,也就5U。
对于数据中心来说,机架服务器,服务器和服务器间要间隔2U,方便通风散热。10U机架服务器一般放3个2U的服务器,对于10U刀箱可以放8个全U刀片服务器或者16个半刀服务器。
刀片式服务器除了可以独立进行管理之外,还可以通过"刀箱"对插入刀箱的刀片服务器进行统一的管理,比如控制刀箱内部的某个刀片服务器的电源。刀箱通常为标准的机架式设计,高度一般以 U 为单位衡量,常见的有7U、10U 等,可方便地安装在数据中心的服务器机架上,能有效节省空间,提高机房空间利用率。
刀箱内部设有多个刀片插槽,用于插入刀片服务器,支持半高、全高甚至更小型化的刀片服务器混插,以满足不同用户的需求。如某些刀箱可提供 8 个全高 Intel 刀片服务器槽位,也能支持 16 个半高刀片服务器。
四、常见硬件服务器专用机柜
机柜(rack)一般是指服务器机柜,是由冷轧钢板或合金精心制作而成 ,是专门用来存放计算机以及相关控制设备的物件。它就像是一个坚固的堡垒,为设备提供全方位的保护,能有效屏蔽电磁干扰,让设备在一个稳定的环境中运行。同时,它还能将各种设备有序、整齐地排列起来,为日后的维护工作带来极大的便利。简单来说,机柜就是电子设备的 “安全屋” 和 “整理师”。
Eaton E-Rack机柜;

1、机柜作用
1. 设备保护
机柜的首要作用是保护内部设备。它可以抵御外界的碰撞、灰尘、湿气以及电磁干扰,为设备创造一个稳定的运行环境。就像在数据中心,大量的服务器和网络设备安装在机柜中,避免了因外界因素导致的故障。
2. 电磁屏蔽
随着电子设备越来越多,电磁干扰也日益严重。机柜的金属材质能够有效屏蔽电磁干扰,防止设备之间的信号相互干扰,确保设备正常工作。比如在通信机房,机柜能保证通信设备的信号稳定传输。
3. 便于维护
机柜合理的布局和设计,使得设备的安装、拆卸和维护都变得更加方便。工作人员可以轻松地对设备进行操作,提高了工作效率。当服务器出现故障时,能快速在机柜中找到并进行维修。
4. 空间利用
在有限的机房空间内,机柜可以将各种设备集中放置,实现空间的高效利用。通过合理规划机柜的尺寸和内部结构,可以容纳更多的设备,满足不断增长的业务需求。
2、机柜的结构
1. 框架
机柜的框架是其核心支撑结构,通常采用优质的冷轧钢板或铝合金制成。框架的设计要保证足够的强度和稳定性,以承受内部设备的重量。常见的框架结构有焊接式和组装式,焊接式框架更加坚固耐用,组装式框架则便于运输和安装。
2. 尺寸规格
机柜遵循 19 英寸标准,宽度多为 600mm 或 800mm 。高度以 U 为单位衡量,1U 等于44.45mm(4.445cm),常见的高度有 22U、27U、32U、37U、42U 和 47U 等 。深度则有 600mm、800mm、1000mm 等多种选择,用户可以根据实际需求选择合适的尺寸。
3. 门与锁具
机柜一般配备前门和后门,有的还有侧面板。前门常见的有钢化玻璃门和网格式门。钢化玻璃门方便工作人员观察内部设备的运行状态;网格式门则具有良好的通风性能,有利于设备散热。门通常配备锁具,能有效防止未经授权的访问,保障设备安全。
4. 附件
机柜还配备了各种附件,如固定或可伸缩的导轨,方便设备的安装和固定;锁紧装置确保设备在机柜中稳固不晃动;铰链使门能够灵活开合;走线槽和走线架用于整理线缆,避免线缆杂乱无章;屏蔽梳形簧片则进一步增强了电磁屏蔽效果。
3、机柜种类-根据用途分类
按用途主要分为4类:
1. 服务器机柜主要用于安装服务器、网络设备等 IT 设备,通常具有较高的深度和宽度,以容纳服务器的尺寸和数量。服务器机柜内部通常配备有电源分配单元、冷却系统、线缆管理系统等,以满足服务器的运行需求。一般高度为 42U、47U 等,宽度为 19 英寸,深度有 600mm、800mm、1000mm 等多种规格。
2. 网络机柜用于安装网络交换机、路由器、防火墙等网络设备,一般侧重于网络布线和管理功能,内部结构相对灵活,便于线缆的连接和整理。其尺寸与服务器机柜类似,但可能在某些细节设计上更注重网络设备的散热和线缆管理,如配备更多的理线架、通风孔等。
3. 通信机柜主要应用于通信领域,用于安装通信传输设备、基站设备等。通信机柜通常需要具备良好的防护性能,以适应不同的户外环境或机房环境。一些通信机柜还会集成电源系统、空调系统等,以满足通信设备的特殊需求。
4. 综合机柜可以综合安装多种类型的设备,包括服务器、网络设备、通信设备等,适用于一些小型企业或机房空间有限的场所,能够满足多种设备的集中管理和布线需求。它的设计较为通用,内部空间和配置可以根据实际需求进行灵活调整。
现在机柜基本都是综合机柜。
五、硬件服务器重要硬件-主板
1、CPU槽位
服务器主板通常支持多个 CPU 同时工作,以满足大规模数据处理和多任务并发的需求。例如,一些服务器主板可支持 2 颗甚至 4 颗 CPU,能够提供强大的计算能力。
普通 PC 主板一般只支持单颗 CPU,其设计主要是为了满足个人用户日常办公、娱乐等单一用户场景下的计算需求。有2颗CPU的服务器我们一般也叫双路服务器,有4颗CPU的服务器我们一般也叫做四路服务器。服务器主板一般有几个CPU槽位,就会有几颗CPU,不会有空槽的情况。
2、内存容量与性能
服务器主板具备大量的内存插槽,可支持大容量的内存扩展,常见的可支持 64GB、128GB 甚至更高容量的内存,并且通常支持 ECC(错误检查和纠正)内存,能自动检测和纠正内存中的错误,确保数据的准确性和系统的稳定性。
普通 PC 主板内存插槽数量相对较少,一般支持 16GB、32GB 的内存就已经能满足大多数用户需求,部分高端游戏主板可能支持到 64GB,但普通 PC 主板通常不支持 ECC 内存。
3、主板元件
服务器主板采用了更高级的元器件,如高品质的电容、电阻等,以确保在长时间高负荷运行下的稳定性。其PCB(印刷电路板)层数通常较多,布线更加合理,可减少信号干扰,提高系统的可靠性。
普通 PC 主板在满足基本性能和稳定性的基础上,更注重成本和功能的平衡,元器件的选用和 PCB 设计主要是满足普通用户的使用场景,通常不需要长时间不间断运行。
4、冗余设计
服务器主板往往具备多种冗余设计,如双电源接口、多个网络接口等,当一个电源或网络接口出现故障时,另一个可以立即接管工作,保证系统的正常运行。
普通 PC 主板一般没有冗余设计,因为普通 PC 用户对系统不间断运行的要求相对较低,出现故障时可以接受一定时间的停机维修。
5、I/O 接口
服务器主板为了满足服务器与各种设备的连接需求,通常提供大量的 SATA 接口、SAS 接口等,用于连接多个硬盘组成 RAID 阵列,以实现数据的存储和冗余备份。同时,服务器主板上的 USB 接口等可能相对较少,并且网络接口一般为千兆或万兆以太网接口,以满足高速数据传输的需求。
普通 PC 主板SATA 接口数量一般能满足用户连接 2-4 个硬盘的需求,同时配备丰富的 USB 接口,以满足用户外接鼠标、键盘、移动存储设备等多种外设的需求,网络接口一般为百兆或千兆以太网接口,就能满足普通用户的上网需求。大多数只提供CPU算力的服务器一般不会使用什么高端显卡,能满足显卡的基本需求即可。
6、扩展插槽
服务器主板扩展插槽主要用于安装各种服务器专用的扩展卡,如 RAID 卡、PCIe网卡、HBA 卡等,以增强服务器的数据存储和网络连接能力,并且为了支持多颗 CPU 和大容量内存等,服务器主板的扩展插槽布局需要考虑散热和电气性能等因素。
普通 PC 主板扩展插槽主要用于安装独立显卡、声卡、网卡等普通扩展设备,以满足用户对游戏、多媒体等方面的需求,扩展插槽的布局更多地考虑与其他硬件的兼容性和用户的升级需求。
7、远程管理功能
服务器主板通常集成了强大的远程管理功能,如 IPMI(智能平台管理接口),管理员可以通过网络远程监控服务器的硬件状态,如温度、电压、风扇转速等,还可以进行远程开关机、重启等操作,方便对服务器进行集中管理和维护。
普通 PC 主板一般不具备远程管理功能,用户需要直接操作电脑才能进行各种管理和维护工作。
8、BIOS 功能
服务器主板BIOS 中提供了丰富的服务器专用设置选项,如 CPU 功耗管理、内存高级设置、RAID 配置等,以满足服务器在不同应用场景下的优化需求。
普通 PC 主板BIOS 功能主要侧重于系统启动设置、硬件基本参数配置等,以满足普通用户的日常使用需求。

六、硬件服务器重要硬件-CPU
1、CPU设计区别
服务器 CPU主要为满足服务器长时间高负荷运行、多任务处理以及大规模数据处理等需求而设计。需要具备强大的计算能力、高并发处理能力和出色的稳定性,以保证服务器能持续稳定地为大量用户提供服务。
普通 PC CPU是为满足个人用户在办公、娱乐、游戏等日常使用场景下的需求而设计。侧重于单任务或少量任务的快速处理,提供良好的用户交互体验。
2、核心与线程数量
服务器 CPU通常具有大量的核心和线程,例如英特尔的至强可扩展处理器,最多可达 128 个核心 256 个线程,能够同时处理大量的任务和数据,适用于云计算、大数据分析等对多核心性能要求极高的场景。
普通 PC CPU核心和线程数量相对较少,主流的桌面级 CPU 一般为 4 核心 8 线程、6 核心 12 线程或 8 核心 16 线程等,如英特尔酷睿 i7-12700K 为 12 核心 20 线程,主要满足日常办公软件、游戏等单用户多任务处理需求。
3、主频与睿频
服务器 CPU基础主频一般相对较低,但睿频能力也很强,主要依靠多核心和多线程以及稳定的性能输出,来应对大规模的数据处理和多任务并发。
普通 PC CPU通常具有较高的基础主频和睿频,能在短时间内快速提升频率,以应对如游戏等对单核心性能要求较高的应用,例如 AMD 的锐龙 7 7800X3D,基础频率 4.2GHz,加速频率可达 5.0GHz。
4、缓存容量
服务器 CPU往往拥有巨大的缓存,以减少数据访问延迟,提高数据处理效率。例如,一些高端服务器 CPU 的三级缓存可以达到 500MB 以上。
普通 PC CPU缓存容量相对较小,一般在 16MB 至 32MB 左右,如英特尔酷睿 i5-13600K 的三级缓存为 24MB。
5、指令集
服务器 CPU支持更多的高级指令集,如英特尔至强处理器支持 AVX-512 指令集,能够更高效地处理复杂的科学计算、数据加密等任务。
普通 PC CPU支持的指令集主要满足日常办公和娱乐需求,部分高端型号也会支持一些高级指令集,但应用场景相对较窄。
6、内存支持
服务器 CPU支持大容量的内存和更高的内存带宽,并且通常支持 ECC 内存,能够检测和纠正内存中的错误,确保数据的准确性和系统的稳定性。
普通 PC CPU对内存容量和带宽的需求相对较低,一般不支持 ECC 内存,主要考虑成本和普通用户的使用需求。
7、功耗与散热
服务器 CPU功耗相对较高,通常需要专业的散热系统来保证其稳定运行。数据中心会采用专门的空调制冷系统、散热风扇等设备,确保服务器 CPU 在合适的温度范围内工作。
普通 PC CPU功耗相对较低,一般的风冷散热器或小型水冷散热器就能满足散热需求,普通 PC 的机箱设计也主要考虑美观和空间利用等因素。
8、可靠性设计
服务器 CPU采用了更严格的制造工艺和质量控制标准,具有更高的可靠性和稳定性,能够在长时间不间断运行的情况下保持稳定的性能输出。
普通 PC CPU在满足普通用户日常使用的可靠性要求基础上,更注重性价比和性能表现,对于长时间高负荷运行的稳定性要求相对较低。
9、价格与市场定位
服务器 CPU价格相对较高,尤其是高端的多核心、大容量缓存的服务器 CPU,主要面向企业级用户、数据中心等,用于构建高性能的服务器集群和云计算平台等。
普通 PC CPU价格范围较广,从入门级到高端产品都有不同的价格区间,以满足不同用户的预算和需求,主要面向个人消费者、小型企业等普通用户市场。
10、Intel 服务器 CPU 型号
1. 至强可扩展系列
铂金(Platinum)系列:如 Xeon Platinum 8352V 等。通常是高端型号,具备强大的计算能力、超多核心与线程以及高内存带宽等特性,适用于对性能要求极高的云计算、大型数据中心等场景。
金牌(Gold)系列:像 Xeon Gold 6330、Xeon Gold 6348、Xeon Gold 5320 等。提供了较高的核心数、频率和缓存,在多任务处理和数据处理方面表现出色,是企业级服务器常用的型号。
银牌(Silver)系列:例如 Xeon Silver 4310、Xeon Silver 4314、Xeon Silver 4316 等25。相对金牌系列,在核心数、频率和缓存等方面稍低,能满足一般企业应用、网络服务等对性能要求不是顶级的场景。
铜牌(Bronze)系列:一般具有较低的核心数和频率,适用于对成本敏感且对性能要求相对不高的入门级服务器场景。
2. 至强 E 级系列
E-2xx 系列:如 E-2100、E-2124、E-2314、E-2324G 等。是面向企业级服务器市场的入门级或中低端产品,可提供一定的计算能力和稳定性,适用于小型企业、分支机构等的服务器应用。
E3、E5、E7 系列:如 Xeon E3-1230 v6、Xeon E5-2680 v4、Xeon E7 v3 等。曾是英特尔服务器CPU 的重要产品线,E3 系列相对适合入门级服务器或工作站,E5 系列适用于主流的双路或多路服务器,E7系列则更侧重于高端企业级应用,支持更多的内存和更强大的多处理器协作能力。
3. 至强 W 系列
至强 W-2500、至强 W-3500 等:专为工作站设计,提供高核心数和大缓存,适用于专业图形处理、工程设计、科学计算等对单系统性能要求较高的工作站场景。
4. 至强 D 系列
针对嵌入式系统、存储设备或其他特殊应用场景,如网络设备、工业控制、边缘计算等对空间、功耗有一定要求的领域。
可通过www.intel.com官网查看intel最新的CPU.
可通过www.amd.com官网查看amd最新的CPU.
七、硬件服务器重要硬件-内存
1、纠错能力
服务器内存常采用 ECC(Error Correcting Code,错误检查和纠正)技术。当内存的数据发生错误时,ECC 内存能够自动检测并纠正单位数据错误,保障数据的准确性和完整性。在服务器运行中,数据的精确性至关重要,如数据库中的交易记录、企业重要文件等,ECC 内存可有效避免因数据错误导致的严重后果。
普通PC 内存一般不具备 ECC 功能。普通用户日常使用场景,如办公文档处理、观看视频、玩游戏等,对数据偶尔出现的错误并不敏感,因此普通 PC 内存更注重成本和性能,而非数据纠错能力。普通 PC 主板的内存插槽数量和电气性能是有限的。如果单根内存容量过大,可能会超出主板内存控制器的支持范围,导致兼容性问题或不稳定现象。
2、稳定性与可靠性
服务器内存在元器件筛选、制造工艺及质量控制方面更为严格。服务器需长时间不间断运行,内存稳定性关乎整个系统的稳定,所以服务器内存采用高品质的芯片和材料,确保在长时间高负荷工作下,仍能保持稳定性能,减少故障发生概率。
普通 PC 内存虽然也有一定稳定性要求,但普通 PC 使用场景多为间断式,对内存长时间稳定运行的要求远低于服务器。普通 PC 内存更倾向于满足日常使用需求,在成本和稳定性间寻求平衡。
3、内存容量与扩展性
服务器由于要面临大量数据处理和多用户并发访问,需支持大容量内存。主板通常配备多个内存插槽,服务器内存单条容量也较大,常见的有 16GB、32GB,甚至 64GB,128G。可实现大容量内存扩展,以满足大型数据库、虚拟化等应用对内存的高需求。
普通 PC 应用场景对内存容量需求相对较小,主板内存插槽数量有限,单条内存容量常见为 4GB、8GB,虽部分高端游戏 PC 或专业工作站也可支持 16GB 甚至 32GB 单条内存,但整体内存扩展能力和需求低于服务器。
4、工作频率与性能
服务器内存工作频率并非追求极致高,更注重稳定数据传输和多任务处理能力。在多核心 CPU 及大量数据交互环境下,服务器内存需与其他硬件协同工作,确保数据在各组件间稳定、高效传输。
普通 PC 内存为满足游戏、图形处理等对速度敏感的应用,部分高性能普通 PC 内存会追求较高工作频率,以提升数据读写速度,在短时间内快速处理大量数据,增强游戏画面渲染、图形处理软件响应速度等。
5、价格
服务器内存因具备 ECC 功能、更高稳定性和可靠性要求,以及采用更优质材料和制造工艺,价格通常高于普通PC 内存。
普通 PC 内存面向大众消费市场,更注重性价比,价格相对亲民,以满足普通用户预算需求。

在金融等行业以及科学界,ECC 内存对于维持数据完整性至关重要。大多数服务器内存也是 ECC 内存。ECC内存进一步减少了数据崩溃情况,这对于多用户服务器应用程序非常重要。
需要注意的是,可能跟一般的想法有差异,虽然ECC内存更贵,但是它的性能实际上是相比同等级的非ECC内存要差的,这是因为纠错功能需要消耗性能的缘故。想用ECC内存,其他系统组件(例如,CPU 和主板)也必须支持 ECC 内存。
八、硬件服务器重要硬件-网卡
1、数据传输速率
服务器网卡通常支持更高的数据传输速率,常见的有 10Gbps、25Gbps、40Gbps 甚至 100Gbps 等高速率接口,以满足服务器处理大量数据和高并发连接的需求。
普通 PC 网卡一般以 1Gbps 为主流,部分高端产品可能支持 2.5Gbps 或 5Gbps。
2、吞吐量和稳定性
服务器网卡具备更高的吞吐量和稳定性,能够在长时间内稳定地传输大量数据,保证服务器的网络服务不中断。为实现这一点,服务器网卡通常采用更先进的芯片组和电路设计,配备更大容量的缓存,以应对高负载的数据传输。
普通 PC 网卡在日常使用中虽能满足一般网络需求,但在面对持续的大数据量传输时,可能会出现丢包、卡顿等现象。
3、多队列和中断调节
服务器网卡支持多队列技术,可将网络数据分配到多个 CPU 核心进行处理,提高系统的并行处理能力,减少 CPU 的负载。同时,能够进行精细的中断调节,根据网络负载动态调整中断频率,降低中断开销,提高系统性能。
普通 PC 网卡一般不具备或仅支持基本的多队列和简单的中断调节功能。
4、扩展网卡
服务器除了板载网卡之外,通常还需要扩展多个网卡,每个网卡有多个网口,不同的网口负责不同的网络传输,比如2个网口做网卡绑定负责管理网络,2个网口做网卡绑定负责业务网络,2个网口做网卡绑定负责存储网络,2个网口做网卡绑定负责迁移网络等。
普通 PC 网卡一般只有一个网口,能满足用户日常的上网需求即可。
5、光模块
咱们经常能看到服务器网卡上有SFP、QSFP 及相关的 SFP+、SFP28等字样,其实这些都是光模块领域的重要概念。
SFP(Small Form-factor Pluggable):即紧凑型小型可热插拔的收发模块,是 GBIC 模块的升级版本,具有 LC 接口,主体尺寸仅为 GBIC 的一半,能有效提高使用密度。可将网络设备主板与光纤或铜电缆网络连接,支持 SONET、千兆以太网、光纤通道等通信标准,传输速率一般在 100Mbps-4Gbps。
SFP+:是 SFP 的增强版本,支持高达 10Gbit/s 的数据速率,支持 8Gbit/s 光纤通道、10-Gigabit
以太网和 OTU2 光传输网络标准等。SFP + 和 SFP 外观尺寸相同,但采用了不同的标准,SFP 基于IEEE802.3 和 SFF-8472,而 SFP + 基于 IEEE 802.3ae、SFF-8431、SFF-8432。
SFP28:传输速率为 25Gbps 的光模块,符合 IEEE802.3、SFF-8472、SFF-8402、SFF-8432 和 SFF-8431 等多重标准与规范,主要用于 25G 以太网和 100G(4x25Gbps)以太网。
QSFP(Quad Small Form-factor Pluggable):即四通道小型可插拔模块,是一种高速可插拔解决方案,采用成熟的 XFP 关键技术,可实现 4 个通道同时传输数据。QSFP 能同时支持 4 通道传输,每条通道数据速率为 1Gbit/s。
QSFP+:是 QSFP 的升级版本,支持 4×10Gbit/s 通道传输,可通过 4 个通道实现 40Gbps 传输速率。广泛应用于交换机、路由器、主机适配器总线等网络设备以及企业存储系统,在保持与 XFP 相同端口体积的同时,密度可达 XFP 产品的 4 倍、SFP + 产品的 3 倍。
QSFP28:专为 100Gbps 应用而设计的高密度、高速产品,具有与 QSFP + 收发器相同的外形,提供四通道高速信号,每一路通道数据速率范围从 25Gbps 到可能 40Gbps,最终满足 100G 以太网(4×25Gbps)和400G(100Gbps 4X)InfiniBand 增强数据速率要求。
intel以太网产品:
九、硬件服务器重要硬件-远程管理卡
服务器的 BMC 网卡是服务器管理中的重要组成部分。BMC(Baseboard Management Controller)网卡是服务器中用于远程监控和管理的重要组件,它是一个独立于服务器主 CPU、内存和操作系统的专用子系统,拥有自己的处理器、内存、存储和网络接口,可以独立运行。
1、BMC子系统的功能
1. 硬件状态监控
能实时监测服务器的各项硬件状态,包括但不限于 CPU 温度、系统电压、风扇转速、硬盘状态等。
例如,当CPU 温度过高时,BMC 会及时发出警报,以便管理员采取措施。
2. 电源管理
支持远程控制服务器的电源,如开机、关机、重启等操作。管理员可以通过网络在远程轻松对服务器进行电源管理,方便进行维护和故障排查。
3. 固件(firmware)升级
可实现服务器固件的在线升级,方便管理员及时更新服务器的 BIOS、驱动程序等固件,以修复安全漏洞、提升性能和增加新功能。
4. 远程管理功能
通过网络接口,管理员可以在远程通过 IP 地址或相关协议访问 BMC 管理界面,进行各种管理操作,如查看系统日志、配置硬件参数等。
5. 系统事件记录
能够记录系统的各种事件和日志,如硬件故障、开机 / 关机记录、登录信息等,这些日志对于故障排查和系统审计非常有帮助。
2、远程管理卡的访问方式
服务器的 BMC 网卡配备专门的以太网接口,通常被标记为 IPMI 或 BMC 端口。这种专用网口提供独立网络路径,即使服务器主操作系统崩溃或网络设置错误,也能保证对 BMC 的访问。
部分服务器支持 BMC 与服务器主操作系统共享同一个物理网口,即通过 NC-SI(Network Controller – Sideband Interface)技术实现。BMC 芯片与网络控制器互联,使用网络控制器上的接口,以节省成本和空间。
3、远程管理卡支持的通信协议
1. IPMI 协议
BMC 网卡通常遵循 IPMI(Intelligent Platform Management Interface)标准,这是一组用于监控系统健康和管理硬件的规范和接口,定义了 BMC 与其他管理工具之间的通信方式和命令集。
2. 其他协议
除 IPMI 外,BMC 也可能支持 SNMP(简单网络管理协议)、SMASH CLP(系统管理架构标准命令行界面协议)和 Redfish 等协议,以实现与不同管理系统的兼容性和互操作性。
4、BMC的配置与使用
网络连接:将 BMC 端口通过网络线连接到管理网络,一般是与主网络分离的专用网络,以提高安全性。
BMC的网络一般叫做OOB(out of band)网络-带外管理网络;服务器上的操作系统的管理网络我们一般叫做inband网络-带内管理网络。
配置 IP 地址:可通过服务器的 BIOS 或 UEFI 设置,为 BMC 接口配置静态 IP 地址,也可设置为通过DHCP 自动分配。
使用管理工具:不同服务器制造商提供各自的专用管理软件或界面,如 HPE 的 iLO、Dell 的iDRAC 或IBM 的 IMM。管理员使用为 BMC 接口设置的 IP 地址进行连接,输入用户名和密码登录后,即可进行各种管理操作。
5、BMC在服务器管理中的重要性
1. 提高运维效率
管理员无需到服务器现场,即可远程完成大部分管理操作,大大节省了时间和人力成本,尤其适用于大规模数据中心的服务器管理。
2. 增强系统可靠性
实时的硬件状态监控和报警功能,使管理员能够及时发现并解决潜在的硬件问题,避免故障扩大,提高服务器系统的稳定性和可用性。
3. 方便远程维护
在服务器出现故障时,管理员可以通过 BMC 远程查看系统日志、诊断故障原因,甚至进行远程修复操作,减少了停机时间,降低了对业务的影响。
6、常见的服务器厂商的远程管理卡名称所带系统名称
惠普:iLO(Integrated Lights-Out)
戴尔:iDrac(Integrated Dell Remote Access Controller)
华为:iBMC(Intelligent Baseboard Management Controller)
思科:CIMC(Cisco Integrated Management Controller)
IBM:IMM(Integrated Management Module)
浪潮:BMC(Baseboard Management Controller)
超微:IPMI(Intelligent Platform Management Interface)
富士通:IRMC(Integrated Remote Management Controller)
曙光:SMC(Server Management Controller)







十、硬件服务器重要硬件-电源PSU,UPS,PDU
在硬件服务器系统中,电源 PSU、UPS、PDU 是保障服务器稳定运行的重要硬件。
1、电源 PSU(Power Supply Unit)
PSU 是服务器的内部电源供应单元,主要功能是将市电(通常是交流电)转换为服务器内部各硬件组件所需的直流电,为服务器的 CPU、内存、硬盘、主板等设备提供稳定的电力支持,确保它们能够正常工作。
按转换效率可分为 80PLUS 白牌、铜牌、银牌、金牌、白金和钛金等不同等级,等级越高,转换效率越高,越节能;按外形可分为 ATX 电源、1U 电源、2U 电源等,以适应不同服务器机箱的空间需求。
服务器PSU一般具有较高的功率,常见的有 500W、750W、1000W 等,以满足服务器多硬件设备的供电需求;服务器PSU具备良好的稳定性和可靠性,采用高品质的电子元件和先进的电路设计,以保证在长时间高负载运行下的稳定供电;支持冗余功能,一些高端服务器会配备多个 PSU,当其中一个出现故障时,其他 PSU 可以继续为服务器供电,确保服务器正常运行。


2、不间断电源 UPS(Uninterruptible Power Supply)
UPS 主要用于在市电中断时,为服务器等设备提供临时的电力支持,使设备能够正常关机或继续运行一段时间,以避免因突然断电而导致的数据丢失、设备损坏等问题。同时,它还能对市电进行净化,稳定电压和频率,保护服务器免受电源波动、浪涌等电力问题的影响。
UPS有很多种类,主要有在线式 UPS、后备式 UPS 和在线互动式 UPS。在线式 UPS 在市电正常和市电中断时都由逆变器为负载供电,供电质量高,但价格相对较高;后备式 UPS 在市电正常时由市电直接为负载供电,市电中断时才切换到逆变器供电,价格相对较低,但切换时间相对较长;在线互动式 UPS 则介于两者之间。
UPS具有电池组,能够存储一定的电量,在市电中断时为服务器提供电力支持,电池容量越大,支持的时间越长;具备快速切换功能,在市电中断的瞬间,能够迅速切换到电池供电模式,切换时间通常在几毫秒到几十毫秒之间,以确保服务器不会因断电而停机;具有智能管理功能,可以通过软件实现对 UPS 的远程监控和管理,实时查看 UPS 的工作状态、电池电量、输入输出电压等信息,并可设置定时关机、远程关机等功能。

3、电源分配单元 PDU(Power Distribution Unit)
PDU 是用于集中分配电力的设备,它通常安装在服务器机柜中,主要功能是将一路电源输入分配成多个输出接口,为服务器、网络设备、存储设备等各种机柜内的硬件设备提供电源插座,方便设备的电源连接和管理。同时,一些 PDU 还具备电源监测、防雷击、防浪涌、远程控制等功能。
PDU按功能可分为普通 PDU、智能 PDU 和工业级 PDU。普通 PDU 主要提供电源分配功能;智能 PDU 除了电源分配外,还具备实时监测电流、电压、功率、电量等电力参数,以及远程控制电源开关、端口管理等功能;工业级 PDU 则具有更高的防护等级和可靠性,适用于恶劣的工业环境。
PDU具有多个电源输出接口,常见的有 10A、16A、32A 等不同规格的插座,以满足不同设备的电源需求;支持多种输入接口,如 C13、C19 等,可根据实际需求选择合适的输入电源;智能 PDU 可以通过网络接口实现远程管理,管理员可以在远程通过网络对 PDU 的每个输出端口进行开关控制、状态监测等操作,方便对机柜内设备的电源进行集中管理和维护。



4、服务器电源和普通 PC 电源在多个方面存在区别
1. 功率
服务器电源:服务器通常需要同时运行多个处理器、大量内存、多个硬盘以及各种扩展卡等设备,对电力需求大,因此服务器电源的功率一般较高,常见的有 500W、750W、1000W 甚至更高,一些大型数据中心的服务器电源功率可能达到数千瓦。
普通 PC 的硬件配置相对简单,一般只需为一个处理器、少量内存、一两个硬盘和普通显卡等设备供电,功率需求相对较低,常见的功率范围在 300W 至 600W 之间。
2. 稳定性与可靠性
服务器通常需要长时间不间断运行,对电源的稳定性和可靠性要求极高。服务器电源采用高品质的电子元件,具备更好的散热设计和更严格的质量控制标准,以确保在长时间高负载运行下的稳定供电。很多服务器电源还支持冗余功能,即配备多个电源模块,当其中一个出现故障时,其他电源可以继续为服务器供电,保证服务器的正常运行。
普通 PC 一般不需要像服务器那样长时间连续运行,对电源的稳定性要求相对较低。虽然也能满足日常使用,但在长时间高负荷运行或遇到电力波动等情况时,出现故障的概率相对较高,且通常不具备冗余功能。
3. 效率
为了降低数据中心的运营成本和能耗,服务器电源通常具有更高的转换效率,一般都能达到80PLUS 铜牌及以上标准,部分高端服务器电源甚至能达到白金或钛金级别,在不同负载下都能保持较高的转换效率,将更多的输入电能转换为有效输出,减少能源浪费。
普通 PC 电源的转换效率参差不齐,一些中低端产品可能仅满足基本的能效标准,转换效率相对较低,在高负载运行时可能会消耗更多的电能,产生更多的热量。
4. 外形尺寸与接口
服务器电源需要适应不同规格的服务器机箱,外形尺寸较为多样化,常见的有 1U、2U 等规格,体积相对较小,以节省服务器机箱空间。电源接口方面,除了提供标准的主板供电接口和硬盘供电接口外,还可能提供多个专门为服务器主板、CPU 和特殊设备设计的接口,以满足服务器复杂的硬件配置需求。
普通 PC 电源的外形尺寸相对较为统一,通常采用标准的 ATX 或 Micro ATX 规格,体积较大。接口类型主要是满足普通 PC 硬件的需求,如为主板提供 24 针供电接口、为 CPU 提供 4 针或 8 针供电接口、为硬盘和光驱提供 SATA 或大 4D 供电接口等,接口数量和种类相对较少。
5. 管理功能
服务器电源通常支持智能管理功能,可通过服务器的管理软件或硬件管理接口,实现对电源的实时监控和管理,如监测电源的输出电压、电流、温度等参数,以及实现远程开关机、电源状态告警等功能,方便管理员对服务器电源进行集中管理和维护。
普通 PC 电源一般不具备复杂的管理功能,用户只能通过电脑的操作系统进行基本的电源开关操作,无法对电源的运行状态进行详细监测和远程管理。
十一、硬件服务器重要硬件-散热器
1、风冷散热器
服务器散热和普通 PC 散热在散热需求、散热设计、散热部件以及维护管理等方面都存在明显区别。
1. 散热需求
服务器通常需要长时间高负荷运行,并且放置在数据中心等环境中,往往是多台服务器密集部署。服务器内的CPU、内存、硬盘等硬件长时间处于高负载工作状态,会产生大量热量,如果散热不及时,会导致硬件性能下降、寿命缩短,甚至出现故障,影响整个业务系统的运行。所以服务器对散热的要求非常高,需要确保在各种工作负载下都能有效散热,维持稳定的工作温度。
普通 PC 一般用于日常办公、娱乐等场景,使用时间和负载相对不固定,工作负载通常低于服务器。虽然也需要散热,但对散热的持续性和稳定性要求相对较低,一般能满足日常使用中的散热需求,保证电脑不出现因过热而死机等问题即可。
2. 散热设计
为了实现高效散热,服务器通常采用冗余散热设计,配备多个散热风扇,形成多路风道,确保冷空气能充分流经各个发热部件,热空气能及时排出。一些高端服务器还会采用液冷等先进散热技术,以提高散热效率,降低噪音。服务器的机箱设计也会充分考虑散热需求,通常具有更多的散热孔和通风通道,以促进空气流通。
普通 PC 的散热设计相对简单,一般在机箱内安装一到两个散热风扇,主要针对 CPU 和电源进行散热,通过机箱上的散热孔排出热空气。一些高性能的游戏 PC 可能会增加机箱风扇数量或采用水冷散热器来加强散热,但整体散热设计的复杂性和规模远低于服务器。
3. 散热部件
服务器的散热风扇通常具有更高的转速和更大的风量,能够在单位时间内交换更多的空气,以满足服务器的散热需求。同时,服务器的风扇通常采用工业级设计,具有更高的可靠性和稳定性,能够长时间连续运行。服务器的CPU 散热器也通常采用更大尺寸的散热鳍片和更高效的导热材料,以提高散热效率。
普通 PC 的散热风扇相对较小,转速和风量根据 PC 的性能需求而定,一般以静音和满足基本散热需求为主要目标。
CPU 散热器的尺寸和性能也相对适中,部分普通 PC 可能会采用下压式散热器,安装方便但散热效率相对有限。
4. 监控与管理
服务器通常配备了完善的散热监控系统,可以实时监测各个部件的温度、风扇转速等参数,并通过服务器管理软件进行远程监控和管理。当温度超过设定阈值时,系统会自动报警,并采取相应的措施,如提高风扇转速、降低服务器负载等,以确保服务器的安全运行。
普通 PC 虽然也能通过主板 BIOS 或第三方软件监测硬件温度,但监控功能相对简单,一般不具备远程管理功能。用户通常只能在本地通过软件查看温度情况,当温度过高时,需要手动检查和解决散热问题。
5. 转速范围
服务器风扇转速通常较高,一般情况下,服务器风扇的转速可以达到 5000 转以上,部分服务器风扇在高负载或高温环境下,转速甚至能达到 10000 转或更高。
普通 PC 风扇转速相对较低,一般普通 PC 的 CPU 风扇转速在 1000-2500 转左右,常规的机箱风扇转速在 3000-5000 转之间,一些高性能的游戏 PC 风扇转速可能会超过 5000 转,达到 7000 转左右。
6. 调速机制
服务器风扇具备更智能和复杂的调速机制。服务器通常配备多个温度传感器,可实时监测不同区域的温度,风扇控制器会根据这些温度数据以及服务器的负载情况,精确地调整风扇转速。当服务器中某个部件温度升高或整体负载增加时,风扇会迅速提高转速,以确保散热效果。
普通 PC 风扇调速机制相对简单,主要依据 CPU 温度或主板温度来调节转速。一般 PC 主板上的风扇控制器根据预设的温度阈值,当温度达到一定值时,风扇转速会相应提高,但调节的精度和速度相对服务器风扇要差一些。
7. 转速稳定性
服务器风扇需要在长时间内保持稳定的转速,以确保服务器持续稳定运行。无论服务器处于何种工作状态,风扇都要能稳定地提供所需的风量,保证散热效果,避免因转速波动导致散热不良,影响服务器性能和寿命。
普通 PC 风扇在日常使用中,由于 PC 的负载变化相对不那么剧烈,对风扇转速稳定性的要求相对较低。虽然也需要保持一定的稳定性,但在一些情况下,如电脑运行大型游戏或软件时,风扇转速可能会有较大幅度的波动,但只要能满足散热需求,一般不会对 PC 造成严重影响。
8. 平均转速
服务器风扇由于服务器通常需要 24 小时不间断运行,且内部硬件密集,发热量巨大,为了保证散热效果,服务器风扇的平均转速通常较高,会持续以较高的转速运行来维持服务器内部的温度平衡。
普通 PC 在日常办公、浏览网页等常规使用场景下,硬件负载较低,产生的热量相对较少,风扇不需要一直以高转速运行,平均转速相对服务器风扇要低很多,只有在运行大型软件或游戏等高负载任务时,风扇转速才会升高,但整体平均转速仍低于服务器风扇。
2、冷板式液冷
通过冷板将服务器 CPU、GPU 等发热元器件的热量间接传递给封闭在循环管路中的冷却液体。冷却液体在循环泵的驱动下在管路中流动,将热量带走并传递到一次侧回路,通过冷却系统进行冷却,最后将热量排出系统。
3、浸没式液冷
单相浸没式液冷使用高沸点冷却液,在散热过程中始终保持液态。服务器发热元件将热量传递给冷却液,使其温度升高,随后在循环泵驱动下,升温的冷却液流到热交换器与外部冷却介质进行热量交换,降温后回到服务器浸没区域,继续循环散热。
相变浸没式液冷采用低沸点冷却液,吸收服务器发热元件热量后迅速从液态转变为气态,气态冷却液上升到容器顶部,经水冷冷凝器冷却,释放热量后重新凝结成液态,回流到服务器浸没区域,完成散热循环。
鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。
更多推荐



所有评论(0)