全面 · 专业 · 实时更新

服务器硬件
基础知识全览

深入了解构建和支持服务器系统的核心物理组件——从处理器到散热系统,涵盖规格参数、选型建议与行业最新动态。

处理器
CPU / APU
内存
DDR4 / DDR5
存储
HDD / SSD / NVMe
RAID
冗余阵列

处理器(CPU)

Central Processing Unit — 服务器的计算核心

处理器是服务器执行计算和处理数据的核心组件,直接决定了服务器的运算能力、并发处理效率和能效表现。服务器处理器与消费级处理器相比,拥有更多核心、更大缓存、更强RAS(可靠性、可用性、可维护性)特性,并支持ECC内存和多路互联。

主流服务器处理器(2024-2025)

型号 品牌 核心/线程 基础/加速频率 缓存 TDP 制程
Intel Xeon 6990P Intel 128核/256线程 2.0 / 3.5 GHz 480MB L3 500W Intel 7
Intel Xeon 6780E Intel 128核/128线程 2.2 / 3.0 GHz 320MB L3 300W Intel 7
AMD EPYC 9754 AMD 128核/256线程 2.4 / 3.1 GHz 512MB L3 360W 5nm
AMD EPYC 9684X AMD 96核/192线程 2.55 / 3.7 GHz 1152MB L3 400W 5nm
Intel Xeon w9-3495X Intel 56核/112线程 1.9 / 4.8 GHz 105MB L3 350W Intel 7

服务器CPU关键特性

  • 支持ECC内存,可纠正单比特错误
  • 多路SMP互联(Intel UPI / AMD Infinity Fabric)
  • 支持虚拟化(Intel VT-x/VT-d, AMD-V)
  • RAS特性:MCA恢复、热插拔、故障隔离
  • 更高MTBF(平均无故障时间),7×24运行保障

选型建议

  • Web/应用服务器:16-32核即可满足多数场景
  • 数据库服务器:优先选择高单核性能+大L3缓存
  • 虚拟化平台:核心数量为王,128核+适合高密度VM
  • HPC/AI训练:关注FLOPS/GPU协同+内存带宽
  • 能效考量:E系列(能效核)适合高密度并发

内存(RAM)

Random Access Memory — 高速数据缓冲

服务器内存用于临时存储操作系统、应用程序和数据的活跃部分,使处理器能够以极低延迟访问所需信息。服务器内存与桌面内存的关键区别在于支持ECC(错误纠正码),能自动检测和修正内存中的数据错误,保障数据完整性。

DDR4
3200 MT/s
主流频率 · 单条最大 128GB
DDR5
5600 MT/s
新一代标准 · 单条最大 256GB
MCR DIMM
8800 MT/s
Multiplexed Rank · 2024新兴

服务器内存关键参数

参数说明推荐值
类型ECC UDIMM / RDIMM / LRDIMM / 3DS RDIMM服务器推荐 RDIMM 或 LRDIMM
容量单条 16GB–256GB,服务器可插 8–32 条数据库≥512GB,虚拟化≥1TB
频率DDR4: 2666–3200 MT/s; DDR5: 4800–5600 MT/s优先选高频,注意与CPU匹配
通道Intel: 8通道/CPU; AMD: 12通道/CPU每通道至少1条DIMM以满带宽
ECCSEC-DED(单纠双检)或 Chipkill(多比特纠正)服务器必须启用ECC
CL延迟DDR4 CL22; DDR5 CL40(等效延迟相近)DDR5虽CL高但实际延迟不劣于DDR4

硬盘 / 固态驱动器

Storage — 持久化数据载体

服务器存储是操作系统、应用程序和数据的持久化载体。根据介质类型分为HDD(机械硬盘)和SSD(固态硬盘),SSD又分为SATA SSD和NVMe SSD。企业级存储更关注耐久性(DWPD)、写入延迟和QoS一致性。

HDD

最大容量:30TB(CMR)

顺序读取:~270 MB/s

随机IOPS:~200

延迟:~5ms

冷数据 / 归档

SATA SSD

最大容量:15.36TB

顺序读取:~550 MB/s

随机IOPS:~100K

延迟:~0.1ms

通用 / 混合负载

NVMe SSD

最大容量:30.72TB

顺序读取:~14 GB/s (PCIe 5.0)

随机IOPS:~2500K

延迟:~0.02ms

高性能 / 数据库

企业级SSD代表产品

型号接口容量DWPD顺序读/写随机读IOPS
Samsung PM1743PCIe 5.0 x41.92–15.36TB1 DWPD13,000/6,600 MB/s2,500K
Solidigm D7-P5810PCIe 4.0 x43.2–12.8TB3 DWPD7,200/5,500 MB/s1,500K
Samsung PM9A3PCIe 4.0 x40.96–15.36TB1 DWPD6,900/4,200 MB/s1,000K
Kioxia CM7-RPCIe 5.0 x41.6–12.8TB3 DWPD12,000/5,600 MB/s2,000K
Seagate Exos X20SATA HDD20TB~270/260 MB/s~200

主板

Motherboard — 连接一切的核心骨架

服务器主板是连接和支持处理器、内存、存储和其他组件的核心电路板,其设计决定了系统的扩展上限和稳定性。服务器主板与消费级主板的区别在于:支持双路/四路CPU、更多内存插槽、更多PCIe通道、IPMI/BMC远程管理等。

核心组件与接口

  • CPU插槽:LGA 4677 (Intel) / SP5 (AMD)
  • 内存插槽:16–32条 DIMM(双路最高支持8TB+)
  • PCIe插槽:5–10个 PCIe 5.0 x16 / x8
  • M.2 / U.2 接口:用于NVMe SSD直连
  • BMC芯片:AST2600,支持IPMI 2.0远程管理

服务器主板形态

  • ATX(305×244mm):入门单路服务器
  • E-ATX(305×330mm):单路/双路中高端
  • EE-ATX / SSI-EEB(330×305mm):双路高性能
  • SSI-MEB:四路CPU超大主板
  • 定制板:OEM/ODM整机定制,如Dell/HP/Supermicro
BMC远程管理:服务器主板内置的BMC(基板管理控制器)芯片(如ASPEED AST2600)支持IPMI 2.0/Redfish协议,可实现远程开关机、KVM over IP、虚拟媒体挂载、传感器监控(温度/电压/风扇转速),即使OS崩溃也能远程管理。

网络接口卡(NIC)

Network Interface Card — 数据通行的门户

网络接口卡是服务器连接局域网或互联网的核心组件,决定了数据传输的带宽和延迟。现代服务器通常集成多端口高速网卡,也可通过PCIe扩展专用智能网卡(SmartNIC)或DPU(数据处理单元)来卸载CPU的网络处理负担。

1 GbE
基础网络
10 GbE
主流标准
25 GbE
数据中心主流
400 GbE
超高性能

主流服务器网卡产品

型号品牌速率端口数接口特性
ConnectX-7NVIDIA/Mellanox400GbE / NDR1–2PCIe 5.0 x16硬件加密、RDMA、Virtio
E810-CQDA2Intel100GbE2PCIe 4.0 x16DPU、RDMA、IPsec
BCM57508Broadcom200GbE2PCIe 4.0 x16SmartNIC、P4可编程
X710-DA4Intel10GbE4PCIe 3.0 x8SR-IOV、iWARP/RoCE
BlueField-3NVIDIA400GbE1–2PCIe 5.0 x16DPU、16核Arm、OVS卸载

电源供应单位(PSU)

Power Supply Unit — 服务器的心脏供血

服务器电源提供稳定、连续的电力供应,是整个系统可靠运行的基础。服务器通常配置冗余电源(1+1或2+2),支持热插拔,确保在单电源故障时系统不停机。80 PLUS认证是衡量电源转换效率的重要标准。

80 PLUS 认证等级

白牌 (Standard)80% 效率
铜牌 (Bronze)85% 效率
银牌 (Silver)88% 效率
金牌 (Gold)90% 效率
铂金牌 (Platinum)94% 效率
钛金牌 (Titanium)96% 效率

服务器电源核心规格

  • 常见功率:550W / 800W / 1200W / 1600W / 2000W+
  • 冗余配置:1+1 / 2+1 / 2+2 热插拔
  • 电压输入:100–240V AC / 200–240V AC / -48V DC
  • 输出规格:+12V为主,+3.3V/+5V辅助
  • PFC:主动式PFC,功率因数≥0.99
  • 保护机制:OVP/OCP/SCP/OTP/OPP
  • 电源形态:ATX / EPS / CRPS(Common Redundant Power System)

散热系统

Cooling System — 保持冷静,确保稳定

服务器散热系统负责将CPU、GPU、内存等组件产生的热量及时排出,确保芯片在安全温度范围内运行。数据中心级散热方案正从传统风冷向液冷演进,以应对AI/ML负载带来的TDP飙升(单GPU可达700W+)。

风冷散热

最传统方案,通过高转速风扇(8K-18K RPM)配合散热片/热管。数据中心采用冷热通道隔离设计,PUE约1.3-1.6。40×28mm/80×80mm风扇为服务器常见规格。

≤300W TDP

冷板式液冷

在CPU/GPU上安装冷板,通过冷却液(去离子水+乙二醇)循环带走热量,散热效率是风冷的3000倍。PUE可降至1.05-1.15,当前AI服务器主流方案。

300W-1000W TDP

浸没式液冷

将整台服务器浸没在绝缘冷却液中(单相或双相),液体直接接触所有发热组件。散热效率最高,PUE可低至1.02-1.05,适合超算和AI集群。

1000W+ TDP
温度参考:CPU正常工作温度30°C–85°C,T-junction上限通常为95°C–105°C。GPU(如H100 SXM)正常工作温度可达80°C+,建议液冷环境保持进液温度在30°C–45°C。服务器机柜出风温度应≤40°C。

RAID 控制器

Redundant Array of Independent Disks

RAID(独立磁盘冗余阵列)通过将多个物理硬盘组合为逻辑单元,实现数据冗余保护、I/O性能提升或两者兼得。硬件RAID控制器内置专用处理器(如Broadcom SAS3916),可卸载主CPU的RAID计算任务,并提供BBU/Flash缓存保障写入安全。

RAID级别最少磁盘冗余能力容量利用率读性能写性能适用场景
RAID 0 2无冗余100% 优秀 优秀 临时数据/缓存
RAID 1 2单盘故障50% 良好 一般 操作系统/关键小数据
RAID 5 3单盘故障(n-1)/n 良好 一般 文件服务器/通用
RAID 6 4双盘故障(n-2)/n 良好 较慢 重要数据/大容量阵列
RAID 10 4每组1盘50% 优秀 优秀 数据库/高性能
RAID 50 6每组1盘中等 优秀 良好 大数据/中等冗余
RAID 60 8每组2盘中等 良好 一般 超大阵列/高可靠性

硬件RAID vs 软件RAID

  • 硬件RAID:专用处理器卸载CPU,BBU/FBWC保障断电写缓存安全,支持热备盘,管理独立于OS
  • 软件RAID:Linux mdraid / Windows Storage Spaces,零硬件成本,灵活性高,但占用CPU资源
  • HBA直通:IT模式HBA卡(如LSI 9300-8i),直接将磁盘暴露给OS,常用于ZFS/CEPH等软件定义存储

主流RAID控制器

  • Broadcom MegaRAID 9560-16i:PCIe 4.0,16端口,支持RAID 0/1/5/6/10/50/60,4GB缓存
  • Microchip Adaptec RAID 41616:PCIe 4.0,16端口,支持NVMe RAID
  • Broadcom SAS3916:16端口 SAS4 HBA,支持24Gbps SAS
LATEST NEWS

行业最新动态

2024-2025年服务器硬件领域的重大发布与趋势

热门 2025年1月

Intel 发布 Granite Rapids-D 与 Sierra Forest 更新型号

Intel 在2024年底至2025年初持续扩展 Xeon 6 产品线。Granite Rapids(P核)面向高性能计算,最高128核;Sierra Forest(E核)面向高密度云原生,最高288核。Intel 3制程带来约20%能效提升,支持MRDIMM内存,带宽较DDR5 RDIMM提升约40%。

发布 2024年10月

AMD EPYC 9005 系列 "Turin" 正式发布

AMD 于2024年10月发布第五代 EPYC 9005 系列(Turin),基于 Zen 5 架构,最高192核/384线程(Turin-X),TDP最高500W。Turin-X 3D V-Cache 版本提供超过 2.6GB L3 缓存,单路性能大幅提升。支持 DDR5 6000 MT/s 和 PCIe 5.0 CXL 扩展。

趋势 2025年

AI服务器液冷渗透率快速提升

受 NVIDIA GB200 NVL72 等AI超级芯片推动(单机柜功耗超120kW),2025年数据中心液冷渗透率预计从不到10%跃升至25%+。冷板式液冷成为主流部署方案,浸没式液冷在超算领域持续增长。OCP DC-MHS 标准推动模块化服务器设计。

技术 2024-2025年

CXL 3.0 与 PCIe 6.0 即将商用

CXL 3.0 标准支持内存池化和多层级交换,允许跨服务器共享内存资源,大幅提升内存利用率。PCIe 6.0 实现 64 GT/s 速率(x16 带宽达 256 GB/s),PAM4 调制技术首次应用于服务器互连。首批 CXL 3.0 内存扩展设备预计2025年中上市。

存储 2025年

PCIe 5.0 企业级 SSD 大规模部署

Samsung PM1743、Kioxia CM7、Solidigm P5+ 等 PCIe 5.0 SSD 已在2024年量产,2025年进入大规模数据中心部署阶段。顺序读取突破 14 GB/s,随机 IOPS 达 250万,同时 DWPD 覆盖 1-3 写入耐久度。EDSFF E3.S 接口形态正在取代传统 U.2。

网络 2024-2025年

Ultra Ethernet Consortium 推动AI网络新标准

由AMD、Intel、Broadcom、Arista等主导的Ultra Ethernet Consortium正在制定面向AI/ML工作负载的下一代以太网标准,目标在400G/800G以太网上实现接近InfiniBand的低延迟和高吞吐,同时保持以太网的成本优势和生态兼容性,预计2025年底推出1.0规范。