Tin Công Nghệ
Đánh giá AMD EPYC thế hệ thứ 4 (AMD Genoa)
885 24/02/2023
AMD đã công bố tính khả dụng chung của CPU thế hệ thứ 4 EPYC 9004 mới. Có tên mã AMD Genoa, dòng CPU mới hỗ trợ 12 kênh DDR5-4800 (dung lượng bộ nhớ lên tới 6TB trên mỗi ổ cắm), 128 làn PCIe Gen5, công nghệ AMD Infinity Fabric/Guard và tối đa 96 lõi. Điều này làm cho chúng trở nên lý tưởng cho khối lượng công việc quan trọng trên điện toán đám mây, doanh nghiệp và hiệu năng cao.
Mục Lục
Lợi ích của CPU EPYC 9004 thế hệ thứ 4 dành cho doanh nghiệp
Với số lượng lớn 96 lõi trong một bộ xử lý, bộ xử lý AMD Genoa mới sẽ cho phép các tổ chức giảm các phần cứng của họ bằng cách triển khai ít máy chủ hơn trong khi tận dụng các máy chủ mạnh hơn. Điều này mang lại tính linh hoạt cao hơn cho hệ sinh thái trung tâm dữ liệu và giúp họ đạt được các mục tiêu bền vững và đảm bảo tương lai.
AMD đã xây dựng bộ xử lý EPYC mới của họ với sự tập trung lớn vào bảo mật nâng cao, đặc biệt là với việc mở rộng AMD Infinity Guard, bộ tính năng của công ty cung cấp cả lớp bảo vệ vật lý và lớp ảo cho CPU của họ. Ví dụ: nó có số lượng encryption keys gấp đôi so với các thế hệ trước, giúp khách hàng giữ an toàn cho dữ liệu của họ cho dù dữ liệu đó được lưu trữ cục bộ, trên đám mây hay nằm trong bộ lưu trữ.
Các tổ chức sẽ có thể hưởng lợi từ bộ tính năng “all-in” của họ, với các tùy chọn để chọn mô hình có số lượng và tần suất cốt lõi (xem bảng bên dưới) phù hợp nhất với nhu cầu của họ. Hơn nữa, bộ xử lý AMD EPYC thế hệ thứ 4 hiện hỗ trợ bộ nhớ DDR5 và PCIe Gen 5, cả hai đều rất quan trọng đối với các ứng dụng AI và ML. Tất nhiên, các nhà cung cấp SSD dành cho doanh nghiệp đang cố gắng hết sức để đưa ổ đĩa của họ trở thành dòng chính, mở ra tiềm năng băng thông gấp đôi so với Gen 4.
SKU AMD Genoa 9004 Series
Model | Cores | Default TDP | cTDP | Base (GHz) | Boost (GHz) |
9654 | 96 | 360w | 320-400w | 2.4 | 3.7 |
9634 | 84 | 290w | 240-300w | 2,25 | 3.7 |
9554 | 64 | 360w | 320-400w | 3.1 | 3,75 |
9534 | 64 | 280w | 240-300w | 2,45 | 3.7 |
9454 | 48 | 290w | 240-300w | 2,75 | 3,8 |
9354 | 32 | 280w | 240-300w | 3,25 | 3,8 |
9334 | 32 | 210w | 200-240w | 2.7 | 3.9 |
9254 | 24 | 200w | 200-240w | 2.9 | 4.15 |
9224 | 24 | 200w | 200-240w | 2,5 | 3.7 |
9124 | 16 | 200w | 200-240w | 3.0 | 3.7 |
9474F | 48 | 360w | 320-400w | 3.6 | 4.1 |
9374F | 32 | 320w | 320-400w | 3,85 | 4.3 |
9274F | 24 | 320w | 320-400w | 4,05 | 4.3 |
9174F | 16 | 320w | 320-400w | 4.1 | 4.4 |
9654P | 96 | 360w | 320-400w | 2.4 | 3.7 |
9554P | 64 | 360w | 320-400w | 3.1 | 3,75 |
9454P | 48 | 290w | 240-300w | 2,75 | 3,8 |
9354P | 32 | 280w | 240-300w | 3,25 | 3,8 |
AMD Genoa – Kiến trúc Zen 4
Được phát hành vào tháng 9 vừa qua, Zen 4 là kiến trúc vi mô mới dành cho CPU AMD EPYC 9004, có lõi hiệu suất cao nhất của AMD cho đến nay. Điều này giúp các CPU EPYC 9004 mang đến cấp độ dẫn đầu mới về hiệu suất và hiệu quả năng lượng, đồng thời cho phép khách hàng tăng tốc hiện đại hóa trung tâm dữ liệu để có thông lượng ứng dụng lớn hơn và hiểu biết sâu sắc hơn. Zen 4 cũng cung cấp năng lượng cho bộ xử lý máy tính để bàn Ryzen 7000 dành cho người tiêu dùng mới của họ.
Mainboard server hỗ trợ socket AMD tại đây
Một trong những thay đổi lớn hơn mà Zen 4 mang lại là nó không còn hỗ trợ bộ nhớ DDR4 nữa vì nó chỉ chuyển sang DDR5. Hơn nữa, Zen 4 hỗ trợ các cấu hình AMD EXPO SPD mới, cho phép các nhà sản xuất RAM tinh chỉnh bộ nhớ và ép xung toàn diện hơn.
Một số tính năng mới khác bao gồm:
- Bộ đệm L2 1M riêng tư nhanh
- Các lần bỏ lỡ nổi bật hơn được hỗ trợ từ L2 đến L3 trên mỗi lõi
- Bỏ lỡ nổi bật hơn được hỗ trợ từ L3 đến bộ nhớ
- Cải thiện L3 và L2 bỏ lỡ BW
- BW cao hơn cho phép cải tiến tìm nạp trước
Tổng quan kiến trúc Zen 4
So sánh Zen 3 và Zen 4
Những cải tiến của dòng AMD EPYC 9004 so với các thế hệ trước
AMD Genoa mới cung cấp một loạt cải tiến đáng chú ý, bao gồm tăng số lượng lõi tối đa lên con số khổng lồ 96 trên mỗi CPU. Điều này rất quan trọng so với một vài thế hệ trước:
- Tối đa 64 core trên mỗi CPU với các models 7773X và 7763 ( EPYC thế hệ thứ 3 )
- Tối đa 40 core trên mỗi CPU với mẫu models ( Xeon Platinum thế hệ thứ 3)
AMD chỉ ra rằng điều này sẽ mang lại hiệu suất gấp khoảng 2,3 lần so với đối thủ cạnh tranh (hoặc 1,6 lần đối với hiệu suất trên mỗi watt) khi đề cập đến thời gian đưa ra giải pháp nhanh hơn. Đây sẽ là lần tăng hiệu suất tổng thể lớn nhất mà chúng tôi từng thấy từ các bản phát hành thế hệ tiếp theo của họ. Đối với các hoạt động kinh doanh của doanh nghiệp mỗi giây, AMD thế hệ thứ 4 kỳ vọng CPU EPYC của họ sẽ cung cấp hiệu suất ~2,6 lần trong khi gợi ý tăng hiệu suất 2,4 lần trong tốc độ kết xuất khi sử dụng Arnold Autodesk.
Nó cũng cung cấp một bản nâng cấp đáng kể về hiệu suất lõi nhờ kiến trúc Zen 4 và khả năng tăng ~14 phần trăm trong việc nâng cấp IPC cho CPU máy chủ.
Sê-ri EPYC 9004 mới cũng có các khả năng của nền tảng leadership được cung cấp để mở rộng quy mô:
- DDR5-4800 12-channel với hiệu suất xếp hạng single-rank
- SERDES multi-function 128L 32Gps và 8L 8Gps (serializer/deserializer)
Ngoài ra, nó có tính năng hỗ trợ bộ nhớ CXL1.1+ (CXL “Type3”), bao gồm khả năng gắn bộ nhớ nâng cao cho DDR và bộ nhớ mới, cũng như SEV-SNP, QoS và các tiện ích mở rộng quản lý bộ nhớ theo cấp. Để tăng cường bảo mật, nó hỗ trợ các phần mở rộng khóa SEV-SNP và AES-256-XTS.
Xem qua ram server DRAM ECC dành cho máy chủ
AMD EPYC 9004 Series Memory
Các CPU AMD Genoa hỗ trợ 12-channels trên mỗi CPU, dung lượng 6TB trên mỗi ổ cắm, tối đa DDR4800 và về mặt lý thuyết cũng có thể đạt băng thông tối đa lên tới 460GB/giây.
Dưới đây là cái nhìn tổng quan về sự so sánh giữa hiệu suất băng thông bộ nhớ thế hệ thứ 3 và thế hệ thứ 4:
Định vị CPU dòng AMD EPYC 9004
Giống như thế hệ trước, AMD đã phân loại CPU mới của họ thành ba nhóm khác nhau:
- Hiệu suất lõi , bao gồm các CPU tần số cao với tỷ lệ bộ đệm/lõi lớn. Các mẫu thuộc trường hợp này bao gồm 9474F (48 lõi @ 360W), 9374F (32 lõi @ 320W), 9274F (24 lõi @ 320W) và 9174F (16 lõi @ 320W).
- Mật độ lõi , bao gồm các CPU có số lượng lõi và luồng cao nhất. Các model thuộc phạm vi này bao gồm 9654/P (96 nhân @ 360W), 9634 (84 nhân @ 290W), 9554/P (64 nhân @ 360W), 9534 (64 nhân @ 280W) và 9454/P (48 nhân @ 290W) ).
- Hiệu suất cân bằng và được tối ưu hóa , bao gồm các CPU có tính năng cân bằng giữa hiệu suất và TCO. Các mẫu thuộc trường hợp này bao gồm 9354/P (32 lõi @ 280W), 9334 (32 lõi @ 210W), 9254 (24 lõi @ 200W), 9224 (24 lõi @ 200W) và 9124 (16 lõi @ 200W).
Hiệu suất CPU AMD Genoa 9004
Cấu hình điểm chuẩn
Đối với thử nghiệm ban đầu của chúng tôi, chúng tôi đã định vị các nền tảng Intel và AMD cao cấp nhất hiện tại với nhau trong một loạt khối lượng công việc sử dụng nhiều CPU ban đầu. Đối với nền tảng Intel của mình, chúng tôi đã tận dụng nền tảng Intel 8380 CPU kép ban đầu được xây dựng xung quanh máy chủ Intel OEM dựa trên nền tảng AMD EPYC 9654 CPU kép bên trong khung máy Quanta.
Thông số kỹ thuật nền tảng Intel: 2 x CPU Intel Xeon Platinum 8380 40 nhân 16 x 32GB DDR4 3200MHz Hệ điều hành Windows Server 2022
Thông số kỹ thuật nền tảng AMD: 2 x CPU AMD EPYC 9654 96 nhân 24 x 64GB DDR5 4800MHz Hệ điều hành Windows Server 2022
Tham khảo cpu server dành cho máy chủ tại đây
V-Ray
V-Ray Benchmark là một ứng dụng từ Chaos Group để chấm điểm và so sánh các CPU và GPU khác nhau. Chaos Group được biết đến với công việc liên quan đến trực quan hóa và kết xuất chuyên về công nghệ dò tia. V-Ray Benchmark chứa cảnh thử nghiệm bản dựng tùy chỉnh để kiểm tra bất kỳ sự kết hợp nào giữa CPU và GPU và so sánh hiệu suất của hệ thống với hệ thống khác.
Trong phòng thí nghiệm của mình, chúng tôi đã sử dụng điểm chuẩn V-Ray ở chế độ chỉ dành cho CPU. Để giảm thiểu mọi tắc nghẽn có thể xảy ra, chúng tôi đã sử dụng SSD NVMe Solidigm P5520 7,68TB và bản cài đặt sạch Windows Server 2022. Đứng đầu bảng xếp hạng cho V-Ray trước đây là hệ thống Bộ xử lý 64 lõi AMD EPYC 7K83 2x đã ghi điểm điểm trung bình ấn tượng 100,844 qua 6 bài thi. Hệ thống mẫu của chúng tôi với 2x AMD EPYC Genoa 96-Core đạt điểm trung bình là 126.940 trong 9 bài kiểm tra. So với hệ thống Intel
Firefox Build from Source
Firefox, trình duyệt của Mozilla, là một dự án mã nguồn mở khổng lồ. Mozilla sẵn sàng cung cấp cho bạn khả năng tự biên dịch dự án từ mã nguồn, thứ đã trở nên phổ biến hơn như một công cụ để so sánh hiệu suất. Tải xuống cho cái này có dung lượng vài gigabyte với hàng nghìn tệp cần được biên dịch.
Trong các thử nghiệm của mình, chúng tôi vô cùng ấn tượng với thời gian 6 phút 57 giây của giàn Intel Xeon 8380, cho đến khi chúng tôi kích hoạt nó trên giàn Genoa, với tốc độ cực nhanh là 6 phút 33- thời gian biên dịch thứ hai. Để so sánh, một máy trạm hàng đầu sẽ có thể hoàn thành nhiệm vụ này trong vòng chưa đầy 10 phút nếu bạn cung cấp cho nó một chế độ ổn định gồm nitơ lỏng và điện áp dư thừa, nghĩa là chúng ta đang xử lý một số mã lực thô nghiêm trọng ngoài cổng với những con chip này.
FF Build from source | |
2 x AMD 9654 96 core | 6:33,85 |
2 x Intel 8380 40 core | 6:57,85 |
Blender – CLI benchmark
Blender Benchmark là một tiêu chuẩn đã được thiết lập trong bối cảnh đo điểm chuẩn CPU và GPU. Blender là một công cụ hoạt hình và tạo mô hình 3D nguồn mở rất tiên tiến và được coi là công cụ hàng đầu trong lĩnh vực này. Phù hợp với chủ đề của bộ xử lý Genoa EPYC, chúng tôi đang sử dụng nó để thể hiện tính linh hoạt của việc có một kiến trúc kết hợp có khả năng hỗ trợ CPU và GPU tiềm năng cho việc triển khai giá đỡ mật độ cao.
Blender có ba điểm chuẩn, được gọi là Monster, Junkshop và Classroom. Đây là ba cảnh được hiển thị tuần tự và cho điểm cho từng phần, sau đó được cộng lại để có tổng điểm.
Blender Test | 2 x AMD 9654 96-core | 2 x Intel 8380 40-core |
Monster | 1788.189128 | 671.145395 |
Junkshop | 1062.533142 | 407.141514 |
Classroom | 850.646333 | 320.507039 |
Tổng cộng | 3701.368603 | 1398.793948 |
Genoa đạt tổng điểm cao 3701, với 1788,2 trong Monster, 1062,5 trong Junkshop và 850,6 trên điểm chuẩn Classroom. So sánh Genoa với Intel Xeon Platinum theo một số cách có vẻ không công bằng, vì Intel chỉ đạt khoảng 41% số lượng lõi, tuy nhiên, nếu chúng tôi xem xét dữ liệu và chuẩn hóa cho sự khác biệt về số lượng lõi, kết quả sẽ rất thú vị . Chip AMD Genoa, nhờ kiến trúc mới hơn, bộ hướng dẫn và sử dụng DDR5, nhanh hơn khoảng 10% so với giàn Intel.
2 x AMD 9654 96-Core | Phần trăm số lượng lõi Intel tương đối | 2 x Intel 8380 40-core |
192 cốt lõi | 41,67 phần trăm | 80 lõi |
384 chủ đề | 41,67 phần trăm | 160 chủ đề |
2 x AMD 9654 96-Core | 2 x Intel 8380 40-Core | |
Blender Total Score | 3701 | 1399 |
Cores / Threads | 192/384 | 80/160 |
Intel Core Count/AMD | 41,67 phần trăm | |
So sánh điểm trực tiếp Intel/AMD | 37,79 phần trăm | |
Điểm Core Normalized AMD | 1542 | |
Intel/AMD tương đối, Core Normalized | 90,70 phần trăm |
Cinebench R23
Cinebench của Maxon đã trở thành điểm chuẩn chính trong một thời gian, nhờ vào phương pháp thử nghiệm được tiêu chuẩn hóa và sử dụng các thử nghiệm trong thế giới thực để đánh giá hiệu suất đa lõi và lõi đơn. R23, phiên bản mới nhất của Cinebench, có một hạn chế mà chúng tôi chưa từng giải quyết trước đây; Nó chỉ có khả năng đo điểm chuẩn 256 lõi/luồng. Thiết bị thử nghiệm của chúng tôi có 384. Điều thú vị là có rất nhiều ứng dụng và điểm chuẩn “tiêu chuẩn” mà chúng tôi đã chạy với số lõi bị giới hạn ở mức 256, vì vậy Cinebench không đơn độc cần một bản cập nhật cho tương lai siêu lõi mà chúng tôi đang hướng tới đối với.
Để cố gắng giải quyết giới hạn này, chúng tôi đã chạy hai thử nghiệm đồng thời và giới hạn mỗi phiên bản thành 196 luồng để thử và chia đều tải. Thông thường, bạn có thể đặt mối quan hệ CPU trong Trình quản lý tác vụ, tuy nhiên, có điều gì đó đã chặn hoạt động này với Cinebench, chúng tôi nghi ngờ đó là một cờ đã được đặt theo cách cơ bản mà API được gọi để ưu tiên CPU. Chúng tôi đã thử chạy nó với tư cách là người dùng ít đặc quyền hơn và khởi chạy với cờ dòng lệnh “start /affinity NODE 0” để thử và ép buộc nó, nhưng không thể khóa ứng dụng vào một Nút NUMA duy nhất.
Không thể chỉ định một mối quan hệ cụ thể cho chương trình, chúng tôi chỉ chạy ứng dụng hai lần và khởi động chúng cùng nhau. Kết quả cho thấy hai điểm số khác nhau đáng kể so với hai phiên bản của ứng dụng, tuy nhiên, khi theo dõi mức sử dụng CPU, chúng tôi có thể quan sát thấy nó dao động giữa mức sử dụng 80 -100 phần trăm trong quá trình thử nghiệm.
Cinebench Single Instance | 2 x AMD 9654 96-Core | 2 x Intel 8380 40-Core |
Multi Thread (256 cap) | 85.160 | 70,540 |
Single Core | 972 | 985 |
MP Ratio | 87,65x | 71,63x |
2 Cinebench Instances | ||
AMD Test Run 1 | AMD Test Run 2 | |
Điểm, ví dụ đầu tiên | 82,063 | 68,231 |
Điểm số, ví dụ thứ 2 | 57,557 | 57,221 |
Tổng cộng | 139,620 | 125,452 |
Các bài tin công nghệ khác