AMD 파트너 디에스앤지

차원을 높이는 강력한 프로세서

AMD는 데이터 센터부터 비즈니스 컴퓨팅 솔루션까지 다양한 생태계에서 고성능 워크로드를 제공합니다. 디에스앤지는 AMD EPYC™ 프로세서 기반의 서버, 스토리지, GPU 솔루션을 제공하여, 최적의 비즈니스 효과를 이끌어냅니다.

MI Series

AMD Instinct™ 가속기는 HPC/AI를 기반으로 한 데이터 센터 컴퓨팅에 최적화되어, 싱글 서버 솔루션부터 슈퍼컴퓨터까지 어떠한 규모의 데이터 센터에서든 뛰어난 성능을 제공합니다. AMD CDNA™ 2 아키텍처, AMD Infinity Fabric™ 및 패키징 기술의 새로운 혁신과 함께, 최신 AMD Instinct™ 가속기는 까다로운 과제를 처리할 수 있도록 도우며 엑사스케일에서의 발견을 구동하도록 설계되었습니다.

컴퓨팅 가속을 위한 AMD 플랫폼

  • AMD CDNA™ 2 아키텍처

    워크로드 최적화 컴퓨팅 아키텍처

  • AMD Infinity 아키텍처

    고속 인피니티 아키텍처

  • AMD ROCm™

    손쉬운 포팅을 지원하는 개방형 소프트웨어

MI Series System

AMD 성능 벤치마크

* MI250은 MI250X와 유사한 벤치마크 성능을 지원합니다.

Application Metric Test Modules Bigger is Better 4xMI250X 1xMI250X
FOM_Setup / Sec (Setup Phase Time) Proxy app for HYPRE/AMG Yes 16,773,660,000
FOM_Solve / Sec (Solve Phase Time) Proxy app for HYPRE/AMG Yes 73,318,380,000
Particles/second gravitation kernel Yes 4.40E+6
TFLOPS N/A Yes 42.26
FOM Particles (Body-to-Body) Interactions/s proxy application of general nbody problems Yes 31.72
FOM Particles (Body-to-Body) Interactions/s proxy application of general nbody problems Yes 19.245
segments/second proxy application of mercury Yes 2.14E+08
Application Metric Test Modules Bigger is Better 8xMI210 2xMI210 1xMI210
FOM_Setup / Sec (Setup Phase Time) Proxy app for HYPRE/AMG Yes 1.97E+10 - -
FOM_Solve / Sec (Solve Phase Time) Proxy app for HYPRE/AMG Yes 8.4E+10 - -
TFLOPS N/A Yes 145.5 - -
FOM Particles (Body-to-Body) Interactions/s proxy application of general nbody problems Yes - - 17113.95
FOM Particles (Body-to-Body) Interactions/s proxy application of general nbody problems Yes - - 9954.49
segments/second prproxy application of mercury Yes - 2.33E+08 -
NS/Day Figure of Merit (FOM) No 4,264 - -
NS/Day Figure of Merit (FOM) No 1,180 - -

AMD Instinct™ MI200 시리즈 가속기는 2세대 AMD CDNA™ 아키텍처를 기반으로 HPC 및 AI에 최적화되어 업계 표준 데이터 센터 GPU를 뛰어넘는 혁신적인 도약을 보여주고 있습니다. 딥 러닝(Deep Learning) 트레이닝에서는 383테라플롭(TFLPOS)의 혼합정밀도 FP16 성능을 구현하는 최초의 데이터 센터 GPU입니다.

MI250

AMD Instinct™ MI250

GPU 아키텍처 CDNA2
리소그래피(Lithography) TSMC 6nm FinFET
스트림 프로세서 13,312
컴퓨팅 유닛 208
Peak Single Precision Matrix (FP32) Performance 90.5 TFLOPs
Peak Double Precision Matrix (FP64) Performance 90.5 TFLOPs
피크 싱글-정밀도 (FP32) 성능 45.3 TFLOPs
피크 더블-정밀도 (FP64) 성능 45.3 TFLOPs
Peak INT4 Performance 362.1 TOPs
Peak INT8 Performance 362.1 TOPs
Peak bfloat16 362.1 TFLOPs
OS 지원 Linux x86_64
Total Board Power (TBP) 500W | 560W Peak
메모리 크기 128 GBs
메모리 유형 HBM2e
메모리 인터페이스 8192-bit
Memory Clock 1.6 GHz
메모리 대역폭 최대 3276.8 GB/s
메모리 ECC 지원 예 (Full-Chip)
폼 팩터 OAM Module
버스 타입 PCIe® 4.0 x16
Infinity Fabric™ Links 8
Peak Infinity Fabric™ Link Bandwidth 100 GB/s
냉각 Passive OAM
보드 높이 해당 없음
보드 너비 해당 없음
지원되는 기술 AMD CDNA™ 2 아키텍처, AMD Infinity 아키텍처, AMD ROCm™ - 국경 없는 생태계
RAS Support Yes
Page Retirement Yes
Coherency Enabled No
OpenMP® Yes
OpenCL™ Yes
HIP Yes
ROCm™ Open Ecosystem Yes
TensorFlow Yes
PyTorch Yes
Kokkos Yes
RAJA Yes

MI210

AMD Instinct™ MI210

GPU 아키텍처 CDNA2
스트림 프로세서 6656
컴퓨팅 유닛 104
피크 하프-정밀도 (FP16) 성능 181 TFLOPs
Peak Engine Clock 1700 MHz
Peak Single Precision Matrix (FP32) Performance 45.3 TFLOPs
Peak Double Precision Matrix (FP64) Performance 45.3 TFLOPs
피크 싱글-정밀도 (FP32) 성능 22.6 TFLOPs
피크 더블-정밀도 (FP64) 성능 22.6 TFLOPs
Peak INT4 Performance 181 TOPs
Peak INT8 Performance 181 TOPs
Peak bfloat16 181 TFLOPs
OS 지원 Linux x86_64
외부 전력 커넥터 1x8 pin 12V EPS
Total Board Power (TBP) 300W Peak
메모리 크기 64 GB
메모리 유형 HBM2e
메모리 인터페이스 4096-bit
Memory Clock 1.6 GHz
메모리 대역폭 최대 1638.4 GB/s
메모리 ECC 지원 예 (Full-Chip)
폼 팩터 PCIe Add-in Card
버스 타입 PCIe® 4.0 x16
Infinity Fabric™ Links 3
Peak Infinity Fabric™ Link Bandwidth 100 GB/s
냉각 수동
보드 높이 전체 높이
보드 길이 10.5" (267mm)
보드 너비 이중 슬롯
지원되는 기술 AMD CDNA™ 2 아키텍처, AMD Infinity 아키텍처
RAS Support Yes
Page Retirement Yes
OpenMP® Yes
OpenCL™ Yes
HIP Yes
TensorFlow Yes
PyTorch Yes
Kokkos Yes
RAJA Yes