ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 제59회 TOP500 슈퍼컴퓨터 랭킹 이야기 (2022.06)
    기술이야기/HPC 및 AI 2022. 6. 10. 09:41

    안녕하세요, 이스파이스 기술연구소입니다.

    5월 마지막주 ~ 6월 첫주에 걸쳐서 독일 하노버에서 슈퍼컴퓨터 쇼가 열렸습니다.

    1년에 두 번 공개되는 HPC 순위도 발표되었는데, 제가 휴가로 인해 정리가 좀 늦었습니다.
    천천히 읽어보세요.

    시작해 보겠습니다.
    블로그에 이미지를 올리면 리사이징이 되어 보이는데, 클릭하면 크게 보일 겁니다.

    지난 회차 발표 당시, 다음 회차엔 1-엑사플롭스 성능을 넘는 시스템이 나올 것이란 암시가 있었습니다.
    이번에 드디어 엑사스케일 시스템이 발표되었습니다.

    우선 TOP500발 주요 뉴스부터 보겠습니다.

    10위 안에 3대의 새로운 시스템이 등재되었습니다.
    이렇게 큰 시스템이 한번에 여럿 완성되는 경우가 드문데, 그 시스템들이 모두 HPE/Cray의 EX235a라는 시스템입니다.
    AMD EPYC 3세대 프로세서인 Milan 기반에, AMD의 최신 가속기인 Instinct mi250X, 그리고 전용 고속 네트워크인 Slingshot-11로 무장했습니다.
    HPE/Cray의 EX235a가 대표적인 사이트 하나에 구축된 것이 아니라 유럽(핀란드, 프랑스)에도 동시 구축되었다는 점에서 이미 준비가 잘 된 시스템이라 보여집니다.

    현재 10위 내에는 1위를 했던 시스템이 Frontier (59회), Fugaku (55~58회), Summit (51~54), TaihuLight(47~50회), Tianhe (41~46회), 이렇게 다섯 대가 있네요.
    미국에서 엑사스케일 프로젝트라고 준비하던 시스템이었던 IBM과 Cray의 경쟁에서는 Cray의 승으로 결론이 났습니다.

    IBM Summit이 Power9 + NVIDIA Volta 조합으로 시장에 등장했을 때, PCI Express G4를 지원하는 Power9이 빠르게 NVIDIA Ampere 조합으로 옮겨가면서 초대형 시스템을 구축할 수 있을 거라 생각했는데
    좀더 유연한 구성이 가능한 Cray가 AMD Milan과 새로운 AMD 가속기 MI250X로 대형 시스템 구축을 했네요.

    좀 더 넓게 TOP20위까지를 보겠습니다.

    TOP20에는 10위권에 3대 새롭게 등재된 것 이외에는 새로운 시스템은 없습니다.
    성능값을 보면, 이게 1위를 노리고 들어오는 시스템은 정말 규모부터 넘사벽입니다.
    2위와의 격차가 확연히 납니다.
    Frontier는 현재 1.1EFlop/s의 성능으로 1위를 차지했지만, 다음 회차에 좀 더 최적화하여 높은 성능으로 끌어올리지 않을까 예상해 봅니다.

    1위를 나타내는 세모 점이 1EFlop/s에 드디어 찍혔네요. 최근 추세로 봐서는 약 2년 (Top500 순위 4회) 정도 1위를 유지하지 않을까 싶습니다.
    500위가 대략 1PFlop/s라 한다고 보면, 1위와는 1000배 차이가 나는군요. 500위의 상승 추세는 고만고만 하네요. 오래된 시스템들이 어느 정도 밀려나가야 하겠지요.

    그럼 500위인 실측값 1PFlop/가 어느 정도 성능이냐면요,
    지금 Xeon Scalable Processor 3세대 중에 가장 막강한 Xeon Platinum 8368Q (38-core, 3.7GHz)가 대략 600개 정도 묶어야 될 것 같고요…
    NVIDIA의 현재 최강 A100이 대략 180개 정도 있어야 될 것 같습니다.
    500위가 이 정도니, 1위 시스템이 얼마나 큰지 가늠이 되시나요?
    어마어마한 거죠. ^^

    한참 중국이 대형 시스템을 TOP500에 등재시키더니 요새 무슨 이유에서인지 많이 안 보입니다. 뭔가 대외적인 단속을 하는 건지… 흠.
    그래서, 슬슬 자유진영이 확장하고 있습니다. 미국은 수량은 좀 적어졌지만 어마어마한 1위가 등장하면서 성능 점유율에서 독보적이네요.
    역시나 2년간 1위를 차지했던 일본이 성능 점유율 2위고요.

    한때 시스템 대수, 성능 점유율 모두 10위 밖에 있던 우리나라도 기상청, KISTI와 삼성전자의 대형 시스템 덕에 비교적 상위권에 올라가 있습니다.

    프로세서는 역시나 인텔 Xeon 계열이 압도적인 가운데, AMD Milan의 뛰어난 성능으로 대형 시스템에 많이 사용되고 있습니다.
    지난 회차에서 6%의 성능 점유율을 보였고, 이번 회차에서 시스템 대수로는 7% 점유인 AMD Milan이 성능 면에서는 35%의 점유율을 보이고 있습니다.
    물론 10위 권에 AMD Milan 시스템이 많은 것이 가장 큰 이유겠으나, 대형 시스템에서 많이 채택하고 있다는 것이 여러 면에서 장점이 있다는 것이겠지요.

    더 놀라운 것은 가속기 부문입니다.

    일단 가속기를 채택한 시스템이 지난 회차보다 18대가 늘었습니다. 
    이제 상위 500대의 시스템 중 1/3은 가속기를 쓰고 있다고 할 수 있겠네요.
    수년간 보통 GPGPU라고 부르는 연산용 가속기 부문은 NVIDIA의 독주라 할 수 있었고, A100은 현존 최고의 가속기로 불리고 있습니다.
    그런데, 이번 순위에서 AMD의 신형 가속기인 Instinct MI250X가 충격적인 등장을 했네요.
    HPE/Cray가 새롭게 구축한 초대형 시스템들이 AMD Instinct MI250X를 탑재하면서 구축한 시스템 수는 얼마 안 되면서, 성능 점유율은 절반 가까이 차지하네요.
    게다가 가속기 코어당 성능이 현존 최고라 하는 A100을 넘는 것으로 보입니다.
    MI250X가 등장하면서, 이거 좀 예사롭지 않다 생각했는데 역시나 놀라운 결과를 보여주고 있습니다.

    고속 네트워크는 인피니밴드가 대세인 가운데, 여기도 HPE/Cray의 Slingshot-11이 눈에 띕니다.\
    HPE/Cray는 예전부터 전용 고속 네트워크를 고유 시스템에 채택해 왔습니다.
    오랫동안 Aries란 고속 네트워크(40G)로 시스템을 만들었었는데, 이걸 인텔에 팔고서는 새롭게 개발한 것이 Slingshot입니다.
    이번에 Slingshot-11로 초대형 시스템이 구축되면서 점유율을 확 높였습니다.
    이건 HPE/Cray 전용 시스템이라 일반 서버로 HPC를 구축하는 대부분의 시스템 빌더들에겐 그림의 떡이긴 합니다.
    그래도, 인피니밴드가 충분히 제 역할을 해주고 있습니다.

    업체별 자료는 역시나 HPE/Cray의 약진이 눈에 띕니다.
    자잘하게 많던 Lenovo의 여러 시스템들이 HPE/Cray의 시스템에 훅~ 밀려난 모습이네요.
    프랑스의 Atos도 조금씩이지만 계속 상승 중이고, Dell도 꾸준합니다.
    중국의 대표적인 업체인 Inspur와 Sugon은 확실히 뭔가 대외적인 업데이트가 안 되는 것 같습니다. 저렇게 놀고 있지는 않을 텐데.

    이건 볼 것도 없이 HPE/Cray의 압도적인 지배죠.
    Cray가 HPE에 합병되긴 했지만, 역시 슈퍼컴의 강자입니다.
    한 10년 전만 해도 IBM이 이 차트에서 40~50%를 차지하던 시절이 있었는데 요새 확실히 약해지긴 했네요.

    소비 전력 대비 성능을 보는 Green500 역시 상당히 놀랍습니다.
    지난 회차에서 NVIDIA의 A100이 거의 싹쓸이를 했는데, 이번엔 가장 효율이 좋은 상위 4개의 시스템이 모두 HPE/Cray 시스템 즉, AMD 프로세서+AMD 가속기 기반 시스템입니다.
    AMD가 2000년대 중반의 Opteron으로 세계를 놀라게 한 이후 다시 한번 놀라운 제품으로 무장한 것 같습니다.

    오랫동안 써온 HPL 성능 지표의 보완으로 측정하고 있는 HPCG 벤치마크도 꾸준히 업데이트되고 있네요.
    Top500의 3위인 LUMI가 Top500 4위인 Summit에서 HPCG가 밀리는 것으로 보면 아직 AMD쪽이 HPCG쪽으로 최적화가 덜 된 것 같습니다.
    이 데이터의 제출은 선택 사항이라 1위 Frontier가 아직 제출을 안 한 상태여서 여전히 일본의 Fugaku가 1위인데, 다음 회차에서 Frotier가 1위릴 차지할 것 같습니다.
    다음 회차 결과가 궁금해지네요.

    전통적인 HPC 성능을 측정하는 HPL보다도 요새는 부동소수점 정밀도가 좀 낮은 AI 연산도 많이 사용되고 있어 이 부분에 대한 성능 지표도 수집되고 있습니다.
    이 값은 제출 안 한 시스템이 많긴 한데, 거의 Top500과 비슷하게 나올 수밖에 없는 거라 큰 이변은 없습니다.

    레노버, 인스퍼는 기업, HPE, Atos는 대형 연구소, Dell은 학교. 이렇게 타겟하고 있네요.
    국가별 분포를 보면, 중국/미국을 제외하고는 자원이 많은 러시아, 캐나다, 사우디 아라비아의 기업체들이 사용하고 있는 것 같고요.

    우리나라에서는 SKT에 새로 설치된 게 있군요. 국내에서 HPE가 큼직한 걸 구축해 나가고 있네요.
    국내 기업들에서도 분명히 HPC를 쓰고 있을 텐데, 이제 순위에 등재될 정도로 큼직한 것들을 설치하고 있군요.
    그리고, 250위권에 있던 기상청 4호기 누리/미리 두 대의 시스템은 순위에서 내려버렸네요. 굳이 뺄 필요가 있나 싶긴 한데, 내렸네요. 뒷 이야기가 살짝 궁금하긴 하네요.

    이번 59회차 TOP500은 HPE/Cray의 1위 시스템 Frontier가 모든 것을 말해주지 않나 싶습니다.
    그 기본 시스템인 EX235a가 채택한 AMD 프로세서, AMD 가속기 그리고, Slingshot-11이 주목할 만한 기술이라 하겠습니다.
    AMD Milan과 Instinct MI250X 관심 가져 봅시다.
    인텔이 곧 PCI Express 5세대롤 탑재한 Xeon Scalable Processor 4세대를 내놓을 예정이고, 내년 초에 NVIDIA의 첫 CPU가 나올 예정인데 그것들이 어떨지도 궁금해지네요.

    이상 59회 TOP500 순위를 한번 훑어봤습니다.


    (주)이스파이스는 Dell Technologies의 Titanium 파트너로서, HPC에 대한 전반적인 컨설팅에서 구축/서비스까지 제공합니다.

    관심있으신 분들은 전화 02-573-1484~5 혹은 이메일 marketing@espice.co.kr로 연락주시기 바랍니다.

    댓글

Designed by Tistory.