국보연, ‘제어시스템 AI 데이터셋과 성능평가 도구’ 업데이트 공개
국가보안기술연구소(소장 최효진, 이하 국보연)는 산업제어시스템의 보안 위협 탐지 연구와 관련 기술 개발을 위하여
개발한 인공지능(AI) 데이터셋 ‘HAI 22.04’와 성능평가 도구 ‘eTaPR’을 공개한다고 밝혔다.
HAI(HIL-based Augmented ICS) 22.04는 HAI 20.07과 HAI 21.03에 이은 3번째 공개 데이터셋이며,
함께 공개되는 성능 평가도구 eTaPR(enhanced Time-series aware Precision and Recall)은 2020년에 공개한 평가도구 TaPR을 개선한 버전이다.
국보연은 2020년에 제어시스템 보안데이터셋 ’HAI 20.03’을 최초 공개한 이래로, 지난해에는 ‘HAI 21.03’을 공개했으며,
올해에는 수집 포인트와 정확성을 더 향상하고, 탐지 변별력을 대폭 상향한 ‘HAI 22.04’ 버전을 공개했다.
AI 기반 산업제어시스템 보안 연구를 위해서는 양질의 데이터셋 확보가 필수적이나 활용 가능한 데이터셋이 현저히 부족하고,
일부 공개된 데이터셋은 연구 활용에 한계가 있었다.
현재 국제적으로 가장 많이 활용되고 있는 공개 데이터셋인 싱가폴 iTrust 연구센터의 SWaT은
수작업에 의존한 공격 재현 및 데이터 라벨링으로 정확성, 신뢰성 한계를 지니고 있다.
HAI는 자동화된 공격 재현과 라벨링으로 이러한 한계점을 극복하여 데이터 신뢰성을 보장하고, 실제와 유사한 사이버 공격이 재현된 데이터셋으로 평가받고 있다.
‘HAI 22.04’는 ‘HAI 21.03’을 한 단계 더 넘어서, 냉각 설비 확장을 통해 현장성을 높이고,
다양한 정상 상황의 확률 재현을 통해 학습데이터를 확보했으며,
공격 탐지 난이도를 높여 이상탐지 기술 향상을 위한 새로운 도전과제를 제시했다.
아울러, 국보연은 제어시스템 보안위협 탐지모델의 성능평가에 적합한 ‘eTaPR’ 도구도 함께 공개한다.
HAI 보안데이터셋은 시간에 따라 순차적로 구성된 시계열 데이터로, 기존방법들은 단위샘플 기반으로 올바른 성능평가가 어려웠다.
국보연은 ‘20년 시계열 데이터의 이상탐지 성능평가에 적합한 평가도구 ‘TaPR’를 최초로 공개했으며, 이를 개선해 ‘eTaPR’을 공개하게 됐다는 설명이다.
‘HAI 22.04’와 ‘eTaPR’은 ‘2021년 산업제어시스템 보안위협 탐지 AI 경진대회(HAICon 2021)’에서 먼저 활용됐으며,
경진대회를 통해 데이터셋 품질과 평가도구의 효용성에 대한 공개 검증의 과정을 거쳐 완성됐다.
이번 데이터셋과 평가도구 공개는 산업 제어시스템 데이터 부족과 제어시스템 보안위협 탐지 성능평가에 어려움이 있는 연구 현장의 애로사항을 해소해 국내‧외 관련 산·학·연 연구자들에게 많은 도움이 될 것으로 기대된다.
국보연은 AI 기반 산업제어시스템 보안연구 활성화와 연구 생태계 조성을 위해 HAI 보안데이터셋을 개선·활용·확산하는 노력을 지속 추진해 나갈 계획이다.
국보연은 AI 기반 보안기술 성능시험에 적합한 정교한 HAI 보안데이터셋 차기 버전을 새롭게 연구‧개발 중이다.
위 포스팅이 문제될 시 삭제처리 하겠습니다.
댓글 없음:
참고: 블로그의 회원만 댓글을 작성할 수 있습니다.