본문 바로가기
카테고리 없음

국가정보자원관리원 전산실 화재 (1분 요약정리)

by withthepro 2025. 10. 7.

국가정보자원관리원 전산실 화재를 계기로, “단일 거점·단일 장치 리스크를 분산하고 복구 가능한 백업을 갖춘다”가 국가 디지털 안전의 최소 조건입니다.

 

<<목차>>

1. 국가정보자원관리원 전산실 화재 핵심 정리
2. 원인과 현장 상황의 디테일
3. 파급효과: 어떤 서비스가 멈췄나
4. 백업과 복구의 교훈
5. 안전·아키텍처 재설계 포인트

 

결론

이번 사건은 데이터센터 설계·운영·백업·복구·거버넌스 전 영역이 한 번에 시험대에 오른 전형적인 ‘블랙스완의 확장’이었습니다. 기술적 개선과 더불어 업무 연속성 계획(BCP)을 현장 실행 가능성 중심으로 재작성해야 합니다. 복구율 숫자만이 아니라 잔여 리스크, 데이터 무결성, 신규 취약점 발생 여부까지 주기적으로 공개하고 점검하는 체계가 필요합니다. 또한 공공-민간 협업 구조에서의 의존성과 결합도를 낮추는 ‘느슨한 연계’ 설계가 중장기적으로 중요합니다. 단기적 재가동과 중장기적 재발 방지를 동시에 추구하는 투트랙 접근이 실효적입니다. 궁극적으로는 ‘사고가 나도 멈추지 않는’ 행정 인프라를 목표로 삼아야 합니다.

 

 

근거1. 국가정보자원관리원 전산실 화재 핵심 정리

불은 오후 전원 차단 후 진행되던 UPS용 리튬이온 배터리 이전 과정에서 폭발로 촉발됐고, 현장의 고열과 연기로 초기 진압이 어려웠습니다. 불길은 다수의 배터리 모듈로 연쇄 확산되며 내부 온도가 급상승했고, 22시간 가까이 소화 작업이 이어진 끝에 완진되었습니다. 이 과정에서 중앙정부 핵심 정보시스템 96개가 직·간접 피해를 입었고, 총 647개 시스템이 중단되면서 공공 서비스의 대체 경로 확보가 절실해졌습니다. 정부는 비상 운영체계로 전환해 우선순위 업무부터 단계적 복구에 나섰으나, 초기 재가동 수치는 두 자릿수에 머물렀습니다. 이후 사이버 위협 단계가 상향되며 2차 피해 방지 조치도 병행되었습니다. 사건의 본질은 ‘원인-확산-영향-복구-재발 방지’의 연쇄 고리를 어떻게 끊을 것인가로 요약됩니다.

 

근거2. 원인과 현장 상황의 디테일

현장 조사에 따르면 리튬이온 기반 UPS가 배터리 재배치 중 폭발하며 초기 착화원이 됐고, 인접 모듈들로 열폭주가 번지는 ‘배터리-배터리’ 전이 위험이 현실화됐습니다. 같은 구역에 배터리와 서버 랙이 근접 배치되어 열·연기·분진이 장비로 유입될 여지가 컸고, 협소한 동선은 소방 접근을 어렵게 했습니다. 내부 온도는 최대 160°C까지 치솟은 것으로 보도되었고, 물 침수 진화가 가장 효과적이었다는 평가가 뒤따랐습니다. 배터리가 234~400개 수준으로 연결된 상태에서의 연쇄 반응 가능성은 현장 제압 시간을 지연시켰습니다. 구조적으로는 랙 기반 UPS를 동일 층에 두는 설계가 ESS급 화재안전 기능과 이격, 구획, 배연 대책보다 취약했다는 비판이 제기됩니다. 작업 절차 측면에서는 전원 차단·가스계 소화·열화상 모니터링·격리 구획 확보 등 ‘재배치 표준작업절차(SOP)’의 보강 필요성이 확인되었습니다.

 

 

근거3. 파급효과: 어떤 서비스가 멈췄나

화재 직후 정부 이메일과 문서 유통, 각종 증명서 발급, 부동산·학교 기록 조회, 우정금융 일부, 구조대원의 위치추적 기능 등 국민 일상과 직결된 기능이 잇달아 오류를 냈습니다. 일부 기관은 수기 대체나 오프라인 예비 절차를 가동했지만, 연동형 전자정부 구조 특성상 병목이 빠르게 상호 전파되었습니다. 추석 연휴 직전이라는 시점은 물류·여행·지급성 업무에 추가 부담을 만들었습니다. 사이버 위협 단계 상향은 화재를 틈탄 침투 시도를 염두에 둔 ‘물리·사이버 복합 리스크’ 인식의 결과였습니다. 이번 중단은 단일 센터·단일 전력 저장 계통에 대한 과의존이 행정 서비스의 연속성을 어떻게 위협하는지 보여줬습니다. 동시에 공공·민간 연계 API들의 강한 결합도가 장애 전파를 가속할 수 있음을 드러냈습니다.

 

근거4. 백업과 복구의 교훈

사고로 정부 클라우드 저장장치 중 핵심 드라이브가 파손되며 858TB 규모의 데이터 영구 손실 가능성이 제기됐고, 중앙부처 협업 저장소(G-Drive) 등 클라우드 업무 기반도 심각한 타격을 입었습니다. 특히 백업 장치 부재·적치 실패·오프사이트 이중화 미흡이 ‘복구가능성’을 급격히 낮췄다는 지적이 나왔습니다. 10월 7일 기준 복구율은 약 24.6%로 발표되었고, 1등급 핵심 업무 22개를 포함한 159개 서비스가 재가동되는 등 점진적 회복이 진행 중입니다. 정부는 임시 대체체계로 ‘온나라 문서 2.0’을 가동해 필수 문서 흐름을 이어가고 있습니다. 다만 손상 매체의 포렌식 복원 가능성, 장비 교체 리드타임, 소프트웨어 의존성 회귀 테스트 등은 당분간 변수가 될 전망입니다. 데이터 자산 분류별로 RPO·RTO를 명시하고, 필수 업무는 ‘다중 백업·이격 이중화·오프라인 사본’까지 갖추는 설계가 필요합니다.

 

 

근거5. 안전·아키텍처 재설계 포인트

첫째, 전력 저장과 IT 장비 구역을 물리적으로 분리하고, 배터리는 ESS급 화재감지·자동소화·차단 기능을 전제한 독립 구획에 둬야 합니다. 둘째, 동일 도시 내 이중화가 아닌 ‘지리적 이중화(Active-Active/Active-Standby)’로 단일 시설 장애가 전국 장애로 번지지 않도록 해야 합니다. 셋째, 공공망·업무망·민감정보망은 논리·물리 분리와 교차접속 최소화를 기본으로 하되, 업무 연속성 관점의 최소 필수 연동만 허용합니다. 넷째, 백업은 스냅샷-버전드-불변(Immutable) 계층과 오프사이트 보관을 조합하고, 복구 리허설을 정례화해 ‘복구 가능한 백업’인지 검증해야 합니다. 다섯째, 부문형 공기업처럼 독립망·분산형 백업을 가진 조직은 영향이 제한적이었다는 사례를 벤치마킹할 수 있습니다. 여섯째, 배터리 이전·교체 등 고위험 작업은 가동 중지 창구, 비상 소화수단, 열화상 모니터링, 소방 합동 대기 등으로 재설계해야 합니다.

 

 

마치며

2025년 9월 26일 밤, 대전 국가정보자원관리원에서 발생한 화재는 정부 디지털 서비스 647개를 동시에 멈춰 세우며 ‘행정의 데이터센터 리스크’를 전국적으로 체감하게 만들었습니다. 배터리 분리 작업 중 폭발로 시작된 불길은 짧은 시간 안에 서버 구역으로 번졌고, 추석 연휴 직전이었던 탓에 민원·통관·금융·여권 발급 등 광범위한 공공 업무가 즉시 영향을 받았습니다. 정부는 중앙재난안전대책본부 체제로 전환해 복구에 착수했지만 초기에는 수십 개 시스템만 재가동되며 혼란이 이어졌습니다. 국가 차원의 조치와 함께 위기 커뮤니케이션, 임시 대체 절차, 사이버 경보 단계 상향 등 후속 대응이 동시다발적으로 진행되었습니다. 이번 사건은 ‘단일 거점-단일 전력·저장 장치’ 구조의 취약성과 백업 전략의 실효성을 근본부터 점검하게 했습니다. 무엇이, 왜, 어떻게 멈췄는지를 시간대별로 구조화해 보면 교훈이 선명해집니다.

 

※주의

현재 "국가정보자원관리원" 와 관련하여 방대한 내용과 정보가 존재하여 하나의 포스팅에 담지 못하고 있습니다.

이와 관련하여 더 많은 정보를 일목요연하게 보고 싶으신 분은 여기에서 모든 정보를 보실 수 있습니다.