데이터 마이그레이션
“기존 시스템 데이터를 신규로 이전·정제·검증하는 작업. 분쟁 다발.”
데이터 마이그레이션이란
데이터 마이그레이션(Data Migration)은 기존 시스템에 축적된 데이터를 신규 시스템 구조에 맞춰 이전하고, 그 과정에서 정제하고 검증하는 일련의 작업이다. 단순히 한쪽 테이블의 값을 다른 쪽으로 옮기는 복사가 아니라, 원천 데이터의 형식과 의미를 신규 모델의 규칙에 맞게 변환하는 과정이 핵심이다.
인도·운영 단계에서 수행되며, 오픈 직전의 마지막 관문으로 프로젝트의 성패를 좌우한다. 데이터가 정확히 옮겨지지 않으면 아무리 잘 만든 신규 시스템도 신뢰를 얻지 못한다.
추출·변환·적재의 흐름
마이그레이션은 통상 추출, 변환, 적재의 세 단계로 진행된다. 추출은 원천 시스템에서 대상 데이터를 빼내는 단계이고, 변환은 신규 데이터 모델의 형식·코드 체계·정규화 규칙에 맞게 가공하는 단계이며, 적재는 변환된 데이터를 신규 시스템에 채워 넣는 단계다.
이 가운데 변환이 가장 까다롭다. 원천 시스템이 오래될수록 코드값이 일관되지 않고, 같은 의미의 데이터가 여러 형태로 흩어져 있기 때문이다.
매핑 정의서를 정밀하게 작성하지 못하면 변환 단계에서 데이터의 의미가 훼손된다.
정제와 정합성 검증
원천 데이터에는 중복, 누락, 형식 오류, 폐기되어야 할 잔여 값이 섞여 있는 경우가 많다. 정제는 이러한 오류를 식별해 보정하거나 제거하는 과정이며, 옮기기 전에 데이터를 깨끗하게 만드는 사전 작업이다.
정제 없이 그대로 적재하면 신규 시스템이 오류 데이터까지 그대로 떠안게 된다. 정제와 함께 정합성 검증이 병행되어야 한다.
건수 일치, 합계 검증, 핵심 항목의 표본 대조를 통해 옮긴 데이터가 원천과 일치하는지를 확인하는 것이 검증의 기본이다.
| 준비 활동 | 목적 | 미흡 시 위험 |
|---|---|---|
| Mock 테스트 | 결함·시간 측정 | 실전환 사고 |
| 전환 계획서 | 시각·합격 기준 | 통제 불가 |
| 복귀 절차 | 기존 시스템 복원 | 복구 불가 |
| 정제 책임 합의 | 분쟁 경계 설정 | 수행·발주 갈등 |
Mock 테스트와 리허설
실제 전환 작업은 단 한 번의 기회만 주어지는 경우가 많아, 사전에 동일한 조건으로 반복 연습하는 것이 필수다. 이를 위해 운영 데이터의 사본을 이용한 Mock 테스트, 즉 모의 전환을 여러 차례 수행한다.
Mock 테스트는 변환 로직의 결함을 미리 드러내고, 전체 작업에 걸리는 시간을 측정해 전환 시간 창을 산정하는 근거가 된다. 회차를 거듭할수록 오류 건수가 줄고 소요 시간이 안정되어야 실제 전환에 임할 수 있다.
충분한 리허설 없이 실 전환을 강행하면 복구 불가능한 사고로 이어진다.
전환 시점과 비상 계획
실제 전환은 서비스 중단의 영향이 가장 적은 시간대에 짧은 시간 창 안에서 완료해야 한다. 따라서 전환 시작 시각, 단계별 완료 기준, 책임자, 합격 판정 기준을 시간 단위로 정리한 전환 계획서가 사전에 마련되어야 한다.
함께 준비해야 할 것이 비상 대응이다. 정해진 시각까지 검증을 통과하지 못하면 기존 시스템으로 되돌리는 복귀 절차를 명문화해 두어야 한다.
이러한 통제는 오픈 이후의 안정화 계획과도 자연스럽게 연결된다.
분쟁이 잦은 영역
데이터 마이그레이션은 수행사와 발주사 사이에서 분쟁이 가장 빈번한 영역이다. 원천 데이터의 품질 책임이 누구에게 있는지, 정제 범위가 어디까지인지를 계약 시점에 명확히 정하지 않으면 전환 단계에서 갈등이 불거진다.
발주사는 깨끗한 결과를 기대하지만, 원천 데이터의 오류는 수행사가 통제할 수 없는 영역인 경우가 많기 때문이다. 따라서 정제 책임의 경계, 데이터 품질 기준, 검증 합격 조건을 사전에 문서로 합의하는 것이 분쟁을 줄이는 출발점이다.
관련 용어