# DB Activities 시간순 정렬 스크립트

## 목적
- `any_approval.documents` 테이블의 `activities` 컬럼을 `actionDate` 기준 오름차순 정렬
- 구조적 공백 제거 (콜론/콤마 뒤 공백)

## 정렬 기준
- `actionDate` (유닉스 타임스탬프 밀리초) 숫자 오름차순
- 작은 숫자 = 과거 → 큰 숫자 = 미래

## 보장 사항
- 키 순서 유지 (Python 3.7+)
- 문자열 값 내부 공백 유지
- 구조적 공백 제거 (`separators=(',', ':')`) ★★★★★ 1,2 버전은 구조적 공백을 유지해서 3버전 새로 작성함

## UPDATE 대상
- 순서가 다른 경우
- 순서는 같지만 공백이 다른 경우

In [1]:
import json
import pymysql
from datetime import datetime, timezone, timedelta

## 0. DB 연결 설정

In [2]:
# ========== DB 연결 설정 ==========
DB_CONFIG = {
    'host': 'localhost',
    'user': 'root',
    'password': '1234',
    'database': 'any_approval',
    'charset': 'utf8mb4',
    'cursorclass': pymysql.cursors.DictCursor
}

# 배치 설정
BATCH_SIZE = 1000

# 한국 시간대 (로그 출력용)
KST = timezone(timedelta(hours=9))

print("설정 완료")
print(f"  - 배치 크기: {BATCH_SIZE}")

설정 완료
  - 배치 크기: 1000


## 1. 정렬 함수

In [3]:
def sort_activities(activities_str):
    """
    activities를 actionDate 기준 오름차순 정렬
    
    Returns: (정렬된_문자열, 변경필요여부, 순서변경여부, 원본순서, 새순서)
    """
    if not activities_str or activities_str.strip() in ('', '[]', 'null', 'NULL'):
        return activities_str, False, False, [], []
    
    try:
        activities = json.loads(activities_str)
    except json.JSONDecodeError:
        return activities_str, False, False, [], []
    
    if not activities or len(activities) == 0:
        return activities_str, False, False, [], []
    
    # 원본 순서 (actionDate 리스트)
    original_order = [a.get('actionDate', 0) for a in activities]
    
    # actionDate 기준 오름차순 정렬
    sorted_activities = sorted(activities, key=lambda x: x.get('actionDate', 0))
    
    # 새 순서
    new_order = [a.get('actionDate', 0) for a in sorted_activities]
    
    # 순서가 바뀌었는지 확인
    order_changed = (original_order != new_order)
    
    # 정렬된 JSON 문자열 생성 (공백 없이)
    sorted_str = json.dumps(sorted_activities, ensure_ascii=False, separators=(',', ':'))
    
    # 원본과 결과 문자열 직접 비교 (순서 + 공백 모두 고려)
    needs_update = (activities_str != sorted_str)
    
    return sorted_str, needs_update, order_changed, original_order, new_order


print("정렬 함수 정의 완료")

정렬 함수 정의 완료


## 2. 검증 함수

In [4]:
def verify_activities_integrity(original_str, sorted_str):
    """
    정렬 전후 activities 무결성 검증
    
    검증 항목:
    1. 개수 동일
    2. 각 activity 객체 내용 동일 (순서만 다름)
    3. 정렬 확인
    
    Returns: (검증통과여부, 오류메시지)
    """
    try:
        orig_list = json.loads(original_str) if original_str else []
        sorted_list = json.loads(sorted_str) if sorted_str else []
    except json.JSONDecodeError as e:
        return False, f"JSON 파싱 오류: {e}"
    
    # 1. 개수 검증
    if len(orig_list) != len(sorted_list):
        return False, f"개수 불일치: 원본 {len(orig_list)} vs 정렬 {len(sorted_list)}"
    
    # 2. 내용 검증 (set 비교 - 순서 무관)
    orig_set = set(json.dumps(a, sort_keys=True, ensure_ascii=False) for a in orig_list)
    sorted_set = set(json.dumps(a, sort_keys=True, ensure_ascii=False) for a in sorted_list)
    
    if orig_set != sorted_set:
        return False, "내용 불일치: 순서 외 다른 변경 발생"
    
    # 3. 정렬 확인 (actionDate 오름차순)
    dates = [a.get('actionDate', 0) for a in sorted_list]
    if dates != sorted(dates):
        return False, "정렬 오류: actionDate 오름차순이 아님"
    
    return True, "OK"


print("검증 함수 정의 완료")

검증 함수 정의 완료


## 3. 테스트

In [5]:
# 실제 DB 데이터 형태로 테스트 (공백 있음)
test_data = '[{"positionName": "상무", "deptName": "ITO사업팀", "actionLogType": "DRAFT", "name": "고상환", "emailId": "shko", "type": "DRAFT", "actionDate": 1609740886000, "deptCode": "DB60", "actionComment": "LGC 실험실행관리시스템 계약 품의입니다."},{"positionName": "선임", "deptName": "사업지원파트", "actionLogType": "AGREEMENT", "name": "한승재", "emailId": "temp323", "type": "AGREEMENT", "actionDate": 1609742126000, "deptCode": "", "actionComment": "합의합니다."},{"positionName": "이사", "deptName": "경영기획팀", "actionLogType": "APPROVAL", "name": "정주연", "emailId": "jyjung", "type": "APPROVAL", "actionDate": 1609747680000, "deptCode": "AB30", "actionComment": "승인합니다."},{"positionName": "대표이사", "deptName": "대표이사", "actionLogType": "APPROVAL", "name": "CEO", "emailId": "temp001", "type": "APPROVAL", "actionDate": 1609747852000, "deptCode": "AB10", "actionComment": "승인합니다"}]'

print("=" * 60)
print("테스트: 공백 있는 데이터 (순서는 이미 맞음)")
print("=" * 60)

def ts_to_kst(ts):
    """타임스탬프를 한국시간 문자열로 변환"""
    dt = datetime.fromtimestamp(ts / 1000, tz=KST)
    return dt.strftime('%Y-%m-%d %H:%M:%S')

sorted_str, needs_update, order_changed, orig_order, new_order = sort_activities(test_data)

print(f"\n변경 필요: {needs_update}")
print(f"순서 변경: {order_changed}")

if needs_update and not order_changed:
    print("→ 공백만 변경됨!")

# 검증
is_valid, msg = verify_activities_integrity(test_data, sorted_str)
print(f"\n검증 결과: {'✅ 통과' if is_valid else '❌ 실패'} - {msg}")

print(f"\n[원본 앞부분]")
print(test_data[:100])
print(f"\n[정렬 후 앞부분]")
print(sorted_str[:100])

테스트: 공백 있는 데이터 (순서는 이미 맞음)

변경 필요: True
순서 변경: False
→ 공백만 변경됨!

검증 결과: ✅ 통과 - OK

[원본 앞부분]
[{"positionName": "상무", "deptName": "ITO사업팀", "actionLogType": "DRAFT", "name": "고상환", "emailId": "s

[정렬 후 앞부분]
[{"positionName":"상무","deptName":"ITO사업팀","actionLogType":"DRAFT","name":"고상환","emailId":"shko","typ


In [6]:
# 정렬이 필요한 테스트 데이터
test_unsorted = '[{"name":"B","actionDate":300,"comment":"두 번째"},{"name":"A","actionDate":100,"comment":"첫 번째"},{"name":"C","actionDate":200,"comment":"세 번째"}]'

print("=" * 60)
print("테스트: 순서 변경 필요한 데이터")
print("=" * 60)

print(f"\n원본: {test_unsorted}")

sorted_str, needs_update, order_changed, orig_order, new_order = sort_activities(test_unsorted)

print(f"정렬: {sorted_str}")
print(f"\n변경 필요: {needs_update}")
print(f"순서 변경: {order_changed}")
print(f"원본 actionDate: {orig_order}")
print(f"정렬 actionDate: {new_order}")

# 검증
is_valid, msg = verify_activities_integrity(test_unsorted, sorted_str)
print(f"\n검증 결과: {'✅ 통과' if is_valid else '❌ 실패'} - {msg}")

테스트: 순서 변경 필요한 데이터

원본: [{"name":"B","actionDate":300,"comment":"두 번째"},{"name":"A","actionDate":100,"comment":"첫 번째"},{"name":"C","actionDate":200,"comment":"세 번째"}]
정렬: [{"name":"A","actionDate":100,"comment":"첫 번째"},{"name":"C","actionDate":200,"comment":"세 번째"},{"name":"B","actionDate":300,"comment":"두 번째"}]

변경 필요: True
순서 변경: True
원본 actionDate: [300, 100, 200]
정렬 actionDate: [100, 200, 300]

검증 결과: ✅ 통과 - OK


In [7]:
# 이미 정렬되고 공백도 없는 데이터 (변경 불필요)
test_already_ok = '[{"name":"A","actionDate":100},{"name":"B","actionDate":200}]'

print("=" * 60)
print("테스트: 이미 완벽한 데이터 (변경 불필요)")
print("=" * 60)

print(f"\n원본: {test_already_ok}")

sorted_str, needs_update, order_changed, _, _ = sort_activities(test_already_ok)

print(f"정렬: {sorted_str}")
print(f"\n변경 필요: {needs_update}")
print(f"순서 변경: {order_changed}")

if not needs_update:
    print("→ ✅ 이미 완벽! UPDATE 스킵")

테스트: 이미 완벽한 데이터 (변경 불필요)

원본: [{"name":"A","actionDate":100},{"name":"B","actionDate":200}]
정렬: [{"name":"A","actionDate":100},{"name":"B","actionDate":200}]

변경 필요: False
순서 변경: False
→ ✅ 이미 완벽! UPDATE 스킵


In [8]:
# 키 순서 유지 테스트
test_key_order = '[{"positionName":"과장","deptName":"개발팀","actionLogType":"DRAFT","name":"홍길동","actionDate":200},{"positionName":"부장","deptName":"개발팀","actionLogType":"APPROVAL","name":"김철수","actionDate":100}]'

print("=" * 60)
print("테스트: 키 순서 유지 확인")
print("=" * 60)

print(f"\n원본:")
print(test_key_order)

sorted_str, needs_update, order_changed, _, _ = sort_activities(test_key_order)

print(f"\n정렬 후:")
print(sorted_str)

# 키 순서 확인
sorted_list = json.loads(sorted_str)
first_keys = list(sorted_list[0].keys())
print(f"\n첫 번째 객체 키 순서: {first_keys}")

expected_keys = ['positionName', 'deptName', 'actionLogType', 'name', 'actionDate']
if first_keys == expected_keys:
    print("✅ 키 순서 유지됨!")
else:
    print("❌ 키 순서 변경됨!")

테스트: 키 순서 유지 확인

원본:
[{"positionName":"과장","deptName":"개발팀","actionLogType":"DRAFT","name":"홍길동","actionDate":200},{"positionName":"부장","deptName":"개발팀","actionLogType":"APPROVAL","name":"김철수","actionDate":100}]

정렬 후:
[{"positionName":"부장","deptName":"개발팀","actionLogType":"APPROVAL","name":"김철수","actionDate":100},{"positionName":"과장","deptName":"개발팀","actionLogType":"DRAFT","name":"홍길동","actionDate":200}]

첫 번째 객체 키 순서: ['positionName', 'deptName', 'actionLogType', 'name', 'actionDate']
✅ 키 순서 유지됨!


In [9]:
# 문자열 내부 공백 유지 테스트
test_string_space = '[{"name":"A","actionDate":200,"comment":"합의 합니다. 감사합니다."},{"name":"B","actionDate":100,"comment":"승인   합니다."}]'

print("=" * 60)
print("테스트: 문자열 값 내부 공백 유지 확인")
print("=" * 60)

print(f"\n원본: {test_string_space}")

sorted_str, needs_update, order_changed, _, _ = sort_activities(test_string_space)

print(f"정렬: {sorted_str}")

# 공백 확인
if '합의 합니다. 감사합니다.' in sorted_str and '승인   합니다.' in sorted_str:
    print("\n✅ 문자열 내부 공백 유지됨!")
else:
    print("\n❌ 문자열 내부 공백 변경됨!")

테스트: 문자열 값 내부 공백 유지 확인

원본: [{"name":"A","actionDate":200,"comment":"합의 합니다. 감사합니다."},{"name":"B","actionDate":100,"comment":"승인   합니다."}]
정렬: [{"name":"B","actionDate":100,"comment":"승인   합니다."},{"name":"A","actionDate":200,"comment":"합의 합니다. 감사합니다."}]

✅ 문자열 내부 공백 유지됨!


## 4. DB 처리 함수

In [10]:
def process_batch(connection, offset, batch_size, stats, dry_run=False):
    """
    배치 단위로 처리
    """
    with connection.cursor() as cursor:
        cursor.execute("""
            SELECT id, activities 
            FROM documents 
            ORDER BY id 
            LIMIT %s OFFSET %s
        """, (batch_size, offset))
        
        rows = cursor.fetchall()
        
        if not rows:
            return 0
        
        updates = []
        
        for row in rows:
            doc_id = row['id']
            activities = row['activities']
            
            stats['total'] += 1
            
            if not activities or activities.strip() in ('', '[]', 'null', 'NULL'):
                stats['skipped_empty'] += 1
                continue
            
            # 정렬 수행
            sorted_str, needs_update, order_changed, orig_order, new_order = sort_activities(activities)
            
            if not needs_update:
                stats['already_ok'] += 1
                continue
            
            # 검증
            is_valid, error_msg = verify_activities_integrity(activities, sorted_str)
            
            if not is_valid:
                stats['verification_failed'].append({
                    'id': doc_id,
                    'error': error_msg
                })
                continue
            
            updates.append((doc_id, sorted_str))
            stats['to_update'] += 1
            
            # 통계 구분
            if order_changed:
                stats['order_changed'] += 1
            else:
                stats['space_only_changed'] += 1
            
            # 샘플 저장 (순서 변경 최대 5개, 공백만 변경 최대 5개)
            if order_changed and len(stats['order_samples']) < 5:
                stats['order_samples'].append({
                    'id': doc_id,
                    'original_order': orig_order,
                    'new_order': new_order
                })
            elif not order_changed and len(stats['space_samples']) < 5:
                stats['space_samples'].append({
                    'id': doc_id,
                    'original': activities[:100],
                    'sorted': sorted_str[:100]
                })
        
        # UPDATE 실행
        if updates and not dry_run:
            for doc_id, new_activities in updates:
                cursor.execute("""
                    UPDATE documents 
                    SET activities = %s 
                    WHERE id = %s
                """, (new_activities, doc_id))
            
            connection.commit()
            stats['updated'] += len(updates)
        
        return len(rows)


print("DB 처리 함수 정의 완료")

DB 처리 함수 정의 완료


## 5. DRY RUN (미리보기)

In [11]:
# ========== DRY RUN ==========
print("=" * 60)
print("DRY RUN 모드 - 실제 UPDATE 없이 분석만 수행")
print("=" * 60)

stats = {
    'total': 0,
    'skipped_empty': 0,
    'already_ok': 0,
    'to_update': 0,
    'order_changed': 0,
    'space_only_changed': 0,
    'updated': 0,
    'verification_failed': [],
    'order_samples': [],
    'space_samples': []
}

try:
    connection = pymysql.connect(**DB_CONFIG)
    print("\nDB 연결 성공")
    
    offset = 0
    while True:
        processed = process_batch(connection, offset, BATCH_SIZE, stats, dry_run=True)
        
        if processed == 0:
            break
        
        offset += BATCH_SIZE
        
        if stats['total'] % 5000 == 0:
            print(f"  처리 중... {stats['total']:,}건")
    
    print(f"\n처리 완료: 총 {stats['total']:,}건")
    
except Exception as e:
    print(f"오류 발생: {e}")
    raise
finally:
    if 'connection' in dir() and connection:
        connection.close()
        print("DB 연결 종료")

DRY RUN 모드 - 실제 UPDATE 없이 분석만 수행

DB 연결 성공
  처리 중... 5,000건
  처리 중... 10,000건
  처리 중... 15,000건
  처리 중... 20,000건

처리 완료: 총 23,320건
DB 연결 종료


In [12]:
# DRY RUN 결과 리포트
print("=" * 60)
print("DRY RUN 결과 리포트")
print("=" * 60)

print(f"\n[처리 통계]")
print(f"  총 row 수: {stats['total']:,}건")
print(f"  activities 없음/비어있음: {stats['skipped_empty']:,}건")
print(f"  이미 완벽 (변경 불필요): {stats['already_ok']:,}건")
print(f"  ⭐ UPDATE 대상: {stats['to_update']:,}건")
print(f"     - 순서 변경: {stats['order_changed']:,}건")
print(f"     - 공백만 변경: {stats['space_only_changed']:,}건")

print(f"\n[검증 결과]")
if stats['verification_failed']:
    print(f"  ❌ 검증 실패: {len(stats['verification_failed'])}건")
    for item in stats['verification_failed'][:5]:
        print(f"     - id={item['id']}: {item['error']}")
else:
    print(f"  ✅ 모든 검증 통과")

print(f"\n[순서 변경 예시] (최대 5건)")
for sample in stats['order_samples']:
    print(f"\n  id={sample['id']}")
    print(f"    변경 전: {[ts_to_kst(ts) for ts in sample['original_order']]}")
    print(f"    변경 후: {[ts_to_kst(ts) for ts in sample['new_order']]}")

print(f"\n[공백만 변경 예시] (최대 5건)")
for sample in stats['space_samples']:
    print(f"\n  id={sample['id']}")
    print(f"    원본: {sample['original']}...")
    print(f"    수정: {sample['sorted']}...")

DRY RUN 결과 리포트

[처리 통계]
  총 row 수: 23,320건
  activities 없음/비어있음: 0건
  이미 완벽 (변경 불필요): 0건
  ⭐ UPDATE 대상: 23,320건
     - 순서 변경: 0건
     - 공백만 변경: 23,320건

[검증 결과]
  ✅ 모든 검증 통과

[순서 변경 예시] (최대 5건)

[공백만 변경 예시] (최대 5건)

  id=1
    원본: [{"positionName": "상무", "deptName": "ITO사업팀", "actionLogType": "DRAFT", "name": "고상환", "emailId": "s...
    수정: [{"positionName":"상무","deptName":"ITO사업팀","actionLogType":"DRAFT","name":"고상환","emailId":"shko","typ...

  id=2
    원본: [{"positionName": "선임", "deptName": "사업지원파트", "actionLogType": "DRAFT", "name": "한승재", "emailId": "t...
    수정: [{"positionName":"선임","deptName":"사업지원파트","actionLogType":"DRAFT","name":"한승재","emailId":"temp323","...

  id=3
    원본: [{"positionName": "선임", "deptName": "KAPE Part", "actionLogType": "DRAFT", "name": "김선홍", "emailId":...
    수정: [{"positionName":"선임","deptName":"KAPE Part","actionLogType":"DRAFT","name":"김선홍","emailId":"shkim",...

  id=4
    원본: [{"positionName": "책임", "deptName": "ETRI팀", "actionLogType": "DRAFT", "n

## 6. 실제 UPDATE 실행

⚠️ **주의**: 아래 셀은 실제로 DB를 수정합니다!

In [13]:
# ========== 실제 UPDATE 실행 ==========
CONFIRM = True  # True로 변경하면 실행됨

if not CONFIRM:
    print("⚠️ CONFIRM = True 로 변경 후 실행하세요.")
    print("   실제 DB UPDATE가 수행됩니다.")
else:
    print("=" * 60)
    print("실제 UPDATE 실행")
    print("=" * 60)
    
    stats = {
        'total': 0,
        'skipped_empty': 0,
        'already_ok': 0,
        'to_update': 0,
        'order_changed': 0,
        'space_only_changed': 0,
        'updated': 0,
        'verification_failed': [],
        'order_samples': [],
        'space_samples': []
    }
    
    try:
        connection = pymysql.connect(**DB_CONFIG)
        print("\nDB 연결 성공")
        
        offset = 0
        while True:
            processed = process_batch(connection, offset, BATCH_SIZE, stats, dry_run=False)
            
            if processed == 0:
                break
            
            offset += BATCH_SIZE
            
            if stats['total'] % 5000 == 0:
                print(f"  처리 중... {stats['total']:,}건 (업데이트: {stats['updated']:,}건)")
        
        print(f"\n✅ 완료!")
        print(f"   총 처리: {stats['total']:,}건")
        print(f"   실제 업데이트: {stats['updated']:,}건")
        print(f"     - 순서 변경: {stats['order_changed']:,}건")
        print(f"     - 공백만 변경: {stats['space_only_changed']:,}건")
        
    except Exception as e:
        print(f"❌ 오류 발생: {e}")
        raise
    finally:
        if 'connection' in dir() and connection:
            connection.close()
            print("DB 연결 종료")

실제 UPDATE 실행

DB 연결 성공
  처리 중... 5,000건 (업데이트: 5,000건)
  처리 중... 10,000건 (업데이트: 10,000건)
  처리 중... 15,000건 (업데이트: 15,000건)
  처리 중... 20,000건 (업데이트: 20,000건)

✅ 완료!
   총 처리: 23,320건
   실제 업데이트: 23,320건
     - 순서 변경: 0건
     - 공백만 변경: 23,320건
DB 연결 종료


## 7. 최종 검증

In [14]:
# UPDATE 후 랜덤 샘플 검증
print("=" * 60)
print("최종 검증: 랜덤 샘플 activities 정렬 및 공백 확인")
print("=" * 60)

try:
    connection = pymysql.connect(**DB_CONFIG)
    
    with connection.cursor() as cursor:
        cursor.execute("""
            SELECT id, activities 
            FROM documents 
            WHERE activities IS NOT NULL 
              AND activities != '' 
              AND activities != '[]'
            ORDER BY RAND() 
            LIMIT 10
        """)
        
        rows = cursor.fetchall()
        
        all_ok = True
        for row in rows:
            doc_id = row['id']
            activities = row['activities']
            
            try:
                act_list = json.loads(activities)
                dates = [a.get('actionDate', 0) for a in act_list]
                is_sorted = dates == sorted(dates)
                
                # 공백 확인 (구조적 공백이 없는지)
                has_struct_space = '": ' in activities or ', "' in activities
                
                if is_sorted and not has_struct_space:
                    status = "✅"
                elif not is_sorted:
                    status = "❌ 정렬 안됨"
                    all_ok = False
                else:
                    status = "⚠️ 공백 있음"
                    all_ok = False
                
                print(f"\n{status} id={doc_id}")
                print(f"   actionDates: {[ts_to_kst(d) for d in dates[:3]]}{'...' if len(dates) > 3 else ''}")
                print(f"   앞부분: {activities[:80]}...")
                
            except Exception as e:
                print(f"\n⚠️ id={doc_id}: 파싱 오류 - {e}")
        
        print("\n" + "=" * 60)
        if all_ok:
            print("✅ 모든 샘플이 정상입니다! (정렬 OK, 공백 OK)")
        else:
            print("❌ 문제가 있는 데이터가 있습니다.")

except Exception as e:
    print(f"오류: {e}")
finally:
    if 'connection' in dir() and connection:
        connection.close()

최종 검증: 랜덤 샘플 activities 정렬 및 공백 확인

✅ id=20835
   actionDates: ['2014-10-22 15:21:20', '2014-10-24 12:54:49']
   앞부분: [{"positionName":"이사","deptName":"경영기획팀","actionLogType":"DRAFT","name":"정주연","e...

✅ id=3814
   actionDates: ['2023-06-27 16:28:09', '2023-06-27 16:36:13', '2023-07-03 12:40:51']
   앞부분: [{"positionName":"선임","deptName":"ETRI사업팀","actionLogType":"DRAFT","name":"조윤호",...

✅ id=4596
   actionDates: ['2024-01-02 15:30:46', '2024-01-02 15:37:26', '2024-01-04 11:30:55']...
   앞부분: [{"positionName":"책임","deptName":"경영기획팀","actionLogType":"DRAFT","name":"김별님","e...

✅ id=19486
   actionDates: ['2013-12-02 13:50:18', '2013-12-02 14:45:06', '2013-12-02 16:51:12']...
   앞부분: [{"positionName":"차장","deptName":"ICT사업팀","actionLogType":"DRAFT","name":"마상미","...

✅ id=18648
   actionDates: ['2013-06-14 11:52:33', '2013-06-14 14:19:54', '2013-06-14 21:30:04']...
   앞부분: [{"positionName":"부장","deptName":"경영기획팀","actionLogType":"DRAFT","name":"김동력","e...

✅ id=15002
   actionDates: ['2

## 완료!

### 실행 순서
1. **DB 설정** - 접속 정보 수정
2. **함수 정의** - 실행
3. **테스트** - 키 순서, 문자열 공백, 구조적 공백 확인
4. **DRY RUN** - 변경 대상 확인 (순서 변경/공백만 변경 구분)
5. **실제 UPDATE** - `CONFIRM = True` 후 실행
6. **최종 검증** - 결과 확인

### 보장 사항
- ✅ 키 순서 유지 (Python 3.7+)
- ✅ 문자열 값 내부 공백 유지 ("합의 합니다.")
- ✅ 구조적 공백 제거 (콜론/콤마 뒤)
- ✅ 검증 통과한 건만 UPDATE
- ✅ 배치 처리

### UPDATE 대상
- 순서가 다른 경우 ✅
- 순서는 같지만 공백이 다른 경우 ✅