# 시퀀스 상세 데이터 분석 (v3.1 - 데이터 개편 완료)
이 노트북은 **데이터 파이프라인 v3.1** 개편 이후의 정제된 데이터를 보여줍니다.

### ✅ 주요 개선 사항 확인 포인트:
1. **리시브 정제**: `Pass Received` 타입이 모두 제거되거나 `Carry`로 변환되었습니다.
2. **좌표 통합**: 우리 팀과 상대 팀 선수의 좌표가 공격 방향(`L->R`)에 맞춰 일관되게 표시됩니다.
3. **중복 제거**: 각 액션 번호(`action_id`)는 오직 하나의 시퀀스에만 등장합니다.

In [None]:
import pandas as pd
import os

# 정제된 데이터 로드
context_file = 'target_sequences_context_refined.csv'
if os.path.exists(context_file):
    df = pd.read_csv(context_file, encoding='utf-8-sig')
    print(f"데이터 로드 완료. (Total rows: {len(df)})")
else:
    print("데이터 파일을 찾을 수 없습니다.")

def display_sequence_with_context(label):
    sample_df = df[df['source_label'] == label].copy()
    if sample_df.empty:
        print(f"Label {label} not found.")
        return
    sid = sample_df['target_sid'].iloc[0]
    print(f"\n---")
    print(f"### [{label}] Target Sequence ID: {sid}")
    print(f"---")
    
    cols = ['action_id', 'player_name_ko', 'type_name', 'start_x', 'start_y', 'end_x', 'end_y', 'is_in_sequence']
    display(sample_df[cols])

## 1. Cluster 5 분석 (가장 많은 패턴)

In [None]:
display_sequence_with_context('c5_s1')
display_sequence_with_context('c5_s2')

## 2. Cluster 6 분석

In [None]:
display_sequence_with_context('c6_s1')
display_sequence_with_context('c6_s2')

## 3. 상대 팀과의 좌표 일치 확인 (c2_s1 샘플 권장)
공격 팀의 패스 종료 지점과 상대 팀의 수비 시작 지점 좌표가 일치하는지 확인해 보세요.

In [None]:
display_sequence_with_context('c2_s1')