In [7]:
import pandas as pd
import re

def extract_values(text):
    patterns = {
        'LV EF': r'LV.*?Ejection Fraction\s*:\s*([\d.]+)\s*%',
        'LV EDV(Value)': r'LV.*?End-Diastolic Volume\s*:\s*([\d.]+)',
        'LV EDV(Index)': r'LV.*?End-Diastolic Volume\s*:\s*[\d.]+\s*\(([\d.]+)\)',
        'LV ESV(Value)': r'LV.*?End-Systolic Volume\s*:\s*([\d.]+)',
        'LV ESV(Index)': r'LV.*?End-Systolic Volume\s*:\s*[\d.]+\s*\(([\d.]+)\)',
        'LV SV(Value)': r'LV.*?Stroke Volume\s*:\s*([\d.]+)',
        'LV SV(Index)': r'LV.*?Stroke Volume\s*:\s*[\d.]+\s*\(([\d.]+)\)',
        'LV CO(Value)': r'LV.*?Cardiac Output\s*:\s*([\d.]+)',
        'LV CO(Index)': r'LV.*?Cardiac Output\s*:\s*[\d.]+\s*\(([\d.]+)\)',
        'LV MM(Value)': r'LV.*?Average Myocardial Mass\s*:\s*([\d.]+)',
        'LV MM(Index)': r'LV.*?Average Myocardial Mass\s*:\s*[\d.]+\s*\(([\d.]+)\)',
        'RV EF': r'RV.*?Ejection Fraction\s*:\s*([\d.]+)\s*%',
        'RV EDV(Value)': r'RV.*?End-Diastolic Volume\s*:\s*([\d.]+)',
        'RV EDV(Index)': r'RV.*?End-Diastolic Volume\s*:\s*[\d.]+\s*\(([\d.]+)\)',
        'RV ESV(Value)': r'RV.*?End-Systolic Volume\s*:\s*([\d.]+)',
        'RV ESV(Index)': r'RV.*?End-Systolic Volume\s*:\s*[\d.]+\s*\(([\d.]+)\)',
        'RV SV(Value)': r'RV.*?Stroke Volume\s*:\s*([\d.]+)',
        'RV SV(Index)': r'RV.*?Stroke Volume\s*:\s*[\d.]+\s*\(([\d.]+)\)',
        'RV CO(Value)': r'RV.*?Cardiac Output\s*:\s*([\d.]+)',
        'RV CO(Index)': r'RV.*?Cardiac Output\s*:\s*[\d.]+\s*\(([\d.]+)\)',
        'RV MM(Value)': r'RV.*?Average Myocardial Mass\s*:\s*([\d.]+)',
        'RV MM(Index)': r'RV.*?Average Myocardial Mass\s*:\s*[\d.]+\s*\(([\d.]+)\)'
    }
    
    results = {}
    for key, pattern in patterns.items():
        match = re.search(pattern, text)
        results[key] = match.group(1) if match else None
    
    return results

# CSV 파일 읽기
df = pd.read_csv('C:\github\TOF\qq.csv')

# 각 row에 대해 value_source_value 컬럼의 텍스트 분석
extracted_data = df['value_source_value'].apply(extract_values)

# 추출된 데이터를 데이터프레임으로 변환
result_df = pd.DataFrame(extracted_data.tolist())

# 원본 데이터프레임과 추출된 데이터 병합
final_df = pd.concat([df, result_df], axis=1)

# 결과를 새로운 CSV 파일로 저장
final_df.to_csv('tof_mri_analyzed.csv', index=False)

print("분석이 완료되었습니다. 결과는 'tof_mri_analyzed.csv' 파일에 저장되었습니다.")

분석이 완료되었습니다. 결과는 'tof_mri_analyzed.csv' 파일에 저장되었습니다.
