In [None]:
# ncbi 홈페이지 : https://www.ncbi.nlm.nih.gov

from Bio import Entrez, Medline
import time
import pandas as pd
from dotenv import load_dotenv
import os

load_dotenv()

# ✨ 반드시 본인의 이메일로 바꿔야 함
Entrez.email = "wanggyu3467@gmail.com"
Entrez.api_key = os.environ.get("ENTREZ_API_KEY")  # 선택사항이지만 추천

query = "airway management infant"
max_results = 10

# 1. PMID 검색
query = '"airway management"[All Fields] AND "infant"[All Fields]'
# query = '"Airway Management"[MeSH Terms] AND "Infant"[MeSH Terms]'
handle = Entrez.esearch(db="pubmed", term=query, retmax=10, sort="relevance")
# Entrez.esearch(db="pubmed", term=query, retmax=10, sort="relevance")  # 기본값
# Entrez.esearch(db="pubmed", term=query, retmax=10, sort="pub+date")  # 최신순
# Entrez.esearch(db="pubmed", term=query, retmax=10, sort="author")    # 저자 이름순
record = Entrez.read(handle)
handle.close()
id_list = record["IdList"]

# 2. 상세 정보 가져오기
handle = Entrez.efetch(db="pubmed", id=",".join(id_list), rettype="medline", retmode="text")
records = list(Medline.parse(handle))
handle.close()

# 3. 데이터 정리
data = []
for record in records:
    title = record.get("TI", "N/A")
    abstract = record.get("AB", "N/A")
    pmid = record.get("PMID", "N/A")
    url = f"https://pubmed.ncbi.nlm.nih.gov/{pmid}/" if pmid != "N/A" else "N/A"
    data.append({
        "keyword": query,
        "title": title,
        "abstract": abstract,
        "url": url
    })

# 4. CSV 저장
df = pd.DataFrame(data)
df.to_csv("pubmed_airway_management_infant.csv", index=False, encoding="utf-8-sig")
print("✅ CSV 저장 완료: pubmed_airway_management_infant.csv")

✅ CSV 저장 완료: pubmed_airway_management_infant.csv


## 파일 하나로 합치기

In [6]:
import pandas as pd

# 파일 불러오기
df = pd.read_excel("/Users/yoon/BOAZ_ADV/Wang_Gyu/소아마취가이드라인1차QAset_지연(수정).xlsx")  # 실제 경로로 변경하세요

# 두 열을 하나로 합치기 (예: 중간에 줄바꿈 추가)
df["Merged_Answer"] = df["CoT Answer"].astype(str) + "\n" + "<ANSWER>:" + df["Answer"].astype(str)

# 기존 두 열 제거
df.drop(columns=["CoT Answer", "Answer"], inplace=True)

# 결과 확인
print(df.head(10))

# # 필요하면 저장
df.to_excel("merged_file.xlsx", index=False)

   page                                           question  \
0     2  만 19세 미만의 소아 환자가 병동에서 진정을 필요로 하는 상황이 발생했습니다. 이...   
1     2  소아 환자가 병동에서 진정을 필요로 하는 상황이 발생했습니다. 이런 상황에서 필요한...   
2     4  8세 소아 환자가 진정 약물 투여를 받고 있습니다. 진정 약물 투여 중에는 어떤 항...   
3     7  소아 환자가 진정 약물 투여 후 회복실에서 모니터링을 받고 있습니다. 이때 어떤 항...   
4     8           진정 약물 투여 후 회복실에 있는 소아 환자를 언제 퇴실시킬 수 있나요?   
5     5            소아 환자에게 진정 약물을 투여하기 전에 어떤 것들을 확인해야 하나요?   
6     7     소아 환자가 진정 약물 투여 후 회복실에서 어떤 상황에서 길항제를 사용해야 하나요?   
7     6               3세의 아이가 진정 약물을 투여받기 전에 얼마나 금식해야 하나요?   
8     5                         소아 진정 시 주의해야 할 합병증은 무엇인가요?   
9     4                     진정 후에 환자와 보호자에게 어떤 교육을 해야 하나요?   

                                              source  \
0  \"1) 진정 진료권자\", \"- ① 실제 소아 진정을 수행하는 의사로서\", \...   
1  \"4) 장비\", \"- ① 산소공급원\", \"- ② 산소투여 및 인공기도: 비...   
2  \"진정 약물 투여 중에는 다음 항목을 모니터링한다: 혈압, 심박동수, 호흡수(깊은...   
3  회복실 모니터링 시에는 진정 시술 중과 동일한 항목을 모니터링한다. 빈도는 회복 시...   
4  \"퇴실 기준: 회복 시작 30분이 경과 후 (modified

In [1]:
import pandas as pd

file_path1 = "/Users/yoon/BOAZ_ADV/Wang_Gyu/학술지_QnA.csv"
file_path2 = "/Users/yoon/BOAZ_ADV/Wang_Gyu/qaset_daeun.csv"
file_path3 = "/Users/yoon/BOAZ_ADV/Wang_Gyu/PediatricAssociation.csv"
file_path4 = "/Users/yoon/BOAZ_ADV/Wang_Gyu/qaset_hyewon_final_207.csv"
file_path5 = "/Users/yoon/BOAZ_ADV/Wang_Gyu/학술지_QA_Set(재원).csv"

# 읽기
df1 = pd.read_csv(file_path1)
df2 = pd.read_csv(file_path2)
df3 = pd.read_csv(file_path3)
df4 = pd.read_csv(file_path4)
df5 = pd.read_csv(file_path5)

# 통일할 컬럼명 리스트 예시 (열 개수는 같아야 함)
# 실제로 출력해서 눈으로 확인 후 수정해야 함
standard_columns = ['file_name', 'question', 'context', 'answer']

# 열 이름을 강제로 통일
df1.columns = standard_columns
df2.columns = standard_columns
df3.columns = standard_columns
df4.columns = standard_columns
df5.columns = standard_columns

# 합치기
merged_df = pd.concat([df1, df2, df3, df4, df5], ignore_index=True)

print(len(merged_df))

# 저장 
merged_df.to_csv("/Users/yoon/BOAZ_ADV/Wang_Gyu/학술지_all.csv", index=False)

997
