In [None]:
import fitz  # PyMuPDF
from PIL import Image
import os
import io
def convert_pdf_to_png(pdf_path, output_dir=None):
    """
    PDF 파일을 PNG 이미지로 변환
    
    Args:
        pdf_path (str): PDF 파일 경로
        output_dir (str, optional): 출력 디렉토리. 기본값은 PDF 파일명에서 확장자 제거
    """
    # PDF 파일명에서 확장자를 제거하여 출력 디렉토리로 사용
    if output_dir is None:
        output_dir = os.path.splitext(os.path.basename(pdf_path))[0]
    
    if not os.path.exists(output_dir):
        os.makedirs(output_dir)
    
    # PDF 문서 열기
    pdf_document = fitz.open(pdf_path)
    
    for page_num in range(len(pdf_document)):
        # 페이지 가져오기
        page = pdf_document.load_page(page_num)
        
        # 페이지를 이미지로 렌더링 (300 DPI)
        mat = fitz.Matrix(300/72, 300/72)
        pix = page.get_pixmap(matrix=mat)
        
        # PIL Image로 변환
        img_data = pix.tobytes("png")
        img = Image.open(io.BytesIO(img_data))
        
        # PNG로 저장
        output_path = os.path.join(output_dir, f"page_{page_num + 1}.png")
        img.save(output_path, "PNG")
        print(f"페이지 {page_num + 1} 저장됨: {output_path}")
    pdf_document.close()

# 사용 예시
# convert_pdf_to_png("input.pdf")


In [None]:
import os
from PIL import Image
import pillow_heif


def convert_heic_to_png(heic_path, output_path=None):
    """
    HEIC 파일을 PNG 이미지로 변환

    Args:
        heic_path (str): HEIC 파일 경로
        output_path (str, optional): 출력 PNG 파일 경로. 기본값은 HEIC 파일명에서 확장자만 변경
    """
    try:
        import pillow_heif
    except ImportError:
        raise ImportError("pillow-heif 패키지 필요. pip install pillow-heif로 설치")

    # 출력 경로 설정
    if output_path is None:
        output_path = os.path.splitext(heic_path)[0] + ".png"

    # HEIC 이미지 열기
    heif_file = pillow_heif.read_heif(heic_path)
    img = Image.frombytes(
        heif_file.mode,
        heif_file.size,
        heif_file.data,
        "raw"
    )

    # PNG로 저장
    img.save(output_path, "PNG")
    print(f"HEIC 파일 변환 완료: {output_path}")

# 사용 예시
# convert_heic_to_png("input.heic")


In [None]:
!pip install pillow-heif

In [None]:
convert_heic_to_png("/Users/jeongho/Desktop/신분증.heic")

In [None]:
convert_pdf_to_png("Chapter 1. LLM Fine-tuning.pdf")

In [None]:
convert_pdf_to_png("오프라인 2강.pdf")

In [1]:
def convert_pdfs_to_png(pdf_files):
    """
    PDF 파일 배열을 PNG 이미지로 변환하는 함수
    
    Args:
        pdf_files: 변환할 PDF 파일명 리스트 또는 단일 파일명
    """
    import fitz  # PyMuPDF
    import os
    
    # 단일 파일명이 전달된 경우 리스트로 변환
    if isinstance(pdf_files, str):
        pdf_files = [pdf_files]
    
    for pdf_file in pdf_files:
        if not os.path.exists(pdf_file):
            print(f"파일을 찾을 수 없음: {pdf_file}")
            continue
            
        # PDF 문서 열기
        doc = fitz.open(pdf_file)
        
        # 파일명에서 확장자 제거하여 폴더명으로 사용
        base_name = os.path.splitext(pdf_file)[0]
        
        # 저장할 디렉토리 생성
        output_dir = base_name
        os.makedirs(output_dir, exist_ok=True)
        
        # 각 페이지를 PNG로 변환
        for page_num in range(len(doc)):
            page = doc.load_page(page_num)
            
            # 페이지를 이미지로 렌더링 (해상도 300 DPI)
            mat = fitz.Matrix(300/72, 300/72)
            pix = page.get_pixmap(matrix=mat)
            
            # PNG 파일로 저장 (폴더 내에 저장)
            output_file = os.path.join(output_dir, f"page_{page_num + 1}.png")
            pix.save(output_file)
            print(f"변환 완료: {output_file}")
        
        doc.close()
        print(f"PDF 변환 완료: {pdf_file} -> {output_dir}/")

In [None]:
# 사용 예시

pdf_files = [
    "ch03-09-강의교안.pdf",
    "패스트캠퍼스-컬러팔레트.pdf",
    "계산된-필드-요약.pdf"
]

convert_pdfs_to_png(pdf_files)

