### [01] 파일 열기

In [None]:
from pptx import Presentation

# 파일 열기
prs = Presentation('presentation_with_list.pptx')

### [02] 텍스트 추출하기

In [None]:
from pptx import Presentation

prs = Presentation('presentation_with_list.pptx')

# ➊ 각 슬라이드의 텍스트를 출력
for slide_number, slide in enumerate(prs.slides): #전체 슬라이드를 순회
  print(f'Slide {slide_number+1}')

  # ➋ 슬라이드의 텍스트 출력
  #각 슬라이드에 포함된 모든 도형(일반적인 도형, 텍스트 프레임, 표 등)를 순회
  for shape in slide.shapes:
    # ➌ 현재 도형에 텍스트 프레임이 있는지 확인하고, 있으면 다음 코드 라인을 실행
    if hasattr(shape, 'text_frame') and shape.text_frame:

      # ➍ 텍스트 프레임의 내용을 출력
      for paragraph in shape.text_frame.paragraphs: # 텍스트 프레임의 모든 단락을 순회
        for run in paragraph.runs: # 현재 단락의 텍스트 런에 접근
          print(run.text) #현재 텍스트 런을 출력

### [03] 표 읽어 추출하기

In [None]:
from pptx import Presentation

prs = Presentation('presentation_with_table.pptx')

# ➊ 전체 슬라이드를 순회하며 표를 찾아 데이터를 추출
for slide_number, slide in enumerate(prs.slides):
  print(f'Slide {slide_number+1}')
  # ➋ 각 슬라이드에 포함된 모든 도형을 순회
  for shape in slide.shapes: 

    if hasattr(shape, 'table'): # ➌ 현재 도형이 표를 포함하고 있는지 확인
      table = shape.table # ➍ 표를 table 변수에 할당

      # ➎ 표를 순회하며 각 셀의 텍스트를 출력
      for row in table.rows: # 각 행을 순회
        for cell in row.cells: # 현재 행의 각 셀을 순회
          print(cell.text) #현재 셀의 텍스트 출력

### [04] 이미지 파일 추출하기

In [None]:
from pptx import Presentation

prs = Presentation('presentation_with_image.pptx')

# ➊ 전체 슬라이드를 순회
for slide_number, slide in enumerate(prs.slides):
  # ➋ 각 슬라이드에서 모든 도형을 순회
  for shape in slide.shapes:

    # ➌ 현재 도형이 이미지의 속성을 가지고 있는지 확인하고, 이미지일 경우 다음의 코드를 실행
    if hasattr(shape, 'image'):

      # ➍ 이미지의 바이트 데이터와 확장자를 가져와 변수에 할당
      image_stream = shape.image.blob
      image_format = shape.image.ext

      # ➎ 바이트 데이터를 사용하여 이미지 파일을 생성
      with open(f'slide_{slide_number}_image.{image_format}', 'wb') as img_file:
        img_file.write(image_stream)
        print('저장된 파일명: ', f'slide_{slide_number}_image.{image_format}')

### [05] 차트 데이터 추출하기

In [None]:
from pptx import Presentation

prs = Presentation('presentation_with_chart.pptx')

# ➊ 전체 슬라이드를 순회
for slide_number, slide in enumerate(prs.slides):

  # ➋ 각 슬라이드 내의 모든 도형을 순회
  for shape in slide.shapes:

    # ➌ if문과 hasattr 함수를 사용하여 현재 도형이 차트 속성을 갖는지 확인
    if hasattr(shape, 'chart'):
      chart = shape.chart  # ➍ 차트가 있는 경우 차트 객체를 chart에 할당

      # ➎ 차트 내의 모든 시리즈를 순회
      for series in chart.series:
        print(f'Series title: {series.name}') # 시리즈 이름을 출력

        # ➏ 첫 번째 플롯(plot)의 카테고리와 값(즉, x값과 y값)의 쌍을 순회하며 출력
        for x_val, y_val in zip(chart.plots[0].categories, series.values):
          print(f'Data point: x={x_val}, y={y_val}')

<u>**<한 걸음 더!> zip( ) 함수란?**</u>

In [None]:
fruits = ['사과', '바나나', '메론']
colors = ['빨강', '노랑']
for fruit, color in zip(fruits, colors):
  print(fruit, color)