In [1]:
from pptx import Presentation
from pptx.util import Pt

# 새 프레젠테이션 생성
prs = Presentation()

# 표지 슬라이드
slide_layout = prs.slide_layouts[0]
slide = prs.slides.add_slide(slide_layout)
title = slide.shapes.title
subtitle = slide.placeholders[1]
title.text = "CLIKCA – RAG 기반 업무 보조 AI 비서"
subtitle.text = "SK Networks Family AI Camp 13기 | 1팀: 딸깍\n중간발표"

# 슬라이드 추가 함수
def add_bullet_slide(title_text, bullet_points):
    slide_layout = prs.slide_layouts[1]  # Title & Content
    slide = prs.slides.add_slide(slide_layout)
    title = slide.shapes.title
    content = slide.placeholders[1]
    title.text = title_text
    tf = content.text_frame
    tf.clear()
    for i, point in enumerate(bullet_points):
        p = tf.add_paragraph() if i > 0 else tf.paragraphs[0]
        p.text = point
        p.font.size = Pt(14)
    return slide

# 2. 프로젝트 개요
add_bullet_slide("프로젝트 개요", [
    "단순 검색을 넘어, 문서·회의·일정·메일까지 통합 관리하는 올인원 AI 비서",
    "서비스 슬로건: '한 번의 클릭, 모든 업무 완결'",
    "핵심 기능: 문서요약, 일정관리, 이메일, To-Do, 초안작성, QnA"
])

# 3. 추진 배경
add_bullet_slide("추진 배경", [
    "신입/부서이동자의 50.2%가 업무 적응에 최소 3개월 소요",
    "문제점: 정보 단편화, 검색 한계, 반복 작업 증가",
    "필요성: RAG+LLM 기반의 조직 내 정보 통합·자동화 시스템"
])

# 4. 서비스 개요
add_bullet_slide("서비스 개요", [
    "서비스명: CLIKCA (Click + Assistant)",
    "차별성: 의미검색+요약, 이기종 데이터 통합, API 양방향 연동",
    "활용 시나리오: 규정 질의, 회의록→일정, 초안 작성"
])

# 5. 주요 기능
add_bullet_slide("주요 기능", [
    "회의록/문서 요약: STT → 요약·액션아이템",
    "일정관리: 자동 추출·등록·충돌감지",
    "이메일 생성: 템플릿+자동발송",
    "To-Do 브리핑: 태스크 추출·리포트",
    "문서 초안 작성: 유사 사례+템플릿 기반",
    "업무 QnA: RAG 기반 검색·원문 링크",
    "대시보드: 일정·메일·문서 통합"
])

# 6. 아키텍처
add_bullet_slide("시스템 아키텍처", [
    "백엔드: FastAPI, MySQL/PostgreSQL",
    "LLM: GPT-4o, Whisper, LangChain, LangGraph",
    "Vector DB: ChromaDB",
    "Frontend: React + Tailwind + Electron",
    "배포: AWS + Docker",
    "보안: SSO + JWT"
])

# 7. 진행 현황
add_bullet_slide("진행 현황", [
    "분석·설계 단계: 100% 완료",
    "데이터 수집·전처리: 80% 완료 (전처리 보고서 성과 포함)",
    "프론트엔드: 화면 설계 완료, 일부 구현 중",
    "백엔드: DB설계·RAG구현 착수",
    "남은 과제: 백엔드 API 완성, 통합 테스트"
])

# 8. 데이터 구축 현황
add_bullet_slide("데이터 구축 현황", [
    "수집 문서: 100건 / 4종(사내규정, 법령, 운영문서, 관계법령)",
    "전처리 성과: Vision 호출 43% 절감",
    "표 인식 성공률 71%→85%",
    "노이즈 제거로 정보량 9% 향상",
    "데이터 파이프라인: 수집 → 유형분류 → 전처리 → VectorDB 저장"
])

# 9. 기대효과
add_bullet_slide("기대효과", [
    "연간 시간 절감: 31,920시간",
    "비용 절감: 95.6억 원",
    "ROI: 1,800% 이상",
    "장기효과: 지식 자산화, 협업문화 개선, AI 기반 업무 표준화"
])

# 10. 향후 계획
add_bullet_slide("향후 계획", [
    "8월 중순: 백엔드·프론트 연동",
    "8월 말: 내부 테스트 및 오류 수정",
    "9월 초: 최종 발표·시연"
])

# 저장
prs.save("CLIKCA_중간발표.pptx")
print("CLIKCA_중간발표.pptx 파일이 생성되었습니다.")


CLIKCA_중간발표.pptx 파일이 생성되었습니다.


In [2]:
from pptx import Presentation
from pptx.util import Pt

# PPT 객체 생성
prs = Presentation()

# 표지 슬라이드
slide_layout = prs.slide_layouts[0]  # Title Slide
slide = prs.slides.add_slide(slide_layout)
slide.shapes.title.text = "PDF → 벡터DB 데이터 전처리 파이프라인"
slide.placeholders[1].text = "추출 · 분석 · 자동 서술 기반 고품질 데이터 구축"

# 콘텐츠 슬라이드 추가 함수
def add_content_slide(title, bullet_points):
    slide_layout = prs.slide_layouts[1]  # Title + Content
    slide = prs.slides.add_slide(slide_layout)
    slide.shapes.title.text = title
    tf = slide.shapes.placeholders[1].text_frame
    tf.clear()  # 기존 내용 삭제
    for point in bullet_points:
        p = tf.add_paragraph()
        p.text = point
        p.font.size = Pt(14)

# 슬라이드 내용 구성
add_content_slide("전체 파이프라인 개요", [
    "PDF 문서 → [1단계: 추출 및 구조화] → [2단계: AI 기반 자동 서술] → Human-in-the-loop 검수 → Vector DB 저장"
])

add_content_slide("1단계: 데이터 추출 및 구조화", [
    "텍스트 → Markdown",
    "표 → CSV",
    "이미지 → PNG",
    "PyMuPDF, Camelot 활용, 페이지별 구조 보존"
])

add_content_slide("2단계: AI 기반 자동 서술", [
    "텍스트 교정: 오탈자·단어깨짐 복원",
    "표 설명 생성: CSV + 페이지 이미지 → 자연어 설명",
    "이미지 설명 생성: 차트/다이어그램 해설"
])

add_content_slide("Human-in-the-loop 프로세스", [
    "1차 자동 변환",
    "2차 인간 검수",
    "최종 저장"
])

add_content_slide("결론 & 향후 계획", [
    "AI + Human 결합으로 최고 신뢰도의 데이터베이스 구축",
    "정확도 100% 달성 전략",
    "다른 문서 유형으로 확장 적용"
])

# 파일 저장
prs.save("시각화중심_중간발표.pptx")
print("PPT 생성 완료: 시각화중심_중간발표.pptx")



PPT 생성 완료: 시각화중심_중간발표.pptx


In [4]:
!pip install python-pptx
from pptx import Presentation
from pptx.util import Inches, Pt
from pptx.enum.text import PP_ALIGN, MSO_AUTO_SIZE
from pptx.enum.shapes import MSO_SHAPE
from pptx.dml.color import RGBColor

# =========================
# Style system
# =========================
PALETTE = {
    "bg_dark": RGBColor(20, 24, 38),       # Deep navy
    "bg_light": RGBColor(245, 247, 250),   # Off white
    "pri": RGBColor(60, 115, 235),         # Primary blue
    "pri_dark": RGBColor(36, 86, 196),
    "sec": RGBColor(86, 204, 150),         # Green
    "acc": RGBColor(245, 158, 11),         # Amber
    "muted": RGBColor(126, 132, 148),      # Gray
    "ink": RGBColor(28, 32, 44),           # Text dark
    "white": RGBColor(255, 255, 255),
}

prs = Presentation()
# Optional: slightly wider canvas look (default 10 x 7.5 in)
prs.slide_width = Inches(13.33)
prs.slide_height = Inches(7.5)

def set_text(run, size=24, bold=False, color=PALETTE["ink"]):
    run.font.size = Pt(size)
    run.font.bold = bold
    run.font.color.rgb = color

def add_header_band(slide, title, subtitle=None, dark=False):
    top_band = slide.shapes.add_shape(
        MSO_SHAPE.RECTANGLE, Inches(0), Inches(0), prs.slide_width, Inches(1.3)
    )
    top_band.fill.solid()
    top_band.fill.fore_color.rgb = PALETTE["pri_dark"] if dark else PALETTE["pri"]
    top_band.line.fill.background()

    title_box = slide.shapes.add_textbox(Inches(0.6), Inches(0.25), prs.slide_width, Inches(0.7))
    tf = title_box.text_frame
    tf.clear()
    p = tf.paragraphs[0]
    run = p.add_run()
    run.text = title
    set_text(run, size=34, bold=True, color=PALETTE["white"])

    if subtitle:
        sub_box = slide.shapes.add_textbox(Inches(0.6), Inches(0.95), prs.slide_width, Inches(0.7))
        tf2 = sub_box.text_frame
        tf2.clear()
        p2 = tf2.paragraphs[0]
        run2 = p2.add_run()
        run2.text = subtitle
        set_text(run2, size=16, color=PALETTE["white"])

def add_footer_note(slide, note):
    bar = slide.shapes.add_shape(
        MSO_SHAPE.RECTANGLE, Inches(0), prs.slide_height - Inches(0.5), prs.slide_width, Inches(0.5)
    )
    bar.fill.solid()
    bar.fill.fore_color.rgb = PALETTE["bg_light"]
    bar.line.fill.background()

    tx = slide.shapes.add_textbox(Inches(0.5), prs.slide_height - Inches(0.45), Inches(10), Inches(0.4))
    tf = tx.text_frame
    tf.clear()
    p = tf.paragraphs[0]
    run = p.add_run()
    run.text = note
    set_text(run, size=12, color=PALETTE["muted"])

def add_card(slide, x, y, w, h, title, lines=None, color="bg_light", accent_left=True):
    rect = slide.shapes.add_shape(MSO_SHAPE.ROUNDED_RECTANGLE, x, y, w, h)
    rect.fill.solid()
    rect.fill.fore_color.rgb = PALETTE[color] if isinstance(color, str) else color
    rect.line.fill.background()
    rect.adjustments[0] = 0.15  # roundness

    if accent_left:
        accent = slide.shapes.add_shape(MSO_SHAPE.RECTANGLE, x, y, Inches(0.18), h)
        accent.fill.solid()
        accent.fill.fore_color.rgb = PALETTE["pri"]
        accent.line.fill.background()

    tx = slide.shapes.add_textbox(x + Inches(0.35), y + Inches(0.25), w - Inches(0.55), h - Inches(0.5))
    tf = tx.text_frame
    tf.clear()

    p = tf.paragraphs[0]
    run = p.add_run()
    run.text = title
    set_text(run, size=20, bold=True)

    if lines:
        for line in lines:
            p = tf.add_paragraph()
            p.level = 1
            r = p.add_run()
            r.text = line
            set_text(r, size=14, color=PALETTE["muted"])

def add_chevron_flow(slide, steps, x, y, w, h, gap=Inches(0.15)):
    # Create a horizontal chevron process
    step_w = (w - gap * (len(steps) - 1)) / len(steps)
    for i, (label, color_key) in enumerate(steps):
        cx = x + i * (step_w + gap)
        shp = slide.shapes.add_shape(MSO_SHAPE.CHEVRON, cx, y, step_w, h)
        shp.fill.solid()
        shp.fill.fore_color.rgb = PALETTE[color_key]
        shp.line.fill.background()
        # Text
        tf = shp.text_frame
        tf.clear()
        p = tf.paragraphs[0]
        p.alignment = PP_ALIGN.CENTER
        r = p.add_run()
        r.text = label
        set_text(r, size=16, bold=True, color=PALETTE["white"])

def add_kpi_chip(slide, x, y, label, value):
    chip = slide.shapes.add_shape(MSO_SHAPE.ROUNDED_RECTANGLE, x, y, Inches(2.8), Inches(0.9))
    chip.fill.solid()
    chip.fill.fore_color.rgb = PALETTE["bg_light"]
    chip.line.fill.background()
    chip.adjustments[0] = 0.6

    tf = chip.text_frame
    tf.clear()
    p1 = tf.paragraphs[0]
    r1 = p1.add_run()
    r1.text = f"{label}"
    set_text(r1, size=12, color=PALETTE["muted"])

    p2 = tf.add_paragraph()
    r2 = p2.add_run()
    r2.text = f"{value}"
    set_text(r2, size=20, bold=True, color=PALETTE["pri"])

def add_checklist(slide, x, y, items):
    for idx, text in enumerate(items):
        yy = y + Inches(idx * 0.6)
        # bullet mark
        dot = slide.shapes.add_shape(MSO_SHAPE.OVAL, x, yy, Inches(0.28), Inches(0.28))
        dot.fill.solid()
        dot.fill.fore_color.rgb = PALETTE["sec"]
        dot.line.fill.background()
        # text
        tx = slide.shapes.add_textbox(x + Inches(0.4), yy - Inches(0.05), Inches(8.5), Inches(0.6))
        tf = tx.text_frame
        tf.clear()
        p = tf.paragraphs[0]
        r = p.add_run()
        r.text = text
        set_text(r, size=16)

# =========================
# Slides
# =========================

# 1) Cover
slide = prs.slides.add_slide(prs.slide_layouts[6])  # blank
add_header_band(slide,
                "PDF → 벡터DB 데이터 전처리 파이프라인",
                "추출 · 분석 · 자동 서술 기반 고품질 데이터 구축",
                dark=True)

# backdrop panel
panel = slide.shapes.add_shape(MSO_SHAPE.ROUNDED_RECTANGLE, Inches(0.6), Inches(2.0), prs.slide_width - Inches(1.2), Inches(4.7))
panel.fill.solid()
panel.fill.fore_color.rgb = PALETTE["bg_light"]
panel.line.fill.background()
panel.adjustments[0] = 0.04

title_box = slide.shapes.add_textbox(Inches(1.0), Inches(2.3), Inches(8.0), Inches(1.0))
tf = title_box.text_frame; tf.clear()
p = tf.paragraphs[0]; r = p.add_run()
r.text = "발표 개요"
set_text(r, size=22, bold=True)

add_checklist(slide, Inches(1.0), Inches(3.0), [
    "텍스트 양을 줄이고 슬라이드당 핵심 메시지 1개",
    "프로세스는 체브론 플로우로 한 눈에",
    "카드형 정보·배지·칩으로 시각 밀도 조절"
])

add_footer_note(slide, "중간발표 시안 — 시각화 중심 레이아웃")

# 2) 전체 파이프라인 개요 (체브론 플로우)
slide = prs.slides.add_slide(prs.slide_layouts[6])
add_header_band(slide, "전체 파이프라인 개요")

add_chevron_flow(
    slide,
    steps=[
        ("PDF 문서", "muted"),
        ("1단계: 추출·구조화", "pri"),
        ("2단계: 자동 서술", "sec"),
        ("Human-in-the-loop 검수", "acc"),
        ("Vector DB 저장", "pri_dark"),
    ],
    x=Inches(0.6),
    y=Inches(2.2),
    w=prs.slide_width - Inches(1.2),
    h=Inches(1.6)
)

add_footer_note(slide, "한 장으로 끝나는 End-to-End 흐름")

# 3) 1단계: 데이터 추출·구조화 (3-카드)
slide = prs.slides.add_slide(prs.slide_layouts[6])
add_header_band(slide, "1단계: 데이터 추출 및 구조화")

card_w = (prs.slide_width - Inches(1.2) - Inches(0.6)*2) / 3
x0 = Inches(0.6)
y0 = Inches(2.0)
gap = Inches(0.6)

add_card(slide, x0, y0, card_w, Inches(3.6), "텍스트 → Markdown", [
    "본문 텍스트만 페이지별 추출",
    "머리말/바닥말 제거",
    "PyMuPDF 파이프라인"
])

add_card(slide, x0 + card_w + gap, y0, card_w, Inches(3.6), "표 → CSV", [
    "구조/셀 단위 보존",
    "Camelot 기반 테이블 감지",
    "원본 단위·제목 유지 가이드"
])

add_card(slide, x0 + (card_w + gap)*2, y0, card_w, Inches(3.6), "이미지 → PNG", [
    "차트/다이어그램 분리 저장",
    "정보성 vs 장식 이미지 구분",
    "페이지 참조 메타 포함"
])

add_footer_note(slide, "도구: PyMuPDF, Camelot · 저장: md/csv/png")

# 4) 2단계: AI 기반 자동 서술 (3-카드 + KPI 칩)
slide = prs.slides.add_slide(prs.slide_layouts[6])
add_header_band(slide, "2단계: AI 기반 자동 서술")

add_card(slide, Inches(0.6), Inches(1.9), Inches(4.0), Inches(3.2), "텍스트 교정", [
    "단어 깨짐·오탈자 복원",
    "의미 보존형 문장 재구성",
    "변경 추적 옵션"
])

add_card(slide, Inches(4.8), Inches(1.9), Inches(4.0), Inches(3.2), "표 설명 생성", [
    "CSV + 페이지 이미지 동시 입력",
    "제목·단위 인지 후 요약",
    "기계 나열 금지, 자연어 설명"
])

add_card(slide, Inches(9.0), Inches(1.9), Inches(4.0), Inches(3.2), "이미지 설명 생성", [
    "차트: 축·범례·포인트 기술",
    "사진/다이어그램: 객관 묘사",
    "주관적 해석·추론 금지"
])

add_kpi_chip(slide, Inches(0.6), Inches(5.4), "자동 서술 커버리지", "텍스트·표·이미지 3종")
add_kpi_chip(slide, Inches(3.6), Inches(5.4), "변환 정책", "원본 의미 우선·추론 금지")
add_kpi_chip(slide, Inches(6.6), Inches(5.4), "멀티모달 입력", "구조+시각맥락 동시 처리")

add_footer_note(slide, "정책 프롬프트: 제목/단위 명시 · 문장형 서술")

# 5) Human-in-the-loop 프로세스 (3-스텝 카드)
slide = prs.slides.add_slide(prs.slide_layouts[6])
add_header_band(slide, "Human-in-the-loop 프로세스")

add_card(slide, Inches(0.6), Inches(2.0), Inches(4.0), Inches(3.0), "1차 자동 변환", [
    "PDF → Markdown/CSV/PNG",
    "서술 초안 자동 생성"
], color="bg_light")

add_card(slide, Inches(4.8), Inches(2.0), Inches(4.0), Inches(3.0), "2차 인간 검수", [
    "미묘한 맥락·누락 보완",
    "용어 통일·형식 점검"
], color="bg_light")

add_card(slide, Inches(9.0), Inches(2.0), Inches(4.0), Inches(3.0), "최종 저장", [
    "확정본만 Vector DB 반영",
    "추적 가능한 히스토리"
], color="bg_light")

add_footer_note(slide, "AI의 속도 + 사람의 정확성 결합")

# 6) 결론 & 향후 계획 (하이라이트 박스 + 체크)
slide = prs.slides.add_slide(prs.slide_layouts[6])
add_header_band(slide, "결론 & 향후 계획")

hl = slide.shapes.add_shape(MSO_SHAPE.RECTANGLE, Inches(0.6), Inches(1.9), prs.slide_width - Inches(1.2), Inches(1.4))
hl.fill.solid(); hl.fill.fore_color.rgb = PALETTE["pri"]; hl.line.fill.background()
tx = slide.shapes.add_textbox(Inches(0.9), Inches(2.05), Inches(10.5), Inches(1.0))
tf = tx.text_frame; tf.clear()
p = tf.paragraphs[0]; r = p.add_run()
r.text = "목표: 정보 손실 최소화 + 기계가 처리 가능한 고품질 텍스트 확보"
set_text(r, size=22, bold=True, color=PALETTE["white"])

add_checklist(slide, Inches(0.9), Inches(3.8), [
    "정확도 상향: 문서 유형별 정책 프롬프트 강화",
    "확장 적용: 스캔PDF·스프레드·보고서 포함",
    "품질 메트릭: 커버리지·오류율·검수시간 트래킹"
])

add_footer_note(slide, "다음 액션: 품질 지표 정의·대상 문서 확장·운영 자동화")

# =========================
# Save
# =========================
out = "시각화중심_중간발표_디자인.pptx"
prs.save(out)
print(f"PPT 생성 완료: {out}")


PPT 생성 완료: 시각화중심_중간발표_디자인.pptx
