# 실습 01: 개발환경 구축

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/leecks1119/document_ai_lecture/blob/master/notebooks/Lab01_개발환경구축.ipynb)

## 🎯 학습 목표
- Google Colab 환경에서 Document AI 실습 준비
- 필요한 패키지 설치 및 테스트
- 환경 검증

## ⏱️ 소요 시간
- 약 10분

## 📊 난이도
⭐☆☆☆☆ (매우 쉬움)


## 📦 Step 1: 패키지 설치 (핵심!)

한 줄로 모든 실습 코드를 사용할 수 있습니다!


In [None]:
# Document AI 강의용 패키지 설치
!pip install -q git+https://github.com/leecks1119/document_ai_lecture.git

# Tesseract OCR 시스템 패키지 설치
!apt-get update -qq
!apt-get install -y tesseract-ocr tesseract-ocr-kor tesseract-ocr-eng

print("✅ 설치 완료!")


## 🔍 Step 2: 환경 검증

설치가 제대로 되었는지 확인합니다.


In [None]:
# 패키지 임포트 테스트
from docai_course import OCRBenchmark, DocumentPreprocessor, UnifiedNERSystem

import cv2
import numpy as np
import pandas as pd
import torch

print("="*50)
print("🔍 환경 검증")
print("="*50)
print(f"\n✅ OpenCV: {cv2.__version__}")
print(f"✅ NumPy: {np.__version__}")
print(f"✅ Pandas: {pd.__version__}")
print(f"✅ PyTorch: {torch.__version__}")
print(f"✅ CUDA 사용 가능: {torch.cuda.is_available()}")
print(f"\n✅ Document AI 패키지 로드 성공!")
print("\n🎉 환경 설정 완료! 다음 실습으로 진행하세요.")


## 🧪 Step 3: 간단한 테스트

OCR이 정상 작동하는지 확인합니다.


In [None]:
# 간단한 이미지 생성 및 OCR 테스트
from PIL import Image, ImageDraw, ImageFont
import pytesseract

# 한글 폰트 로드 (Windows/Linux 호환)
try:
    font = ImageFont.truetype("C:\\Windows\\Fonts\\malgun.ttf", 20)
except:
    try:
        font = ImageFont.truetype("/usr/share/fonts/truetype/nanum/NanumGothic.ttf", 20)
    except:
        font = ImageFont.load_default()

# 테스트 이미지 생성
img = Image.new('RGB', (400, 100), color='white')
draw = ImageDraw.Draw(img)
draw.text((10, 30), "Document AI 실습 환경 테스트", fill='black', font=font)

# 이미지 파일로 저장
test_image_path = 'test_ocr_sample.jpg'
img.save(test_image_path)
print(f"✅ 테스트 이미지 저장: {test_image_path}\n")

# 저장된 이미지로 OCR 실행
text = pytesseract.image_to_string(img, lang='kor+eng')
print(f"OCR 결과: {text}")

if "Document" in text or "실습" in text:
    print("✅ OCR 작동 정상!")
else:
    print("⚠️ OCR 결과 확인 필요 (한글 인식 약할 수 있음)")

# 이미지 미리보기
print("\n📷 생성된 이미지:")
img


---

## ✅ 완료!

환경 설정이 완료되었습니다. 이제 다음 실습으로 넘어갈 수 있습니다!

### 📚 다음 실습
- **Lab02**: Document AI 기술표

### 💡 참고사항
- **Google Drive 마운트**: 선택사항입니다. 결과를 저장하고 싶으면 사용하세요.
- **GPU 설정**: `런타임` → `런타임 유형 변경` → `GPU` 선택
- **문제 발생 시**: `런타임` → `런타임 다시 시작` 후 재실행
