# Chapter 8-3: 외부 라이브러리

## 학습 목표
- pip를 이용한 패키지 관리하기
- 가상환경(Virtual Environment) 이해하기
- 유명한 외부 라이브러리들 활용하기
- requirements.txt 파일 작성하기

## 1. pip 패키지 관리자

**pip**는 Python Package Index(PyPI)에서 패키지를 설치하고 관리하는 도구입니다.

### 기본 pip 명령어
- `pip install package_name`: 패키지 설치
- `pip uninstall package_name`: 패키지 제거
- `pip list`: 설치된 패키지 목록
- `pip show package_name`: 패키지 정보 확인
- `pip freeze`: 설치된 패키지와 버전 정보
- `pip search package_name`: 패키지 검색 (제한적)

In [None]:
# pip 명령어 시뮬레이션 (실제로는 터미널에서 실행)
import subprocess
import sys

def run_pip_command(command):
    """pip 명령어 실행 시뮬레이션"""
    print(f"$ pip {command}")
    print(f"[시뮬레이션] pip {command} 명령어가 실행됩니다.")
    print("실제 사용시에는 터미널에서 실행하세요.\n")

# 기본 pip 명령어들
commands = [
    "list",
    "show requests",
    "install requests",
    "freeze",
    "uninstall requests"
]

print("=== 주요 pip 명령어들 ===")
for cmd in commands:
    run_pip_command(cmd)

## 2. 가상환경(Virtual Environment)

가상환경은 프로젝트별로 독립적인 Python 환경을 만들어주는 도구입니다.

### 가상환경의 필요성
- **의존성 충돌 방지**: 프로젝트별로 다른 버전의 패키지 사용
- **환경 격리**: 시스템 Python과 분리
- **재현 가능한 환경**: 동일한 환경을 다른 곳에서 구성

### 가상환경 명령어
```bash
# 가상환경 생성
python -m venv myenv

# 가상환경 활성화 (Windows)
myenv\Scripts\activate

# 가상환경 활성화 (Linux/Mac)
source myenv/bin/activate

# 가상환경 비활성화
deactivate
```

In [None]:
import os
import sys

print("=== 현재 Python 환경 정보 ===")
print(f"Python 실행 파일: {sys.executable}")
print(f"Python 버전: {sys.version}")
print(f"가상환경 여부: {'Yes' if hasattr(sys, 'real_prefix') or (hasattr(sys, 'base_prefix') and sys.base_prefix != sys.prefix) else 'No'}")
print(f"Python 경로: {sys.path[:3]}...")  # 처음 3개만 표시

# 환경변수 확인
virtual_env = os.environ.get('VIRTUAL_ENV')
if virtual_env:
    print(f"가상환경 경로: {virtual_env}")
else:
    print("가상환경이 활성화되지 않았습니다.")

## 3. 유명한 외부 라이브러리들

Python 생태계의 대표적인 외부 라이브러리들을 소개합니다.

In [None]:
# requests 라이브러리 시뮬레이션
print("=== requests 라이브러리 ===")
print("HTTP 요청을 쉽게 보낼 수 있는 라이브러리")
print("설치: pip install requests")
print("")

# requests 사용 예제 (실제로는 설치 필요)
requests_example = '''
import requests

# GET 요청
response = requests.get('https://api.github.com/users/python')
print(response.status_code)  # 200
print(response.json())       # JSON 응답

# POST 요청
data = {'key': 'value'}
response = requests.post('https://httpbin.org/post', json=data)
print(response.json())
'''

print("사용 예제:")
print(requests_example)

# 간단한 HTTP 요청 시뮬레이션 (urllib 사용)
import urllib.request
import json

try:
    print("\n=== 실제 HTTP 요청 예제 (urllib 사용) ===")
    with urllib.request.urlopen('https://httpbin.org/get') as response:
        data = json.loads(response.read().decode())
        print(f"응답 코드: {response.status}")
        print(f"URL: {data.get('url', 'N/A')}")
        print(f"Headers 일부: {list(data.get('headers', {}).keys())[:3]}")
except Exception as e:
    print(f"요청 실패: {e}")

In [None]:
# 기타 유명한 라이브러리들 소개
popular_libraries = {
    'numpy': {
        'description': '수치 계산 및 배열 처리',
        'install': 'pip install numpy',
        'example': 'import numpy as np\narr = np.array([1, 2, 3])\nprint(arr * 2)'
    },
    'pandas': {
        'description': '데이터 분석 및 조작',
        'install': 'pip install pandas',
        'example': 'import pandas as pd\ndf = pd.DataFrame({"A": [1, 2], "B": [3, 4]})\nprint(df)'
    },
    'matplotlib': {
        'description': '데이터 시각화',
        'install': 'pip install matplotlib',
        'example': 'import matplotlib.pyplot as plt\nplt.plot([1, 2, 3])\nplt.show()'
    },
    'beautifulsoup4': {
        'description': 'HTML/XML 파싱',
        'install': 'pip install beautifulsoup4',
        'example': 'from bs4 import BeautifulSoup\nsoup = BeautifulSoup("<p>Hello</p>", "html.parser")'
    },
    'flask': {
        'description': '웹 프레임워크',
        'install': 'pip install flask',
        'example': 'from flask import Flask\napp = Flask(__name__)\n@app.route("/")\ndef hello(): return "Hello World!"'
    },
    'selenium': {
        'description': '웹 브라우저 자동화',
        'install': 'pip install selenium',
        'example': 'from selenium import webdriver\ndriver = webdriver.Chrome()\ndriver.get("https://www.python.org")'
    }
}

print("=== 인기 Python 라이브러리들 ===")
for lib_name, info in popular_libraries.items():
    print(f"\n📦 {lib_name}")
    print(f"   설명: {info['description']}")
    print(f"   설치: {info['install']}")
    print(f"   예제:\n   {info['example'].replace(chr(10), chr(10) + '   ')}")

## 4. requirements.txt 파일

프로젝트의 의존성을 관리하기 위한 파일입니다.

In [None]:
# requirements.txt 파일 예제 생성
requirements_content = '''# 웹 개발 프로젝트 의존성
# 웹 프레임워크
Flask==2.3.3
Django>=4.0.0,<5.0.0

# 데이터베이스
SQLAlchemy==1.4.46
psycopg2-binary==2.9.5

# HTTP 요청
requests>=2.28.0
urllib3<2.0

# 데이터 처리
pandas==1.5.3
numpy>=1.21.0

# 유틸리티
python-dotenv==1.0.0
click>=8.0

# 개발 도구 (선택사항)
pytest>=7.0.0
black==23.1.0
flake8>=5.0.0
'''

# requirements.txt 파일 생성
with open('requirements.txt', 'w', encoding='utf-8') as f:
    f.write(requirements_content)

print("requirements.txt 파일이 생성되었습니다!")
print("\n=== requirements.txt 내용 ===")
print(requirements_content)

print("\n=== requirements.txt 사용법 ===")
print("1. 의존성 설치: pip install -r requirements.txt")
print("2. 현재 환경 저장: pip freeze > requirements.txt")
print("3. 특정 버전 지정: package==1.2.3")
print("4. 버전 범위 지정: package>=1.0,<2.0")
print("5. 최신 버전: package (버전 미지정)")

## 5. 실습: 간단한 웹 스크래핑 도구

외부 라이브러리 없이 기본 모듈만으로 웹 스크래핑을 구현해보겠습니다.

In [None]:
# 웹 스크래핑 유틸리티 (내장 모듈만 사용)
import urllib.request
import urllib.parse
import re
import json
from html.parser import HTMLParser

class SimpleHTMLParser(HTMLParser):
    """간단한 HTML 파서"""
    
    def __init__(self):
        super().__init__()
        self.links = []
        self.titles = []
        self.text_content = []
        self.current_tag = None
    
    def handle_starttag(self, tag, attrs):
        self.current_tag = tag
        if tag == 'a':
            for attr_name, attr_value in attrs:
                if attr_name == 'href':
                    self.links.append(attr_value)
    
    def handle_data(self, data):
        if self.current_tag == 'title':
            self.titles.append(data.strip())
        elif self.current_tag in ['p', 'h1', 'h2', 'h3']:
            if data.strip():
                self.text_content.append(data.strip())

class WebScraper:
    """웹 스크래핑 도구"""
    
    def __init__(self, user_agent='Python-WebScraper/1.0'):
        self.user_agent = user_agent
    
    def fetch_page(self, url, timeout=10):
        """웹 페이지 내용 가져오기"""
        try:
            req = urllib.request.Request(url)
            req.add_header('User-Agent', self.user_agent)
            
            with urllib.request.urlopen(req, timeout=timeout) as response:
                return {
                    'status_code': response.status,
                    'content': response.read().decode('utf-8', errors='ignore'),
                    'headers': dict(response.headers)
                }
        except Exception as e:
            return {
                'status_code': None,
                'content': None,
                'error': str(e)
            }
    
    def parse_html(self, html_content):
        """HTML 콘텐츠 파싱"""
        parser = SimpleHTMLParser()
        parser.feed(html_content)
        
        return {
            'title': parser.titles[0] if parser.titles else None,
            'links': parser.links[:10],  # 처음 10개만
            'text_content': parser.text_content[:5]  # 처음 5개만
        }
    
    def extract_emails(self, text):
        """텍스트에서 이메일 추출"""
        email_pattern = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'
        return re.findall(email_pattern, text)
    
    def scrape_website(self, url):
        """웹사이트 종합 스크래핑"""
        print(f"스크래핑 시작: {url}")
        
        # 페이지 가져오기
        result = self.fetch_page(url)
        
        if result.get('status_code') != 200:
            return {'error': result.get('error', '페이지를 가져올 수 없습니다.')}
        
        # HTML 파싱
        parsed_data = self.parse_html(result['content'])
        
        # 이메일 추출
        emails = self.extract_emails(result['content'])
        
        return {
            'url': url,
            'status_code': result['status_code'],
            'title': parsed_data['title'],
            'links_count': len(parsed_data['links']),
            'sample_links': parsed_data['links'][:3],
            'text_snippets': parsed_data['text_content'][:3],
            'emails_found': len(emails),
            'sample_emails': emails[:3] if emails else []
        }

# 웹 스크래퍼 테스트
scraper = WebScraper()

print("=== 웹 스크래핑 도구 테스트 ===")

# 안전한 테스트 사이트들
test_urls = [
    'https://httpbin.org/html',
    'https://example.com'
]

for url in test_urls:
    try:
        result = scraper.scrape_website(url)
        
        if 'error' in result:
            print(f"\n❌ {url}: {result['error']}")
        else:
            print(f"\n✅ {url}")
            print(f"   제목: {result.get('title', 'N/A')}")
            print(f"   상태 코드: {result['status_code']}")
            print(f"   링크 수: {result['links_count']}")
            print(f"   샘플 링크: {result['sample_links']}")
            if result['text_snippets']:
                print(f"   텍스트 일부: {result['text_snippets'][0][:50]}...")
            
    except Exception as e:
        print(f"\n❌ {url}: 오류 발생 - {e}")

print("\n⚠️  실제 웹 스크래핑 시 주의사항:")
print("- robots.txt 확인")
print("- 요청 간격 두기 (rate limiting)")
print("- 웹사이트 이용약관 준수")
print("- User-Agent 헤더 설정")

## 6. 패키지 배포하기

자신이 만든 패키지를 PyPI에 배포하는 방법을 알아보겠습니다.

In [None]:
# setup.py 파일 예제
setup_py_content = '''from setuptools import setup, find_packages

with open("README.md", "r", encoding="utf-8") as fh:
    long_description = fh.read()

setup(
    name="my-awesome-package",
    version="0.1.0",
    author="Your Name",
    author_email="your.email@example.com",
    description="A short description of your package",
    long_description=long_description,
    long_description_content_type="text/markdown",
    url="https://github.com/yourusername/your-package",
    packages=find_packages(),
    classifiers=[
        "Development Status :: 3 - Alpha",
        "Intended Audience :: Developers",
        "License :: OSI Approved :: MIT License",
        "Operating System :: OS Independent",
        "Programming Language :: Python :: 3",
        "Programming Language :: Python :: 3.8",
        "Programming Language :: Python :: 3.9",
        "Programming Language :: Python :: 3.10",
    ],
    python_requires=">=3.8",
    install_requires=[
        "requests>=2.25.0",
        "click>=8.0.0",
    ],
    extras_require={
        "dev": [
            "pytest>=6.0",
            "black>=21.0",
            "flake8>=3.8",
        ],
    },
    entry_points={
        "console_scripts": [
            "my-tool=mypackage.cli:main",
        ],
    },
)
'''

# pyproject.toml 파일 예제 (최신 방식)
pyproject_toml_content = '''[build-system]
requires = ["setuptools>=45", "wheel"]
build-backend = "setuptools.build_meta"

[project]
name = "my-awesome-package"
version = "0.1.0"
description = "A short description of your package"
readme = "README.md"
authors = [{name = "Your Name", email = "your.email@example.com"}]
license = {text = "MIT"}
requires-python = ">=3.8"
classifiers = [
    "Development Status :: 3 - Alpha",
    "Intended Audience :: Developers",
    "License :: OSI Approved :: MIT License",
    "Programming Language :: Python :: 3",
]
dependencies = [
    "requests>=2.25.0",
    "click>=8.0.0",
]

[project.optional-dependencies]
dev = [
    "pytest>=6.0",
    "black>=21.0",
    "flake8>=3.8",
]

[project.scripts]
my-tool = "mypackage.cli:main"

[project.urls]
Homepage = "https://github.com/yourusername/your-package"
Repository = "https://github.com/yourusername/your-package"
'''

# 파일들 생성
with open('setup.py', 'w', encoding='utf-8') as f:
    f.write(setup_py_content)

with open('pyproject.toml', 'w', encoding='utf-8') as f:
    f.write(pyproject_toml_content)

print("=== 패키지 배포 파일들이 생성되었습니다! ===")
print("\n📦 setup.py (전통적 방식)")
print("📦 pyproject.toml (최신 방식)")

print("\n=== 패키지 배포 단계 ===")
print("1. 패키지 빌드: python -m build")
print("2. TestPyPI 업로드: python -m twine upload --repository testpypi dist/*")
print("3. 테스트 설치: pip install --index-url https://test.pypi.org/simple/ your-package")
print("4. PyPI 업로드: python -m twine upload dist/*")

print("\n=== 필요한 도구 설치 ===")
print("pip install build twine")

## 7. 정리 및 요약

### 🎯 학습한 내용

1. **pip 패키지 관리**
   - 패키지 설치/제거/업그레이드
   - 패키지 정보 확인
   - 의존성 관리

2. **가상환경**
   - 프로젝트별 환경 격리
   - 의존성 충돌 방지
   - 재현 가능한 환경 구성

3. **인기 라이브러리**
   - requests: HTTP 클라이언트
   - pandas: 데이터 분석
   - numpy: 수치 계산
   - flask: 웹 프레임워크
   - beautifulsoup4: HTML 파싱

4. **requirements.txt**
   - 의존성 명세
   - 버전 관리
   - 환경 재구성

5. **패키지 배포**
   - setup.py / pyproject.toml
   - PyPI 업로드
   - 패키지 빌드

### 💡 모범 사례

- 항상 가상환경 사용
- requirements.txt로 의존성 관리
- 적절한 버전 명시
- 보안 업데이트 주의
- 라이선스 확인

다음 장에서는 **날씨 정보 앱** 미니프로젝트를 진행하겠습니다!