# 1. 자연어처리를 위한 모듈과 라이브러리

1.1 필수 라이브러리

In [None]:
# NLTK (Natural Language Toolkit): 텍스트 처리, 토큰화, 품사 태깅, 불용어 제거 등을 위한 기본 라이브러리.

pip install nltk

In [None]:
#spaCy: 고급 자연어처리 작업을 위한 라이브러리로, 빠르고 효율적이며, 다양한 언어를 지원.

pip install spacy


In [None]:
#gensim: 토픽 모델링 및 Word2Vec과 같은 단어 임베딩을 위한 라이브러리.

pip install gensim


In [None]:
#scikit-learn: 머신러닝을 위한 라이브러리로, 텍스트 분류, 클러스터링 등을 지원.

pip install scikit-learn


In [None]:
#transformers: Hugging Face의 트랜스포머 모델을 쉽게 사용할 수 있도록 해주는 라이브러리.

pip install transformers


In [None]:
# TensorFlow / Keras: 딥러닝 모델을 구축하고 훈련하기 위한 라이브러리.

pip install tensorflow


In [None]:
#PyTorch: 또 다른 딥러닝 라이브러리로, 다양한 NLP 모델 구현에 유용.

pip install torch


In [None]:
#beautifulsoup4: 웹 스크래핑을 위한 라이브러리, HTML/XML 문서 파싱에 유용

pip install beautifulsoup4


In [None]:
# Flair: NLP 태스크를 위한 딥러닝 라이브러리로, 다양한 사전 훈련된 모델을 제공
pip install flair


In [None]:
# textblob: 감정 분석, 품사 태깅, 번역 등 다양한 NLP 작업을 위한 간단한 라이브러리.
pip install textblob

# 2. 의존성 및 충돌 방지를 위한 설정 조건

2.1 가상 환경 사용
가상 환경을 사용하여 프로젝트마다 독립적인 환경을 유지하는 것이 좋습니다. Python의 venv 또는 conda를 사용할 수 있습니다.

In [None]:
# venv 사용 예
python -m venv myenv
source myenv/bin/activate  # Linux/Mac
myenv\Scripts\activate  # Windows

# conda 사용 예
conda create --name myenv python=3.8
conda activate myenv

2.2 패키지 버전 관리
특정 라이브러리의 버전을 명시하여 설치하여 충돌을 방지합니다. requirements.txt 파일을 만들어서 필요한 패키지와 버전을 기록합니다.

In [None]:
# 1번 라이브러리
nltk==3.6.5
spacy==3.0.0
gensim==4.0.0
scikit-learn==0.24.2  # 1번, 2번 라이브러리에서 중복
transformers==4.10.0

# 2번 라이브러리
numpy==1.21.6
pandas==1.3.5
matplotlib==3.5.1
seaborn==0.11.2


2.3 패키지 설치
가상 환경을 활성화한 후, 아래와 같이 패키지를 설치합니다.

In [None]:
pip install -r requirements.txt


3. 의존성 검사
패키지를 설치한 후, 각 라이브러리의 의존성을 확인하여 충돌 여부를 검사합니다.

In [None]:
pip install pipdeptree
pipdeptree  # 패키지 의존성 확인

4. 기본 테스트
모든 라이브러리를 간단히 테스트하여 충돌이 없는지 확인합니다

In [None]:
import nltk
import spacy
import gensim
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.ensemble import RandomForestClassifier
from transformers import pipeline

# 각 라이브러리 버전 확인
print("NLTK version:", nltk.__version__)
print("spaCy version:", spacy.__version__)
print("Gensim version:", gensim.__version__)
print("NumPy version:", np.__version__)
print("Pandas version:", pd.__version__)
print("Matplotlib version:", plt.__version__)
print("Seaborn version:", sns.__version__)
print("Scikit-learn version:", scikit_learn.__version__)
print("Transformers version:", transformers.__version__)


5. 데이터분석 기본 라이브러리 

import nltk
import spacy
import gensim
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.ensemble import RandomForestClassifier
from transformers import pipeline

# 3. setup.py  설정

>>> setup.py 파일은 Python 프로젝트의 패키징 및 배포를 위한 메타데이터와 설정 정보를 포함하는 스크립트입니다. 이 파일의 주요 역할은 다음과 같습니다:

1. 패키지 메타데이터 정의
이름, 버전, 설명: 패키지의 이름, 버전, 설명, 저자, 라이센스 등의 정보를 제공합니다.
의존성: 패키지가 작동하기 위해 필요한 다른 패키지를 명시합니다. 이를 통해 설치 시 자동으로 필요한 라이브러리를 설치할 수 있습니다.
2. 패키지 구조 설정
모듈 및 서브패키지: 패키지에 포함될 모듈 및 서브패키지를 지정합니다.
데이터 파일: 패키지에 포함되어야 하는 데이터 파일(예: 텍스트 파일, 이미지 파일 등)을 정의할 수 있습니다.

3. 설치 및 배포
setup.py를 사용하여 패키지를 설치하거나 배포할 수 있습니다. 일반적으로 아래 명령어를 사용하여 설치합니다:
PyPI(Python Package Index)와 같은 저장소에 패키지를 배포할 수 있는 도구(예: setuptools, twine)와 함께 사용됩니다.

In [None]:
python setup.py install

4. 스크립트 실행
entry_points를 사용하여 패키지에 포함된 스크립트를 콘솔에서 직접 실행할 수 있도록 설정할 수 있습니다.
5. 다양한 설치 옵션
setup.py는 다양한 설치 옵션(예: 개발 모드 설치, 패키지의 특정 버전 설치 등)을 제공합니다.

In [None]:
# 아래는 기본적인 setup.py의 예제입니다:

from setuptools import setup, find_packages

setup(
    name='my_package',
    version='0.1.0',
    description='A simple example package',
    author='Your Name',
    author_email='your.email@example.com',
    url='https://github.com/yourusername/my_package',
    packages=find_packages(),
    install_requires=[
        'numpy>=1.21.6',
        'pandas>=1.3.5',
        'nltk==3.6.5',
        'spacy==3.0.0',
    ],
    entry_points={
        'console_scripts': [
            'my_command=my_package.module:main_function',
        ],
    },
)


>>> 설치 시의 차이점
setup.py 사용 시:
python setup.py install 또는 pip install .를 통해 패키지를 설치하면, install_requires에 명시된 의존성들이 자동으로 설치됩니다.
requirements.txt 사용 시:
pip install -r requirements.txt를 통해 명시된 모든 패키지를 설치합니다.