### **디렉토리에서 문서를 로드**

LangChain의 [DirectoryLoader](https://api.python.langchain.com/en/latest/document_loaders/langchain_community.document_loaders.directory.DirectoryLoader.html)는 디스크에서 파일을 읽어 LangChain [Document](https://api.python.langchain.com/en/latest/documents/langchain_core.documents.base.Document.html#langchain_core.documents.base.Document) 객체로 변환하는 기능을 구현합니다. 

- 와일드카드 패턴을 포함하여 파일 시스템에서 로드하는 방법
- 파일 I/O에 멀티스레딩을 사용하는 방법
- 특정 파일 유형(예: 코드)을 파싱하기 위해 사용자 정의 로더 클래스를 사용하는 방법
- 디코딩으로 인한 오류와 같은 오류를 처리하는 방법

**DirectoryLoader**는 기본적으로 [UnstructuredLoader](https://python.langchain.com/v0.2/docs/integrations/providers/unstructured/)
를 `loader_cls` kwarg로 받아들입니다. [Unstructured](https://unstructured-io.github.io/unstructured/)는 PDF와 HTML과 같은 다양한 형식의 파싱을 지원합니다. 여기서는 마크다운(.md) 파일을 읽기 위해 사용합니다.

`glob` 매개변수를 사용하여 로드할 파일 형식을 제어할 수 있습니다. 

In [None]:
# 설치치
#!pip install python-magic

from langchain_community.document_loaders import DirectoryLoader

# 디렉토리 로더 초기화
loader = DirectoryLoader("../", glob="**/*.txt")
# 문서 로드
docs = loader.load()
# 문서 개수 계산
len(docs)

3

In [4]:
# 페이지 내용 출력
print(docs[0].page_content[:100])

Selecting the “right” amount of information to include in a summary is a difficult task. A good summ


In [None]:
# `show_progress=True` 진행 상황표시 가능

loader = DirectoryLoader(
    "../", glob="**/*.md", show_progress=True
)  # 디렉토리 로더 설정
docs = loader.load()  # 문서 로드

다중 스레드 활용 `use_multithreading = True` 

In [None]:
loader = DirectoryLoader(
    "../", glob="**/*.md", use_multithreading=True
)  # 디렉토리 로더 설정
docs = loader.load()  # 문서 로드

### **loader_cls**

- `loader_cls` 는 기본 값으로 `UnstructuredLoader` 클래스를 사용 

- 특정 로더 사용가능

In [None]:
from langchain_community.document_loaders import TextLoader

# loader_cls 를 TextLoader 변경경
loader = DirectoryLoader("../", glob="**/*.md", loader_cls=TextLoader)

# 문서 로드
docs = loader.load()

In [None]:
# 문서 페이지 내용 출력
print(docs[0].page_content[:100])

In [None]:
# Python 소스 코드 파일을 로더
from langchain_community.document_loaders import PythonLoader

# 현재폴더(.) 의 .py 파일을 모두 조회하여 PythonLoader 로 로드
loader = DirectoryLoader(".", glob="**/*.py", loader_cls=PythonLoader)

In [None]:
# 문서 로드
docs = loader.load()
docs