# Criando um Document Loader Customizado no LangChain

Na última aula, discutimos a importância dos Document Loaders no LangChain e como utilizá-los para carregar dados de diferentes fontes. Agora, vamos aprender a criar um Document Loader customizado. Isso é útil quando você precisa carregar dados de uma fonte que não é suportada pelos loaders padrão do LangChain.

### O que é um Document Loader Customizado?

Um Document Loader customizado é uma classe que você cria para carregar dados de uma fonte específica. Essa classe deve implementar um método que retorna uma lista de documentos, onde cada documento é um objeto que contém o conteúdo e os metadados.

### Passos para Criar um Document Loader Customizado

1. **`Importar as Bibliotecas Necessárias:`** Você precisará importar as classes e métodos do LangChain que serão utilizados na criação do seu loader.

In [None]:
from langchain.document_loaders.base import BaseLoader
from langchain.schema import Document

2. **`Definir a Classe do Loader:`** Crie uma nova classe que herda de BaseLoader. Essa classe deve implementar o método load(). Neste caso, criamos um loader que cria um documento para cada linha de texto de um arquivo.

In [None]:
class MyCustomLoader(BaseLoader):
  def __init__(self, source):
    self.source = source  # Fonte de dados, como um arquivo ou URL

  def load(self):
    # Lógica para carregar os dados da fonte
    documents = []
    # Exemplo: Carregar dados de um arquivo de texto
    with open(self.source, 'r') as file:
      content = file.read()
      # Criar um documento com o conteúdo e metadados
      documents.append(Document(page_content=content, metadata={"source": self.source}))
    return documents

3. **`Utilizar o Document Loader Customizado:`** Após definir a classe, você pode instanciá-la e utilizá-la para carregar os dados.

In [None]:
# Criar uma instância do loader
loader = MyCustomLoader('caminho/para/seu/arquivo.txt')
documentos = loader.load()

# Verificar o conteúdo carregado
for doc in documentos:
  print(doc.page_content)  # Exibir o conteúdo do documento
  print(doc.metadata)  # Exibir os metadados do documento

### Exemplo Completo

Aqui está um exemplo completo de um Document Loader customizado que carrega dados de um arquivo de texto:

In [None]:
from langchain.document_loaders.base import BaseLoader
from langchain.schema import Document

class MyCustomLoader(BaseLoader):
  def __init__(self, source):
    self.source = source  # Fonte de dados, como um arquivo ou URL

  def load(self):
    documents = []
    with open(self.source, 'r') as file:
      content = file.read()
      documents.append(Document(page_content=content, metadata={"source": self.source}))
    return documents

# Utilizando o Document Loader customizado
loader = MyCustomLoader('caminho/para/seu/arquivo.txt')
documentos = loader.load()

# Exibindo o conteúdo e metadados
for doc in documentos:
  print(doc.page_content)
  print(doc.metadata)

### Resumindo

- Document Loaders customizados permitem que você carregue dados de fontes não suportadas pelos loaders padrão do LangChain.

- Implemente a classe herdando de **`BaseLoader`** e defina o método **`load()`** para retornar uma lista de documentos.

- Utilize o seu loader customizado instanciando a classe e chamando o método **`load()`**.

Criar Document Loaders customizados é uma maneira poderosa de expandir as capacidades do LangChain e adaptar a biblioteca às suas necessidades específicas. Se você tiver dúvidas ou precisar de ajuda para criar um loader para uma fonte específica, sinta-se à vontade para perguntar!