# GitHub

此笔记本展示了如何加载指定仓库的 issue 和 pull requests (PR)，以及如何加载指定仓库的文件。我们将以 LangChain Python 仓库为例。

## 设置访问令牌

要访问 GitHub API，您需要一个个人访问令牌 - 您可以在此处设置您的令牌：https://github.com/settings/tokens?type=beta 。您可以将此令牌设置为环境变量 ``GITHUB_PERSONAL_ACCESS_TOKEN``，它会自动拉取，或者在初始化时直接将其作为 ``access_token`` 命名参数传入。

In [None]:
# If you haven't set your access token as an environment variable, pass it in here.
from getpass import getpass

ACCESS_TOKEN = getpass()

## 加载问题和 PR

In [None]:
from langchain_community.document_loaders import GitHubIssuesLoader

In [None]:
loader = GitHubIssuesLoader(
    repo="langchain-ai/langchain",
    access_token=ACCESS_TOKEN,  # delete/comment out this argument if you've set the access token as an env var.
    creator="UmerHA",
)

让我们加载“UmerHA”创建的所有 issues 和 PRs。

以下是您可以使用所有过滤器的列表：
- include_prs
- milestone
- state
- assignee
- creator
- mentioned
- labels
- sort
- direction
- since

有关更多信息，请参阅 https://docs.github.com/en/rest/issues/issues?apiVersion=2022-11-28#list-repository-issues。

In [None]:
docs = loader.load()

In [None]:
print(docs[0].page_content)
print(docs[0].metadata)

## 只加载问题

默认情况下，GitHub API 会将拉取请求也视为问题。要仅获取“纯粹”的问题（即没有拉取请求），请使用 `include_prs=False`。

In [None]:
loader = GitHubIssuesLoader(
    repo="langchain-ai/langchain",
    access_token=ACCESS_TOKEN,  # delete/comment out this argument if you've set the access token as an env var.
    creator="UmerHA",
    include_prs=False,
)
docs = loader.load()

In [None]:
print(docs[0].page_content)
print(docs[0].metadata)

## 加载 Github 文件内容

对于下面的代码，它会加载 `langchain-ai/langchain`  仓库中的所有 markdown 文件。

In [1]:
from langchain_community.document_loaders import GithubFileLoader

In [None]:
loader = GithubFileLoader(
    repo="langchain-ai/langchain",  # the repo name
    branch="master",  # the branch name
    access_token=ACCESS_TOKEN,
    github_api_url="https://api.github.com",
    file_filter=lambda file_path: file_path.endswith(
        ".md"
    ),  # load all markdowns files.
)
documents = loader.load()

```json
document.metadata: 
    {
      "path": "README.md",
      "sha": "82f1c4ea88ecf8d2dfsfx06a700e84be4",
      "source": "https://github.com/langchain-ai/langchain/blob/master/README.md"
    }
document.content:
    模拟内容
```