# 哦，天哪！

如果你到了这里，说明你在设置环境时仍然遇到问题。非常抱歉！请坚持住，我们很快就能帮你搞定。

设置数据科学环境可能具有挑战性，因为底层有很多东西在运行。但我们会成功的。

请记住——我随时准备提供帮助。这个笔记本的最后一个单元格有一些诊断信息，可以帮助我找出问题所在。

# 开始之前

## 检查你的网络连接

首先，让我们检查一下是否存在 VPN、防火墙或证书问题。

点击下面的单元格并按 Shift+Return（Shift+回车）运行它。


In [None]:
import urllib.request

try:
    response = urllib.request.urlopen("https://www.google.com", timeout=10)
    if response.status != 200:
        print("无法访问谷歌 - 您的互联网/VPN/防火墙可能有问题？")
    else:
        print("已连接到互联网并且可以访问谷歌")
except Exception as e:
    print(f"连接失败，错误信息：{e}")

## 再次提及 PC 用户偶尔会遇到的“陷阱”

Windows 上有 4 个需要注意的意外问题：
1. 权限。
2. 杀毒软件、防火墙、VPN。这些可能会干扰安装和网络访问；必要时尝试暂时禁用它们
3. 烦人的 Windows 260 字符文件名长度限制 
4. 如果你以前没有在你的电脑上使用过数据科学包，你可能需要安装 Microsoft Build Tools。

## 对于 Mac 用户

1. 如果你是 Mac 开发新手，你可能需要安装 XCode 开发者工具。
2. 与 PC 用户一样，杀毒软件、防火墙、VPN 也可能存在问题。这些可能会干扰安装和网络访问；必要时尝试暂时禁用它们

# 步骤 1

尝试运行下一个单元格（点击此单元格下方的单元格并按 Shift+Return）。

如果出现错误，那么你很可能没有在“已激活”的环境中运行。请查看 SETUP 指南的第 5 部分，了解 [PC](../SETUP-PC.md) 或 [Mac](../SETUP-mac.md) 如何设置 Anaconda（或 virtualenv）环境并激活它，然后再运行 `jupyter lab`。

如果你查看 Anaconda prompt (PC) 或 Terminal (Mac)，你应该在你启动 `jupyter lab` 的提示符中看到 `(llms)` —— 这是 llms 环境已激活的标志。

如果你处于已激活的环境中，接下来要尝试的是重启所有内容：
1. 关闭所有 Jupyter 窗口，如此窗口
2. 退出所有命令提示符 / 终端 / Anaconda
3. 重复 SETUP 说明中的第 5 部分，以启动一个新的已激活环境，并从 `llm_engineering` 目录启动 `jupyter lab`
4. 回到这个笔记本，然后执行 Kernel 菜单 >> Restart Kernel and Clear Outputs of All Cells (内核菜单 >> 重启内核并清除所有单元格的输出)
5. 再次尝试下面的单元格。

如果**那样**还不行，请联系我！我会尽快回复，我们会解决它。请运行诊断程序（此笔记本中的最后一个单元格），以便我进行调试。如果你使用的是 Anaconda，可能是因为某些原因你的环境已损坏，这种情况下最简单的修复方法是改用 virtualenv 方法（设置指南中的第 2B 部分）。

In [None]:
# 一些快速检查，确保您的 Conda 环境或 VirtualEnv 符合预期
# 环境名称应为：llms

import os
conda_name, venv_name = "", ""

conda_prefix = os.environ.get('CONDA_PREFIX')
if conda_prefix:
    print("Anaconda 环境已激活：")
    print(f"环境路径：{conda_prefix}")
    conda_name = os.path.basename(conda_prefix)
    print(f"环境名称：{conda_name}")

virtual_env = os.environ.get('VIRTUAL_ENV')
if virtual_env:
    print("Virtualenv 已激活：")
    print(f"环境路径：{virtual_env}")
    venv_name = os.path.basename(virtual_env)
    print(f"环境名称：{venv_name}")

if conda_name != "llms" and venv_name != "llms" and venv_name != "venv":
    print("Anaconda 和 Virtualenv 似乎都没有以预期的名称 'llms' 或 'venv' 激活")
    print("您是否从命令行显示 (llms) 的已激活环境中运行 'jupyter lab'？")
    print("如有疑问，请关闭所有 jupyter lab，并遵循 SETUP-PC 或 SETUP-mac 指南中的第 5 部分。")

# 步骤 1.1

## 是时候检查环境是否良好以及依赖项是否已安装了

现在，下一个单元格应该可以运行且没有任何输出——没有导入错误。

导入错误可能表示您在未激活环境的情况下启动了 jupyter lab？请参阅 SETUP 第 5 部分。

或者您可能需要重启您的内核和 Jupyter Lab。

或者可能是 Anaconda 出了问题。
如果是这样，这里有一些恢复说明：
首先，关闭所有程序并重启您的计算机。
然后在 Anaconda Prompt (PC) 或 Terminal (Mac) 中，从一个已激活的环境（提示符中显示 **(llms)**），在 `llm_engineering` 目录下运行以下命令：
`python -m pip install --upgrade pip`
`pip install --retries 5 --timeout 15 --no-cache-dir --force-reinstall -r requirements.txt`
仔细观察是否有任何错误，并告诉我。
如果您看到安装 Microsoft Build Tools 或 Apple XCode tools 的说明，请按照说明操作。
然后再试一次！

最后，如果这不起作用，请尝试 SETUP 第 2B 部分，这是第 2 部分的替代方案（使用 Python 3.11 或 Python 3.12）。

如果您不确定，请运行诊断程序（此笔记本中的最后一个单元格），然后通过 ed@edwarddonner.com 给我发邮件。

In [None]:
# 如果您的环境已激活且依赖项已安装，则此导入应该可以正常工作！

from openai import OpenAI

# 步骤 2

让我们检查你的 .env 文件是否存在并且其中是否正确设置了 OpenAI 密钥。
请运行此代码并检查它是否打印成功消息，否则请按照其说明进行操作。

如果不成功，则它无法在 `llm_engineering` 文件夹中找到名为 `.env` 的文件。
文件名必须确切地是 `.env` —— 如果它被称为 `my-keys.env` 或 `.env.doc`，则无法工作。
`.env` 是否实际上名为 `.env.txt`？在 Windows 中，你可能需要在文件资源管理器中更改设置以确保显示文件扩展名（将“显示文件扩展名”设置为“开”）。如果你在 `llm_engineering` 目录中键入 `dir`，也应该能看到文件扩展名。

需要注意的讨厌陷阱：
- 在 .env 文件中，等号和密钥之间不应有空格。例如：`OPENAI_API_KEY=sk-proj-...`
- 如果你从其他应用程序复制粘贴了 API 密钥，请确保它没有将密钥中的连字符替换为长破折号。

请注意，`.env` 文件不会显示在你的 Jupyter Lab 文件浏览器中，因为 Jupyter 为了安全起见会隐藏以点开头的文件；它们被认为是隐藏文件。如果你需要更改名称，你需要使用命令终端或文件资源管理器 (PC) /访达窗口 (Mac)。如果遇到问题，可以问 ChatGPT，或者给我发邮件！

如果你在创建 `.env` 文件时遇到困难，我们也可以用代码来创建它！请参见下一个单元格之后的单元格。

从项目根目录 `llm_engineering` 启动 `jupyter lab` 非常重要。如果你没有这样做，这个单元格可能会给你带来问题。

In [None]:
from pathlib import Path

parent_dir = Path("..")
env_path = parent_dir / ".env"

if env_path.exists() and env_path.is_file():
    print(".env 文件已找到。")

    # 读取 .env 文件的内容
    with env_path.open("r") as env_file:
        contents = env_file.readlines()

    key_exists = any(line.startswith("OPENAI_API_KEY=") for line in contents)
    good_key = any(line.startswith("OPENAI_API_KEY=sk-proj-") for line in contents)
    classic_problem = any("OPEN_" in line for line in contents)
    
    if key_exists and good_key:
        print("成功！找到 OPENAI_API_KEY 并且它具有正确的前缀")
    elif key_exists:
        print("找到了一个 OPENAI_API_KEY，但它没有预期的前缀 sk-proj- \n请仔细检查文件中的密钥..")
    elif classic_problem:
        print("没有找到 OPENAI_API_KEY，但我注意到出现了 'OPEN_' - 你是不是有拼写错误，比如 OPEN_API_KEY 而不是 OPENAI_API_KEY？")
    else:
        print("在 .env 文件中没有找到 OPENAI_API_KEY")
else:
    print(".env 文件未在 llm_engineering 目录中找到。它的名称必须确切为：.env")
    
    possible_misnamed_files = list(parent_dir.glob("*.env*"))
    
    if possible_misnamed_files:
        print("\n警告：未找到 '.env' 文件，但在 llm_engineering 目录中找到了以下名称中包含 '.env' 的文件。也许这个文件需要重命名？")
        for file in possible_misnamed_files:
            print(file.name)

## 备用方案 - 用 python 代码为你创建 .env 文件

只有在创建 .env 文件遇到问题时才运行下一个单元格。
用你从 OpenAI 获取的密钥替换代码第一行中的文本。

In [None]:
# 只有当您想让代码为您创建一个 .env 文件时，才运行此单元格中的代码！

# 将您的密钥放在引号内
make_me_a_file_with_this_key = "把你的密钥放在这里的引号内..它应该以 sk-proj- 开头"

# 如果您已经有一个 .env 文件并且希望我替换它，请将此更改为 True
overwrite_if_already_exists = False 

from pathlib import Path

parent_dir = Path("..")
env_path = parent_dir / ".env"

if env_path.exists() and not overwrite_if_already_exists:
    print("已经存在一个 .env 文件 - 如果您想让我创建一个新的，请将上面的变量 overwrite_if_already_exists 更改为 True")
else:
    try:
        with env_path.open(mode='w', encoding='utf-8') as env_file:
            env_file.write(f"OPENAI_API_KEY={make_me_a_file_with_this_key}")
        print(f"成功在 {env_path} 创建了 .env 文件")
        if not make_me_a_file_with_this_key.startswith("sk-proj-"):
            print(f"您提供的密钥以 '{make_me_a_file_with_this_key[:8]}' 开头，这与 sk-proj- 不同，这是您期望的吗？")
        print("现在重新运行上一个单元格以确认文件已创建且密钥正确。")
    except Exception as e:
        print(f"创建 .env 文件时发生错误：{e}")

# 步骤 3

现在让我们检查您的 API 密钥是否在 `.env` 文件中正确设置，并且可以通过 dotenv 包使用。
尝试运行下一个单元格。

In [None]:
# 这应该会将您的 API 密钥打印到输出中 - 请遵循打印出的说明

import os
from dotenv import load_dotenv
load_dotenv(override=True)

api_key = os.getenv("OPENAI_API_KEY")

if not api_key:
    print("未找到 API 密钥 - 请尝试 Kernel 菜单 >> Restart Kernel And Clear Outputs of All Cells (重启内核并清除所有单元格的输出)")
elif not api_key.startswith("sk-proj-"):
    print(f"找到了一个 API 密钥，但它以 {api_key[:8]} 开头，而不是 sk-proj-，请仔细检查这是否符合预期。")
elif api_key.strip() != api_key:
    print("找到了一个 API 密钥，但它看起来可能在开头或结尾有空格或制表符 - 请移除它们")
else:
    print("API 密钥已找到，目前看起来不错！")

if api_key:
    problematic_unicode_chars = ['\u2013', '\u2014', '\u201c', '\u201d', '\u2026', '\u2018', '\u2019']
    forbidden_chars = ["'", " ", "\n", "\r", '"']
    
    if not all(32 <= ord(char) <= 126 for char in api_key):
        print("潜在问题：密钥中可能意外包含不可打印字符？")
    elif any(char in api_key for char in problematic_unicode_chars):
        print("潜在问题：密钥中可能存在特殊字符，如长连字符或弯引号 - 您是通过文字处理器复制的吗？")
    elif any(char in api_key for char in forbidden_chars):
        print("潜在问题：您的密钥中是否包含引号、空格或空行？")
    else:
        print("API 密钥包含有效字符")
    
print(f"\n这是密钥 --> {api_key} <--")
print()
print("如果此密钥看起来没问题，请转到 编辑 菜单 >> 清除单元格输出，这样您的密钥就不会再显示在这里了！")

## 它应该打印一些检查信息，包括类似下面的内容：

`这是密钥 --> sk-proj-blahblahblah <--`

如果它没有打印出密钥，那么希望它已经提供了足够的信息让你解决这个问题。或者联系我！

如果你愿意，还有一个最后的备用方法：你可以完全避免使用 .env 文件，而总是手动提供你的 API 密钥。
无论何时你在代码中看到这个：
`openai = OpenAI()`
你可以用这个替换它：
`openai = OpenAI(api_key="sk-proj-xxx")`

# 步骤 4

现在运行下面的代码，你将有望看到 GPT 可以处理基本的算术！！

如果不行，请看下面的单元格。

In [None]:
from openai import OpenAI
from dotenv import load_dotenv
load_dotenv(override=True)

my_api_key = os.getenv("OPENAI_API_KEY")

print(f"正在使用 API 密钥 --> {my_api_key} <--")

openai = OpenAI()
completion = openai.chat.completions.create(
    model='gpt-4o-mini',
    messages=[{"role":"user", "content": "2+2等于几?"}],
)
print(completion.choices[0].message.content)
print("现在请转到 编辑 菜单 >> 清除单元格输出，以移除密钥的显示。")

## 如果密钥设置正确，但仍然无法工作

### 如果 OpenAI 返回关于你的密钥的错误，或者出现速率限制错误，那么你的 API 密钥有问题！

首先检查[此网页](https://platform.openai.com/settings/organization/billing/overview)以确保你有正的信用余额。
OpenAI 要求你拥有正的信用余额，并且有最低限额，通常约为当地货币 5 美元。我对 OpenAI 的推销是，这对于你的学习来说非常值得：用不到一张音乐专辑的价格，你就能积累宝贵的商业经验。但这并非本课程所必需；README 中有说明，当我们使用 OpenAI 时，可以通过 Ollama 调用免费的开源模型。

OpenAI 账单页面（含信用余额）在此：
https://platform.openai.com/settings/organization/billing/overview
在你充值余额后，OpenAI 可能需要几分钟才能启用你的密钥。
一位美国境外的学生提到，他需要允许他的信用卡进行国际支付才能成功。

虽然不太可能，但如果你的密钥有问题，你也可以尝试在这里创建一个新密钥（右上角按钮）：
https://platform.openai.com/api-keys

### 检查你是否可以从 OpenAI playground 使用 gpt-4o-mini

为了确认账单设置正确且你的密钥有效，你可以尝试直接使用 gpt-4o-mini：
https://platform.openai.com/playground/chat?models=gpt-4o-mini

### 如果出现与证书相关的错误

如果你遇到类似以下的证书错误：
`ConnectError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1000)`
那么请将：
`openai = OpenAI()`
替换为：
`import httpx`
`openai = OpenAI(http_client=httpx.Client(verify=False))`
并且也请将：
`requests.get(url, headers=headers)`
替换为：
`requests.get(url, headers=headers, verify=False)`
如果这样可行，那你就没问题了。你只需要在每次遇到此证书错误时，以同样的方式更改实验代码即可。
这种方法不适用于生产代码，但对于我们的实验来说是可以的。你可能需要联系 IT 支持以了解你的环境中是否存在限制。

## 如果所有方法都失败了：

(1) 尝试将你的错误粘贴到 ChatGPT 或 Claude！它们解决问题的能力常常令人惊叹

(2) 尝试创建另一个密钥，在 .env 文件中替换它，然后重新运行！

(3) 联系我！请运行下面单元格中的诊断程序，然后将你的问题通过电子邮件发送给我：ed@edwarddonner.com

非常感谢，很抱歉这给你带来了麻烦！

# 收集必要的诊断信息

## 请运行下一个单元格以收集一些重要数据

请运行下一个单元格；它大约需要一分钟左右的时间来运行。大部分时间用于检查您的网络带宽。
然后将最后一个单元格的输出通过电子邮件发送给我 ed@edwarddonner.com。
或者：这将创建一个名为 report.txt 的文件 - 只需将该文件附加到您的电子邮件中即可。

In [None]:
# 运行我的诊断报告以收集用于调试的关键信息
# 请将结果通过电子邮件发送给我。可以复制并粘贴输出，或附加 report.txt 文件

!pip install -q requests speedtest-cli psutil setuptools
from diagnostics import Diagnostics
Diagnostics().run()