In [1]:
import requests
import json


In [2]:
# 导入我们需要的工具库
import requests
import json # json库用来更漂亮地打印我们获取的数据

# 定义我们要访问的API地址 (从你给的API文档里找到的)
api_url = "https://alwaysberunning.net/api/tournaments"

print(f"正在尝试从以下地址获取数据: {api_url}")

# 使用requests库的get方法来发送一个“请给我数据”的请求
response = requests.get(api_url)

# 检查请求是否成功。状态码200代表“成功”！
if response.status_code == 200:
    print("成功！服务器已响应。")
    
    # response.json() 会自动将服务器返回的JSON格式文本转换成Python的数据结构（通常是列表或字典）
    data = response.json()
    
    print(f"我们成功获取了 {len(data)} 场锦标赛的数据。")
    
    # 让我们来看一下列表中的第一场锦标赛是什么样子的
    first_tournament = data[0]
    
    print("\n这是第一场锦标赛的数据结构：")
    # 使用json.dumps可以让字典打印得更整齐
    print(json.dumps(first_tournament, indent=2))
    
else:
    print(f"请求失败，状态码: {response.status_code}")
    print("请检查你的网络连接或API地址是否正确。")

正在尝试从以下地址获取数据: https://alwaysberunning.net/api/tournaments
成功！服务器已响应。
我们成功获取了 4419 场锦标赛的数据。

这是第一场锦标赛的数据结构：
{
  "id": 2049,
  "title": "RetroRunner Meetup",
  "creator_id": 14616,
  "creator_name": "zengoshugoju",
  "creator_supporter": 0,
  "creator_class": "",
  "created_at": "2019.03.18. 13:35:24",
  "location": "Canada, Powell River",
  "location_lat": 49.843557,
  "location_lng": -124.528569,
  "location_country": "Canada",
  "location_state": "",
  "address": "4712 Marine Ave, Powell River, BC V8A 2L4, Canada",
  "store": "High Tide Games",
  "place_id": "ChIJXcNB-c7mh1QRrd1Dn8YwAfA",
  "contact": "",
  "approved": 1,
  "registration_count": 1,
  "photos": 0,
  "url": "https://alwaysberunning.net/tournaments/2049/retrorunner-meetup",
  "link_facebook": "https://www.facebook.com/events/424211991471698/?event_time_id=424211998138364&active_tab=discussion",
  "recurring_day": "Saturday"
}


In [3]:
# data是什么类型的？ (应该会输出 <class 'list'>)
print(type(data))

# 列表里第一个元素是什么类型的？ (应该会输出 <class 'dict'>)
first_tournament = data[0]
print(type(first_tournament))

# 这个字典里有哪些信息？(会输出 'id', 'title', 'date' 等)
print(first_tournament.keys())

# 我想看第一场比赛的标题，怎么获取？
print(first_tournament['title'])

<class 'list'>
<class 'dict'>
dict_keys(['id', 'title', 'creator_id', 'creator_name', 'creator_supporter', 'creator_class', 'created_at', 'location', 'location_lat', 'location_lng', 'location_country', 'location_state', 'address', 'store', 'place_id', 'contact', 'approved', 'registration_count', 'photos', 'url', 'link_facebook', 'recurring_day'])
RetroRunner Meetup


In [5]:
api_url1 = "https://alwaysberunning.net/api/tournaments/5051/pawnshop-2-oops-i-left-my-eternal-in-the-wash"
print(f"正在尝试从以下地址获取数据: {api_url1}")

# 使用requests库的get方法来发送一个“请给我数据”的请求
response = requests.get(api_url1)

# 检查请求是否成功。状态码200代表“成功”！
if response.status_code == 200:
    print("成功！服务器已响应。")
    
    # response.json() 会自动将服务器返回的JSON格式文本转换成Python的数据结构（通常是列表或字典）
    data = response.json()
    
    # 让我们来看一下列表中的第一场锦标赛是什么样子的
    first_tournament = data[0]
    
    print("\n这是第一场锦标赛的数据结构：")
    # 使用json.dumps可以让字典打印得更整齐
    print(json.dumps(first_tournament, indent=2))
    
else:
    print(f"请求失败，状态码: {response.status_code}")
    print("请检查你的网络连接或API地址是否正确。")

In [8]:
# 导入我们需要的工具库
import requests
import json

# 明确定义我们要获取的目标锦标赛ID
target_id = "5051/pawnshop-2-oops-i-left-my-eternal-in-the-wash"

# --- 第一步：构建URL并请求数据 ---

# 使用f-string（一种方便的字符串格式化方法）来构建精确的API地址
api_url = f"https://alwaysberunning.net/api/tournaments/{target_id}"

print(f"准备就绪！正在从以下地址获取锦标赛数据:\n{api_url}\n")

# 发送GET请求
try:
    response = requests.get(api_url)
    
    # 检查请求是否成功 (HTTP状态码 200 代表成功)
    # response.raise_for_status() 是一个很好的习惯，如果请求失败（如404, 500），它会自动报错
    response.raise_for_status() 

    print("✅ 数据获取成功！服务器已正确响应。\n")

    # --- 第二步：解析JSON数据并提取核心信息 ---

    # 将服务器返回的JSON文本解析为Python字典
    tournament_data = response.json()

    # 从这份详细数据中，我们最关心的就是 'decklists'
    # 先检查一下是否存在'decklists'这个键，并且它不是空的
    if 'decklists' in tournament_data and tournament_data['decklists']:
        
        print(f"🎉 成功找到 {len(tournament_data['decklists'])} 份牌表！现在开始逐一解析：\n" + "="*40)
        
        # 'decklists' 是一个列表，列表中的每个元素都是一个字典，代表一份牌表
        all_decklists = tournament_data['decklists']
        
        # --- 第三步：遍历牌表并展示我们想要的信息 ---
        
        # 使用 for 循环来遍历列表中的每一份牌表
        for i, decklist in enumerate(all_decklists):
            
            # 从每个牌表字典中提取我们需要的信息
            player_name = decklist.get('username', '未知玩家') # .get()方法更安全，如果键不存在会返回默认值
            corp_deck_url = decklist.get('corp_deck_netrunnerdb_url') # 获取公司方卡组链接
            runner_deck_url = decklist.get('runner_deck_netrunnerdb_url') # 获取潜袭者方卡组链接
            
            # 打印格式化的输出，让结果一目了然
            print(f"牌表 #{i+1}:")
            print(f"  👤 玩家: {player_name}")
            
            if corp_deck_url:
                print(f"  🏢 公司方卡组链接: {corp_deck_url}")
            else:
                print("  🏢 公司方卡组链接: 未提供")
                
            if runner_deck_url:
                print(f"  🏃 潜袭者方卡组链接: {runner_deck_url}")
            else:
                print("  🏃 潜袭者方卡组链接: 未提供")
            
            print("-"*20) # 打印分割线

    else:
        print("❌ 在返回的数据中没有找到'decklists'部分，或者该部分为空。")

except requests.exceptions.HTTPError as err:
    print(f"❌ HTTP请求错误: {err}")
    print("这通常意味着该ID不存在（404错误），或者服务器端出现了问题。")
except requests.exceptions.RequestException as err:
    print(f"❌ 网络或其他请求错误: {err}")
    print("请检查你的网络连接。")

准备就绪！正在从以下地址获取锦标赛数据:
https://alwaysberunning.net/api/tournaments/5051/pawnshop-2-oops-i-left-my-eternal-in-the-wash

❌ HTTP请求错误: 404 Client Error: Not Found for url: https://alwaysberunning.net/api/tournaments/5051/pawnshop-2-oops-i-left-my-eternal-in-the-wash
这通常意味着该ID不存在（404错误），或者服务器端出现了问题。


In [9]:
# 导入我们需要的工具库
import requests
import json # json库用来更漂亮地打印我们获取的数据

# 定义我们要访问的API地址 (从你给的API文档里找到的)
api_url = "https://alwaysberunning.net/api/entries?id=533"

print(f"正在尝试从以下地址获取数据: {api_url}")

# 使用requests库的get方法来发送一个“请给我数据”的请求
response = requests.get(api_url)

# 检查请求是否成功。状态码200代表“成功”！
if response.status_code == 200:
    print("成功！服务器已响应。")
    
    # response.json() 会自动将服务器返回的JSON格式文本转换成Python的数据结构（通常是列表或字典）
    data = response.json()

    print(data)
   
    
else:
    print(f"请求失败，状态码: {response.status_code}")
    print("请检查你的网络连接或API地址是否正确。")

正在尝试从以下地址获取数据: https://alwaysberunning.net/api/entries?id=533
成功！服务器已响应。
[{'user_id': 0, 'user_name': None, 'user_import_name': 'Chris Dyer', 'rank_swiss': 1, 'rank_top': 3, 'runner_deck_title': 'Whizzard: Master Gamer', 'runner_deck_identity_id': '02001', 'runner_deck_url': '', 'corp_deck_title': 'Haas-Bioroid: Engineering the Future', 'corp_deck_identity_id': '01054', 'corp_deck_url': '', 'runner_deck_identity_title': 'Whizzard: Master Gamer', 'runner_deck_identity_faction': 'anarch', 'corp_deck_identity_title': 'Haas-Bioroid: Engineering the Future', 'corp_deck_identity_faction': 'haas-bioroid'}, {'user_id': 13024, 'user_name': 'Cacoethesvictor', 'user_import_name': 'Mark Mottram', 'rank_swiss': 2, 'rank_top': 2, 'runner_deck_title': 'Whizzard', 'runner_deck_identity_id': '02001', 'runner_deck_url': '', 'corp_deck_title': 'New Angeles Sol', 'corp_deck_identity_id': '09002', 'corp_deck_url': '', 'runner_deck_identity_title': 'Whizzard: Master Gamer', 'runner_deck_identity_faction': '

In [10]:
api_url = "https://alwaysberunning.net/api/tournaments?format=standard&concluded=1&start=2025.05.01&end=2025.08.30"

print(f"正在尝试从以下地址获取数据: {api_url}")

# 使用requests库的get方法来发送一个“请给我数据”的请求
response = requests.get(api_url)

# 检查请求是否成功。状态码200代表“成功”
if response.status_code == 200:
    print("成功！服务器已响应。")
    
    # response.json() 会自动将服务器返回的JSON格式文本转换成Python的数据结构（通常是列表或字典）
    data = response.json()
    
    print(f"我们成功获取了 {len(data)} 场锦标赛的数据。")

    # 锦标赛数量
    num_of_tounament=len(data)
    
    # 让我们来看一下列表中的第一场锦标赛是什么样子的
    first_tournament = data[0]
    
    print("\n这是第一场锦标赛的数据结构：")
    # 使用json.dumps可以让字典打印得更整齐
    print(json.dumps(first_tournament, indent=2))
    
else:
    print(f"请求失败，状态码: {response.status_code}")
    print("请检查你的网络连接或API地址是否正确。")

正在尝试从以下地址获取数据: https://alwaysberunning.net/api/tournaments?format=standard&concluded=1&start=2025.05.01&end=2025.08.30
成功！服务器已响应。
我们成功获取了 132 场锦标赛的数据。

这是第一场锦标赛的数据结构：
{
  "id": 5020,
  "title": "CTK (Standard) 2025H1 @ Redraft, Katowice",
  "creator_id": 7009,
  "creator_name": "zombiak",
  "creator_supporter": 0,
  "creator_class": "",
  "created_at": "2025.07.16. 16:40:41",
  "location": "Poland, Katowice",
  "location_lat": 50.257129,
  "location_lng": 19.012159,
  "location_country": "Poland",
  "location_state": "",
  "address": "Kamienna 7/2, 40-067 Katowice, Poland",
  "store": "Redraft",
  "place_id": "ChIJZWZMVwDPFkcRPiADxKCPQvs",
  "contact": "dvoraque@gmail.com",
  "approved": 1,
  "registration_count": 8,
  "photos": 0,
  "url": "https://alwaysberunning.net/tournaments/5020/ctk-standard-2025h1-redraft-katowice",
  "link_facebook": "https://www.facebook.com/groups/1507181989567601",
  "cardpool": "Elevation",
  "date": "2025.08.23.",
  "type": "casual tournament kit",
  "for

In [11]:
import requests
import json

# --- 第一步：获取数据并存入 tournaments_list ---

api_url = "https://alwaysberunning.net/api/tournaments?format=standard&concluded=1&start=2025.05.01&end=2025.08.30"

print(f"正在尝试从以下地址获取数据: {api_url}")

# 使用requests库的get方法来发送一个“请给我数据”的请求
response = requests.get(api_url)

# 检查请求是否成功。状态码200代表“成功”
if response.status_code == 200:
    print("成功！服务器已响应。")
    
    # 魔法就在这一行！
    # response.json() 返回了一个包含所有锦标赛信息的列表
    # 我们用'='把它赋值给一个我们自己命名的变量，这里就叫 tournaments_list
    tournaments_list = response.json()
    
    print(f"我们成功获取了 {len(tournaments_list)} 场锦标赛的数据，并已将其存储在 'tournaments_list' 变量中。")

    # --- 第二步：验证一下列表里的内容 (可选) ---

    # 检查一下列表是否为空
    if tournaments_list:
        # 让我们来看一下列表中的第一场锦标赛是什么样子的
        first_tournament = tournaments_list[0]
        
        print("\n这是 'tournaments_list' 中第一场锦標賽的数据结构：")
        print(json.dumps(first_tournament, indent=2))
        
else:
    print(f"请求失败，状态码: {response.status_code}")
    print("请检查你的网络连接或API地址是否正确。")

正在尝试从以下地址获取数据: https://alwaysberunning.net/api/tournaments?format=standard&concluded=1&start=2025.05.01&end=2025.08.30
成功！服务器已响应。
我们成功获取了 132 场锦标赛的数据，并已将其存储在 'tournaments_list' 变量中。

这是 'tournaments_list' 中第一场锦標賽的数据结构：
{
  "id": 5020,
  "title": "CTK (Standard) 2025H1 @ Redraft, Katowice",
  "creator_id": 7009,
  "creator_name": "zombiak",
  "creator_supporter": 0,
  "creator_class": "",
  "created_at": "2025.07.16. 16:40:41",
  "location": "Poland, Katowice",
  "location_lat": 50.257129,
  "location_lng": 19.012159,
  "location_country": "Poland",
  "location_state": "",
  "address": "Kamienna 7/2, 40-067 Katowice, Poland",
  "store": "Redraft",
  "place_id": "ChIJZWZMVwDPFkcRPiADxKCPQvs",
  "contact": "dvoraque@gmail.com",
  "approved": 1,
  "registration_count": 8,
  "photos": 0,
  "url": "https://alwaysberunning.net/tournaments/5020/ctk-standard-2025h1-redraft-katowice",
  "link_facebook": "https://www.facebook.com/groups/1507181989567601",
  "cardpool": "Elevation",
  "date": "202

In [12]:
# 假设 tournaments_list 是你上一步获取到的包含132个锦标赛字典的列表
# tournaments_list = response.json() 

# --- 数据筛选步骤 ---

# 1. 创建一个空列表，用来存放符合我们条件的锦标赛ID
filtered_ids = []

print(f"开始从 {len(tournaments_list)} 场锦标赛中进行筛选...")
print("筛选条件: claim_count > 3 AND claim_conflict is False\n")

# 2. 遍历你获取到的每一场锦标赛数据
for tournament in tournaments_list:
    
    # 3. 检查每一个锦标赛字典是否同时满足两个条件
    # 使用 .get() 方法来安全地获取值，如果键不存在，则返回一个不会导致错误的值
    # 例如，如果'claim_count'不存在，我们给它一个默认值0
    claim_count = tournament.get('claim_count', 0)
    claim_conflict = tournament.get('claim_conflict', True) # 如果'claim_conflict'不存在，默认它是有问题的

    # 这就是筛选的核心逻辑！
    if claim_count > 3 and claim_conflict == False:
        # 4. 如果条件满足，就把这场锦标赛的'id'添加到我们的列表中
        filtered_ids.append(tournament['id'])
        # 我们可以顺便打印出符合条件的比赛信息，方便检查
        print(f"✅ 符合条件: ID={tournament['id']}, Title='{tournament['title']}', claim_count={claim_count}")

# 5. 循环结束后，打印出所有符合条件的ID
print("\n" + "="*50)
print("🎉 筛选完成！")

if filtered_ids:
    print(f"总共有 {len(filtered_ids)} 场锦标赛符合条件。")
    print("它们的ID分别是:")
    print(filtered_ids)
else:
    print("没有找到符合条件的锦标赛。")

开始从 132 场锦标赛中进行筛选...
筛选条件: claim_count > 3 AND claim_conflict is False

✅ 符合条件: ID=5022, Title='Leuven Summer CO', claim_count=4
✅ 符合条件: ID=4858, Title='2025 Americas Continental Championship - Montréal', claim_count=28
✅ 符合条件: ID=5002, Title='2025 Asia-Pacific Continental Championship', claim_count=14
✅ 符合条件: ID=4832, Title='2025 APAC Continental Championship - Sydney', claim_count=18
✅ 符合条件: ID=4906, Title='TORONTO MEGACITY 2025', claim_count=6
✅ 符合条件: ID=5024, Title='Standard CTK @ Enchanted Grounds (Bowles)', claim_count=5
✅ 符合条件: ID=4800, Title='Cascadia 2025 - NA Netrunner Players Circuit', claim_count=10
✅ 符合条件: ID=4829, Title='EMEA Continentals 2025 @Cologne [Sponsored by NSG]', claim_count=46
✅ 符合条件: ID=4958, Title='Card Game Paradise H1 Casual tournament', claim_count=7
✅ 符合条件: ID=5027, Title='Berlin Megacity 2025 - EMEA Warmup Pod SBL25.08', claim_count=4
✅ 符合条件: ID=5018, Title='Card Game Paradise China Megacity', claim_count=14
✅ 符合条件: ID=4828, Title='Berlin Megacity Champi

In [13]:
import time # 导入time库，用于控制请求频率

# 假设 filtered_ids 是你上一步筛选后得到的锦标赛ID列表
# 例如: filtered_ids = [5012, 5009, 4989, ...]

# 1. 创建一个空列表，用来存放我们最终想要的所有URL信息
all_deck_urls = []
all_corp_deck_urls = []
all_runner_deck_urls = []

print(f"准备开始从 {len(filtered_ids)} 场筛选后的锦标赛中获取牌表链接...\n")

# 2. 遍历每一个筛选出来的锦标赛ID
for tournament_id in filtered_ids:
    
    # 构建针对单个锦標賽的API URL
    url = f"https://alwaysberunning.net/api/entries?id={tournament_id}"
    
    print(f"正在请求锦标赛 ID: {tournament_id} ...")
    
    try:
        response = requests.get(url)
        response.raise_for_status() # 检查请求是否成功
        
        tournament_data = response.json()
        
        # 3. 检查并提取 'decklists'
        if 'decklists' in tournament_data and tournament_data['decklists']:
            
            # 遍历这场比赛中的每一份牌表
            for decklist in tournament_data['decklists']:
                
                # 4. 提取 corp 和 runner 的牌表链接
                corp_url = decklist.get('corp_deck_url')
                runner_url = decklist.get('runner_deck_url')
                
                # 5. 将提取到的信息以字典的形式，存入我们的总列表中
                # 这样做更结构化，方便后续处理
                if corp_url or runner_url: # 只有在至少有一个URL存在时才添加
                    all_deck_urls.append({
                        'tournament_id': tournament_id,
                        'player': decklist.get('username', 'N/A'),
                        'corp_deck_url': corp_url,
                        'runner_deck_url': runner_url
                    })
            
            print(f"  -> 成功处理了 {len(tournament_data['decklists'])} 份牌表。")
            
        else:
            print(f"  -> 警告: 锦标赛 {tournament_id} 中没有找到 'decklists'。")

    except requests.exceptions.RequestException as e:
        print(f"  -> 错误: 请求锦标赛 {tournament_id} 失败: {e}")

    # 【重要】做一个有礼貌的API使用者！
    # 在每次请求之间暂停一秒，避免因请求过于频繁而被服务器屏蔽。
    time.sleep(0.1)

# --- 循环结束后，查看我们的成果 ---
print("\n" + "="*50)
print("🎉 全部处理完成！")

if all_deck_urls:
    print(f"总共收集到了 {len(all_deck_urls)} 份包含URL的牌表信息。")
    print("\n前5条记录示例：")
    # 使用json.dumps可以把列表打印得更整齐
    print(json.dumps(all_deck_urls[:5], indent=2))
else:
    print("未能收集到任何牌表链接。")

准备开始从 55 场筛选后的锦标赛中获取牌表链接...

正在请求锦标赛 ID: 5022 ...
  -> 警告: 锦标赛 5022 中没有找到 'decklists'。
正在请求锦标赛 ID: 4858 ...
  -> 警告: 锦标赛 4858 中没有找到 'decklists'。
正在请求锦标赛 ID: 5002 ...
  -> 警告: 锦标赛 5002 中没有找到 'decklists'。
正在请求锦标赛 ID: 4832 ...
  -> 警告: 锦标赛 4832 中没有找到 'decklists'。
正在请求锦标赛 ID: 4906 ...
  -> 警告: 锦标赛 4906 中没有找到 'decklists'。
正在请求锦标赛 ID: 5024 ...
  -> 警告: 锦标赛 5024 中没有找到 'decklists'。
正在请求锦标赛 ID: 4800 ...
  -> 警告: 锦标赛 4800 中没有找到 'decklists'。
正在请求锦标赛 ID: 4829 ...
  -> 警告: 锦标赛 4829 中没有找到 'decklists'。
正在请求锦标赛 ID: 4958 ...
  -> 警告: 锦标赛 4958 中没有找到 'decklists'。
正在请求锦标赛 ID: 5027 ...
  -> 警告: 锦标赛 5027 中没有找到 'decklists'。
正在请求锦标赛 ID: 5018 ...
  -> 警告: 锦标赛 5018 中没有找到 'decklists'。
正在请求锦标赛 ID: 4828 ...
  -> 警告: 锦标赛 4828 中没有找到 'decklists'。
正在请求锦标赛 ID: 4976 ...
  -> 警告: 锦标赛 4976 中没有找到 'decklists'。
正在请求锦标赛 ID: 4715 ...
  -> 警告: 锦标赛 4715 中没有找到 'decklists'。
正在请求锦标赛 ID: 4745 ...
  -> 警告: 锦标赛 4745 中没有找到 'decklists'。
正在请求锦标赛 ID: 5001 ...
  -> 警告: 锦标赛 5001 中没有找到 'decklists'。
正在请求锦标赛 ID: 4843 ...
  -> 警告: 锦标赛 4843 中没有找

In [15]:
import requests
import json
import time

# 假设 filtered_ids 是你上一步筛选后得到的锦标赛ID列表
# 例如: filtered_ids = [5051, 5020, 4989] 

# 1. 创建两个空列表，分别存放公司和潜袭者的URL信息
all_corp_deck_urls = []
all_runner_deck_urls = []

print(f"准备开始从 {len(filtered_ids)} 场筛选后的锦标赛中获取牌表链接...\n")

# 2. 遍历每一个筛选出来的锦标赛ID
for tournament_id in filtered_ids:
    
    # 构建针对单个锦标赛的API URL和参数
    params = {'id': tournament_id}
    url = "https://alwaysberunning.net/api/entries"
    
    print(f"正在请求锦标赛 ID: {tournament_id} 的参赛列表...")
    
    try:
        response = requests.get(url, params=params)
        response.raise_for_status()
        
        # 3. response.json() 返回的是一个参赛者列表 (list of entries)
        # 我们直接把它命名为 entries_list
        entries_list = response.json()
        
        # 4. 检查这个参赛者列表是否为空
        if entries_list:
            print(f"  -> 成功获取了 {len(entries_list)} 条参赛记录。")
            
            # 5. 遍历这场比赛中的【每一条参赛记录】(每一个参赛者字典)
            for entry in entries_list:
                
                # 6. 从每个参赛者(entry)字典中提取URL
                corp_url = entry.get('corp_deck_url')
                runner_url = entry.get('runner_deck_url')
                player_name = entry.get('user_name', 'N/A')
                
                # 7. 如果公司URL存在，就把它存到公司列表中
                if corp_url:
                    all_corp_deck_urls.append({
                        'tournament_id': tournament_id,
                        'player': player_name,
                        'corp_deck_url': corp_url
                    })
                
                # 8. 如果潜袭者URL存在，就把它存到潜袭者列表中
                if runner_url:
                    all_runner_deck_urls.append({
                        'tournament_id': tournament_id,
                        'player': player_name,
                        'runner_deck_url': runner_url
                    })
        else:
            print(f"  -> 锦标赛 {tournament_id} 没有返回参赛记录。")

    except requests.exceptions.RequestException as e:
        print(f"  -> 错误: 请求锦标赛 {tournament_id} 失败: {e}")

    # 礼貌地暂停一秒
    time.sleep(1)

# --- 循环结束后，查看我们的成果 ---
print("\n" + "="*50)
print("🎉 全部处理完成！")

# 公司URL输出
if all_corp_deck_urls:
    print(f"\n总共收集到了 {len(all_corp_deck_urls)} 份公司牌表链接。")
    print("前5条记录示例：")
    print(json.dumps(all_corp_deck_urls[:5], indent=2))
else:
    print("\n未能收集到任何公司牌表链接。")

# 潜袭者URL输出
if all_runner_deck_urls:
    print(f"\n总共收集到了 {len(all_runner_deck_urls)} 份潜袭者牌表链接。")
    print("前5条记录示例：")
    print(json.dumps(all_runner_deck_urls[:5], indent=2))
else:
    print("\n未能收集到任何潜袭者牌表链接。")
    

准备开始从 55 场筛选后的锦标赛中获取牌表链接...

正在请求锦标赛 ID: 5022 的参赛列表...
  -> 成功获取了 10 条参赛记录。
正在请求锦标赛 ID: 4858 的参赛列表...
  -> 成功获取了 91 条参赛记录。
正在请求锦标赛 ID: 5002 的参赛列表...
  -> 成功获取了 45 条参赛记录。
正在请求锦标赛 ID: 4832 的参赛列表...
  -> 成功获取了 62 条参赛记录。
正在请求锦标赛 ID: 4906 的参赛列表...
  -> 成功获取了 19 条参赛记录。
正在请求锦标赛 ID: 5024 的参赛列表...
  -> 成功获取了 14 条参赛记录。
正在请求锦标赛 ID: 4800 的参赛列表...
  -> 成功获取了 50 条参赛记录。
正在请求锦标赛 ID: 4829 的参赛列表...
  -> 成功获取了 102 条参赛记录。
正在请求锦标赛 ID: 4958 的参赛列表...
  -> 成功获取了 20 条参赛记录。
正在请求锦标赛 ID: 5027 的参赛列表...
  -> 成功获取了 16 条参赛记录。
正在请求锦标赛 ID: 5018 的参赛列表...
  -> 成功获取了 38 条参赛记录。
正在请求锦标赛 ID: 4828 的参赛列表...
  -> 成功获取了 21 条参赛记录。
正在请求锦标赛 ID: 4976 的参赛列表...
  -> 成功获取了 12 条参赛记录。
正在请求锦标赛 ID: 4715 的参赛列表...
  -> 成功获取了 17 条参赛记录。
正在请求锦标赛 ID: 4745 的参赛列表...
  -> 成功获取了 20 条参赛记录。
正在请求锦标赛 ID: 5001 的参赛列表...
  -> 成功获取了 13 条参赛记录。
正在请求锦标赛 ID: 4843 的参赛列表...
  -> 成功获取了 36 条参赛记录。
正在请求锦标赛 ID: 4862 的参赛列表...
  -> 成功获取了 31 条参赛记录。
正在请求锦标赛 ID: 4863 的参赛列表...
  -> 成功获取了 30 条参赛记录。
正在请求锦标赛 ID: 4876 的参赛列表...
  -> 成功获取了 12 条参赛记录。
正在请求锦标赛 ID: 4881 的参赛列表...
  ->

In [17]:
# --- 第一步：定义目标 ---

# 我们想要获取的卡组ID
decklist_id = 91005

# 使用 f-string 构建完整的API URL
api_url = f"https://netrunnerdb.com/api/2.0/public/decklist/{decklist_id}"

print(f"准备请求NetrunnerDB API，目标地址：\n{api_url}\n")


# --- 第二步：发送请求并处理响应 ---

try:
    response = requests.get(api_url)
    response.raise_for_status() # 检查是否有HTTP错误 (如 404 Not Found)

    print("✅ 请求成功！服务器已返回数据。\n")

    # 将返回的JSON数据解析成Python字典
    decklist_data = response.json()

    # --- 第三步：打印并分析返回的数据结构 ---

    print("="*50)
    print("以下是API返回的完整数据结构：")
    # 使用 json.dumps 并设置 indent=2 可以让JSON数据格式化输出，非常易读
    print(json.dumps(decklist_data, indent=2))
    print("="*50)

    # --- 第四步：提取核心信息 ---

    # 根据API文档和上面的输出，我们发现数据包裹在 "data" 键的列表里
    if decklist_data.get('success') and decklist_data.get('data'):
        # 获取卡组信息字典，它在data列表的第一个位置
        deck_info = decklist_data['data'][0]
        
        # 我们最关心的就是 'cards' 这个键，它包含了所有的卡牌
        cards = deck_info.get('cards')
        deck_name = deck_info.get('name')

        print(f"\n成功解析卡组 '{deck_name}'！")
        
        if cards:
            print("\n卡组中的'cards'部分包含以下内容（键为卡牌ID，值为数量）:")
            # 'cards' 本身是一个字典，我们打印出来看看
            print(cards)
            
            # 计算卡组总张数
            total_cards = sum(cards.values())
            print(f"\n卡组总张数: {total_cards}")
            
        else:
            print("未能在此卡组信息中找到'cards'键。")
            
    else:
        print("API返回的数据格式不符合预期，或者请求未成功。")

except requests.exceptions.RequestException as e:
    print(f"❌ 请求失败: {e}")

准备请求NetrunnerDB API，目标地址：
https://netrunnerdb.com/api/2.0/public/decklist/91005

✅ 请求成功！服务器已返回数据。

以下是API返回的完整数据结构：
{
  "data": [
    {
      "id": 91005,
      "uuid": "d553a33b-7f6e-4e19-92dd-f30bfe89adad",
      "date_creation": "2025-08-04T12:56:36+00:00",
      "date_update": "2025-08-22T07:20:46+00:00",
      "name": "Reg Hosh is dead, long live Reg Hosh! (5th @ EMEA Conts)",
      "description": "<p><img data-src=\"https://i.imgur.com/v5dhAiY.jpeg\" alt=\"They put me in the orb\" /></p>\n\n<hr />\n\n<h1>\"It's just a few tweaks in the same reg hosh\"</h1>\n\n<p>Yes, at face value, nothing really changed except removing bankhar from the <a href=\"https://netrunnerdb.com/en/decklist/830bbeae-9c68-4739-8c4e-819fa1944ee9/this-is-what-real-gacha-addiction-looks-like-1st-hasseltmc-\">gachapon</a> deck and changing some slots around (+2 pinhole, +1 bahia bands +1 botulus, -1 airblade, -1 nuka, -3 strike fund, -3 bankhar). So, shouldn't the deck be so much worse since bankhar was such a

In [18]:
import pandas as pd # 导入pandas库，通常简写为pd

# 假设 all_corp_deck_urls 和 all_runner_deck_urls 是你已经成功获取的列表
# all_corp_deck_urls = [{'tournament_id': 5051, 'player': 'rubenpieters', 'corp_deck_url': 'https://netrunnerdb.com/en/decklist/91006/...'}, ...]

# --- 第一部分：处理公司方卡组 ---

# 1. 创建一个最终的、大的列表，用来存放每一条卡牌记录
corp_card_data = []

print(f"准备处理 {len(all_corp_deck_urls)} 个公司方卡组链接...\n")

# 2. 遍历我们之前收集到的每一个包含URL的字典
for deck_info in all_corp_deck_urls:
    
    url = deck_info['corp_deck_url']
    
    # 如果URL为空，则跳过此次循环
    if not url:
        continue

    try:
        # 3. 从URL中解析出 decklist_id (这是关键一步！)
        # 例如: 'https://netrunnerdb.com/en/decklist/91006/...' -> '91006'
        decklist_id = url.split('/')[5]
        
        # 4. 使用ID调用NetrunnerDB API
        api_url = f"https://netrunnerdb.com/api/2.0/public/decklist/{decklist_id}"
        print(f"正在请求 Decklist ID: {decklist_id} ...")
        
        response = requests.get(api_url)
        response.raise_for_status()
        decklist_data = response.json()
        
        # 5. 提取 'cards' 字典
        if decklist_data.get('success') and decklist_data.get('data'):
            cards_dict = decklist_data['data'][0].get('cards')
            
            if cards_dict:
                # 6. 【核心】遍历 'cards' 字典，将每张卡作为一条新记录添加
                for card_id, quantity in cards_dict.items():
                    corp_card_data.append({
                        'tournament_id': deck_info['tournament_id'],
                        'player': deck_info['player'],
                        'decklist_id': decklist_id,
                        'card_id': card_id,
                        'quantity': quantity
                    })
        
        # 礼貌地暂停
        time.sleep(1)

    except Exception as e:
        print(f"  -> 处理URL {url} 时发生错误: {e}")
        continue # 即使单个URL出错，也继续处理下一个

# --- 第二部分：将收集到的数据转换成表格 (Pandas DataFrame) ---
print("\n" + "="*50)
print("🎉 公司方数据处理完成！正在创建表格...")

if corp_card_data:
    # 这就是“拼成表格”的魔法！
    corp_df = pd.DataFrame(corp_card_data)

    print("\n公司方卡牌数据表格创建成功！")
    print("表格信息概览：")
    corp_df.info() # 显示表格的结构信息

    print("\n表格前5行预览：")
    print(corp_df.head()) # 显示表格的前5行
else:
    print("未能收集到任何公司方卡牌数据。")

准备处理 553 个公司方卡组链接...

正在请求 Decklist ID: 91122 ...
正在请求 Decklist ID: 91066 ...
正在请求 Decklist ID: 91410 ...
正在请求 Decklist ID: 91392 ...
正在请求 Decklist ID: 91301 ...
正在请求 Decklist ID: 91401 ...
正在请求 Decklist ID: 91424 ...
正在请求 Decklist ID: 91301 ...
正在请求 Decklist ID: 91475 ...
正在请求 Decklist ID: 91488 ...
正在请求 Decklist ID: 91481 ...
正在请求 Decklist ID: 91160 ...
正在请求 Decklist ID: 91530 ...
正在请求 Decklist ID: 91433 ...
正在请求 Decklist ID: 91498 ...
正在请求 Decklist ID: 91407 ...
正在请求 Decklist ID: 91452 ...
正在请求 Decklist ID: 91618 ...
正在请求 Decklist ID: 91397 ...
正在请求 Decklist ID: 91399 ...
正在请求 Decklist ID: 89599 ...
正在请求 Decklist ID: 91299 ...
正在请求 Decklist ID: 91771 ...
正在请求 Decklist ID: 91529 ...
正在请求 Decklist ID: 91505 ...
正在请求 Decklist ID: 91418 ...
正在请求 Decklist ID: 88500 ...
正在请求 Decklist ID: 91111 ...
正在请求 Decklist ID: 91476 ...
正在请求 Decklist ID: 91404 ...
正在请求 Decklist ID: 90984 ...
正在请求 Decklist ID: 91496 ...
正在请求 Decklist ID: 91301 ...
正在请求 Decklist ID: 91299 ...
正在请求 Decklist ID: 91289 ..

In [19]:
corp_df['card_id'].value_counts().head(20)


card_id
30053    540
30075    372
35081    320
35079    271
30056    191
35078    185
30060    177
34044    162
35072    162
34040    154
35051    149
33061    142
30071    142
26125    139
33042    137
34059    137
26058    134
34108    133
26044    132
33125    129
Name: count, dtype: int64