In [4]:
'''
日本月刊 sm 号转 B av 号脚本
'''

import re

import requests

def search_one(keyword: str) -> list:
    '''
    :param: keyword 要搜索的关键字
    
    :return: 一个含视频信息的列表，格式如下
    [{'id': 21762,
   'aid': 333377274,
   'bvid': 'BV15A411372L',
   'owner_name': '文体9开花',
   'owner_id': 393821889,
   'desc': 'sm28678953\n作者：Happy Machinery\nB站本家：av31953632\n简介：初音MADです。 UDKと一緒にクッキー☆を振り返りましょう。クッキー☆4部作出演声優全員が何らかの形で登場します。\n原曲：CAND¥¥¥LAND\n曲奇编年史喜欢',
   'duration': 224,
   'pubdate': 1622875763,
   'copyright': 0,
   'tags': {'-1': 'from topic'},
   'title': '【720p60fps】COOKI€€€☆LAND',
   'view': 1,
   'like': 2,
   'favorite': 1,
   'reply': 0}, ...]
    '''
    api = f'https://uzuki.ml/search-api/search?type=desc_or_title&keyword={keyword}&pn=1&ps=20&join=or'
    
    res = requests.get(api, timeout=10).json()
    return res['data']

def search_many(keywords: list) -> list:
    for keyword in keywords:
        yield search_one(keyword)
        
def parse_keywords(keywords: str) -> list:
    '''
    提取月刊的关键字和排名，排序后返回
    :param: keywords 月刊排名文本 
    
    :returns:
    格式如下的元组列表
        [('20', 'sm38705701')]
    其中第一个元素是排名，第二个元素是关键字
    '''
    result = []
    
    li = keywords.split()
    
    for (idx, item) in enumerate(li):
        rank = re.findall('([\d\w]+):', item)
        keyword = re.findall('sm\d+', item)
        
        if rank:
            rank = rank[0]
        else:
            rank = len(li) - idx

        if keyword:
            keyword = keyword[0]
            
        result.append((rank, keyword))
    
    def _sort(item):
        try:
            return int(item[0])
        except ValueError:
            return -sum(map(ord, item[0])) # 转成 ascii 对应的值然后求和，最后返回负数
            
    result.sort(key=_sort, reverse=True)
    
    return result


def generate_rank(text: str, show_not_found: bool = True):
    items = parse_keywords(text)
    
    for item in items:
         rank, keyword = item
    
         if keyword:
            search_results = search_one(keyword)
            if not search_results and show_not_found:
                print(rank, keyword, '未找到')

            for result in search_results:
                print(rank, keyword, 'av' + str(result['aid']), result['title'])

In [5]:
text = '''sm38909010 sm38831771

30th-21st
sm38849607 sm38863968 sm38849048 sm38890395 sm38868364
sm38855122 sm38831830 sm38957943 sm38910424 sm38955214

20th-11th
sm38873715 sm38932392 sm38910444 sm38787871 sm38823534
sm38863151 sm38920471 sm38877734 sm38949638 sm38846267

10th-1st
sm38891747 sm38883304 sm38894630 sm38853033 sm38870721
sm38828514 sm38859852 sm38896328 sm38936798 sm38826001

P1-P5
sm38833974 sm38857047
sm38857880 sm38879653 sm38954836

OP
sm38881187
''' # 2021-5 月的月刊文本

generate_rank(text)

43 sm38909010 未找到
42 sm38831771 未找到
40 sm38849607 未找到
39 sm38863968 未找到
38 sm38849048 av715888001 ノリノリNYN姉貴BB＋使用例.igarashiyuriko
37 sm38890395 av716185868 【BB曲奇剧场】如果有神秘开关时该怎么做呢
37 sm38890395 av206138995 スイッチがあったらどうしようNYN姉貴
36 sm38868364 av846049933 短编集⭐
35 sm38855122 av673829170 【BB曲奇剧场】某家族的一日
34 sm38831830 av545957502 ３Dと化したRRMのQVC☆
33 sm38957943 未找到
32 sm38910424 av631152251 独自一人被赶到外面的UDK
31 sm38955214 av846394160 s.z.
31 sm38955214 av376411798 s.z.
29 sm38873715 未找到
28 sm38932392 未找到
27 sm38910444 av673733388 【BB曲奇剧场】想堆雪人的NYN姐贵
26 sm38787871 未找到
25 sm38823534 av758414474 银乱系ならるりまでオナろう
24 sm38863151 av206109120 天箭桥神社 BW
23 sm38920471 av248771182 想钓到大家伙的ICG姐贵
22 sm38877734 av761068629 VANILLA神社
21 sm38949638 未找到
20 sm38846267 未找到
18 sm38891747 av248727824 【合作】投稿者 × 絵师 合作☆
17 sm38883304 未找到
16 sm38894630 av673732146 并没有向夜晚奔去
15 sm38853033 av588421557 Kung-fu Fantasia☆
15 sm38853033 av930920090 Kung-fu Fantasia☆
14 sm38870721 av248626393 大改造☆劇的ビフォーアフター神社.theme【弹幕附】
14 sm38870721 av88857

In [15]:
# https://www.nicovideo.jp/series/197048 饼月刊

text2 = '''
30th-21st
sm38643926 sm38576402 sm38531519 sm38585060 sm38562800
sm38560665 sm38564265 sm38573010 sm38533247 sm38595346

20th-11th
sm38598362 sm38616150 sm38518145 sm38540022 sm38580217
sm38598744 sm38588518 sm38636838 sm38565773 sm38517133

10th-1st
sm38538787 sm38533566 sm38613713 sm38648193 sm38606872
sm38525895 sm38520329 sm38574191 sm38631283 sm38525718

P1-P7
sm38536281 sm38557421 sm38567011 sm38567213
sm38573448 sm38622178 sm38646568

OP
sm38586567

2021年3月号: sm38518838
2021年5月号: sm38823506

2020年4月号: sm36774907
'''

generate_rank(text2)

-1 sm38643926 未找到
-1 sm38576402 av972614594 Searching for the Cocoa Treasure ☆
-1 sm38531519 未找到
-1 sm38585060 未找到
-1 sm38562800 av375033715 RIM一家の人気投票
-1 sm38560665 av845098977 尚未看过巨人最新话的NYN姐贵.序
-1 sm38564265 未找到
-1 sm38573010 av757560868 节食的DIYUSI
-1 sm38533247 av587917942 猫月
-1 sm38533247 av247443926 ク砕月☆
-1 sm38595346 未找到
-1 sm38598362 av760161716 一脸嫌弃地给你看的BNKRG姐贵
-1 sm38616150 av332803338 Critical Crystal☆.mp4
-1 sm38616150 av375153400 Critical Crystal☆.mp4
-1 sm38518145 av459997897 白虎野の娘☆☆☆☆☆
-1 sm38540022 av629876130 Goodbye宣言☆
-1 sm38580217 av290025006 这些家伙总是看起来这么欢乐啊Unwelcome School☆
-1 sm38598744 av845209498 Komugi Rave
-1 sm38588518 av630123908 乡村小路☆　feat.MGRoid
-1 sm38636838 av247777250 变成驴的NYN姐贵
-1 sm38565773 av205073992 ルリマ / いんらんベア
-1 sm38565773 av845028780 Rurima / いんらんベア
-1 sm38517133 av502899359 想让UDK生草的先辈
-1 sm38538787 av629921300 唱Dragostea Din Tei的ICG姐贵GB
-1 sm38533566 av587439890 めぐ列车 / MGRoid
-1 sm38613713 av247650480 まけるマンのうた
-1 sm38648193 av972849506 Big brother