In [26]:
# 要获取一个文件资源链接的文件格式，可以使用Python编写一个函数来下载文件并检查其MIME类型。以下是一个示例代码：


import requests
import mimetypes

def get_file_format(url: str) -> str:
    """
    获取文件格式
    
    :param url: 文件资源链接
    :return: 文件的MIME类型
    """
    response = requests.get(url, stream=True)
    if response.status_code == 200:
        content_type = response.headers.get('Content-Type')
        if content_type:
            return content_type
        else:
            ext = url.split('.')[-1]
            mime_type = mimetypes.guess_type(url)[0]
            return mime_type if mime_type else '未知类型'
    else:
        return '无法访问文件'

# # 示例使用
url = "https://ipfs.io/ipfs/QmeSjSinHpPnmXmspMjwiXyN6zS4E9zccariGR3jxcaWtq/2.jpg"
# url = "https://i.seadn.io/gae/48oVuDyfe_xhs24BC2TTVcaYCX7rrU5mpuQLyTgRDbKHj2PtzKZsQ5qC3xTH4ar34wwAXxEKH8uUDPAGffbg7boeGYqX6op5vBDcbA?w=3840&auto=format"
# url = "https://i.seadn.io/gcs/files/c6cb0b1d6f2ab61c0efacf00e62e2230.jpg?w=3840&auto=format"
file_format = get_file_format(url)
print(f"文件格式为: {file_format}")


文件格式为: 无法访问文件


In [31]:
import requests

def get_media_format(url: str) -> str:
    """
    获取文件格式，如果文件名包含常见文件扩展名则返回该扩展名
    
    :param url: 文件资源链接
    :return: 文件扩展名例如(".jpg", ".png", ".mp4" 等), 如果无法获取则返回 NULL
    
    """

    response = requests.get(url, stream=True)
    if response.status_code == 200:
        content_type = response.headers.get('Content-Type')
        if content_type:
            fmt = f".{content_type.split('/')[-1]}"
            return fmt
        else:
            common_formats = ['.jpg', '.jpeg', '.png', 'webp', '.gif', '.mp4', ".svg", '.xml']
            for fmt in common_formats:
                if fmt in url:
                    return fmt
    else:
        return None

# 示例使用
# url = "https://i.seadn.io/gcs/files/c6cb0b1d6f2ab61c0efacf00e62e2230.jpg?w=3840&auto=format"
url = "https://ipfs.io/ipfs/QmYPznMvizE4BxrYaXM8dpRrzgN6Pg2rtTczjzNn13More"
file_format = get_media_format(url)
print(f"文件格式为: {file_format}")


文件格式为: .png
