In [12]:
import re

def count_chinese_characters(text):
    """
    统计文本中的中文字符数量。

    参数:
        text (str): 输入的文本字符串。
    
    返回:
        int: 中文字符的数量。
    """
    # 匹配中文字符的正则表达式
    chinese_characters = re.findall(r'[\u4e00-\u9fff]', text)
    return len(chinese_characters)

def count_chinese_from_file(file_path):
    """
    从文件中读取文本并统计中文字符数量。

    参数:
        file_path (str): txt 文件的路径。
    
    返回:
        int: 中文字符的数量。
    """
    try:
        with open(file_path, 'r', encoding='utf-8') as file:
            text = file.read()
        return count_chinese_characters(text)
    except FileNotFoundError:
        print("文件未找到，请检查路径。")
        return 0
    except UnicodeDecodeError:
        print("文件编码格式错误，请确保文件是 UTF-8 编码。")
        return 0

# 示例：从文件中读取
file_path = r'C:\Users\Jiacheng Zheng\Downloads\论文.txt'  # 替换为你的文件路径
chinese_count = count_chinese_from_file(file_path)
print(f"文件中的中文字符数为: {chinese_count}")


文件中的中文字符数为: 2043
