Skip to content

taishan1994/Classification-Factory

Repository files navigation

Classification-Factory

以极简的代码实现文本分类,包括二分类、多分类、多标签分类。

安装依赖

pip install -r requirements.txt

项目说明

train_multi_label.py:用于多标签分类
train.py:用于二分类或者多分类
predict.py:用于预测二分类或者多分类
predict_multi_label.py:用于多标签分类
k_fold.y:用于k折交叉验证筛选出疑似噪声数据

数据格式:

[
    {
        "text": "在大模型时代,我们继续读《控制论与科学方法论》\n- 《控制论与科学方法论》于2025年由广东人民出版社再版,该书由金观涛与华国凡撰写,最初成书于40多年前,是控制论思想的重要奠基之作。  \n- 该书核心观点指出,智能的本质源于反馈结构与多层次自耦合稳态机制,这一思想贯穿于现代人工智能的负反馈架构,尤其体现在大语言模型的“学习”能力中。  \n- 人工智能与管理学在控制论方法论下具有同构性:二者均探讨“组织智能”问题,且都面临“智能与主体性”关系这一深层认识论危机。  \n- 管理学领域较早引入“心智模型”概念(如彼得·圣吉的《第五项修炼》),将其作为组织学习与决策的基础,而这一概念后来被人工智能领域重新发现并用于构建“世界模型”。  \n- 当前人工智能的认知困境,如“超级对齐”问题,本质上源于对智能与主体性的混淆,重读《控制论》有助于回归方法论原点,探索从控制论到真实性哲学的理论突破路径。  \n\n",
        "labels": [
            1,
            0,
            0,
            0,
        ]
    },
]

无论是二分类、多分类、多标签分类,训练可采取以上格式。可以在对应的文件里面酌情修改。整体的代码量并不多。

二分类、多分类训练

python3 train.py

多标签分类

python3 train_multi_label.py

About

以极简的代码实现文本分类,包括二分类、多分类、多标签分类。

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages