Feature Extractor负责为音频或视觉模型准备输入特征。这包括从序列中提取特征,例如,对音频文件进行预处理以生成Log-Mel频谱特征,以及从图像中提取特征,例如,裁剪图像文件,同时还包括填充、归一化和转换为NumPy、PyTorch和TensorFlow张量。
[[autodoc]] feature_extraction_utils.FeatureExtractionMixin - from_pretrained - save_pretrained
[[autodoc]] SequenceFeatureExtractor - pad
[[autodoc]] BatchFeature
[[autodoc]] image_utils.ImageFeatureExtractionMixin