人脸识别
===

## Haar

### 基本概念
Haar级联分类器是由Paul Viola和Michael Jones在2001年提出的。它使用Haar特征和级联分类器来快速检测图像中的对象（如人脸）。

### Haar特征
Haar特征是一种简单的矩形特征，类似于Haar小波。常见的Haar特征包括边缘特征、线特征和四边形特征。每个特征由两个或多个矩形区域组成，通过计算这些区域的像素值之差来表示特征值。

### 级联分类器
级联分类器是一种分层的分类器结构。每一层都是一个弱分类器，只有当一个图像区域通过当前层的检测时，才会进入下一层进行更详细的检测。这种结构可以显著提高检测速度，因为大部分非目标区域会在前几层被快速排除。

### 训练过程
1. 收集正负样本：收集包含目标对象（如人脸）的正样本和不包含目标对象的负样本。
2. 计算Haar特征：对样本图像计算大量的Haar特征。
3. 训练弱分类器：使用AdaBoost算法训练多个弱分类器，每个弱分类器基于一个Haar特征。
4. 构建级联分类器：将多个弱分类器按层次结构组合成一个级联分类器。

### 使用方法
在OpenCV中，可以使用CascadeClassifier类加载预训练的Haar级联分类器，并使用DetectMultiScale方法进行人脸检测。

In [1]:
#r "nuget: OpenCvSharp4.Windows"
using OpenCvSharp;

In [None]:
var cascade = new CascadeClassifier("assets/haarcascade_frontalface_default.xml");
using (var src = new Mat("assets/faces.jpg", ImreadModes.Color))
using (var gray = new Mat())
{
    Mat result = src.Clone();
    Cv2.CvtColor(src, gray, ColorConversionCodes.BGR2GRAY);

    // Detect faces
    Rect[] faces = cascade.DetectMultiScale(gray, 1.08, 2, HaarDetectionTypes.ScaleImage, new Size(30, 30));

    // Render all detected faces
    foreach (Rect face in faces)
    {
        var center = new Point
        {
            X = (int)(face.X + face.Width * 0.5),
            Y = (int)(face.Y + face.Height * 0.5)
        };
        var axes = new Size
        {
            Width = (int)(face.Width * 0.5),
            Height = (int)(face.Height * 0.5)
        };
        Cv2.Ellipse(result, center, axes, 0, 0, 360, new Scalar(255, 0, 255), 4);
    }

    Cv2.ImShow("Faces by Haar", result);
    Cv2.WaitKey(0);
    Cv2.DestroyAllWindows();
}

## LBP

### 基本概念
LBP（局部二值模式）是一种纹理描述符，由Timo Ojala等人在1994年提出。LBP级联分类器使用LBP特征和级联分类器来检测图像中的对象。

### LBP特征
LBP特征通过比较像素与其邻域像素的灰度值来生成二进制模式。具体步骤如下：
1.	选择中心像素：选择一个像素作为中心像素。
2.	比较邻域像素：将中心像素与其邻域像素进行比较，如果邻域像素的灰度值大于或等于中心像素，则该位置记为1，否则记为0。
3.	生成二进制模式：将比较结果按顺序排列，生成一个二进制数。

### 级联分类器
与Haar级联分类器类似，LBP级联分类器也使用分层的分类器结构。每一层都是一个弱分类器，只有当一个图像区域通过当前层的检测时，才会进入下一层进行更详细的检测。

### 训练过程
1. 收集正负样本：收集包含目标对象（如人脸）的正样本和不包含目标对象的负样本。
2. 计算LBP特征：对样本图像计算LBP特征。
3. 训练弱分类器：使用AdaBoost算法训练多个弱分类器，每个弱分类器基于一个LBP特征。
4. 构建级联分类器：将多个弱分类器按层次结构组合成一个级联分类器。

### 使用方法
在OpenCV中，可以使用CascadeClassifier类加载预训练的LBP级联分类器，并使用DetectMultiScale方法进行人脸检测。

In [None]:
var cascade = new CascadeClassifier("assets/lbpcascade_frontalface.xml");
using (var src = new Mat("assets/faces.jpg", ImreadModes.Color))
using (var gray = new Mat())
{
    Mat result = src.Clone();
    Cv2.CvtColor(src, gray, ColorConversionCodes.BGR2GRAY);

    // Detect faces
    Rect[] faces = cascade.DetectMultiScale(gray, 1.08, 2, HaarDetectionTypes.ScaleImage, new Size(30, 30));

    // Render all detected faces
    foreach (Rect face in faces)
    {
        var center = new Point
        {
            X = (int)(face.X + face.Width * 0.5),
            Y = (int)(face.Y + face.Height * 0.5)
        };
        var axes = new Size
        {
            Width = (int)(face.Width * 0.5),
            Height = (int)(face.Height * 0.5)
        };
        Cv2.Ellipse(result, center, axes, 0, 0, 360, new Scalar(255, 0, 255), 4);
    }

    Cv2.ImShow("Faces by Haar", result);
    Cv2.WaitKey(0);
    Cv2.DestroyAllWindows();
}

## DNN（深度神经网络）

### 基本概念
DNN（深度神经网络）是一种人工神经网络，具有多个隐藏层。DNN在图像分类、目标检测和语音识别等任务中表现出色。常见的DNN架构包括卷积神经网络（CNN）、循环神经网络（RNN）和生成对抗网络（GAN）。

### 卷积神经网络（CNN）
CNN是一种专门用于处理图像数据的神经网络。它通过卷积层、池化层和全连接层来提取图像特征。卷积层使用卷积核对图像进行卷积操作，池化层对卷积结果进行下采样，全连接层将特征映射到输出类别。

### 训练过程
1.	数据准备：收集并标注大量的训练数据。
2.	网络初始化：初始化网络参数，如权重和偏置。
3.	前向传播：将输入数据通过网络，计算输出。
4.	损失计算：计算预测输出与真实标签之间的损失。
5.	反向传播：计算损失相对于网络参数的梯度。
6.	参数更新：使用优化算法（如SGD、Adam）更新网络参数。
7.	迭代训练：重复前向传播、损失计算、反向传播和参数更新，直到损失收敛。

### 使用方法
在OpenCV中，可以使用dnn模块加载预训练的DNN模型，并使用forward方法进行前向传播，获取检测结果。

TODO: 第9行会报错

In [11]:
using OpenCvSharp.Dnn;

var frame = Cv2.ImRead("assets/faces.jpg");
int frameHeight = frame.Rows;
int frameWidth = frame.Cols;
var faceNet = CvDnn.ReadNetFromCaffe("assets/bvlc_googlenet.prototxt", "assets/res10_300x300_ssd_iter_140000_fp16.caffemodel");
var blob = CvDnn.BlobFromImage(frame, 1.0, new Size(1507, 776), new Scalar(104, 117, 123), false, false);
faceNet.SetInput(blob, "data");
var detection = faceNet.Forward("detection_out");
var detectionMat = Mat.FromPixelData(detection.Size(2), detection.Size(3), MatType.CV_32F, detection.Ptr(0));
for (int i = 0; i < detectionMat.Rows; i++)
{
    float confidence = detectionMat.At<float>(i, 2);

    if (confidence > 0.7)
    {
        int x1 = (int)(detectionMat.At<float>(i, 3) * frameWidth);
        int y1 = (int)(detectionMat.At<float>(i, 4) * frameHeight);
        int x2 = (int)(detectionMat.At<float>(i, 5) * frameWidth);
        int y2 = (int)(detectionMat.At<float>(i, 6) * frameHeight);

        Cv2.Rectangle(frame, new Point(x1, y1), new Point(x2, y2), new Scalar(0, 255, 0), 2, LineTypes.Link4);
    }
}

Cv2.ImShow("Detected Faces", frame);
Cv2.WaitKey(0);
Cv2.DestroyAllWindows();

Error: OpenCvSharp.OpenCVException: !blobs.empty() || inputs.size() > 1
   at OpenCvSharp.Internal.NativeMethods.<>c.<.cctor>b__1687_0(ErrorCode status, String funcName, String errMsg, String fileName, Int32 line, IntPtr userData)
   at OpenCvSharp.Internal.NativeMethods.dnn_Net_forward1(IntPtr net, String outputName, IntPtr& returnValue)
   at OpenCvSharp.Dnn.Net.Forward(String outputName)
   at Submission#12.<<Initialize>>d__0.MoveNext()
--- End of stack trace from previous location ---
   at Microsoft.CodeAnalysis.Scripting.ScriptExecutionState.RunSubmissionsAsync[TResult](ImmutableArray`1 precedingExecutors, Func`2 currentExecutor, StrongBox`1 exceptionHolderOpt, Func`2 catchExceptionOpt, CancellationToken cancellationToken)