In [12]:
import math
import random

# Step 1: 图像读取和灰度转换，并进行预处理（去噪和光照平衡）
def load_image(filepath):
    try:
        with open(filepath, 'rb') as f:
            # 读取 BMP 文件头 (14 字节)
            file_header = f.read(14)
            if len(file_header) < 14:
                print("错误：BMP 文件头太短。")
                return None

            bfType = file_header[0:2]
            if bfType != b'BM':
                print("错误：不是 BMP 文件。")
                return None

            bfSize = int.from_bytes(file_header[2:6], 'little')
            bfReserved1 = int.from_bytes(file_header[6:8], 'little')
            bfReserved2 = int.from_bytes(file_header[8:10], 'little')
            bfOffBits = int.from_bytes(file_header[10:14], 'little')

            # 读取 BITMAPINFOHEADER
            biSize_bytes = f.read(4)
            if len(biSize_bytes) < 4:
                print("错误：无法读取 BMP 信息头大小。")
                return None
            biSize = int.from_bytes(biSize_bytes, 'little')
            biHeader = f.read(biSize - 4)
            if len(biHeader) < biSize - 4:
                print("错误：BMP 信息头太短。")
                return None

            biWidth = int.from_bytes(biHeader[0:4], 'little')
            biHeight = int.from_bytes(biHeader[4:8], 'little')
            biPlanes = int.from_bytes(biHeader[8:10], 'little')
            biBitCount = int.from_bytes(biHeader[10:12], 'little')
            biCompression = int.from_bytes(biHeader[12:16], 'little')

            if biCompression != 0:
                print("错误：不支持压缩的 BMP 文件。")
                return None

            if biBitCount != 24 and biBitCount != 32:
                print("错误：仅支持 24 位或 32 位 BMP 文件。")
                return None

            width = biWidth
            height = abs(biHeight)

            # 计算每行的字节数
            bytes_per_pixel = biBitCount // 8
            row_padded = (width * bytes_per_pixel + 3) & (~3)

            # 移动文件指针到像素数据开始位置
            f.seek(bfOffBits)

            pixels = []
            for y in range(height):
                row = []
                row_data = f.read(row_padded)
                if len(row_data) < row_padded:
                    print("错误：像素数据不足。")
                    return None
                for x in range(width):
                    offset = x * bytes_per_pixel
                    b = row_data[offset]
                    g = row_data[offset + 1]
                    r = row_data[offset + 2]
                    gray = int(0.299 * r + 0.587 * g + 0.114 * b)
                    row.append(gray)
                pixels.append(row)

            # 如果高度为正，则图像数据从下到上，需要翻转
            if biHeight > 0:
                pixels.reverse()

            # 对噪声进行均值滤波处理
            filtered_pixels = [[0 for _ in range(width)] for _ in range(height)]
            for y in range(1, height - 1):
                for x in range(1, width - 1):
                    neighbors = [
                        pixels[y - 1][x - 1], pixels[y - 1][x], pixels[y - 1][x + 1],
                        pixels[y][x - 1], pixels[y][x], pixels[y][x + 1],
                        pixels[y + 1][x - 1], pixels[y + 1][x], pixels[y + 1][x + 1]
                    ]
                    filtered_pixels[y][x] = sum(neighbors) // len(neighbors)
            # 边缘部分直接复制原始像素值
            for y in range(height):
                filtered_pixels[y][0] = pixels[y][0]
                filtered_pixels[y][width - 1] = pixels[y][width - 1]
            for x in range(width):
                filtered_pixels[0][x] = pixels[0][x]
                filtered_pixels[height - 1][x] = pixels[height - 1][x]

            # 对光照变化进行简单的平衡处理
            min_pixel = min(min(row) for row in filtered_pixels)
            max_pixel = max(max(row) for row in filtered_pixels)
            range_pixel = max_pixel - min_pixel if max_pixel > min_pixel else 1
            normalized_pixels = [[(pixel - min_pixel) * 255 // range_pixel for pixel in row] for row in filtered_pixels]

            return normalized_pixels

    except Exception as e:
        print(f"加载图像时出错：{e}")
        return None

# Step 2: 关键点检测和描述算法

class KeypointDetector:
    def __init__(self, image, threshold=1e4):
        self.image = image
        self.height = len(image)
        self.width = len(image[0])
        self.threshold = threshold
        # 计算图像的水平和垂直梯度
        self.Ix, self.Iy = self.compute_image_gradients()
        self.Ix2 = [[self.Ix[y][x] ** 2 for x in range(self.width)] for y in range(self.height)]
        self.Iy2 = [[self.Iy[y][x] ** 2 for x in range(self.width)] for y in range(self.height)]
        self.IxIy = [[self.Ix[y][x] * self.Iy[y][x] for x in range(self.width)] for y in range(self.height)]

    def compute_image_gradients(self):
        # 使用 Sobel 算子计算图像梯度
        Ix = [[0 for _ in range(self.width)] for _ in range(self.height)]
        Iy = [[0 for _ in range(self.width)] for _ in range(self.height)]
        for y in range(1, self.height - 1):
            for x in range(1, self.width - 1):
                gx = (-1 * self.image[y - 1][x - 1] + 1 * self.image[y - 1][x + 1]
                      -2 * self.image[y][x - 1]     + 2 * self.image[y][x + 1]
                      -1 * self.image[y + 1][x - 1] + 1 * self.image[y + 1][x + 1])
                gy = (-1 * self.image[y - 1][x - 1] -2 * self.image[y - 1][x] -1 * self.image[y - 1][x + 1]
                      +1 * self.image[y + 1][x - 1] +2 * self.image[y + 1][x] +1 * self.image[y + 1][x + 1])
                Ix[y][x] = gx
                Iy[y][x] = gy
        return Ix, Iy

    def apply_gaussian_filter(self, image, kernel_size=3, sigma=1.5):
        # 使用高斯滤波器平滑图像
        kernel = self.gaussian_kernel(kernel_size, sigma)
        return self.convolve(image, kernel)

    def gaussian_kernel(self, size, sigma):
        # 生成高斯核
        kernel = []
        center = size // 2
        sum_val = 0
        for i in range(size):
            row = []
            for j in range(size):
                x = j - center
                y = i - center
                exponent = -(x**2 + y**2) / (2 * sigma**2)
                value = (1 / (2 * math.pi * sigma**2)) * math.exp(exponent)
                row.append(value)
                sum_val += value
            kernel.append(row)
        # 归一化核
        for i in range(size):
            for j in range(size):
                kernel[i][j] /= sum_val
        return kernel

    def convolve(self, image, kernel):
        # 卷积操作
        height = len(image)
        width = len(image[0])
        kernel_size = len(kernel)
        padding = kernel_size // 2
        padded_image = [[0 for _ in range(width + 2 * padding)] for _ in range(height + 2 * padding)]
        for i in range(height):
            for j in range(width):
                padded_image[i + padding][j + padding] = image[i][j]
        result = [[0 for _ in range(width)] for _ in range(height)]
        for i in range(height):
            for j in range(width):
                sum_val = 0
                for m in range(kernel_size):
                    for n in range(kernel_size):
                        sum_val += padded_image[i + m][j + n] * kernel[m][n]
                result[i][j] = sum_val
        return result

    def detect_keypoints(self):
        # Harris 角点检测参数
        window_size = 3
        offset = window_size // 2
        k = 0.06  # Harris 角点检测器中的敏感度因子
        threshold = self.threshold

        # 对 Ix2, Iy2, IxIy 进行高斯平滑
        Sxx = self.apply_gaussian_filter(self.Ix2)
        Syy = self.apply_gaussian_filter(self.Iy2)
        Sxy = self.apply_gaussian_filter(self.IxIy)

        corner_response = [[0 for _ in range(self.width)] for _ in range(self.height)]
        keypoints = []

        # 计算角点响应函数
        for y in range(offset, self.height - offset):
            for x in range(offset, self.width - offset):
                det = Sxx[y][x] * Syy[y][x] - Sxy[y][x] ** 2
                trace = Sxx[y][x] + Syy[y][x]
                R = det - k * (trace ** 2)
                corner_response[y][x] = R

        # 非极大值抑制和阈值化
        for y in range(offset + 1, self.height - offset - 1):
            for x in range(offset + 1, self.width - offset - 1):
                R = corner_response[y][x]
                if R > threshold:
                    local_max = True
                    for dy in range(-1, 2):
                        for dx in range(-1, 2):
                            if dy == 0 and dx == 0:
                                continue
                            if corner_response[y + dy][x + dx] > R:
                                local_max = False
                                break
                        if not local_max:
                            break
                    if local_max:
                        keypoints.append((x, y, R))  # 将响应值 R 一同存储

        # 限制最大关键点数量
        N = 5000
        keypoints.sort(key=lambda x: x[2], reverse=True)
        keypoints = keypoints[:N]

        valid_keypoints = []
        descriptors = []
        # 计算描述符
        for x, y, R in keypoints:
            descriptor = self.compute_descriptor(x, y)
            if descriptor is not None:
                valid_keypoints.append((x, y))
                descriptors.append(descriptor)

        print(f"有效关键点数量：{len(valid_keypoints)}")

        return valid_keypoints, descriptors

    def compute_descriptor(self, x, y):
        # SIFT-like 描述符
        patch_size = 16
        half_size = patch_size // 2
        num_bins = 8
        descriptor = []

        if x - half_size < 0 or x + half_size >= self.width or y - half_size < 0 or y + half_size >= self.height:
            return None

        magnitudes = [[0 for _ in range(patch_size)] for _ in range(patch_size)]
        angles = [[0 for _ in range(patch_size)] for _ in range(patch_size)]
        for i in range(-half_size, half_size):
            for j in range(-half_size, half_size):
                gx = self.Ix[y + i][x + j]
                gy = self.Iy[y + i][x + j]
                magnitude = math.sqrt(gx ** 2 + gy ** 2)
                angle = (math.atan2(gy, gx) * 180 / math.pi) % 360
                magnitudes[i + half_size][j + half_size] = magnitude
                angles[i + half_size][j + half_size] = angle

        subregion_size = 4
        for i in range(0, patch_size, subregion_size):
            for j in range(0, patch_size, subregion_size):
                histogram = [0] * num_bins
                for dy in range(subregion_size):
                    for dx in range(subregion_size):
                        mag = magnitudes[i + dy][j + dx]
                        angle = angles[i + dy][j + dx]
                        bin_idx = int(angle / 360 * num_bins) % num_bins
                        histogram[bin_idx] += mag
                norm = math.sqrt(sum(h ** 2 for h in histogram))
                if norm > 0:
                    histogram = [h / norm for h in histogram]
                else:
                    histogram = [0] * num_bins
                descriptor.extend(histogram)

        norm = math.sqrt(sum(d ** 2 for d in descriptor))
        if norm > 0:
            descriptor = [d / norm for d in descriptor]
        else:
            return None

        if any(math.isnan(d) or math.isinf(d) for d in descriptor):
            return None

        return descriptor

# Step 3: 特征匹配

class FeatureMatcher:
    def __init__(self, keypoints1, descriptors1, keypoints2, descriptors2):
        self.keypoints1 = keypoints1
        self.descriptors1 = descriptors1
        self.keypoints2 = keypoints2
        self.descriptors2 = descriptors2

    def match_features(self, ratio_threshold=0.95):
        matches = []
        for i, desc1 in enumerate(self.descriptors1):
            distances = []
            for j, desc2 in enumerate(self.descriptors2):
                dist = self.euclidean_distance(desc1, desc2)
                distances.append((dist, j))
            
            # 按距离排序，找到最近邻和次近邻
            distances.sort(key=lambda x: x[0])
            if len(distances) < 2:
                continue
            
            dist1, index1 = distances[0]  # 最近邻
            dist2, _ = distances[1]        # 次近邻
            
            # 比率测试，避免误匹配
            if dist1 < ratio_threshold * dist2:
                kp1 = self.keypoints1[i]
                kp2 = self.keypoints2[index1]
                matches.append((kp1, kp2, dist1))
        
        print(f"匹配数量：{len(matches)}")
        return matches

    def euclidean_distance(self, desc1, desc2):
        """
        计算两个描述符之间的欧氏距离。
        :param desc1: 第一个描述符。
        :param desc2: 第二个描述符。
        :return: 欧氏距离。
        """
        return math.sqrt(sum((a - b) ** 2 for a, b in zip(desc1, desc2)))

    def match_descriptors_with_ransac(self, matches, ransac_threshold=5.0, max_iterations=1000):
        """
        使用 RANSAC 算法来消除错误的匹配。
        :param matches: 初始匹配的关键点列表。
        :param ransac_threshold: RANSAC 中的距离阈值。
        :param max_iterations: RANSAC 的最大迭代次数。
        :return: 经过 RANSAC 过滤后的匹配。
        """
        # 初始化 RANSAC 的相关变量
        best_inliers = []
        best_model = None
        
        for _ in range(max_iterations):
            random_match = matches[math.floor(math.random() * len(matches))]
            kp1, kp2, _ = random_match

            model = self.estimate_model(kp1, kp2)
            
            # 计算内点数量
            inliers = []
            for match in matches:
                kp1_test, kp2_test, _ = match
                if self.is_inlier(kp1_test, kp2_test, model, ransac_threshold):
                    inliers.append(match)
            
            # 更新最佳模型
            if len(inliers) > len(best_inliers):
                best_inliers = inliers
                best_model = model
        
        print(f"RANSAC 内点数量：{len(best_inliers)}")
        return best_inliers

    def estimate_model(self, kp1, kp2):
        """
        估计模型参数，这里可以根据需要实现具体的模型估计，例如单应性矩阵。
        :param kp1: 第一个关键点。
        :param kp2: 第二个关键点。
        :return: 估计的模型。
        """
        # 返回两个关键点的位置
        return (kp1, kp2)

    def is_inlier(self, kp1, kp2, model, threshold):
        """
        判断一个匹配是否为模型的内点。
        :param kp1: 第一个关键点。
        :param kp2: 第二个关键点。
        :param model: 估计的模型。
        :param threshold: 距离阈值。
        :return: 如果是内点，返回 True，否则返回 False。
        """
        # 使用简单的欧氏距离作为内点判断标准
        est_kp1, est_kp2 = model
        distance = self.euclidean_distance(kp1, kp2)
        return distance < threshold


# Шаг 4: Оценка фундаментальной матрицы
class FundamentalAndEssentialMatrixEstimator:
    def __init__(self, matches, K, num_iterations=5000, inlier_threshold=0.1):
        """
        Инициализация оценщика фундаментальной и базовой матриц.
        :param matches: Пары совпавших точек [(kp1, kp2), ...], где kp1 и kp2 — соответствующие пиксельные точки (x, y).
        :param K: Матрица внутренних параметров камеры.
        :param num_iterations: Максимальное количество итераций для RANSAC.
        :param inlier_threshold: Порог для определения внутренних точек.
        """
        self.matches = matches
        self.K = K
        self.num_iterations = num_iterations
        self.inlier_threshold = inlier_threshold

    @staticmethod
    def matrix_determinant(R):
        """Вычисление детерминанта 3x3 матрицы"""
        return (
            R[0][0] * (R[1][1] * R[2][2] - R[1][2] * R[2][1]) -
            R[0][1] * (R[1][0] * R[2][2] - R[1][2] * R[2][0]) +
            R[0][2] * (R[1][0] * R[2][1] - R[1][1] * R[2][0])
        )

    @staticmethod
    def matrix_inverse(A):
        """Вычисление обратной матрицы 3x3"""
        det = (
            A[0][0] * (A[1][1] * A[2][2] - A[1][2] * A[2][1]) -
            A[0][1] * (A[1][0] * A[2][2] - A[1][2] * A[2][0]) +
            A[0][2] * (A[1][0] * A[2][1] - A[1][1] * A[2][0])
        )
        if abs(det) < 1e-10:
            print("Матрица необратима")
            return None
        inv_det = 1 / det
        return [
            [
                inv_det * (A[1][1] * A[2][2] - A[1][2] * A[2][1]),
                inv_det * (A[0][2] * A[2][1] - A[0][1] * A[2][2]),
                inv_det * (A[0][1] * A[1][2] - A[0][2] * A[1][1]),
            ],
            [
                inv_det * (A[1][2] * A[2][0] - A[1][0] * A[2][2]),
                inv_det * (A[0][0] * A[2][2] - A[0][2] * A[2][0]),
                inv_det * (A[0][2] * A[1][0] - A[0][0] * A[1][2]),
            ],
            [
                inv_det * (A[1][0] * A[2][1] - A[1][1] * A[2][0]),
                inv_det * (A[0][1] * A[2][0] - A[0][0] * A[2][1]),
                inv_det * (A[0][0] * A[1][1] - A[0][1] * A[1][0]),
            ],
        ]

    def triangulate_point(self, p1, p2, R, t):
        """Триангуляция 3D точки"""
        P1 = [[1, 0, 0, 0], [0, 1, 0, 0], [0, 0, 1, 0]]
        P2 = [
            [R[0][0], R[0][1], R[0][2], t[0][0]],
            [R[1][0], R[1][1], R[1][2], t[1][0]],
            [R[2][0], R[2][1], R[2][2], t[2][0]],
        ]

        A = [
            [
                p1[0][0] * P1[2][0] - P1[0][0],
                p1[0][0] * P1[2][1] - P1[0][1],
                p1[0][0] * P1[2][2] - P1[0][2],
                p1[0][0] * P1[2][3] - P1[0][3],
            ],
            [
                p1[1][0] * P1[2][0] - P1[1][0],
                p1[1][0] * P1[2][1] - P1[1][1],
                p1[1][0] * P1[2][2] - P1[1][2],
                p1[1][0] * P1[2][3] - P1[1][3],
            ],
            [
                p2[0][0] * P2[2][0] - P2[0][0],
                p2[0][0] * P2[2][1] - P2[0][1],
                p2[0][0] * P2[2][2] - P2[0][2],
                p2[0][0] * P2[2][3] - P2[0][3],
            ],
            [
                p2[1][0] * P2[2][0] - P2[1][0],
                p2[1][0] * P2[2][1] - P2[1][1],
                p2[1][0] * P2[2][2] - P2[1][2],
                p2[1][0] * P2[2][3] - P2[1][3],
            ],
        ]

        U, S, Vt = self.svd(A)
        X = Vt[-1]
        if abs(X[3]) < 1e-10:
            return None

        return [[X[i] / X[3]] for i in range(3)]

    def estimate_fundamental_matrix(self):
        if len(self.matches) < 8:
            print("Недостаточно совпадений для вычисления фундаментальной матрицы.")
            return None

        best_F = None
        max_inliers = []
        best_inlier_count = 0

        for iteration in range(self.num_iterations):
            # Случайный выбор 8 совпадений
            sample_matches = random.sample(self.matches, 8)
            pts1_sample = [(kp1[0], kp1[1]) for kp1, _, _ in sample_matches]
            pts2_sample = [(kp2[0], kp2[1]) for _, kp2, _ in sample_matches]

            F_candidate = self.estimate_fundamental_matrix_from_points(pts1_sample, pts2_sample)
            if F_candidate is None:
                continue

            inliers = []
            for match in self.matches:
                (x1, y1), (x2, y2), _ = match
                error = self.compute_sampson_error(F_candidate, x1, y1, x2, y2)
                if error < self.inlier_threshold:
                    inliers.append(match)

            if len(inliers) > best_inlier_count:
                best_inlier_count = len(inliers)
                best_F = F_candidate
                max_inliers = inliers

            if best_inlier_count > len(self.matches) * 0.8:
                break

        if best_F and len(max_inliers) >= 8:
            pts1_inliers = [(kp1[0], kp1[1]) for kp1, _, _ in max_inliers]
            pts2_inliers = [(kp2[0], kp2[1]) for _, kp2, _ in max_inliers]
            F_refined = self.estimate_fundamental_matrix_from_points(pts1_inliers, pts2_inliers)
            print(f"Количество инлаеров для лучшей модели RANSAC: {len(max_inliers)}")
            return F_refined
        else:
            print("Не удалось найти подходящую фундаментальную матрицу.")
            return None

    # Остальная часть кода аналогично переводу.

    # Метод оценки фундаментальной матрицы из точек
    def estimate_fundamental_matrix_from_points(self, pts1, pts2):
        if len(pts1) < 8 or len(pts2) < 8:
            print("Недостаточно точек для оценки фундаментальной матрицы.")
            return None
    
        pts1_norm, T1 = self.normalize_points(pts1)
        pts2_norm, T2 = self.normalize_points(pts2)
    
        A = []
        for i in range(len(pts1_norm)):
            x1, y1, _ = pts1_norm[i]
            x2, y2, _ = pts2_norm[i]
            A.append([x1 * x2, x1 * y2, x1, y1 * x2, y1 * y2, y1, x2, y2, 1])
    
        U, S, Vt = self.svd(A)
        if Vt is None:
            return None
    
        f = Vt[-1]
        F = [[f[0], f[1], f[2]],
             [f[3], f[4], f[5]],
             [f[6], f[7], f[8]]]
        F = self.enforce_rank2_constraint(F)
        F = self.matrix_multiply(self.matrix_transpose(T2), self.matrix_multiply(F, T1))
    
        if F[2][2] != 0:
            F = [[element / F[2][2] for element in row] for row in F]
    
        return F
    
    # Метод оценки базовой матрицы
    def estimate_essential_matrix(self, F):
        """
        Оценка базовой матрицы E на основе фундаментальной матрицы F.
        :param F: Фундаментальная матрица.
        :return: Базовая матрица E или None.
        """
        K_transpose = self.matrix_transpose(self.K)
        temp = self.matrix_multiply(K_transpose, F)
        E = self.matrix_multiply(temp, self.K)
        if E is None:
            return None
    
        # SVD разложение и ограничение сингулярных значений базовой матрицы
        U, S, V = self.svd(E)
        if None in (U, S, V):
            return None
        S_new = [[1, 0, 0],
                 [0, 1, 0],
                 [0, 0, 0]]
        temp = self.matrix_multiply(U, S_new)
        E = self.matrix_multiply(temp, self.matrix_transpose(V))
    
        return E
    
    # Извлечение возможных положений камеры
    def extract_camera_pose(self, E):
        """
        Извлечение возможных положений камеры (R, t) из базовой матрицы E.
        :param E: Базовая матрица.
        :return: Четыре возможных положения камеры [(R1, t1), (R1, -t1), (R2, t2), (R2, -t2)].
        """
        U, S, Vt = self.svd(E)
        if E is None:
            return None
    
    # Нормализация точек
    def normalize_points(self, pts):
        # Вычисление центра масс
        centroid = [sum(p[0] for p in pts) / len(pts), sum(p[1] for p in pts) / len(pts)]
        # Вычисление среднего расстояния
        avg_dist = sum(math.sqrt((p[0] - centroid[0]) ** 2 + (p[1] - centroid[1]) ** 2) for p in pts) / len(pts)
        if avg_dist == 0:
            scale = 1
        else:
            scale = math.sqrt(2) / avg_dist
        # Построение матрицы нормализации
        T = [[scale, 0, -scale * centroid[0]],
             [0, scale, -scale * centroid[1]],
             [0, 0, 1]]
        # Нормализованные точки
        pts_normalized = []
        for p in pts:
            x = scale * (p[0] - centroid[0])
            y = scale * (p[1] - centroid[1])
            pts_normalized.append([x, y, 1])
        return pts_normalized, T
    
    # Вычисление ошибки Сэмпсона
    def compute_sampson_error(self, F, x1, y1, x2, y2):
        p1 = [x1, y1, 1]
        p2 = [x2, y2, 1]
        F_p1 = self.matrix_vector_multiply(F, p1)
        Ft_p2 = self.matrix_vector_multiply(self.matrix_transpose(F), p2)
        p2_F_p1 = sum(p2[i] * F_p1[i] for i in range(3))
        error_numerator = p2_F_p1 ** 2
        error_denominator = F_p1[0] ** 2 + F_p1[1] ** 2 + Ft_p2[0] ** 2 + Ft_p2[1] ** 2
        if error_denominator == 0:
            return float('inf')
        return error_numerator / error_denominator
    
    # Умножение матриц
    def matrix_multiply(self, A, B):
        result = []
        for A_row in A:
            row_result = []
            for B_col in zip(*B):
                element = sum(a * b for a, b in zip(A_row, B_col))
                row_result.append(element)
            result.append(row_result)
        return result
    
    # Транспонирование матрицы
    def matrix_transpose(self, A):
        return [list(row) for row in zip(*A)]
    
    # Выбор правильного положения камеры
    def select_correct_pose(self, poses, points1, points2):
        """
        Выбор правильного положения камеры (R, t).
        """
        best_pose = None
        max_positive_depths = 0
    
        for R, t in poses:
            positive_depths = 0
    
            for (x1, y1), (x2, y2) in zip(points1, points2):
                p1 = self.matrix_multiply(self.matrix_inverse(self.K), [[x1], [y1], [1]])
                p2 = self.matrix_multiply(self.matrix_inverse(self.K), [[x2], [y2], [1]])
                P = self.triangulate_point(p1, p2, R, t)
                if P and P[2][0] > 0:
                    P2 = self.matrix_multiply(R, P)
                    P2 = [[P2[i][0] + t[i][0]] for i in range(3)]
                    if P2[2][0] > 0:
                        positive_depths += 1
    
            if positive_depths > max_positive_depths:
                max_positive_depths = positive_depths
                best_pose = (R, t)
    
        return best_pose
    
    # SVD разложение
    def svd(self, A):
        # Преобразование A в матричную форму
        m = len(A)
        n = len(A[0])
        AtA = [[0] * n for _ in range(n)]
        for i in range(n):
            for j in range(n):
                AtA[i][j] = sum(A[k][i] * A[k][j] for k in range(m))
    
        # Инициализация матрицы собственных векторов V
        V = [[1 if i == j else 0 for j in range(n)] for i in range(n)]
        max_iter = 100
        eps = 1e-10
    
        for _ in range(max_iter):
            max_offdiag = 0
            p = 0
            q = 0
            # Поиск наибольшего недиагонального элемента
            for i in range(n):
                for j in range(i + 1, n):
                    if abs(AtA[i][j]) > max_offdiag:
                        max_offdiag = abs(AtA[i][j])
                        p = i
                        q = j
            if max_offdiag < eps:
                break
    
            # Вычисление угла поворота
            if AtA[p][p] == AtA[q][q]:
                angle = math.pi / 4
            else:
                angle = 0.5 * math.atan2(2 * AtA[p][q], AtA[p][p] - AtA[q][q])
    
            sin_angle = math.sin(angle)
            cos_angle = math.cos(angle)
    
            # Обновление матрицы AtA
            for i in range(n):
                aip = cos_angle * AtA[i][p] - sin_angle * AtA[i][q]
                aiq = sin_angle * AtA[i][p] + cos_angle * AtA[i][q]
                AtA[i][p] = aip
                AtA[i][q] = aiq
            for i in range(n):
                AtA[p][i] = AtA[i][p]
                AtA[q][i] = AtA[i][q]
            AtA_pp = cos_angle ** 2 * AtA[p][p] - 2 * sin_angle * cos_angle * AtA[p][q] + sin_angle ** 2 * AtA[q][q]
            AtA_qq = sin_angle ** 2 * AtA[p][p] + 2 * sin_angle * cos_angle * AtA[p][q] + cos_angle ** 2 * AtA[q][q]
            AtA[p][p] = AtA_pp
            AtA[q][q] = AtA_qq
            AtA[p][q] = 0
            AtA[q][p] = 0
    
            # Обновление матрицы собственных векторов V
            for i in range(n):
                vip = cos_angle * V[i][p] - sin_angle * V[i][q]
                viq = sin_angle * V[i][p] + cos_angle * V[i][q]
                V[i][p] = vip
                V[i][q] = viq
    
        # Извлечение собственных значений
        eigenvalues = [AtA[i][i] for i in range(n)]
    
        # Обработка отрицательных собственных значений, устанавливаем их в ноль
        singular_values = [math.sqrt(max(eig, 0)) for eig in eigenvalues]
    
        # Построение левой сингулярной матрицы U
        U = []
        for i in range(m):
            Ui_row = []
            for j in range(n):
                sum_u = sum(A[i][k] * V[k][j] for k in range(n))
                if singular_values[j] != 0:
                    Ui_row.append(sum_u / singular_values[j])
                else:
                    Ui_row.append(0)
            U.append(Ui_row)
    
        # Транспонирование V
        Vt = self.matrix_transpose(V)
    
        return U, singular_values, Vt
    
    # Принудительное обеспечение ранга 2 для фундаментальной матрицы
    def enforce_rank2_constraint(self, F):
        U, S, Vt = self.svd(F)
        if U is None or S is None or Vt is None:
            return F
        S[2] = 0  # Устанавливаем наименьшее сингулярное значение в ноль
        # Восстановление F
        S_matrix = [[S[0], 0, 0], [0, S[1], 0], [0, 0, S[2]]]
        F_rank2 = self.matrix_multiply(U, self.matrix_multiply(S_matrix, Vt))
        return F_rank2
    
    # Умножение матрицы на вектор
    def matrix_vector_multiply(self, M, v):
        return [sum(m * vi for m, vi in zip(M_row, v)) for M_row in M]


# Шаг 5: 3D реконструкция
class Reconstruction3D:
    def __init__(self, matches, F):
        self.matches = matches
        self.F = F

    def reconstruct(self):
        # Извлечение совпадающих точек
        points1 = [match[0] for match in self.matches]  
        points2 = [match[1] for match in self.matches]  

        P1 = [[1, 0, 0, 0],
              [0, 1, 0, 0],
              [0, 0, 1, 0]]  # Проекционная матрица для камеры 1

        P2 = [[1, 0, 0, 1],
              [0, 1, 0, 0],
              [0, 0, 1, 0]]  # Проекционная матрица для камеры 2

        points_3d = []
        estimator = FundamentalMatrixEstimator(None)

        for i in range(len(points1)):
            x1, y1 = points1[i]
            x2, y2 = points2[i]

            # Построение матрицы A для решения гомогенного уравнения AX = 0 для триангуляции
            A = [
                [x1 * P1[2][0] - P1[0][0], x1 * P1[2][1] - P1[0][1], x1 * P1[2][2] - P1[0][2], x1 * P1[2][3] - P1[0][3]],
                [y1 * P1[2][0] - P1[1][0], y1 * P1[2][1] - P1[1][1], y1 * P1[2][2] - P1[1][2], y1 * P1[2][3] - P1[1][3]],
                [x2 * P2[2][0] - P2[0][0], x2 * P2[2][1] - P2[0][1], x2 * P2[2][2] - P2[0][2], x2 * P2[2][3] - P2[0][3]],
                [y2 * P2[2][0] - P2[1][0], y2 * P2[2][1] - P2[1][1], y2 * P2[2][2] - P2[1][2], y2 * P2[2][3] - P2[1][3]]
            ]

            # Использование SVD для решения A * X = 0
            U, S, Vt = estimator.svd(A)
            if Vt is None:
                print("Не удалось выполнить SVD, невозможно триангулировать точку.")
                continue
            X = Vt[-1]
            if X[3] != 0:
                X = [X[i] / X[3] for i in range(4)]  # Нормализация гомогенных координат
                points_3d.append(X[:3])
            else:
                points_3d.append([0, 0, 0])

        return points_3d, P1, P2

# Шаг 6: Создание BMP изображения из 3D точек
def visualize_point_cloud(point_cloud):
    """
    Простейшая визуализация облака точек.
    Параметры:
        point_cloud (list): Данные облака точек в формате [[X, Y, Z], ...]
    """
    if not point_cloud:
        print("Облако точек пусто")
        return

    # Определение диапазона значений в облаке точек
    x_min = min(p[0][0] for p in point_cloud)
    x_max = max(p[0][0] for p in point_cloud)
    y_min = min(p[1][0] for p in point_cloud)
    y_max = max(p[1][0] for p in point_cloud)
    z_min = min(p[2][0] for p in point_cloud)
    z_max = max(p[2][0] for p in point_cloud)

    print("Визуализация облака точек")
    print(f"Диапазон X: от {x_min} до {x_max}")
    print(f"Диапазон Y: от {y_min} до {y_max}")
    print(f"Диапазон Z: от {z_min} до {z_max}")
    print("Часть данных облака точек (не более 300 точек):")
    
    max_points = min(300, len(point_cloud))
    for i, point in enumerate(point_cloud[:max_points]):
        print(f"Точка {i + 1}: X={point[0][0]}, Y={point[1][0]}, Z={point[2][0]}")


def create_bmp_from_points(points_3d, filename, width=800, height=600):
    """
    Сохранение 3D облака точек в виде BMP изображения
    Параметры:
        points_3d (list): Облако 3D точек [[X, Y, Z], ...]
        filename (str): Путь для сохранения BMP файла
        width (int): Ширина изображения
        height (int): Высота изображения
    """
    
    # Проекция 3D точек на 2D плоскость
    projected_points = []
    for point in points_3d:
        x, y, z = point
        projected_points.append((x, y))

    x_values = [pt[0] for pt in projected_points]
    y_values = [pt[1] for pt in projected_points]
    min_x, max_x = min(x_values), max(x_values)
    min_y, max_y = min(y_values), max(y_values)

    scale_x = (width - 20) / (max_x - min_x) if max_x != min_x else 1
    scale_y = (height - 20) / (max_y - min_y) if max_y != min_y else 1
    scale = min(scale_x, scale_y)
    offset_x = -min_x * scale + 10
    offset_y = -min_y * scale + 10

    # Создание пустого изображения
    image = [[[255, 255, 255] for _ in range(width)] for _ in range(height)]

    # Отрисовка точек
    for pt in projected_points:
        x = int(pt[0] * scale + offset_x)
        y = int(pt[1] * scale + offset_y)
        if 0 <= x < width and 0 <= y < height:
            image[height - y - 1][x] = [0, 0, 0]

    save_bmp_image(filename, image)


def save_bmp_image(filename, image):
    """
    Сохранение BMP изображения
    Параметры:
        filename (str): Путь для сохранения
        image (list): Данные изображения
    """
    height = len(image)
    width = len(image[0])
    row_padded = (width * 3 + 3) & (~3)
    padding_size = row_padded - width * 3

    with open(filename, 'wb') as f:
        # Заголовок BMP файла
        f.write(b'BM')  # Идентификатор файла
        file_size = 14 + 40 + row_padded * height
        f.write(file_size.to_bytes(4, byteorder='little'))  # Размер файла
        f.write((0).to_bytes(2, byteorder='little'))  # Зарезервировано
        f.write((0).to_bytes(2, byteorder='little'))  # Зарезервировано
        f.write((14 + 40).to_bytes(4, byteorder='little'))  # Смещение пиксельных данных

        # Заголовок DIB
        f.write((40).to_bytes(4, byteorder='little'))  # Размер заголовка
        f.write(width.to_bytes(4, byteorder='little'))  # Ширина
        f.write(height.to_bytes(4, byteorder='little'))  # Высота
        f.write((1).to_bytes(2, byteorder='little'))  # Число цветовых плоскостей
        f.write((24).to_bytes(2, byteorder='little'))  # Биты на пиксель
        f.write((0).to_bytes(4, byteorder='little'))  # Метод сжатия
        f.write((row_padded * height).to_bytes(4, byteorder='little'))  # Размер изображения
        f.write((0).to_bytes(4, byteorder='little'))  # Горизонтальное разрешение
        f.write((0).to_bytes(4, byteorder='little'))  # Вертикальное разрешение
        f.write((0).to_bytes(4, byteorder='little'))  # Число цветов в палитре
        f.write((0).to_bytes(4, byteorder='little'))  # Важные цвета

        # Запись пиксельных данных
        for row in image:
            for pixel in row:
                b, g, r = pixel
                f.write(bytes([b, g, r]))
            for _ in range(padding_size):
                f.write(b'\x00')



# Главная функция
if __name__ == "__main__":
    import math

    # Список путей к изображениям
    image_paths = [
        r"C:\Users\21214\Desktop\1c1c8068b11215c04ce1547db420785.bmp",
        r"C:\Users\21214\Desktop\f7446d11320c3c0919614de4c68d4ed.bmp",
        r"C:\Users\21214\Desktop\860a098bb87b1236fb9ac2dd50c888c.bmp",
        r"C:\Users\21214\Desktop\dee2d0c86ac1715f6efac92aa42b9bb.bmp",
    ]

    # Загрузка данных изображений
    images = []
    for path in image_paths:
        img = load_image(path)  
        if img is not None:
            images.append(img)
            print(f"Изображение {path} успешно загружено, размер: {len(img[0])}x{len(img)}")
        else:
            print(f"Не удалось загрузить изображение {path}.")
            exit()

    # Списки ключевых точек и дескрипторов
    keypoints_list = []
    descriptors_list = []

    # Обнаружение ключевых точек и дескрипторов для каждого изображения
    for idx, img in enumerate(images):
        detector = KeypointDetector(img, threshold=1e3)
        keypoints, descriptors = detector.detect_keypoints()
        keypoints_list.append(keypoints)
        descriptors_list.append(descriptors)
        print(f"Количество допустимых ключевых точек на изображении {idx+1}: {len(keypoints)}")
        print(f"Количество дескрипторов на изображении {idx+1}: {len(descriptors)}")

    def check_keypoint_distribution(keypoints, image_width, image_height, grid_size=4):
        # Разделение изображения на сетку размером grid_size x grid_size
        cell_width = image_width // grid_size
        cell_height = image_height // grid_size
    
        # Создание сетки для подсчета количества ключевых точек в каждом блоке
        grid = [[0 for _ in range(grid_size)] for _ in range(grid_size)]
    
        # Перебор всех ключевых точек и подсчет количества в каждом блоке
        for x, y in keypoints:
            cell_x = min(x // cell_width, grid_size - 1)  # Предотвращение выхода за пределы
            cell_y = min(y // cell_height, grid_size - 1)
            grid[cell_y][cell_x] += 1
    
        # Проверка распределения ключевых точек
        min_points_per_cell = len(keypoints) // (grid_size * grid_size) * 0.5  
        max_points_per_cell = len(keypoints) // (grid_size * grid_size) * 2.0  
    
        balanced = True
        for i in range(grid_size):
            for j in range(grid_size):
                if grid[i][j] < min_points_per_cell or grid[i][j] > max_points_per_cell:
                    balanced = False
                    print(f"Количество ключевых точек в ячейке ({i}, {j}) равно {grid[i][j]}, не соответствует стандарту.")
    
        if balanced:
            print("Ключевые точки равномерно распределены по изображению.")
        else:
            print("Распределение ключевых точек неравномерное, рассмотрите изменение параметров.")

    # Сопоставление изображений и оценка фундаментальной матрицы
    for i in range(len(images) - 1):
        keypoints1 = keypoints_list[i]
        descriptors1 = descriptors_list[i]
        keypoints2 = keypoints_list[i + 1]
        descriptors2 = descriptors_list[i + 1]

        matcher = FeatureMatcher(keypoints1, descriptors1, keypoints2, descriptors2)
        matches = matcher.match_features()

        print(f"Количество сопоставленных пар точек между изображением {i+1} и изображением {i+2}: {len(matches)}")

        # Пропуск, если недостаточно совпадений
        if len(matches) < 8:
            print("Недостаточно совпадений для оценки фундаментальной матрицы и 3D реконструкции.")
            continue

        # Оценка фундаментальной матрицы и вычисление базовой матрицы
        K = [[980, 0, 630], [0, 980, 630], [0, 0, 1]]  # Внутренние параметры камеры
        estimator = FundamentalAndEssentialMatrixEstimator(
            matches,
            K=K,
            num_iterations=10000,
            inlier_threshold=1.5,
        )
        F = estimator.estimate_fundamental_matrix()

        if F:
            print(f"Фундаментальная матрица для изображений {i+1} и {i+2}:")
            for row in F:
                print(row)

            # Вычисление базовой матрицы
            E = estimator.estimate_essential_matrix(F)
            if E:
                print(f"Базовая матрица для изображений {i+1} и {i+2}:")
                for row in E:
                    print(row)

                # Извлечение положения камеры
                poses = estimator.extract_camera_pose(E)
                if poses is None:
                    print("Не удалось извлечь положение камеры, пропуск текущей пары изображений.")
                    continue
                
                # Проверка и выбор правильного положения камеры
                points1 = [(kp1[0], kp1[1]) for kp1, _, _ in matches]
                points2 = [(kp2[0], kp2[1]) for _, kp2, _ in matches]
                correct_pose = estimator.select_correct_pose(poses, points1, points2)
                
                if correct_pose is None:
                    print("Не найдено правильное положение камеры, пропуск текущей пары изображений.")
                    continue
                    
                if correct_pose:
                    R, t = correct_pose
                    print("Правильное положение камеры:")
                    print("Матрица вращения R:", R)
                    print("Вектор трансляции t:", t)

                    # Выполнение 3D реконструкции
                    points_3d = []
                    for (x1, y1), (x2, y2) in zip(points1, points2):
                        # Преобразование в нормализованные координаты
                        p1 = estimator.matrix_multiply(
                            estimator.matrix_inverse(K), [[x1], [y1], [1]]
                        )
                        p2 = estimator.matrix_multiply(
                            estimator.matrix_inverse(K), [[x2], [y2], [1]]
                        )
                        if p1 and p2:
                            P = estimator.triangulate_point(p1, p2, R, t)
                            if P:
                                points_3d.append([P[0][0], P[1][0], P[2][0]])

                    if points_3d:
                        print(f"3D реконструкция для изображений {i+1} и {i+2} завершена, количество точек: {len(points_3d)}")
                        for idx, X in enumerate(points_3d):
                            print(f"Точка {idx}: X={X[0]}, Y={X[1]}, Z={X[2]}")

                        # Визуализация облака точек
                        print("Визуализация облака точек...")
                        visualize_point_cloud(
                            [[[p[0]], [p[1]], [p[2]]] for p in points_3d]
                        )

                        # Сохранение облака точек в виде BMP
                        bmp_filename = f"pointcloud_{i+1}_{i+2}.bmp"
                        create_bmp_from_points(points_3d, bmp_filename)
                        print(f"Облако точек сохранено в виде BMP: {bmp_filename}")
                    else:
                        print("Не удалось выполнить 3D реконструкцию.")
                else:
                    print("Не найдено правильное положение камеры.")
            else:
                print("Не удалось вычислить базовую матрицу.")
        else:
            print("Не удалось оценить фундаментальную матрицу.")

# Генерация случайных данных облака точек
point_cloud = [[[random.randint(0, 500)], [random.randint(0, 500)], [random.randint(0, 500)]] for _ in range(500)]

visualize_point_cloud(point_cloud)
create_bmp_from_points(
    [[p[0][0], p[1][0], p[2][0]] for p in point_cloud], "example_pointcloud.bmp"
)
print("Пример облака точек сохранен в BMP изображение: example_pointcloud.bmp")






图像 C:\Users\21214\Desktop\1c1c8068b11215c04ce1547db420785.bmp 加载成功，尺寸：1260x1260
图像 C:\Users\21214\Desktop\f7446d11320c3c0919614de4c68d4ed.bmp 加载成功，尺寸：1260x1260
图像 C:\Users\21214\Desktop\860a098bb87b1236fb9ac2dd50c888c.bmp 加载成功，尺寸：1260x1260
图像 C:\Users\21214\Desktop\dee2d0c86ac1715f6efac92aa42b9bb.bmp 加载成功，尺寸：1260x1260
有效关键点数量：5000
图像 1 的有效关键点数量：5000
图像 1 的描述符数量：5000
有效关键点数量：5000
图像 2 的有效关键点数量：5000
图像 2 的描述符数量：5000
有效关键点数量：5000
图像 3 的有效关键点数量：5000
图像 3 的描述符数量：5000
有效关键点数量：5000
图像 4 的有效关键点数量：5000
图像 4 的描述符数量：5000
匹配数量：4271
图像 1 和 图像 2 匹配的特征点对数：4271
RANSAC 最佳模型的内点数量：3430
图像 1 和 图像 2 的基础矩阵 F：
[2.6012947180067903e-06, -5.217093106224484e-07, -0.0010730025655573691]
[-1.2514027627517836e-07, 4.0559807825107845e-07, -0.0001955758163512702]
[-0.0018625647099486636, 1.687920812499452e-05, 1.0]
图像 1 和 图像 2 的本质矩阵 E：
[0.9525126971830876, -0.8643664682997314, 0.25016762074405074]
[0.04047072159708024, 0.30631363057723315, -0.04379871796975714]
[-0.14012508454116798, 0.019563540832832446, -0.01973107