## 얼굴 인식을 위한 라이브러리 설치

In [None]:
!pip install face_recognition
!pip install opencv-python




In [None]:
import face_recognition
import cv2
import numpy as np
import os

# CUDA를 사용하지 않도록 설정
import dlib
dlib.DLIB_USE_CUDA = True


In [None]:
!pip install pandas # csv 파일 만들기 위한 pandas 설치



In [None]:
!pip install deepface # 얼굴 인식을 위한 deepface 라이브러리 설치

Collecting deepface
  Downloading deepface-0.0.92-py3-none-any.whl (105 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/105.5 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m105.5/105.5 kB[0m [31m3.3 MB/s[0m eta [36m0:00:00[0m
Collecting mtcnn>=0.1.0 (from deepface)
  Downloading mtcnn-0.1.1-py3-none-any.whl (2.3 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.3/2.3 MB[0m [31m60.2 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting retina-face>=0.0.1 (from deepface)
  Downloading retina_face-0.0.17-py3-none-any.whl (25 kB)
Collecting fire>=0.4.0 (from deepface)
  Downloading fire-0.6.0.tar.gz (88 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m88.4/88.4 kB[0m [31m17.2 MB/s[0m eta [36m0:00:00[0m
[?25h  Preparing metadata (setup.py) ... [?25l[?25hdone
Collecting gunicorn>=20.1.0 (from deepface)
  Downloading gunicorn-22.0.0-py3-none-any.whl (84 kB)
[2K    

## face_recognition 라이브러리 이용하여 유사도 계산
### 유사도 높은 남녀 / 유사도 낮은 남녀 매칭
가장 유사도가 낮은 사람에 모두 외국인 여성 8,9번이 매칭되는 문제 발생.

In [None]:
import os
import face_recognition

# 이미지 폴더 경로
image_folder = '/content/drive/MyDrive/images_3'

# 남자와 여자 이미지 파일명 리스트 생성
male_files = [f'{i}_M.jpeg' for i in range(1, 33)]
female_files = [f'{i}_F.jpeg' for i in range(1, 23)]

# 이미지 파일 경로 확인
all_files = male_files + female_files
missing_files = [file for file in all_files if not os.path.exists(os.path.join(image_folder, file))]

if missing_files:
    print("다음 파일들이 존재하지 않습니다:")
    for file in missing_files:
        print(file)
else:
    print("모든 파일이 존재합니다.")

# 얼굴 인코딩을 저장할 딕셔너리
male_encodings = {}
female_encodings = {}

# 남자 얼굴 인코딩
for file in male_files:
    img_path = os.path.join(image_folder, file)
    image = face_recognition.load_image_file(img_path)
    encoding = face_recognition.face_encodings(image)
    if encoding:
        male_encodings[file] = encoding[0]

# 여자 얼굴 인코딩
for file in female_files:
    img_path = os.path.join(image_folder, file)
    image = face_recognition.load_image_file(img_path)
    encoding = face_recognition.face_encodings(image)
    if encoding:
        female_encodings[file] = encoding[0]

# 모든 남자 이미지 대상으로 비교
for target_male in male_files:
    target_encoding = male_encodings.get(target_male)
    if target_encoding is None:
        print(f"{target_male}의 얼굴 인코딩을 찾을 수 없습니다.")
        continue

    # 유사도 계산
    similarities = {}
    for female, encoding in female_encodings.items():
        distance = face_recognition.face_distance([target_encoding], encoding)[0]
        similarities[female] = distance

    # 가장 유사한 사람과 가장 유사하지 않은 사람 찾기
    most_similar = min(similarities, key=similarities.get)
    least_similar = max(similarities, key=similarities.get)

    print(f"남자 {target_male}와 가장 유사한 사람: {most_similar} (유사도: {similarities[most_similar]})")
    print(f"남자 {target_male}와 가장 유사하지 않은 사람: {least_similar} (유사도: {similarities[least_similar]})")


모든 파일이 존재합니다.
남자 1_M.jpeg와 가장 유사한 사람: 17_F.jpeg (유사도: 0.432739059668433)
남자 1_M.jpeg와 가장 유사하지 않은 사람: 8_F.jpeg (유사도: 0.8653470364954269)
남자 2_M.jpeg와 가장 유사한 사람: 1_F.jpeg (유사도: 0.41918852835283255)
남자 2_M.jpeg와 가장 유사하지 않은 사람: 8_F.jpeg (유사도: 0.927281946777246)
남자 3_M.jpeg와 가장 유사한 사람: 18_F.jpeg (유사도: 0.5991096672419246)
남자 3_M.jpeg와 가장 유사하지 않은 사람: 8_F.jpeg (유사도: 0.7985422227422773)
남자 4_M.jpeg와 가장 유사한 사람: 14_F.jpeg (유사도: 0.44046454775016375)
남자 4_M.jpeg와 가장 유사하지 않은 사람: 8_F.jpeg (유사도: 0.8304519627676109)
남자 5_M.jpeg와 가장 유사한 사람: 6_F.jpeg (유사도: 0.48957097649847975)
남자 5_M.jpeg와 가장 유사하지 않은 사람: 8_F.jpeg (유사도: 0.9693151431909157)
남자 6_M.jpeg와 가장 유사한 사람: 18_F.jpeg (유사도: 0.46705589417520305)
남자 6_M.jpeg와 가장 유사하지 않은 사람: 9_F.jpeg (유사도: 0.8455235995084854)
남자 7_M.jpeg와 가장 유사한 사람: 1_F.jpeg (유사도: 0.46829620554354656)
남자 7_M.jpeg와 가장 유사하지 않은 사람: 9_F.jpeg (유사도: 0.8895220010381261)
8_M.jpeg의 얼굴 인코딩을 찾을 수 없습니다.
9_M.jpeg의 얼굴 인코딩을 찾을 수 없습니다.
남자 10_M.jpeg와 가장 유사한 사람: 1_F.jpeg (유사도: 0.43888959861384685)
남자 10_

### 유사도 높은 남녀 / 유사도 낮은 남녀 매칭

가장 유사도가 낮은 매칭에 외국인 여성 8, 9번이 모두 매칭되는 문제를 해결하기 위해 8,9번을 제외하고 실험해봄.

하나의 값이 중복되는 경우는 줄었지만 여전히 중복값 존재.

In [None]:
import os
import face_recognition

# 이미지 폴더 경로
image_folder = '/content/drive/MyDrive/images_3'

# 남자와 여자 이미지 파일명 리스트 생성
male_files = [f'{i}_M.jpeg' for i in range(1, 33)]
female_files = [f'{i}_F.jpeg' for i in range(1, 23) if i not in [8, 9]]

# 이미지 파일 경로 확인
all_files = male_files + female_files
missing_files = [file for file in all_files if not os.path.exists(os.path.join(image_folder, file))]

if missing_files:
    print("다음 파일들이 존재하지 않습니다:")
    for file in missing_files:
        print(file)
else:
    print("모든 파일이 존재합니다.")

# 얼굴 인코딩을 저장할 딕셔너리
male_encodings = {}
female_encodings = {}

# 남자 얼굴 인코딩
for file in male_files:
    img_path = os.path.join(image_folder, file)
    image = face_recognition.load_image_file(img_path)
    encoding = face_recognition.face_encodings(image)
    if encoding:
        male_encodings[file] = encoding[0]

# 여자 얼굴 인코딩
for file in female_files:
    img_path = os.path.join(image_folder, file)
    image = face_recognition.load_image_file(img_path)
    encoding = face_recognition.face_encodings(image)
    if encoding:
        female_encodings[file] = encoding[0]

# 모든 남자 이미지 대상으로 비교
for target_male in male_files:
    target_encoding = male_encodings.get(target_male)
    if target_encoding is None:
        print(f"{target_male}의 얼굴 인코딩을 찾을 수 없습니다.")
        continue

    # 유사도 계산
    similarities = {}
    for female, encoding in female_encodings.items():
        distance = face_recognition.face_distance([target_encoding], encoding)[0]
        similarities[female] = distance

    # 가장 유사한 사람과 가장 유사하지 않은 사람 찾기
    most_similar = min(similarities, key=similarities.get)
    least_similar = max(similarities, key=similarities.get)

    print(f"남자 {target_male}와 가장 유사한 사람: {most_similar} (유사도: {similarities[most_similar]})")
    print(f"남자 {target_male}와 가장 유사하지 않은 사람: {least_similar} (유사도: {similarities[least_similar]})")


모든 파일이 존재합니다.
남자 1_M.jpeg와 가장 유사한 사람: 17_F.jpeg (유사도: 0.432739059668433)
남자 1_M.jpeg와 가장 유사하지 않은 사람: 14_F.jpeg (유사도: 0.6421776415884894)
남자 2_M.jpeg와 가장 유사한 사람: 1_F.jpeg (유사도: 0.41918852835283255)
남자 2_M.jpeg와 가장 유사하지 않은 사람: 13_F.jpeg (유사도: 0.6133092081726357)
남자 3_M.jpeg와 가장 유사한 사람: 18_F.jpeg (유사도: 0.5991096672419246)
남자 3_M.jpeg와 가장 유사하지 않은 사람: 21_F.jpeg (유사도: 0.7257604818954753)
남자 4_M.jpeg와 가장 유사한 사람: 14_F.jpeg (유사도: 0.44046454775016375)
남자 4_M.jpeg와 가장 유사하지 않은 사람: 15_F.jpeg (유사도: 0.5962499954656073)
남자 5_M.jpeg와 가장 유사한 사람: 6_F.jpeg (유사도: 0.48957097649847975)
남자 5_M.jpeg와 가장 유사하지 않은 사람: 19_F.jpeg (유사도: 0.625339107710842)
남자 6_M.jpeg와 가장 유사한 사람: 18_F.jpeg (유사도: 0.46705589417520305)
남자 6_M.jpeg와 가장 유사하지 않은 사람: 15_F.jpeg (유사도: 0.6830558599724508)
남자 7_M.jpeg와 가장 유사한 사람: 1_F.jpeg (유사도: 0.46829620554354656)
남자 7_M.jpeg와 가장 유사하지 않은 사람: 14_F.jpeg (유사도: 0.6105120015296661)
8_M.jpeg의 얼굴 인코딩을 찾을 수 없습니다.
9_M.jpeg의 얼굴 인코딩을 찾을 수 없습니다.
남자 10_M.jpeg와 가장 유사한 사람: 1_F.jpeg (유사도: 0.43888959861384685)

### 유사도가 높은 남녀 매칭_중복없음

원활한 데이트 매칭을 위해, 한명이 하나 이상의 매칭에 중복되지 않도록 코드 수정.

In [None]:
import os
import face_recognition

# 이미지 폴더 경로
image_folder = '/content/drive/MyDrive/images_3'


# 남자와 여자 이미지 파일명 리스트 생성
male_files = [f'{i}_M.jpeg' for i in range(1, 33)]
female_files = [f'{i}_F.jpeg' for i in range(1, 23)]

# 이미지 파일 경로 확인
all_files = male_files + female_files
missing_files = [file for file in all_files if not os.path.exists(os.path.join(image_folder, file))]

if missing_files:
    print("다음 파일들이 존재하지 않습니다:")
    for file in missing_files:
        print(file)
else:
    print("모든 파일이 존재합니다.")

# 얼굴 인코딩을 저장할 딕셔너리
male_encodings = {}
female_encodings = {}

# 남자 얼굴 인코딩
for file in male_files:
    img_path = os.path.join(image_folder, file)
    image = face_recognition.load_image_file(img_path)
    encoding = face_recognition.face_encodings(image)
    if encoding:
        male_encodings[file] = encoding[0]

# 여자 얼굴 인코딩
for file in female_files:
    img_path = os.path.join(image_folder, file)
    image = face_recognition.load_image_file(img_path)
    encoding = face_recognition.face_encodings(image)
    if encoding:
        female_encodings[file] = encoding[0]

# 모든 남자와 여자 간의 거리 계산
distances = []
for male, male_encoding in male_encodings.items():
    for female, female_encoding in female_encodings.items():
        distance = face_recognition.face_distance([male_encoding], female_encoding)[0]
        distances.append((male, female, distance))

# 거리 기준으로 정렬 (거리가 작은 순서대로)
distances.sort(key=lambda x: x[2])

# 매칭 결과와 이미 매칭된 남녀를 추적할 집합
matches = []
matched_males = set()
matched_females = set()

# 거리 순서대로 매칭 수행
for male, female, distance in distances:
    if male not in matched_males and female not in matched_females:
        matches.append((male, female, distance))
        matched_males.add(male)
        matched_females.add(female)
    # 모든 남성과 여성이 매칭되면 종료
    if len(matched_males) == len(male_encodings) or len(matched_females) == len(female_encodings):
        break

# 매칭 결과 출력
for male, female, distance in matches:
    print(f"남자 {male}와 여자 {female} 매칭 (거리: {distance})")

모든 파일이 존재합니다.
남자 27_M.jpeg와 여자 21_F.jpeg 매칭 (거리: 0.38403525006823463)
남자 15_M.jpeg와 여자 1_F.jpeg 매칭 (거리: 0.3885018282052957)
남자 1_M.jpeg와 여자 17_F.jpeg 매칭 (거리: 0.432739059668433)
남자 23_M.jpeg와 여자 6_F.jpeg 매칭 (거리: 0.4365608736550224)
남자 18_M.jpeg와 여자 20_F.jpeg 매칭 (거리: 0.43753287009046965)
남자 4_M.jpeg와 여자 14_F.jpeg 매칭 (거리: 0.44046454775016375)
남자 16_M.jpeg와 여자 15_F.jpeg 매칭 (거리: 0.4521344388080061)
남자 10_M.jpeg와 여자 12_F.jpeg 매칭 (거리: 0.458235162582762)
남자 22_M.jpeg와 여자 7_F.jpeg 매칭 (거리: 0.46678751669638263)
남자 6_M.jpeg와 여자 18_F.jpeg 매칭 (거리: 0.46705589417520305)
남자 2_M.jpeg와 여자 4_F.jpeg 매칭 (거리: 0.4675173041882859)
남자 30_M.jpeg와 여자 11_F.jpeg 매칭 (거리: 0.4782378984053563)
남자 19_M.jpeg와 여자 19_F.jpeg 매칭 (거리: 0.4833208296294276)
남자 12_M.jpeg와 여자 22_F.jpeg 매칭 (거리: 0.4848898162439117)
남자 25_M.jpeg와 여자 10_F.jpeg 매칭 (거리: 0.5221648333734169)
남자 29_M.jpeg와 여자 16_F.jpeg 매칭 (거리: 0.5294591073051343)
남자 26_M.jpeg와 여자 13_F.jpeg 매칭 (거리: 0.5626413797840967)
남자 24_M.jpeg와 여자 8_F.jpeg 매칭 (거리: 0.7270764661894039)
남자

## Deepface 라이브러리를 활용한 유사도 계산

In [None]:
distances = []
for male, male_encoding in male_encodings.items():
    for female, female_encoding in female_encodings.items():
        distance = face_recognition.face_distance([male_encoding], female_encoding)[0]
        distances.append((male, female, distance))

# 거리 기준으로 정렬 (거리가 작은 순서대로)
distances.sort(key=lambda x: x[2], reverse=True)

# 매칭 결과와 이미 매칭된 남녀를 추적할 집합
matches = []
matched_males = set()
matched_females = set()

# 거리 순서대로 매칭 수행
for male, female, distance in distances:
    if male not in matched_males and female not in matched_females:
        matches.append((male, female, distance))
        matched_males.add(male)
        matched_females.add(female)
    # 모든 남성과 여성이 매칭되면 종료
    if len(matched_males) == len(male_encodings) or len(matched_females) == len(female_encodings):
        break

# 매칭 결과 출력
for male, female, distance in matches:
    print(f"남자 {male}와 여자 {female} 매칭 (거리: {distance})")

남자 23_M.jpeg와 여자 9_F.jpeg 매칭 (거리: 18.647097078708608)
남자 2_M.jpeg와 여자 8_F.jpeg 매칭 (거리: 17.234977847436085)
남자 3_M.jpeg와 여자 22_F.jpeg 매칭 (거리: 14.451637562323622)
남자 8_M.jpeg와 여자 7_F.jpeg 매칭 (거리: 14.3850636933572)
남자 6_M.jpeg와 여자 20_F.jpeg 매칭 (거리: 13.949519971389464)
남자 1_M.jpeg와 여자 14_F.jpeg 매칭 (거리: 13.596740057865047)
남자 16_M.jpeg와 여자 6_F.jpeg 매칭 (거리: 12.878639636552172)
남자 14_M.jpeg와 여자 13_F.jpeg 매칭 (거리: 12.625111508688661)
남자 15_M.jpeg와 여자 18_F.jpeg 매칭 (거리: 11.895159551513343)
남자 18_M.jpeg와 여자 15_F.jpeg 매칭 (거리: 11.872096843634134)
남자 26_M.jpeg와 여자 1_F.jpeg 매칭 (거리: 10.658648412213033)
남자 31_M.jpeg와 여자 11_F.jpeg 매칭 (거리: 9.95670627408424)
남자 19_M.jpeg와 여자 4_F.jpeg 매칭 (거리: 9.794089778742975)
남자 10_M.jpeg와 여자 2_F.jpeg 매칭 (거리: 9.468234745190552)
남자 21_M.jpeg와 여자 16_F.jpeg 매칭 (거리: 5.519047694734929)
남자 7_M.jpeg와 여자 21_F.jpeg 매칭 (거리: 5.468338332807378)
남자 5_M.jpeg와 여자 10_F.jpeg 매칭 (거리: 4.310535237728313)


## 유사도 계산 후, CSV 파일로 결과 저장하기

In [None]:

import os
import pandas as pd
import face_recognition

# 이미지 폴더 경로
image_folder = '/content/drive/MyDrive/images_3'

# 남자와 여자 이미지 파일명 리스트 생성
male_files = [f'{i}_M.jpeg' for i in range(1, 33)]
female_files = [f'{i}_F.jpeg' for i in range(1, 23)]

# 이미지 파일 경로 확인
all_files = male_files + female_files
missing_files = [file for file in all_files if not os.path.exists(os.path.join(image_folder, file))]

if missing_files:
    print("다음 파일들이 존재하지 않습니다:")
    for file in missing_files:
        print(file)
else:
    print("모든 파일이 존재합니다.")

# 얼굴 인코딩을 저장할 딕셔너리
male_encodings = {}
female_encodings = {}

# 남자 얼굴 인코딩
for file in male_files:
    img_path = os.path.join(image_folder, file)
    image = face_recognition.load_image_file(img_path)
    encoding = face_recognition.face_encodings(image)
    if encoding:
        male_encodings[file] = encoding[0]

# 여자 얼굴 인코딩
for file in female_files:
    img_path = os.path.join(image_folder, file)
    image = face_recognition.load_image_file(img_path)
    encoding = face_recognition.face_encodings(image)
    if encoding:
        female_encodings[file] = encoding[0]

# 결과를 저장할 데이터프레임 생성
columns = ['Female'] + male_files
results_df = pd.DataFrame(columns=columns)

# 각 여성을 32명의 남자와 비교하여 유사도 값을 계산하고 데이터프레임에 추가
for female, female_encoding in female_encodings.items():
    distances = {'Female': female}
    for male, male_encoding in male_encodings.items():
        distance = face_recognition.face_distance([male_encoding], female_encoding)[0]
        distances[male] = distance
    results_df = pd.concat([results_df, pd.DataFrame([distances])], ignore_index=True)

# 결과를 CSV 파일로 저장
results_df.to_csv('face_comparison_results.csv', index=False)
print("결과가 face_comparison_results.csv 파일에 저장되었습니다.")



모든 파일이 존재합니다.
결과가 face_comparison_results.csv 파일에 저장되었습니다.


### CSV 파일을 읽어서 최대값과 최소값 찾기

In [None]:
import pandas as pd

# CSV 파일 읽기
df = pd.read_csv('/content/face_comparison_results.csv', sep='\t')

# Female 행들만 추출
female_rows = df.iloc[1:, :]

# 결과를 저장할 딕셔너리
results = {}

# 각 행에서 최대값과 최소값을 찾고 겹치지 않도록 조정
for index, row in female_rows.iterrows():
    row_data = row[1:].dropna().astype(float)  # 첫 번째 컬럼은 이미지 이름이므로 제외

    # NaN 값을 무시하고 최대값과 최소값의 인덱스를 찾기
    if not row_data.empty:
        max_val = row_data.max()
        min_val = row_data.min()

        # 최대값과 최소값의 인덱스를 찾기
        max_idx = row_data.idxmax()
        min_idx = row_data.idxmin()

        # 겹치지 않도록 최대값과 최소값 조정
        for other_index, other_row in female_rows.iterrows():
            if other_index == index:
                continue
            other_data = other_row[1:].dropna().astype(float)
            if not other_data.empty:
                if max_val == other_data.max():
                    row_data.drop(max_idx, inplace=True)
                    if not row_data.empty:
                        max_val = row_data.max()
                        max_idx = row_data.idxmax()
                    else:
                        max_val = None
                        max_idx = None
                if min_val == other_data.min():
                    row_data.drop(min_idx, inplace=True)
                    if not row_data.empty:
                        min_val = row_data.min()
                        min_idx = row_data.idxmin()
                    else:
                        min_val = None
                        min_idx = None

        # 결과 저장
        results[row[0]] = {'max': (max_idx, max_val), 'min': (min_idx, min_val)}
    else:
        results[row[0]] = {'max': (None, None), 'min': (None, None)}

# 결과 출력
for female, values in results.items():
    max_col, max_val = values['max']
    min_col, min_val = values['min']
    print(f"{female}: 최대값 - {max_val} (컬럼: {max_col}), 최소값 - {min_val} (컬럼: {min_col})")



4_F.jpeg,0.5625850637183426,0.4675173041882859,0.6477504050939262,0.529279125703613,0.5784796712510802,0.5668478405665237,0.5523009326311369,,,0.5278265300553353,,0.5350534907774163,0.7291798846587569,0.5605398708018408,0.49835769403694796,0.5759964969540938,0.6621506442672068,0.5138731074761806,0.5342885416863633,,,0.5462124851918638,0.5381735459964104,0.6756919695993202,0.5349429387761441,0.5925691551989943,0.4988883900382493,,0.5575324546426964,0.5540883421559654,,: 최대값 - None (컬럼: None), 최소값 - None (컬럼: None)
6_F.jpeg,0.48983886258954606,0.5126492095238753,0.638253579714369,0.5157785600011079,0.48957097649847975,0.6297547637091386,0.5224555579115986,,,0.4921957363599714,,0.5441041217697404,0.6975705314739532,0.5332177726166936,0.5128701092943889,0.584631344138958,0.5520289153276092,0.49276412492677346,0.5244503691419217,,,0.5178469573933767,0.4365608736550224,0.6483361579813159,0.519516127636214,0.6111767158899488,0.4529346702887254,,0.5690933892981392,0.5803791517192516,,: 최대값 - N