In [None]:
# 임베딩 테스트를 위한 예시 문장
short_sentences = [
    "겨울에는 따뜻한 옷을 입는다.",
    "추운날은 두꺼운 외투가 필요하다.",
    "인공지능은 기술 발전의 부산물이다.",
    "AI는 인류에게 유용한 기술이다.",
    "AI는 인류에게 쓸모없는 기술이다.",
    "패스트캠퍼스 강의는 유용하다.",
]

long_sentences = [
    "겨울이 되면 눈이 내려서 거리가 하얗게 변하고 사람들은 따뜻한 옷을 입는다.",
    "하얀 눈이 내리면서 도시가 은빛 세상으로 변하고, 사람들은 두꺼운 외투를 입는다.",
    "인공지능은 과학 기술의 진보, 데이터 처리 능력의 향상, 그리고 복잡한 문제 해결을 위한 새로운 접근 방식의 필요성이 결합된 결과이다.",
    "인공지능은 단순히 기술의 발전을 넘어서 인류의 삶을 개선하고, 더 나은 미래를 구축하는 데 필수적인 역할을 하고 있다.",
    "인공지능은 인류에게 잠재적인 위험 요소를 내포하는 기술로, 그 사용과 발전에 있어 신중한 접근이 필요하다.",
    "패스트캠퍼스의 강의는 실무 중심의 커리큘럼을 제공하여, 현업에서 바로 활용할 수 있는 실용적인 지식과 기술을 습득할 수 있다"
]

all_sentences = short_sentences + long_sentences

all_sentences

In [None]:
# 시각화를 위한 라이브러리 import
import matplotlib.pyplot as plt
import seaborn as sns

In [None]:
# Sentence Transformer를 통해 모델을 로드하고 문장들을 벡터로 인코딩합니다
from sentence_transformers import SentenceTransformer, util

model = SentenceTransformer("BAAI/bge-m3")
sb_vectors = model.encode(all_sentences)

# 문장 벡터들 간의 코사인 유사도를 계산합니다
sb_short_similarities = util.cos_sim(sb_vectors[:6], sb_vectors[:6])
sb_long_similarities = util.cos_sim(sb_vectors[6:], sb_vectors[6:])
sb_similarities = util.cos_sim(sb_vectors, sb_vectors)

In [None]:
# 유사도 행렬의 히트맵을 시각화합니다 (short sentences)
plt.figure(figsize=(10, 8))
sns.heatmap(sb_short_similarities, annot=True, cmap='coolwarm')
plt.title("Sentence BERT Sentence Embedding Similarity Heatmap")
plt.xlabel("Sentence Index")
plt.ylabel("Sentence Index")
plt.show()

In [None]:
import torch
import gc
import ctypes

def force_memory_cleanup():
    """강력한 메모리 정리"""
    # Python 가비지 컬렉션
    gc.collect()
    
    # PyTorch CUDA 캐시 정리
    if torch.cuda.is_available():
        torch.cuda.empty_cache()
        torch.cuda.ipc_collect()
        torch.cuda.synchronize()
    
    # 시스템 메모리 압축 (Linux)
    try:
        with open('/proc/sys/vm/drop_caches', 'w') as f:
            f.write('3')  # 모든 캐시 삭제 (root 권한 필요)
    except:
        pass
    
    print("메모리 정리 시도 완료")

# 실행
force_memory_cleanup()

In [None]:
import torch
print(torch._C._GLIBCXX_USE_CXX11_ABI)