In [None]:
import openai
import os
import pandas as pd
import ast

In [None]:
client = openai.OpenAI(api_key = "")

In [None]:
def get_embedding(text):
    response = client.embeddings.create(
        input=text,
        model='text-embedding-ada-002'
    )
    return response.data[0].embedding

In [None]:
# folder_path와 file_name을 결합하여 file_path = './data/embedding.csv'
folder_path = './data'
file_path = './data/embedding.csv'

# if: embedding.csv가 이미 존재한다면 데이터프레임 df로 로드한다.
if os.path.isfile(file_path):
    df = pd.read_csv(file_path)
    df['embedding'] = df['embedding'].apply(ast.literal_eval)

# 그렇지 않다면 text열과 embedding열이 존재하는 df를 신규 생성해야한다.
else:
    # 서울 청년 정책 txt 파일명을 txt_files에 저장한다.
    txt_files = [file for file in os.listdir(folder_path) if file.endswith('.txt')]

    data = []
    # txt_files로부터 청년 정책 데이터를 로드하여 df를 신규 생성한다.
    for file in txt_files:
        file_path = os.path.join(folder_path, file)
        with open(file_path, 'r', encoding='utf-8') as f:
            text = f.read()
            data.append(text)

    df = pd.DataFrame(data, columns=['text'])

    # 데이터프레임의 text 열로부터 embedding열을 생성한다.
    df['embedding'] = df.apply(lambda row: get_embedding(
        row.text,
    ), axis=1)

    # 추후 사용을 위해 df를 'embedding.csv' 파일로 저장한다.
    # 이렇게 저장되면 추후 실행에서는 df를 새로 만드는 과정을 생략한다.
    df.to_csv('./data/embedding.csv', index=False, encoding='utf-8')

df

Unnamed: 0,text,embedding
0,정책 이름 : 청년예술지원\n서울시청 문화예술과에서는 청년 예술인들을 위한 프로그램...,"[0.00507919117808342, -0.011912347748875618, 0..."
1,정책이름: 청년활력 프로그램 운영(청년활동지원센터 운영)\n서울시청 미래청년기획단에...,"[-0.0029026188421994448, -0.000854346319101750..."
2,정책제목: 서울시 청년허브 운영\n서울시청 미래청년기획단에서 주최하는 사회참여 정책...,"[0.00030871693161316216, -0.015466758981347084..."
3,서울시 미래청년기획단에서 주최하는 마음건강 정책은 청년들의 마음건강 증진을 위해 일...,"[0.006030500866472721, 0.0018328320002183318, ..."
4,정책제목: 서울시 청년부상제대군인지원사업\n서울시청 복지정책과에서 주최하는 신체건강...,"[0.006674320437014103, -0.000539932050742209, ..."
5,정책제목: 서울시 가족돌봄청년 지원사업\n서울시 복지정책과에서 주최하는 마음건강 정...,"[-0.008335916325449944, 0.0008343437220901251,..."
6,정책제목: 서울시 고립ㆍ은둔청년 지원사업\n\n서울시청 미래청년기획단에서 주최하는 ...,"[0.005923017859458923, -0.006003194022923708, ..."
7,"정책 제목: 독립유공자후손장학금\n서울시 교육정책과에서 주관하는 교육 정책으로, 독...","[0.0012183372164145112, -0.011429676786065102,..."
8,"정책이름: 서울희망공익인재장학금\n서울시 교육정책과에서 주관하는 교육 정책으로, 공...","[-0.00952510442584753, -0.005954008549451828, ..."
9,정책이름: 서울희망 직업전문학교 장학금\n서울시 교육정책과에서 주관하는 교육 정책으...,"[0.003617602866142988, -0.005877786781638861, ..."
