In [None]:
import os
import pandas as pd

# 데이터셋 다운로드 및 압축 해제
def download_and_extract_dailydialog():
    if not os.path.exists('DailyDialog'):
        os.system('wget http://yanran.li/files/ijcnlp_dailydialog.zip')
        os.system('unzip ijcnlp_dailydialog.zip -d DailyDialog')

# 데이터셋 로드
def load_dataset(file_path):
    data = pd.read_csv(file_path, delimiter='\t', names=['text'])
    return data

# 다운로드 및 압축 해제
download_and_extract_dailydialog()

# 데이터셋 로드
dataset_path = '/content/DailyDialog/ijcnlp_dailydialog/dialogues_text.txt'
data = load_dataset(dataset_path)

# 데이터셋 출력
data.head()

Unnamed: 0,text
0,The kitchen stinks . __eou__ I'll throw out th...
1,"So Dick , how about getting some coffee for to..."
2,Are things still going badly with your housegu...
3,Would you mind waiting a while ? __eou__ Well ...
4,Are you going to the annual party ? I can give...


In [None]:
# 데이터 정규화
def normalize_text(text):
    text = text.lower()
    text = re.sub(r'\s+', ' ', text)
    text = re.sub(r'[^\w\s]', '', text)
    return text

# 토큰화
def tokenize_text(text):
    return text.split()

# NER 모델 로드
nlp = spacy.load('en_core_web_sm')

def detect_sensitive_info(text):
    doc = nlp(text)
    entities = [(ent.text, ent.label_) for ent in doc.ents]
    return entities

# 마스킹 처리
def mask_sensitive_info(text):
    entities = detect_sensitive_info(text)
    for entity, label in entities:
        text = text.replace(entity, '[MASK]')
    return text

정규화된 텍스트 (Normalized text):
입력 텍스트를 소문자로 변환하고 불필요한 구두점을 제거.

In [None]:
# 테스트 데이터
sample_text = "John Doe's phone number is 123-456-7890 and he lives in New York."

# 데이터 정규화
normalized_text = normalize_text(sample_text)
print("Normalized text:")
print(normalized_text)

Normalized text:
john does phone number is 1234567890 and he lives in new york


토큰화된 텍스트 (Tokenized text):
정규화된 텍스트를 단어 단위로 분할

In [None]:
# 토큰화
tokenized_text = tokenize_text(normalized_text)
print("\nTokenized text:")
print(tokenized_text)


Tokenized text:
['john', 'does', 'phone', 'number', 'is', '1234567890', 'and', 'he', 'lives', 'in', 'new', 'york']


탐지된 민감 정보 (Detected sensitive information):
NER 모델을 사용하여 텍스트에서 민감 정보를 탐지

In [None]:
# 민감 정보 탐지
entities = detect_sensitive_info(sample_text)
print("\nDetected sensitive information:")
print(entities)


Detected sensitive information:
[("John Doe's", 'PERSON'), ('123', 'CARDINAL'), ('New York', 'GPE')]


마스킹된 텍스트 (Masked text):

"[MASK]'s phone number is [MASK] and he lives in [MASK]."

In [None]:
# 민감 정보 마스킹
masked_text = mask_sensitive_info(sample_text)
print("\nMasked text:")
print(masked_text)


Masked text:
[MASK] phone number is [MASK]-456-7890 and he lives in [MASK].


강화학습 환경을 설정하여 프라이버시 보호 수준에 따라 보상을 받도록 함.

상태 (State):

self.state: 현재 대화 상태 및 민감 정보 탐지 상태 간단히 0과 1로 표현
0: 민감 정보가 탐지되지 않은 상태.
1: 민감 정보가 탐지된 상태.
행동 (Action):

self.action_space: 두 가지 행동(마스킹 수준).
0: Low masking (낮은 수준의 마스킹).
1: High masking (높은 수준의 마스킹).
보상 (Reward):

reward: 각 행동에 따른 보상을 정의
0.9: 높은 수준의 마스킹을 적용했을 때 주어지는 보상.
0.7: 낮은 수준의 마스킹을 적용했을 때 주어지는 보상.
환경 초기화 (Reset):

reset(): 환경을 초기 상태로 리셋 state = 0으로 설정
환경 단계 (Step):

step(action): 주어진 행동(action)을 취한 후의 상태, 보상, 종료 여부를 반환.
done = True: 한 번의 행동 후 에피소드가 종료

In [None]:
# 강화학습 환경 설정
class PrivacyEnv(gym.Env):
    def __init__(self):
        super(PrivacyEnv, self).__init__()
        self.action_space = gym.spaces.Discrete(2)  # 예: 0: Low masking, 1: High masking
        self.observation_space = gym.spaces.Discrete(2)  # 예: 0: No sensitive info, 1: Sensitive info

    def reset(self):
        self.state = 0
        return self.state

    def step(self, action):
        if action == 1:
            reward = 0.9  # High masking
        else:
            reward = 0.7  # Low masking
        self.state = 1 if action == 1 else 0
        done = True
        return self.state, reward, done, {}

env = PrivacyEnv()

Q-learning 알고리즘을 사용하여 프라이버시 보호와 대화 품질 간의 최적 균형을 찾음

table 초기화:

q_table = np.zeros([env.observation_space.n, env.action_space.n]): Q-table을 상태와 행동의 크기에 맞게 0으로 초기화.
에피소드 반복 (num_episodes):

for episode in range(num_episodes): 지정된 횟수(num_episodes)만큼 에피소드를 반복.
상태 초기화:

state = env.reset(): 환경을 초기화하고 초기 상태를 설정합니다.
행동 선택 (Action Selection):

if np.random.uniform(0, 1) < epsilon: 탐색(exploration)과 활용(exploitation)을 위한 입실론 탐욕 정책(epsilon-greedy policy)을 사용.
action = env.action_space.sample(): 무작위 행동 선택 (탐색).
action = np.argmax(q_table[state]): 현재 Q-table을 기반으로 최적 행동 선택 (활용).
환경 단계 진행:

next_state, reward, done, _ = env.step(action): 선택된 행동에 따라 환경의 다음 상태, 보상 및 종료 여부를 반환.
Q-table 업데이트:

q_table[state, action] = q_table[state, action] + alpha * (reward + gamma * np.max(q_table[next_state]) - q_table[state, action]): Q-learning 업데이트 규칙을 사용하여 Q-table을 갱신.
alpha: 학습률 (learning rate).
gamma: 할인율 (discount factor).
reward: 현재 상태에서의 보상.
np.max(q_table[next_state]): 다음 상태에서의 최대 Q 값.
상태 전이:

state = next_state: 현재 상태를 다음 상태로 업데이트.
에피소드 진행 상황 출력:

if episode % 100 == 0: 100회마다 에피소드 진행 상황을 출력

In [None]:
# Q-learning 알고리즘 적용
q_table = np.zeros([env.observation_space.n, env.action_space.n])

def q_learning(env, num_episodes=1000, alpha=0.1, gamma=0.6, epsilon=0.1):
    for episode in range(num_episodes):
        state = env.reset()
        done = False
        while not done:
            if np.random.uniform(0, 1) < epsilon:
                action = env.action_space.sample()
            else:
                action = np.argmax(q_table[state])
            next_state, reward, done, _ = env.step(action)
            q_table[state, action] = q_table[state, action] + alpha * (reward + gamma * np.max(q_table[next_state]) - q_table[state, action])
            state = next_state
        if episode % 100 == 0:
            print(f"Episode {episode}: Q-table updated.")

q_learning(env)

Episode 0: Q-table updated.
Episode 100: Q-table updated.
Episode 200: Q-table updated.
Episode 300: Q-table updated.
Episode 400: Q-table updated.
Episode 500: Q-table updated.
Episode 600: Q-table updated.
Episode 700: Q-table updated.
Episode 800: Q-table updated.
Episode 900: Q-table updated.


Hugging Face API 토큰을 사용하여 로그인하고, GPT-2 모델을 사용하여 텍스트 생성 기능을 구현

In [None]:
from huggingface_hub import login

# Hugging Face 로그인
login(token="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")

The token has not been saved to the git credentials helper. Pass `add_to_git_credential=True` in this function directly or `--add-to-git-credential` if using via `huggingface-cli` if you want to set the git credential as well.
Token is valid (permission: fineGrained).
Your token has been saved to /root/.cache/huggingface/token
Login successful


In [None]:
# Hugging Face 모델 설정
generator = pipeline('text-generation', model='gpt2')

def generate_alternative_response(prompt):
    set_seed(42)
    response = generator(prompt, max_length=50, num_return_sequences=1)
    return response[0]['generated_text']

config.json:   0%|          | 0.00/665 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/548M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/124 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/26.0 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/1.04M [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/456k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.36M [00:00<?, ?B/s]

In [None]:
# 메인 함수
if __name__ == "__main__":
    # 데이터셋 로드
    dataset_path = '/content/DailyDialog/ijcnlp_dailydialog/dialogues_text.txt'
    data = load_dataset(dataset_path)

    # 데이터 전처리
    print("Normalizing text...")
    data['text'] = data['text'].apply(normalize_text)
    print("Normalized text:")
    print(data['text'].head())

    print("Tokenizing text...")
    data['tokens'] = data['text'].apply(tokenize_text)
    print("Tokenized text:")
    print(data['tokens'].head())

    # 민감 정보 탐지 및 마스킹
    print("Masking sensitive information...")
    data['masked_text'] = data['text'].apply(mask_sensitive_info)
    print("Masked text:")
    print(data['masked_text'].head())

    # 강화학습 적용
    print("Applying Q-learning...")
    q_learning(env)

Normalizing text...
Normalized text:
0    the kitchen stinks  __eou__ ill throw out the ...
1    so dick  how about getting some coffee for ton...
2    are things still going badly with your housegu...
3    would you mind waiting a while  __eou__ well  ...
4    are you going to the annual party  i can give ...
Name: text, dtype: object
Tokenizing text...
Tokenized text:
0    [the, kitchen, stinks, __eou__, ill, throw, ou...
1    [so, dick, how, about, getting, some, coffee, ...
2    [are, things, still, going, badly, with, your,...
3    [would, you, mind, waiting, a, while, __eou__,...
4    [are, you, going, to, the, annual, party, i, c...
Name: tokens, dtype: object
Masking sensitive information...
Masked text:
0    the kitchen stinks  __[MASK]_ [MASK] throw out...
1    so dick  how about getting some coffee for [MA...
2    are things still going badly with your housegu...
3    would you mind waiting a while  __[MASK]_ well...
4    are you going to the [MASK] party  i can give ...
Nam

In [None]:
    # 대체 응답 생성 예제
    prompt = "For verification, could you provide some other form of identification?"
    alternative_response = generate_alternative_response(prompt)
    print("Alternative Response:", alternative_response)

NameError: name 'set_seed' is not defined