## 전체 내용
### 과목별 로드맵 (미리 추출한 문제들을 사용)
- 과목별 배우는 알고리즘에 해당하는 문제를 추천함 
    - **튜플, 딕셔너리 같은 기본 문법에 관한 문제는 추천하기 어려우므로 주차별로 제시하는 것이 아닌 과목별로 페이지를 만들어 주요 알고리즘에 관한 문제만 추천되게 함**
- 조건들을 지정해 과목명을 아무렇게나 입력해도 올바른 과목명이 출력되도록 함
- 배운 내용을 입력 받은 후 키워드를 추출하여 관련 있는 문제를 제시함
    - 키워드 추출 과정에서 사용하는 형태소 분석기를 선정하는 과정에서 여러 형태소 분석기 비교 실험을 통해 konlpy의 Okt가 가장 빠르다고 판단해 Okt를 사용
- 문제 추출 시 난이도는 따로 선택하지 않았기에 **웹에서 난이도 정렬 가능하게 했는데 어떻게 연동시키지?**

### 유사 문제 추천 (입력 때마다 달라짐)
- find_similar_sentences 함수에 문제 제목을 입력하면 유사 문제가 추천됨
    - Sentence Bert 모델을 사용해 문제의 문장 간 유사도를 구하고, 코사인 유사도를 사용해 문제 간 알고리즘 분류 유사도를 구하여 유사도가 높은 순으로 정렬
    - 최종 유사도: 문장 간 유사도 + 알고리즘 분류 유사도
    - 현재 선택한 문제의 레벨과 3 이내로 차이나는 항목만 추천되도록 함
- 유사도뿐만 아니라 난이도별로 정렬할 수 있게 함
- **반복문 조건문 같이 유사하지 않은 문제가 추천되면 어떡하지? (사용자 피드백: 사용자에게 문제별로 유사 문제가 맞는지 추천을 받음 -> 추천 순으로 정렬?)**
    
### 내가 풀지 않은 문제 중 나와 비슷한 레벨의 타 사용자가 푼 문제 추천 (사용자마다 다르게 보여야 함)
- 사용자 이름(아이디)을 입력하면 문제가 추천됨
- 사용자 클러스터링을 통해 사용자에게 군집을 부여하고 나는 풀지 않았지만 같은 군집 내 타 사용자들이 많이 푼 문제를 추천

## 과목별 로드맵 (미리 추출한 문제들을 사용)
- 과목별 배우는 알고리즘에 해당하는 문제를 추천함
    - **주차별로 하면 너무 세세해짐**
    - **튜플, 딕셔너리 같은 기본 문법에 관한 문제는 추천하기 어려우므로 주차별로 제시하는 것이 아닌 과목별로 페이지를 만들어 주요 알고리즘에 관한 문제만 추천되게 함**
- 조건들을 지정해 과목명을 아무렇게나 입력해도 올바른 과목명이 출력되도록 함
- 배운 내용을 입력 받은 후 키워드를 추출하여 관련 있는 문제를 제시함
    - 키워드 추출 과정에서 사용하는 형태소 분석기를 선정하는 과정에서 여러 형태소 분석기 비교 실험을 통해 konlpy의 Okt가 가장 빠르다고 판단해 Okt를 사용
- 문제 추출 시 난이도는 따로 선택하지 않았기에 **웹에서 난이도 정렬 가능하게**

![image.png](attachment:image.png)
![image-2.png](attachment:image-2.png)
![image-3.png](attachment:image-3.png)

과목별 로드맵
- C프로그래밍및실습: 조건문, 반복문, 배열, 함수
- 고급C프로그래밍및실습: **포인터**, 문자열, **구조체**, **동적할당**
- 자료구조및실습: 재귀, **리스트, 연결리스트**, **집합**, 스택, 큐, 트리
- 알고리즘및실습: 우선순위 큐, 힙, 정렬(힙 정렬, 합병 정렬, 퀵 정렬), 사전(=이진 탐색), **탐색 트리**, **해시테이블**, 그래프(그래프 순회, 방향 그래프), 최소 신장 트리, **최단 경로**
- 프로그래밍활용C: 조건문, 반복문, 배열, 함수(재귀함수도 포함), 포인터, 문자열, 구조체

- 컴퓨터사고기반기초코딩, SW기초코딩: 조건문, 반복문, 함수, 리스트 
- 프로그래밍활용P: 조건문, 반복문, 함수, 리스트, 중첩리스트, 튜플, 딕셔너리, 집합
- 고급프로그래밍활용: 조건문, 반복문, 함수, 리스트

In [1]:
import pandas as pd
df_if = pd.read_csv('문제 추천/조건문_로드맵.csv', encoding='cp949')
df_for = pd.read_csv('문제 추천/반복문_로드맵.csv', encoding='utf-8')
df_arr = pd.read_csv('문제 추천/배열_로드맵.csv', encoding='utf-8')
df_string = pd.read_csv('문제 추천/문자열_로드맵.csv', encoding='utf-8')
df_function = pd.read_csv('문제 추천/함수_로드맵.csv', encoding='utf-8')
df_recursion = pd.read_csv('문제 추천/재귀_로드맵.csv', encoding='utf-8')
df_stack = pd.read_csv('문제 추천/스택_로드맵.csv', encoding='utf-8')
df_queue = pd.read_csv('문제 추천/큐_로드맵.csv', encoding='cp949')
df_tree = pd.read_csv('문제 추천/트리_로드맵.csv', encoding='utf-8')
df_heap = pd.read_csv('문제 추천/우선순위 큐_로드맵.csv', encoding='utf-8')
df_sort = pd.read_csv('문제 추천/정렬_로드맵.csv', encoding='utf-8')
df_binary = pd.read_csv('문제 추천/이진 탐색_로드맵.csv', encoding='utf-8')
df_graph = pd.read_csv('문제 추천/그래프_로드맵.csv', encoding='utf-8')

print(df_if.shape, df_for.shape, df_arr.shape, df_string.shape, df_function.shape)
print(df_recursion.shape, df_stack.shape, df_queue.shape, df_tree.shape, df_heap.shape, df_sort.shape, df_binary.shape, df_graph.shape)

(27, 6) (77, 6) (100, 6) (88, 6) (192, 9)
(44, 6) (33, 6) (20, 6) (51, 6) (11, 6) (69, 6) (51, 6) (68, 6)


In [2]:
def get_question():
    question = input("배운 내용을 입력하세요: ")
    return question

def find_question(question):
    okt = Okt()
    li = okt.phrases(question)
    if question == '큐':
        li.append('큐')
        
    for item in li:
        if "조건" in item or "if" in item:
            return df_if[['제목', '문제', 'level']]
        
        if "반복" in item or "for" in item or "while" in item:
            return df_for[['제목', '문제', 'level']]
        
        if "배열" in item:
            return df_arr[['제목', '문제', 'level']]
        
        if "문자열" in item:
            return df_string[['제목', '문제', 'level']]
        
        if "함수" in item:
            return df_function[['제목', '문제', 'level']]
        
        if "재귀" in item or "재귀함수" in item or "재귀 함수" in item:
            return df_recursion[['제목', '문제', 'level']]
        
        if "스택" in item:
            return df_stack[['제목', '문제', 'level']]
        
        if "큐" in item:
            return df_queue[['제목', '문제', 'level']]
        
        if "트리" in item:
            return df_tree[['제목', '문제', 'level']]
        
        if "정렬" in item:
            return df_sort[['제목', '문제', 'level']]
        
        if "이진탐색" in item or "이진 탐색" in item:
            return df_binary[['제목', '문제', 'level']]
        
        if "그래프" in item:
            return df_graph[['제목', '문제', 'level']]
        
def get_subject_name():
    subject_name = input("과목명을 입력하세요: ")
    return subject_name

def find_subject(subject_name):
    subject_name = subject_name.lower()
    
    # c프로그래밍및실습
    if subject_name == 'c프로그래밍및실습' or subject_name == 'c프' or subject_name == 'c프로그래밍' or subject_name == '씨프' or subject_name == '씨프로그래밍':
        return 'c프로그래밍및실습'
    
    # 고급c프로그래밍및실습
    elif subject_name == '고급c프로그래밍및실습' or subject_name == '고c' or subject_name == '고급c' or subject_name == '고급c프로그래밍' or subject_name == '고씨' or subject_name == '고급씨':
        return '고급c프로그래밍및실습'
    
    # 자료구조및실습
    elif subject_name == '자료구조및실습' or subject_name == '자료구조' or subject_name == '자구' or subject_name == '자료구조실습':
        return '자료구조및실습'

    # 알고리즘및실습
    elif subject_name == '알고리즘및실습' or subject_name == '알고리즘' or subject_name == '알고리즘실습':
        return '알고리즘및실습'
    
    # 프로그래밍활용C
    elif subject_name == '프로그래밍활용C' or subject_name == '프활c':
        return '프로그래밍활용C'
    
    # 컴퓨터사고기반기초코딩
    elif subject_name == '컴퓨터사고기반기초코딩' or subject_name == '컴기코':
        return '컴퓨터사고기반기초코딩'
    
    # SW기초코딩
    elif subject_name == 'SW기초코딩':
        return 'SW기초코딩'

    # 프로그래밍활용P
    elif subject_name == '프로그래밍활용P' or subject_name == '프활P':
        return '프로그래밍활용P'
    
    # 고급프로그래밍활용
    elif subject_name == '고급프로그래밍활용' or subject_name == '고프활':
        return '고급프로그래밍활용'
    
    else:
        return None    

import konlpy
from konlpy.tag import Kkma, Komoran, Okt, Hannanum

subject_name = get_subject_name()
result = find_subject(subject_name)

if result is not None:
    print('과목명:', result)
else:
    print("해당하는 과목명을 찾을 수 없습니다.")
    
question = get_question()
result_q = find_question(question)

if result_q is None:
    print("해당하는 알고리즘을 찾을 수 없습니다.")
else:
    result_q = result_q.sort_values('level')
    display(result_q)

과목명을 입력하세요: 자료구조
과목명: 자료구조및실습
배운 내용을 입력하세요: 큐


Unnamed: 0,제목,문제,level
9,줄 세우기,점심시간이 되면 반 학생 모두가 한 줄로 줄을 서서 급식을 탄다. 그런데 매일 같이...,4
15,식당 입구 대기 줄,여러 명의 학생이 식사하기 위하여 학교 식당을 향해 달려가고 있다. 학교 식당에 도...,6
12,요세푸스 문제 0,요세푸스 문제는 다음과 같다.1번부터 N번까지 N명의 사람이 원을 이루면서?앉아있고...,6
10,카드1,"N장의 카드가 있다. 각각의 카드는 차례로 1부터 N까지의 번호가 붙어 있으며, 1...",6
17,덱,"정수를 저장하는 덱(Deque)를 구현한 다음, 입력으로 주어지는 명령을 처리하는 ...",7
13,요세푸스 문제,요세푸스 문제는 다음과 같다.1번부터 N번까지 N명의 사람이 원을 이루면서?앉아있고...,7
18,나무 블록,블록은 아래와 같은 나무 조각 8개를 이용해서 하는 게임이다.이 게임의 목표는 아래...,7
8,카드2,"N장의 카드가 있다. 각각의 카드는 차례로 1부터 N까지의 번호가 붙어 있으며, 1...",7
0,큐 2,"정수를 저장하는 큐를 구현한 다음, 입력으로 주어지는 명령을 처리하는 프로그램을 작...",7
2,덱 2,"정수를 저장하는 덱을 구현한 다음, 입력으로 주어지는 명령을 처리하는 프로그램을 작...",7
