In [None]:
from sklearn.feature_extraction.text import TfidfVectorizer

def extract_top_keywords(paragraph, n=3):
    # Tokenize the paragraph into words
    words = paragraph.split()

    # Create TF-IDF vectorizer
    tfidf_vectorizer = TfidfVectorizer()

    # Fit and transform the paragraph
    tfidf_matrix = tfidf_vectorizer.fit_transform([paragraph])

    # Get the feature names (words)
    feature_names = tfidf_vectorizer.get_feature_names_out()

    # Create a dictionary to store word and corresponding TF-IDF score
    word_tfidf_scores = {}
    for col in tfidf_matrix.nonzero()[1]:
        word = feature_names[col]
        tfidf_score = tfidf_matrix[0, col]
        word_tfidf_scores[word] = tfidf_score

    # Sort the words by their TF-IDF scores
    sorted_words_tfidf = sorted(word_tfidf_scores.items(), key=lambda x: x[1], reverse=True)

    # Extract top keywords
    top_keywords = [word for word, _ in sorted_words_tfidf[:n]]

    return top_keywords

# Test the function
paragraph = """
엔화 약세 지속과 미국 채권금리 강세가 이어지면서 일본 증시에 상장된 미국채 상장지수펀드(ETF)를 매수한 '일학개미'들의 시름이 커져가고 있다.
올해 들어 글로벌 증시가 강세를 보인 가운데 엔화 표시 미국채 ETF는 13% 넘는 손실을 기록 중이다.
증권가에서는 엔화 약세가 한동안 길어질 수 있다고 내다보고 있다.
"""
print("Top Keywords:")
print(extract_top_keywords(paragraph))

Top Keywords:
['엔화', '있다', '미국채']
