In [7]:
# -*- coding: utf-8 -*-
import numpy as np
from konlpy.tag import Okt
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.metrics.pairwise import cosine_similarity
from sentence_transformers import SentenceTransformer
import os
import pickle
import re
import itertools

  from tqdm.autonotebook import tqdm, trange


In [8]:
model = SentenceTransformer('sentence-transformers/xlm-r-100langs-bert-base-nli-stsb-mean-tokens')



In [11]:
query = "음원-음반"
sentence = f'주식 투자와 관련돼서 {query} 테마에 대해 1500자 내외로 투자 전문가 처럼 설명해줘.'

print(sentence)

주식 투자와 관련돼서 음원-음반 테마에 대해 1500자 내외로 투자 전문가 처럼 설명해줘.


In [12]:
text = """
음원-음반 테마는 음악 산업의 변화를 반영하며, 주식 투자자들에게 흥미로운 기회를 제공합니다. 과거 아날로그 시대의 음반에서 디지털 음원 스트리밍으로의 전환은 음악 소비 방식에 큰 변화를 가져왔고, 이에 따라 관련 기업들의 비즈니스 모델과 수익 구조도 변화하고 있습니다. 이 테마는 특히 스트리밍 서비스, 음반 제작, 아티스트 관리 및 관련 기술 기업과 밀접한 연관이 있습니다.

### 1. 시장 현황
음원 및 음반 시장은 글로벌적으로 연평균 10% 이상의 성장률을 기록하고 있으며, 이는 디지털 음원 스트리밍 서비스의 급성장 덕분입니다. **Spotify**, **Apple Music**, **YouTube Music** 등과 같은 플랫폼이 시장의 주요 플레이어로 자리잡고 있으며, 이들은 사용자 기반을 확장하고 수익 모델을 다양화하기 위해 노력하고 있습니다. CD와 같은 물리적 음반의 판매는 감소세를 보이고 있지만, 여전히 특정 소비층에서는 수요가 존재합니다.

### 2. 시장 성장 배경
음원-음반 시장의 성장은 여러 요인에 의해 촉진되고 있습니다. 첫째, 디지털화의 진전입니다. 소비자들은 음악을 쉽게 접근하고 소비할 수 있는 디지털 플랫폼을 선호하게 되었으며, 이는 스트리밍 서비스의 급성장으로 이어졌습니다. 둘째, 전 세계적으로 K-POP과 같은 특정 장르의 인기가 높아지면서, 글로벌 시장에서 한국 아티스트들의 영향력이 증가하고 있습니다. 이는 음원 및 음반 판매에 긍정적인 영향을 미치고 있습니다.

셋째, 팬들과 아티스트 간의 소통 강화입니다. 소셜 미디어와 팬 커뮤니티의 활성화는 아티스트의 브랜드 가치를 높이고, 음원 및 음반 판매에 직접적인 영향을 미치고 있습니다. 팬들은 아티스트와의 소통을 통해 더 큰 충성도를 느끼며, 이는 매출 증가로 이어질 수 있습니다.

### 3. 주요 기업과 경쟁 환경
음원-음반 시장에는 여러 주요 기업들이 존재합니다. **Universal Music Group**, **Sony Music Entertainment**, **Warner Music Group** 등의 대형 음반사들은 전 세계적으로 큰 영향력을 가지고 있으며, 다양한 아티스트와의 계약을 통해 수익을 창출하고 있습니다. 이들 기업은 아티스트의 음원 유통뿐만 아니라, 라이브 공연, 머천다이징 등 다양한 수익원도 관리하고 있습니다.

스트리밍 서비스 기업인 **Spotify**와 **Apple Music**은 사용자 기반을 확대하기 위해 다양한 콘텐츠와 기능을 제공하고 있으며, 이들은 음악 산업의 판도를 바꾸고 있습니다. 특히, Spotify는 데이터 분석을 통해 개인 맞춤형 추천 시스템을 강화하고 있으며, 이는 사용자 경험을 개선하는 데 중요한 역할을 하고 있습니다.

### 4. 기술 혁신과 소비자 경험
음원-음반 산업은 기술 혁신을 통해 소비자 경험을 개선하고 있습니다. 인공지능(AI)과 머신러닝을 활용한 데이터 분석은 음악 추천 시스템의 정확성을 높이고, 사용자 맞춤형 콘텐츠를 제공하는 데 기여하고 있습니다. 또한, 블록체인 기술을 통한 저작권 관리와 수익 분배의 투명성 강화는 아티스트와 소비자 모두에게 긍정적인 영향을 미칠 수 있습니다.

### 5. 리스크 관리와 투자 전략
음원-음반 테마에 투자할 때는 여러 가지 리스크를 고려해야 합니다. 첫째, 소비자 선호의 변화입니다. 음악 소비 트렌드는 급속히 변화하고 있으며, 특정 장르나 플랫폼에 대한 선호가 변할 경우 기업의 수익성에 영향을 미칠 수 있습니다. 둘째, 저작권 문제와 관련된 법적 리스크입니다. 아티스트와 음반사 간의 계약 문제나 저작권 분쟁이 발생할 경우, 기업의 평판과 재무에 부정적인 영향을 줄 수 있습니다.

투자 전략 측면에서는, 주요 기업들의 재무 건전성과 시장 점유율, 그리고 성장 가능성을 분석해야 합니다. 또한, 소비자 트렌드와 음악 산업의 변화에 대한 면밀한 모니터링이 필요합니다. 다양한 플랫폼에서의 수익 모델과 아티스트 관리 전략을 평가하여, 장기적인 투자 결정을 내리는 것이 중요합니다.

### 6. 결론
음원-음반 테마는 디지털화와 글로벌화가 진행되는 현대 사회에서 중요한 투자 기회를 제공합니다. 스트리밍 서비스의 성장과 K-POP을 포함한 다양한 음악 장르의 인기는 이 시장의 지속적인 성장 가능성을 나타냅니다. 따라서, 이 분야에 대한 철저한 분석과 시장 동향을 면밀히 살펴보며, 전략적으로 접근하는 것이 중요합니다. 음원-음반 시장은 단순한 소비재 시장을 넘어, 음악과 문화의 변화를 반영하는 중요한 분야로 자리잡고 있으며, 이를 통해 투자자들은 새로운 기회를 발견할 수 있을 것입니다. 

이런 자료를 참고했어요.
[1] 핀고 - 음악 저작권 투자 – 전통 자산과 상관관계가 낮은 대체 투자자산 (https://story.fingo.run/%ED%95%80%EA%B3%A0-fingo-%EC%9D%8C%EC%95%85-%EC%A0%80%EC%9E%91%EA%B6%8C-%EC%A3%BC%EC%8B%9D-%EB%B6%80%EB%8F%99%EC%82%B0-%EC%B1%84%EA%B6%8C-%EC%BD%94%EC%9D%B8-%EB%8C%80%EC%B2%B4%ED%88%AC%EC%9E%90/)
[2] 주달 - 주달 - 테마주, 관련주, 주식정보, 정리 (https://www.judal.co.kr/)
[3] 핀고 - 글로벌 음악 IP 투자 시장의 활성화, 그리고 음악 IP 펀드 (https://story.fingo.run/%EA%B8%80%EB%A1%9C%EB%B2%8C-%EC%9D%8C%EC%95%85-ip-%ED%88%AC%EC%9E%90-%ED%8E%80%EB%93%9C-%EB%B0%8F-%ED%88%AC%EC%9E%90%EC%82%AC/)
[4] 뮤직카우 - 뮤직카우 - 세계 최초 음악수익증권 투자 플랫폼 (https://www.musicow.com/) 

뤼튼 사용하러 가기 > https://agent.wrtn.ai/5xb91l
"""
text = text.split('이런 자료를 참고했어요.')[0]
split_text = re.split(r'(\s*[a-zA-Z]+(?:[^\w\s]+[a-zA-Z]+)*\s*)', text)
split_text = [part.strip() for part in split_text if part.strip()]

okt = Okt()
nouns=[]
for sentence in split_text:
    sen = okt.nouns(sentence)
    if len(sen) != 0:
        nouns.extend(sen)
    else:
        nouns.append(sentence)

text = ' '.join(nouns)

doc_embedding = model.encode([text])

file_path = f'D:/Topic_Modeling/New/embeddings/{query}.pkl'

with open(file_path, 'wb') as file:
    pickle.dump(doc_embedding, file)


In [18]:
with open(file_path, 'rb') as file:
    doc_embedding = pickle.load(file)

# doc_embedding 사용
print(doc_embedding)

[[-2.31621534e-01 -1.63131505e-01  1.01069546e+00  8.42395127e-02
   5.46826541e-01 -5.17102957e-01 -2.63194233e-01 -2.37388968e-01
   5.84355481e-02 -1.07458532e-01 -9.24968999e-03  6.91706717e-01
  -2.19435066e-01  3.87119293e-01  2.37694860e-01  6.27285466e-02
  -3.99043024e-01  1.49734672e-02  7.51522407e-02 -5.84505200e-01
   5.13814688e-02 -1.81511231e-02  8.37270737e-01 -4.24032509e-02
  -2.51699120e-01 -1.88096046e-01  3.16632614e-02 -2.50125319e-01
  -8.64905119e-02  4.31720674e-01 -2.14159656e-02 -8.75515416e-02
  -2.88146615e-01 -2.08859980e-01 -1.69323713e-01  3.10863182e-02
  -2.20319256e-01 -4.53375326e-03  2.31262088e-01  4.26564515e-02
  -2.03329474e-01 -2.53382593e-01  3.13648254e-01  1.56915784e-01
  -7.08155334e-01  2.83283472e-01 -4.05470550e-01 -2.85489023e-01
  -4.68076915e-01  9.24992263e-02 -3.13981354e-01  3.71917009e-01
   3.08771968e-01  3.00055742e-01  2.97507029e-02  5.72219849e-01
  -1.64616793e-01 -6.12064362e-01  1.26487017e-02  2.48437226e-01
   2.21683