In [1]:
### 필요한 라이브러리 설치
!pip install finance-datareader

Collecting finance-datareader
  Downloading finance_datareader-0.9.90-py3-none-any.whl (46 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/46.6 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m46.6/46.6 kB[0m [31m1.2 MB/s[0m eta [36m0:00:00[0m
Collecting requests-file (from finance-datareader)
  Downloading requests_file-2.1.0-py2.py3-none-any.whl (4.2 kB)
Installing collected packages: requests-file, finance-datareader
Successfully installed finance-datareader-0.9.90 requests-file-2.1.0


### SOXL 상위 8개종목과 상관관계분석('NVDA', 'AVGO', 'QCOM', 'AMD', 'MU', 'TXN', 'INTC', 'MCHP')

In [None]:
### 현재 데이터가 부족한 종목
'''
ON SWKS STM WOLF QRVO UMC ACLS RMBS MKSI ASX LSCC TER ENTG
'''

In [51]:
import FinanceDataReader as fdr
import pandas as pd

# 비교 대상 종목 리스트
comparison_symbols = ['NVDA', 'AVGO', 'QCOM', 'AMD', 'MU', 'TXN', 'INTC', 'MCHP']

# 대상 종목 리스트
symbols = ['ON', 'SWKS', 'STM', 'WOLF', 'QRVO', 'UMC', 'ACLS', 'RMBS', 'MKSI', 'ASX', 'LSCC', 'TER', 'ENTG']

# 시작 날짜와 종료 날짜 설정
start_date = '2023-05-23'
end_date = pd.to_datetime('today').strftime('%Y-%m-%d')  # 현재 날짜

# 주가 데이터를 불러와서 하나의 데이터프레임으로 병합
all_data = pd.DataFrame()
for symbol in comparison_symbols + symbols:
    df = fdr.DataReader(symbol, start_date, end_date)[['Close']]
    df.columns = [symbol]
    if all_data.empty:
        all_data = df
    else:
        all_data = all_data.join(df, how='inner')

# 상관계수 계산
correlation_matrix = all_data.corr()

# 각 비교 대상 종목에 대해 상관계수 0.7 초과인 종목들을 찾기
high_correlation_results = {}

for comparison_symbol in comparison_symbols:
    correlation_series = correlation_matrix[comparison_symbol]
    # 비교 대상 종목들끼리는 제외
    correlation_series = correlation_series.drop(labels=comparison_symbols)
    high_correlation_symbols = correlation_series[correlation_series > 0.7].index.tolist()
    high_correlation_results[comparison_symbol] = high_correlation_symbols

# 결과 출력
for comparison_symbol, high_corr_symbols in high_correlation_results.items():
    print(f"{comparison_symbol}와 상관계수가 0.7 초과인 종목들:")
    for symbol in high_corr_symbols:
        correlation_coefficient = correlation_matrix.loc[symbol, comparison_symbol]
        print(f"{symbol}: {correlation_coefficient:.2f}")

NVDA와 상관계수가 0.7 초과인 종목들:
MKSI: 0.81
ASX: 0.93
ENTG: 0.89
AVGO와 상관계수가 0.7 초과인 종목들:
MKSI: 0.78
ASX: 0.92
ENTG: 0.92
QCOM와 상관계수가 0.7 초과인 종목들:
MKSI: 0.81
ASX: 0.94
ENTG: 0.92
AMD와 상관계수가 0.7 초과인 종목들:
QRVO: 0.72
MKSI: 0.79
ASX: 0.88
ENTG: 0.93
MU와 상관계수가 0.7 초과인 종목들:
MKSI: 0.72
ASX: 0.90
ENTG: 0.82
TXN와 상관계수가 0.7 초과인 종목들:
MKSI: 0.72
TER: 0.94
INTC와 상관계수가 0.7 초과인 종목들:
MCHP와 상관계수가 0.7 초과인 종목들:
MKSI: 0.73
TER: 0.79
ENTG: 0.70


In [52]:
# 결과 출력
high_correlation_aggregated = {}

for comparison_symbol, high_corr_symbols in high_correlation_results.items():
    high_correlation_aggregated[comparison_symbol] = high_corr_symbols

# Flatten the list of tickers
all_high_correlation_symbols = [ticker for tickers in high_correlation_aggregated.values() for ticker in tickers]

# Remove duplicates
all_high_correlation_symbols = list(set(all_high_correlation_symbols))

print("상관관계 0.7 초과인 종목들:", all_high_correlation_symbols)


상관관계 0.7 초과인 종목들: ['ASX', 'ENTG', 'QRVO', 'TER', 'MKSI']


In [None]:
'''
QCOM 와 MKSI ASX ENTG
TXN 과 TER
AMD 와 QRVO
'''

### 전기차 기업들과의 비교 ('TSLA', 'LCID', 'NKLA', 'ALB', 'LAC', 'ENPH', 'BLNK', 'PLUG', 'NIO', 'WKHS')

In [53]:
### 현재 데이터및 상관관계가 부족한 종목
'''
'ON', 'SWKS', 'STM', 'WOLF', 'QRVO', 'UMC', 'ACLS', 'RMBS', 'LSCC'
'''

"\n'ON', 'SWKS', 'STM', 'WOLF', 'QRVO', 'UMC', 'ACLS', 'RMBS', 'LSCC'\n"

In [54]:
import FinanceDataReader as fdr
import pandas as pd

# 비교 대상 종목 리스트
comparison_symbols = ['TSLA', 'LCID', 'NKLA', 'ALB', 'LAC', 'ENPH', 'BLNK', 'PLUG', 'NIO', 'WKHS']

# 대상 종목 리스트
symbols = ['ON', 'SWKS', 'STM', 'WOLF', 'QRVO', 'UMC', 'ACLS', 'RMBS', 'LSCC']

# 시작 날짜와 종료 날짜 설정
start_date = '2023-05-23'
end_date = pd.to_datetime('today').strftime('%Y-%m-%d')  # 현재 날짜

# 주가 데이터를 불러와서 하나의 데이터프레임으로 병합
all_data = pd.DataFrame()
for symbol in comparison_symbols + symbols:
    df = fdr.DataReader(symbol, start_date, end_date)[['Close']]
    df.columns = [symbol]
    if all_data.empty:
        all_data = df
    else:
        all_data = all_data.join(df, how='inner')

# 상관계수 계산
correlation_matrix = all_data.corr()

# 각 비교 대상 종목에 대해 상관계수 0.7 이상인 종목들을 찾기
high_correlation_results = {}

for comparison_symbol in comparison_symbols:
    correlation_series = correlation_matrix[comparison_symbol]
    # 비교 대상 종목들끼리는 제외
    correlation_series = correlation_series.drop(labels=comparison_symbols)
    high_correlation_symbols = correlation_series[correlation_series > 0.7].index.tolist()
    high_correlation_results[comparison_symbol] = high_correlation_symbols

# 결과 출력
for comparison_symbol, high_corr_symbols in high_correlation_results.items():
    print(f"{comparison_symbol}와 상관계수가 0.7 이상인 종목들:")
    for symbol in high_corr_symbols:
        correlation_coefficient = correlation_matrix.loc[symbol, comparison_symbol]
        print(f"{symbol}: {correlation_coefficient:.2f}")


TSLA와 상관계수가 0.7 이상인 종목들:
WOLF: 0.86
ACLS: 0.74
LCID와 상관계수가 0.7 이상인 종목들:
WOLF: 0.71
ACLS: 0.81
NKLA와 상관계수가 0.7 이상인 종목들:
ALB와 상관계수가 0.7 이상인 종목들:
ON: 0.72
LAC와 상관계수가 0.7 이상인 종목들:
ENPH와 상관계수가 0.7 이상인 종목들:
LSCC: 0.71
BLNK와 상관계수가 0.7 이상인 종목들:
PLUG와 상관계수가 0.7 이상인 종목들:
ACLS: 0.82
NIO와 상관계수가 0.7 이상인 종목들:
WOLF: 0.82
ACLS: 0.78
WKHS와 상관계수가 0.7 이상인 종목들:
ACLS: 0.79


In [55]:
# 결과 출력
high_correlation_aggregated = {}

for comparison_symbol, high_corr_symbols in high_correlation_results.items():
    high_correlation_aggregated[comparison_symbol] = high_corr_symbols

# Flatten the list of tickers
all_high_correlation_symbols = [ticker for tickers in high_correlation_aggregated.values() for ticker in tickers]

# Remove duplicates
all_high_correlation_symbols = list(set(all_high_correlation_symbols))

print("상관관계 0.7 초과인 종목들:", all_high_correlation_symbols)

상관관계 0.7 초과인 종목들: ['LSCC', 'WOLF', 'ON', 'ACLS']


In [None]:
'''
NIO 와 WOLF ACLS
ALB 과 ON
ENPH 와 LSCC
'''

In [None]:
### 현재 데이터및 상관관계가 부족한 종목
'''
SWKS STM QRVO UMC RMBS
'''

In [43]:
import FinanceDataReader as fdr
import pandas as pd

# 비교 대상 종목 리스트
comparison_symbols = ['ASML', 'KLAC','LRCX','AMAT','SIEGY']

# 대상 종목 리스트
symbols = ['SWKS', 'STM', 'QRVO', 'UMC', 'RMBS']

# 시작 날짜와 종료 날짜 설정
start_date = '2023-05-23'
end_date = pd.to_datetime('today').strftime('%Y-%m-%d')  # 현재 날짜

# 주가 데이터를 불러와서 하나의 데이터프레임으로 병합
all_data = pd.DataFrame()
for symbol in comparison_symbols + symbols:
    df = fdr.DataReader(symbol, start_date, end_date)[['Close']]
    df.columns = [symbol]
    if all_data.empty:
        all_data = df
    else:
        all_data = all_data.join(df, how='inner')

# 상관계수 계산
correlation_matrix = all_data.corr()

# 각 비교 대상 종목에 대해 상관계수 0.7 이상인 종목들을 찾기
high_correlation_results = {}

for comparison_symbol in comparison_symbols:
    correlation_series = correlation_matrix[comparison_symbol]
    # 비교 대상 종목들끼리는 제외
    correlation_series = correlation_series.drop(labels=comparison_symbols)
    high_correlation_symbols = correlation_series[correlation_series > 0.7].index.tolist()
    high_correlation_results[comparison_symbol] = high_correlation_symbols

# 결과 출력
for comparison_symbol, high_corr_symbols in high_correlation_results.items():
    print(f"{comparison_symbol}와 주가 흐름이 비슷한 종목들:")
    for symbol in high_corr_symbols:
        print(symbol)


ASML와 주가 흐름이 비슷한 종목들:
QRVO
KLAC와 주가 흐름이 비슷한 종목들:
LRCX와 주가 흐름이 비슷한 종목들:
AMAT와 주가 흐름이 비슷한 종목들:
SIEGY와 주가 흐름이 비슷한 종목들:
QRVO
UMC


In [50]:
import FinanceDataReader as fdr
import pandas as pd

# 비교할 두 기업의 종목 코드
symbol1 = 'QRVO'  # QRVO
symbol2 = 'ASML'  # ASML

# 시작 날짜와 종료 날짜 설정
start_date = '2023-05-23'
end_date = pd.to_datetime('today').strftime('%Y-%m-%d')  # 현재 날짜

# QRVO와 ASML의 주가 데이터를 불러오기
df1 = fdr.DataReader(symbol1, start_date, end_date)[['Close']]
df2 = fdr.DataReader(symbol2, start_date, end_date)[['Close']]

# 두 데이터프레임을 합치고 컬럼 이름 변경
merged_df = pd.merge(df1, df2, left_index=True, right_index=True)
merged_df.columns = ['QRVO', 'ASML']

# 상관관계 계산
correlation_coefficient = merged_df['QRVO'].corr(merged_df['ASML'])

print(f"{symbol1}와 {symbol2}의 상관관계: {correlation_coefficient:.2f}")


QRVO와 ASML의 상관관계: 0.73


In [45]:
import FinanceDataReader as fdr
import pandas as pd

# 비교 대상 종목 리스트
comparison_symbols = ['SIEGY']

# 대상 종목 리스트
symbols = ['QRVO', 'UMC']

# 시작 날짜와 종료 날짜 설정
start_date = '2023-05-23'
end_date = pd.to_datetime('today').strftime('%Y-%m-%d')  # 현재 날짜

# 주가 데이터를 불러와서 하나의 데이터프레임으로 병합
all_data = pd.DataFrame()
for symbol in comparison_symbols + symbols:
    df = fdr.DataReader(symbol, start_date, end_date)[['Close']]
    df.columns = [symbol]
    if all_data.empty:
        all_data = df
    else:
        all_data = all_data.join(df, how='inner')

# 상관계수 계산
correlation_matrix = all_data.corr()

# 결과 출력
for comparison_symbol in comparison_symbols:
    for symbol in symbols:
        correlation_coefficient = correlation_matrix.loc[comparison_symbol, symbol]
        print(f"{comparison_symbol}와 {symbol}의 상관계수: {correlation_coefficient:.2f}")


SIEGY와 QRVO의 상관계수: 0.73
SIEGY와 UMC의 상관계수: 0.70
