## 1. 회사 기본 정보 테이블 (Companies)


In [None]:
import pandas as pd
import yfinance as yf

# S&P 500 회사들의 티커 심볼이 포함된 CSV 파일을 불러옵니다.
sp500 = pd.read_csv('./sp500_companies.csv')
sp500_tickers = sp500['Symbol']

# 정보를 저장할 빈 리스트 생성
selected_info = []

# 각 티커 심볼에 대하여 필요한 정보만을 가져옵니다.
for ticker_symbol in sp500_tickers:
    stock = yf.Ticker(ticker_symbol)
    info = stock.info

    # 필요한 정보만을 추출하여 리스트에 추가합니다.
    selected_info.append({
        "symbol": info.get("symbol"),
        "companyName": info.get("longName"),
        "industry": info.get("industry"),
        "sector": info.get("sector"),

    })

# 리스트를 데이터프레임으로 변환
data = pd.DataFrame(selected_info)

# 데이터프레임을 CSV 파일로 저장
file_path = "C:\\Users\\mit14\\Desktop\\project\\Untitled Folder\\Enterprise.csv"  # 저장할 파일 경로
data.to_csv(file_path, index=False)
print(f"Data saved to {file_path}")

## 2. 주가 정보 테이블 (StockPrices)

In [32]:
import yfinance as yf
import pandas as pd
from datetime import datetime, timedelta

# S&P 500 회사들의 티커 심볼이 포함된 CSV 파일을 불러옵니다.
sp500 = pd.read_csv('./sp500_companies.csv')
sp500_tickers = sp500['Symbol']

# 데이터를 저장할 빈 리스트 생성
data = []

# 각 티커 심볼에 대하여 필요한 정보만을 가져옵니다.
for ticker_symbol in sp500_tickers:
    # yfinance를 사용하여 주식 정보 다운로드
    stock = yf.Ticker(ticker_symbol)
    info = stock.info
    
    # 가져온 정보에서 필요한 부분을 선택하고 리스트에 추가
    data.append({
        'Symbol': ticker_symbol,
        'Name': info.get('shortName', ''),
        'Sector': info.get('sector', ''),
        'Country': info.get('country', '')
    })

# 데이터프레임으로 변환
df = pd.DataFrame(data)

# CSV 파일로 저장
csv_file_path = "C:/Users/mit14/Desktop/project/Untitled Folder/sp500_company_info.csv"  # 저장할 파일 경로와 이름
df.to_csv(csv_file_path, index=False)

print(f"Data saved to {csv_file_path}")

[*********************100%%**********************]  1 of 1 completed

Data saved to C:/Users/mit14/Desktop/project/Untitled Folder/sp500_yesterday_hourly.csv





## 3. 기사 정보 테이블 (NewsArticles)

In [None]:
import requests

def fetch_news(api_key, query, from_date, to_date, language='en'):
    url = 'https://newsapi.org/v2/everything'
    params = {
        'q': query,
        'from': from_date,
        'to': to_date,
        'language': language,
        'apiKey': api_key
    }
    response = requests.get(url, params=params)
    if response.status_code == 200:
        return response.json()['articles']
    else:
        print("Failed to fetch news")
        return None

# 사용 예시
api_key = 'bdfe72be91334fb5a5fb41fdbd4fc597'
query = 'JNJ'  # 뉴스를 검색할 종목명 또는 관련 키워드
from_date = '2024-02-01'  # 검색 시작 날짜
to_date = '2024-02-28'  # 검색 종료 날짜

news_articles = fetch_news(api_key, query, from_date, to_date)

for article in news_articles[:5]:  # 상위 5개 기사 출력
    print(f"Title: {article['title']}\nDescription: {article['description']}\nURL: {article['url']}\n")


# 데이터프레임을 CSV 파일로 저장
news_articles = "C:/Users/mit14/Desktop/project/Untitled Folder/news_articles.csv"  # 저장할 파일 경로와 이름
data.to_csv(news_articles)

print(f"Data saved to {news_articles}")


## 4. 재무 정보 테이블 (Financials)

In [None]:
## 일단 불

## 5. 분석 데이터 테이블 (AnalystRatings)

## 6. 기업의 분기 및 연간 보고서를 저장합니다.

## 7. 기업이 발행한 배당에 관한 정보를 저장합니다.

In [56]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

# S&P 500 회사들의 티커 심볼이 포함된 CSV 파일을 불러옵니다.
sp500 = pd.read_csv('./sp500_companies.csv')
sp500_tickers = sp500['Symbol']

# 정보를 저장할 빈 리스트 생성
selected_info = []

# 각 티커 심볼에 대하여 필요한 정보만을 가져옵니다.
for ticker_symbol in sp500_tickers:
    stock = yf.Ticker(ticker_symbol)
    info = stock.info

# 요청 헤더 설정
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
}

# GET 요청을 보내고 응답을 받아옴
response = requests.get(url, headers=headers)

# 응답의 상태코드를 확인하여 성공적으로 받아왔는지 확인
if response.status_code == 200:
    # BeautifulSoup을 사용하여 HTML을 파싱
    soup = BeautifulSoup(response.text, 'html.parser')

    # 배당 정보가 들어있는 테이블을 찾음
    dividend_table = soup.find_all('table', class_='W(100%) M(0)')[0]

    # 첫 번째 행은 헤더이므로 스킵
    rows = dividend_table.find_all('tr')[1:]

    # 데이터를 저장할 빈 리스트 생성
    data = []

    # 각 행을 순회하며 데이터 추출
    for row in rows:
        # 각 열을 추출
        columns = row.find_all('td')
        if len(columns) >= 5:  # 최소한의 열이 존재하는지 확인
            declaration_date = columns[0].text.strip()
            ex_dividend_date = columns[1].text.strip()
            payment_date = columns[2].text.strip()
            dividend_amount = columns[3].text.strip()

            # 추출한 데이터를 딕셔너리로 묶어 리스트에 추가
            data.append({
                'Declaration Date': declaration_date,
                'Ex-Dividend Date': ex_dividend_date,
                'Payment Date': payment_date,
                'Dividend Amount': dividend_amount
            })

    # 리스트를 데이터프레임으로 변환
    df = pd.DataFrame(data)

    # 데이터프레임을 CSV 파일로 저장
    file_path = "C:/Users/mit14/Desktop/project/Untitled Folder/dividend_info.csv"  # 저장할 파일 경로와 이름
    df.to_csv(file_path, index=False)

    print(f"Data saved to {file_path}")
else:
    print("Failed to retrieve data from the website. Status code:", response.status_code)


Declaration Date: Feb 28, 2024
Ex-Dividend Date: 182.51
Payment Date: 183.12
Dividend Amount: 180.13

Declaration Date: Feb 27, 2024
Ex-Dividend Date: 181.10
Payment Date: 183.92
Dividend Amount: 179.56

Declaration Date: Feb 26, 2024
Ex-Dividend Date: 182.24
Payment Date: 182.76
Dividend Amount: 180.65

Declaration Date: Feb 23, 2024
Ex-Dividend Date: 185.01
Payment Date: 185.04
Dividend Amount: 182.23

Declaration Date: Feb 22, 2024
Ex-Dividend Date: 183.48
Payment Date: 184.96
Dividend Amount: 182.46

Declaration Date: Feb 21, 2024
Ex-Dividend Date: 181.94
Payment Date: 182.89
Dividend Amount: 180.66

Declaration Date: Feb 20, 2024
Ex-Dividend Date: 181.79
Payment Date: 182.43
Dividend Amount: 180.00

Declaration Date: Feb 16, 2024
Ex-Dividend Date: 183.42
Payment Date: 184.85
Dividend Amount: 181.67

Declaration Date: Feb 15, 2024
Ex-Dividend Date: 183.55
Payment Date: 184.49
Dividend Amount: 181.35

Declaration Date: Feb 14, 2024
Ex-Dividend Date: 185.32
Payment Date: 185.53
Divid

In [58]:
import requests
from bs4 import BeautifulSoup
import pandas as pd
import yfinance as yf  # yfinance 모듈 임포트

# S&P 500 회사들의 티커 심볼이 포함된 CSV 파일을 불러옵니다.
sp500 = pd.read_csv('./sp500_companies.csv')
sp500_tickers = sp500['Symbol']

# 정보를 저장할 빈 리스트 생성
data = []

# 각 티커 심볼에 대하여 필요한 정보만을 가져옵니다.
for ticker_symbol in sp500_tickers:
    stock = yf.Ticker(ticker_symbol)
    info = stock.info

    # 요청 헤더 설정
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
    }

    # GET 요청을 보내고 응답을 받아옴
    url = f'https://finance.yahoo.com/quote/{ticker_symbol}/history'
    response = requests.get(url, headers=headers)

    # 응답의 상태코드를 확인하여 성공적으로 받아왔는지 확인
    if response.status_code == 200:
        # BeautifulSoup을 사용하여 HTML을 파싱
        soup = BeautifulSoup(response.text, 'html.parser')

        # 배당 정보가 들어있는 테이블을 찾음
        dividend_tables = soup.find_all('table', class_='W(100%) M(0)')

        # 테이블이 존재하는 경우에만 데이터 추출
        if dividend_tables:
            dividend_table = dividend_tables[0]

            # 첫 번째 행은 헤더이므로 스킵
            rows = dividend_table.find_all('tr')[1:]

            # 각 행을 순회하며 데이터 추출
            for row in rows:
                # 각 열을 추출
                columns = row.find_all('td')
                if len(columns) >= 5:  # 최소한의 열이 존재하는지 확인
                    declaration_date = columns[0].text.strip()
                    ex_dividend_date = columns[1].text.strip()
                    payment_date = columns[2].text.strip()
                    dividend_amount = columns[3].text.strip()

                    # 추출한 데이터를 딕셔너리로 묶어 리스트에 추가
                    data.append({
                        'Ticker Symbol': ticker_symbol,
                        'Declaration Date': declaration_date,
                        'Ex-Dividend Date': ex_dividend_date,
                        'Payment Date': payment_date,
                        'Dividend Amount': dividend_amount
                    })
    else:
        print(f"Failed to retrieve data for {ticker_symbol}. Status code:", response.status_code)

# 리스트를 데이터프레임으로 변환
df = pd.DataFrame(data)

# 데이터프레임을 CSV 파일로 저장
file_path = "C:/Users/mit14/Desktop/project/Untitled Folder/dividend_info.csv"  # 저장할 파일 경로와 이름
df.to_csv(file_path, index=False)

print(f"Data saved to {file_path}")

404 Client Error: Not Found for url: https://query2.finance.yahoo.com/v10/finance/quoteSummary/ATVI?modules=financialData%2CquoteType%2CdefaultKeyStatistics%2CassetProfile%2CsummaryDetail&corsDomain=finance.yahoo.com&formatted=false&symbol=ATVI&crumb=2jU8oy0VXUb
404 Client Error: Not Found for url: https://query2.finance.yahoo.com/v10/finance/quoteSummary/ABC?modules=financialData%2CquoteType%2CdefaultKeyStatistics%2CassetProfile%2CsummaryDetail&corsDomain=finance.yahoo.com&formatted=false&symbol=ABC&crumb=2jU8oy0VXUb
404 Client Error: Not Found for url: https://query2.finance.yahoo.com/v10/finance/quoteSummary/RE?modules=financialData%2CquoteType%2CdefaultKeyStatistics%2CassetProfile%2CsummaryDetail&corsDomain=finance.yahoo.com&formatted=false&symbol=RE&crumb=2jU8oy0VXUb


Data saved to C:/Users/mit14/Desktop/project/Untitled Folder/dividend_info.csv


## 기본 데이터 불러오기

In [15]:
import requests
import pandas as pd
import io  # io 모듈에서 StringIO를 가져오기 위해 추가

# S&P 500 기업 목록이 담긴 CSV 파일의 URL입니다.
url = 'https://datahub.io/core/s-and-p-500-companies/r/0.csv'

# HTTP GET 요청을 보내어 파일을 다운로드합니다.
response = requests.get(url)

# 요청이 성공적이었는지 상태 코드로 확인합니다.
if response.status_code == 200:
    # 받아온 내용을 io.StringIO를 이용하여 CSV 형식으로 읽어 DataFrame 객체로 변환합니다.
    data = pd.read_csv(io.StringIO(response.text))
    
    # 데이터를 확인하기 위해 DataFrame의 처음 5행을 출력합니다.
    print(data.head())
else:
    # 요청이 실패했다면 오류 메시지를 출력합니다.
    print("데이터를 가져오지 못했습니다.")

# 데이터프레임을 CSV 파일로 저장
file_path = "C:/Users/mit14/Desktop/sp500_yesterday_hourly.csv"  # 저장할 파일 경로와 이름
data.to_csv(file_path)
print(f"Data saved to {file_path}")

  Symbol                 Name       Sector
0    MMM                   3M  Industrials
1    AOS          A. O. Smith  Industrials
2    ABT  Abbott Laboratories  Health Care
3   ABBV               AbbVie  Health Care
4   ABMD              Abiomed  Health Care
Data saved to C:/Users/mit14/Desktop/sp500_yesterday_hourly.csv


## 모든정보 불러오기

In [20]:
import yfinance as yf
sp500 = pd.read_csv('./sp500_companies.csv')
sp500_tg = sp500['Symbol']
# 특정 주식을 위한 티커 심볼, 예를 들어 Apple Inc.
for i in sp500_tg
ticker_symbol = "AAPL"

# yfinance를 사용하여 주식 정보 가져오기
stock = yf.Ticker(ticker_symbol)

# 가능한 모든 정보를 가져오기
info = stock.info

# 정보 출력
for key, value in info.items():
    print(f"{key}: {value}")

address1: One Apple Park Way
city: Cupertino
state: CA
zip: 95014
country: United States
phone: 408 996 1010
website: https://www.apple.com
industry: Consumer Electronics
industryKey: consumer-electronics
industryDisp: Consumer Electronics
sector: Technology
sectorKey: technology
sectorDisp: Technology
longBusinessSummary: Apple Inc. designs, manufactures, and markets smartphones, personal computers, tablets, wearables, and accessories worldwide. The company offers iPhone, a line of smartphones; Mac, a line of personal computers; iPad, a line of multi-purpose tablets; and wearables, home, and accessories comprising AirPods, Apple TV, Apple Watch, Beats products, and HomePod. It also provides AppleCare support and cloud services; and operates various platforms, including the App Store that allow customers to discover and download applications and digital content, such as books, music, video, games, and podcasts. In addition, the company offers various services, such as Apple Arcade, a g

## 필요 데이터 불러오기

In [30]:
import pandas as pd
import yfinance as yf

# S&P 500 회사들의 티커 심볼이 포함된 CSV 파일을 불러옵니다.
sp500 = pd.read_csv('./sp500_companies.csv')
sp500_tickers = sp500['Symbol']

# 정보를 저장할 빈 리스트 생성
selected_info = []

# 각 티커 심볼에 대하여 필요한 정보만을 가져옵니다.
for ticker_symbol in sp500_tickers:
    stock = yf.Ticker(ticker_symbol)
    info = stock.info

    # 필요한 정보만을 추출하여 리스트에 추가합니다.
    selected_info.append({
        "symbol": info.get("symbol"),
        "companyName": info.get("longName"),
        "industry": info.get("industry"),
        "sector": info.get("sector"),
        "netIncomeToCommon": info.get("netIncomeToCommon"),
        "totalRevenue": info.get("totalRevenue"),
        "ebitda": info.get("ebitda"),
        "totalDebt": info.get("totalDebt"),
        "currentRatio": info.get("currentRatio"),
        "returnOnAssets": info.get("returnOnAssets"),
        "returnOnEquity": info.get("returnOnEquity"),
        "grossMargins": info.get("grossMargins"),
        "operatingMargins": info.get("operatingMargins")
    })

# 리스트를 데이터프레임으로 변환
data = pd.DataFrame(selected_info)

# 데이터프레임을 CSV 파일로 저장
file_path = "C:\\Users\\mit14\\Desktop\\project\\Untitled Folder\\Enterprise.csv"  # 저장할 파일 경로
data.to_csv(file_path, index=False)
print(f"Data saved to {file_path}")

404 Client Error: Not Found for url: https://query2.finance.yahoo.com/v10/finance/quoteSummary/ATVI?modules=financialData%2CquoteType%2CdefaultKeyStatistics%2CassetProfile%2CsummaryDetail&corsDomain=finance.yahoo.com&formatted=false&symbol=ATVI&crumb=2jU8oy0VXUb
404 Client Error: Not Found for url: https://query2.finance.yahoo.com/v10/finance/quoteSummary/ABC?modules=financialData%2CquoteType%2CdefaultKeyStatistics%2CassetProfile%2CsummaryDetail&corsDomain=finance.yahoo.com&formatted=false&symbol=ABC&crumb=2jU8oy0VXUb
404 Client Error: Not Found for url: https://query2.finance.yahoo.com/v10/finance/quoteSummary/RE?modules=financialData%2CquoteType%2CdefaultKeyStatistics%2CassetProfile%2CsummaryDetail&corsDomain=finance.yahoo.com&formatted=false&symbol=RE&crumb=2jU8oy0VXUb


Data saved to C:\Users\mit14\Desktop\project\Untitled Folder\Enterprise.csv


## 국내 기사 불러오기(날짜 조율 안됨)

In [27]:
import feedparser

# Google News RSS 피드 URL을 설정합니다. 테슬라에 관한 뉴스를 예로 듭니다.
rss_url = 'https://news.google.com/rss/search?q=테슬라&hl=ko&gl=KR&ceid=KR:ko'

# feedparser를 사용하여 RSS 피드를 파싱합니다.
feed = feedparser.parse(rss_url)

# 파싱된 뉴스 항목을 순회하며 제목을 출력합니다.
for entry in feed.entries:
    print(f"Title: {entry.title}")
    print(f"Link: {entry.link}\n")

Title: “타도 테슬라” 외치던 벤츠·포드, 왜 ‘전기차 올인’ 버리고 방향 틀었나 - 조선일보
Link: https://news.google.com/rss/articles/CBMiSmh0dHBzOi8vd3d3LmNob3N1bi5jb20vZWNvbm9teS9hdXRvLzIwMjQvMDIvMjcvMlBPU1JMR0VRUkJFVEJGTElWVjZKS05CNkEv0gFZaHR0cHM6Ly93d3cuY2hvc3VuLmNvbS9lY29ub215L2F1dG8vMjAyNC8wMi8yNy8yUE9TUkxHRVFSQkVUQkZMSVZWNkpLTkI2QS8_b3V0cHV0VHlwZT1hbXA?oc=5

Title: "역대 가장 놀라운 제품"…테슬라, 로드스터 내년 출시 - 한국경제
Link: https://news.google.com/rss/articles/CBMiLmh0dHBzOi8vd3d3Lmhhbmt5dW5nLmNvbS9hcnRpY2xlLzIwMjQwMjI4NzMxMGnSASpodHRwczovL3d3dy5oYW5reXVuZy5jb20vYW1wLzIwMjQwMjI4NzMxMGk?oc=5

Title: 애플 전기차 포기에 테슬라 등 차 업계가 '안도'하는 이유 - 연합뉴스
Link: https://news.google.com/rss/articles/CBMiL2h0dHBzOi8vd3d3LnluYS5jby5rci92aWV3L0FLUjIwMjQwMjI4MDQxNjAwMDA50gEA?oc=5

Title: 테슬라 모델3 롱레인지 가격 또 인상…그래서 얼만데? - 디지털투데이
Link: https://news.google.com/rss/articles/CBMiQWh0dHBzOi8vd3d3LmRpZ2l0YWx0b2RheS5jby5rci9uZXdzL2FydGljbGVWaWV3Lmh0bWw_aWR4bm89NTA3MTky0gEA?oc=5

Title: [50초 리포트] 테슬라 '노쇼'에 대박 난 파이 가게 - KBS뉴스
Link: https://news.google.com/rss/arti