# 1. requests 모듈 설치
* 설명서 링크 [바로가기](https://requests.readthedocs.io/en/latest/)

In [1]:
!pip install requests

Collecting requests
  Downloading requests-2.32.5-py3-none-any.whl.metadata (4.9 kB)
Collecting charset_normalizer<4,>=2 (from requests)
  Downloading charset_normalizer-3.4.4-cp310-cp310-win_amd64.whl.metadata (38 kB)
Collecting urllib3<3,>=1.21.1 (from requests)
  Downloading urllib3-2.6.3-py3-none-any.whl.metadata (6.9 kB)
Collecting certifi>=2017.4.17 (from requests)
  Downloading certifi-2026.1.4-py3-none-any.whl.metadata (2.5 kB)
Downloading requests-2.32.5-py3-none-any.whl (64 kB)
Downloading charset_normalizer-3.4.4-cp310-cp310-win_amd64.whl (107 kB)
Downloading urllib3-2.6.3-py3-none-any.whl (131 kB)
Downloading certifi-2026.1.4-py3-none-any.whl (152 kB)
Installing collected packages: urllib3, charset_normalizer, certifi, requests

   ---------------------------------------- 0/4 [urllib3]
   ---------------------------------------- 0/4 [urllib3]
   ---------------------------------------- 0/4 [urllib3]
   ---------- ----------------------------- 1/4 [charset_normalizer]
   ---

# 2. requests 사용법
```python
import requests

url = "접속주소url" # url
payload = dict(key=value) # parameter
headers = dict(key=value) # headers
r = requests.get(url.params=payload) # 서버에 url + parameter로 요청보내기 # r은 관용적으로 사용하는 것
print(r.url) # 서버에 요청을 보낸 url 출력
print(r.status_code) #서버에서 보내준 응답코드 200 정상, 400, 500은 오류
response = r.text # r.content, r.json()
```

* r.text: utf-8로 인코딩해서 보여줌 한글이 잘 보임
* r.content:서버가 보내준 그대로의 자료     => 나중에 HTML의 자료를 뽑을 때 사용
* r.json():requests 모듈 내부의 json모듈로 text를 json으로 자동 변환

# 3. requests로 네이버 API에서 자료 수집하기

In [2]:
import os
from dotenv import load_dotenv
load_dotenv()

True

In [14]:
import requests
import pandas as pd
from myfunc import text_clean

* 이전 코드

In [None]:
# 네이버 검색 API 예제 - 블로그 검색
# import os
# import sys
# import urllib.request
# client_id = os.getenv('Client_ID')
# client_secret = os.getenv('Client_secret')
# encText = urllib.parse.quote("삼성전자")
# url = "https://openapi.naver.com/v1/search/blog?query=" + encText # JSON 결과
# # url = "https://openapi.naver.com/v1/search/blog.xml?query=" + encText # XML 결과
# request = urllib.request.Request(url)
# request.add_header("X-Naver-Client-Id",client_id)
# request.add_header("X-Naver-Client-Secret",client_secret)
# response = urllib.request.urlopen(request)
# rescode = response.getcode()
# if(rescode==200):
#     response_body = response.read()
#     print(response_body.decode('utf-8'))
# else:
#     print("Error Code:" + rescode)

* 새로운 코드(requests를 사용)

In [8]:
keyword = '삼성전자'
url = "https://openapi.naver.com/v1/search/blog"
payload = dict(query=keyword, display=100,start=1,sort='sim')
headers = {"X-Naver-Client-Id" : os.getenv('Client_ID'),
           "X-Naver-Client-Secret":os.getenv('Client_secret')}

r = requests.get(url, params=payload, headers=headers)
print(r.url) # 옵션(url이 잘 만들어 졌는지 확인하는 용도) 
print(r.status_code) # url과 status_code는 처음에 꼭 찍어보고, 결과가 제대로 오는지 확인이 필요하다.
data = r.text # r.json으로 받으면 바로 딕셔너리로 받을 수 있다.
data

https://openapi.naver.com/v1/search/blog?query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&display=100&start=1&sort=sim
200


'{\n\t"lastBuildDate":"Tue, 20 Jan 2026 15:32:03 +0900",\n\t"total":4150504,\n\t"start":1,\n\t"display":100,\n\t"items":[\n\t\t{\n\t\t\t"title":"[\'26 CES 1일차] 윈호텔 <b>삼성전자<\\/b> 단독 전시 후기",\n\t\t\t"link":"https:\\/\\/blog.naver.com\\/yellowsoap\\/224152380712",\n\t\t\t"description":"오늘은 2026 CES 1일차 이야기로 윈호텔(Wynn Hotel)에서 열린 <b>삼성전자<\\/b> 전시회 관람을 이야기 해볼까... 입구장 앞에 많은 사람들이 있어 삼성의 인기를 실감할 수 있었습니다. 한쪽에 AI 프로모터가 있었는데... ",\n\t\t\t"bloggername":"세상의 모든 스토리! 우기도령",\n\t\t\t"bloggerlink":"blog.naver.com\\/yellowsoap",\n\t\t\t"postdate":"20260120"\n\t\t},\n\t\t{\n\t\t\t"title":"외국인들 <b>삼성전자<\\/b> 팔고 셀트리온 산다는데",\n\t\t\t"link":"https:\\/\\/blog.naver.com\\/yahoyaho08\\/224145850607",\n\t\t\t"description":"외국인들은 어떤 종목을 매수하고 있고 우리도 <b>삼성전자<\\/b> 팔고 외국인들이 사는 종목을 따라가야할지..?... 대표적으로는 한화에어로스페이스 한화오션, 두산에너빌리티, 삼성중공업등이 투자자들의 기대감을... ",\n\t\t\t"bloggername":"디노의 경제 재테크이야기",\n\t\t\t"bloggerlink":"blog.naver.com\\/yahoyaho08",\n\t\t\t"postdate":"20260114"\n\t\t},\n\t\t{\n\t\t\t"title":"홍라희 여사 <b>삼성전자<\\/b> 주

In [20]:
keyword = '삼성전자'
url = "https://openapi.naver.com/v1/search/blog"
payload = dict(query=keyword, display=100,start=1,sort='sim')
headers = {"X-Naver-Client-Id" : os.getenv('Client_ID'),
           "X-Naver-Client-Secret":os.getenv('Client_secret')}

r = requests.get(url, params=payload, headers=headers)
print(r.url) # 옵션(url이 잘 만들어 졌는지 확인하는 용도)
print(r.status_code)
data = r.json()

result = {}
for item in data['items']:
    for key,value in item.items():
        if key in ('title', 'description'):
            value = text_clean(value)
        result.setdefault(key, []).append(value)
        
df = pd.DataFrame(result)
df

https://openapi.naver.com/v1/search/blog?query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&display=100&start=1&sort=sim
200


Unnamed: 0,title,link,description,bloggername,bloggerlink,postdate
0,CES 일차 윈호텔 삼성전자 단독 전시 후기,https://blog.naver.com/yellowsoap/224152380712,오늘은 0 CES 일차 이야기로 윈호텔 Wynn Hotel 에서 열린 삼성전자 전시...,세상의 모든 스토리! 우기도령,blog.naver.com/yellowsoap,20260120
1,외국인들 삼성전자 팔고 셀트리온 산다는데,https://blog.naver.com/yahoyaho08/224145850607,외국인들은 어떤 종목을 매수하고 있고 우리도 삼성전자 팔고 외국인들이 사는 종목을 ...,디노의 경제 재테크이야기,blog.naver.com/yahoyaho08,20260114
2,홍라희 여사 삼성전자 주식 대량 매도 주가에 악재일까 기회일까,https://blog.naver.com/totoro3123/224151135821,반면 소식을 접하고 의견들을 찾아보니 이번 매각을 삼성전자가 더 높이 날아오르기 위...,너부리의 주식경제노트,blog.naver.com/totoro3123,20260118
3,물린 사람이 없는 삼성전자주가 0 년 전망은,https://blog.naver.com/goodbye202407/224138808514,0 년을 지나오며 삼성전자 주가를 두고 이런 말이 나옵니다 이 주식 물린 사람이 거...,여행가는 망고주스,blog.naver.com/goodbye202407,20260109
4,삼성전자 주식 조원 규모 매도하는 이유는 상속세 및 대출금,https://blog.naver.com/lmj400/224151180213,여러분은 이번 삼성가의 결정을 보며 어떤 생각이 드셨나요 상속세 제도에 대한 견해나...,웰커넥티드,blog.naver.com/lmj400,20260118
...,...,...,...,...,...,...
95,HBM 공급망 지도 좋음 삼성전자 SK하이닉스,https://blog.naver.com/going_tothe_moon/224138...,기업 SK하이닉스 삼성전자 마이크론 ASIC 설계자 ASIC Designer 특정 ...,고잉투더문,blog.naver.com/going_tothe_moon,20260108
96,삼성전자 분기 영업이익 0조원 기록,https://blog.naver.com/pokara61/224139368098,삼성전자 분기 실적이 발표되었다 분기영업이익 0조 달성으로 컨센서스 부합 삼성전자 ...,포카라의 실전투자,blog.naver.com/pokara61,20260108
97,삼성전자 밸류가 낮아서 업사이드도 높다 HBM 좋은 평가,https://blog.naver.com/pokara61/224119442972,삼성전자가 내년에는 HBM 시장에서 돌파구를 마련할 것인가 삼성전자의 HBM 가 엔...,포카라의 실전투자,blog.naver.com/pokara61,20251223
98,삼성전자 주가 오르자 삼성전자우 도 0만원 돌파,https://blog.naver.com/tearhunter/224134910389,삼성전자 강세 속 삼선전자우도 꾸준히 상승 삼성전자우 우선주 가 월 일 장중 0만원...,웹진 [Coin Choice],blog.naver.com/tearhunter,20260105


In [22]:
for item in data['items']:
    print(item)

{'title': "['26 CES 1일차] 윈호텔 <b>삼성전자</b> 단독 전시 후기", 'link': 'https://blog.naver.com/yellowsoap/224152380712', 'description': '오늘은 2026 CES 1일차 이야기로 윈호텔(Wynn Hotel)에서 열린 <b>삼성전자</b> 전시회 관람을 이야기 해볼까... 입구장 앞에 많은 사람들이 있어 삼성의 인기를 실감할 수 있었습니다. 한쪽에 AI 프로모터가 있었는데... ', 'bloggername': '세상의 모든 스토리! 우기도령', 'bloggerlink': 'blog.naver.com/yellowsoap', 'postdate': '20260120'}
{'title': '외국인들 <b>삼성전자</b> 팔고 셀트리온 산다는데', 'link': 'https://blog.naver.com/yahoyaho08/224145850607', 'description': '외국인들은 어떤 종목을 매수하고 있고 우리도 <b>삼성전자</b> 팔고 외국인들이 사는 종목을 따라가야할지..?... 대표적으로는 한화에어로스페이스 한화오션, 두산에너빌리티, 삼성중공업등이 투자자들의 기대감을... ', 'bloggername': '디노의 경제 재테크이야기', 'bloggerlink': 'blog.naver.com/yahoyaho08', 'postdate': '20260114'}
{'title': '홍라희 여사 <b>삼성전자</b> 주식 대량 매도, 주가에 악재일까 기회일까?', 'link': 'https://blog.naver.com/totoro3123/224151135821', 'description': "반면, 소식을 접하고 의견들을 찾아보니 이번 매각을 <b>삼성전자</b>가 더 높이 날아오르기 위한 '마지막 체증 해소'로 보는 시각도 있더라고요. 5년 상속세 마침표: 삼성 일가를 괴롭혀온 12조 원 상속세 이슈가... ", 'bloggername': '너부리의 주식경제노트', 'blogg

In [21]:
result = {}
for item in data['items']:
    for key,value in item.items():
        if key in ('title', 'description'):
            value = text_clean(value)
        result.setdefault(key, []).append(value)
        
df = pd.DataFrame(result)
df

Unnamed: 0,title,link,description,bloggername,bloggerlink,postdate
0,CES 일차 윈호텔 삼성전자 단독 전시 후기,https://blog.naver.com/yellowsoap/224152380712,오늘은 0 CES 일차 이야기로 윈호텔 Wynn Hotel 에서 열린 삼성전자 전시...,세상의 모든 스토리! 우기도령,blog.naver.com/yellowsoap,20260120
1,외국인들 삼성전자 팔고 셀트리온 산다는데,https://blog.naver.com/yahoyaho08/224145850607,외국인들은 어떤 종목을 매수하고 있고 우리도 삼성전자 팔고 외국인들이 사는 종목을 ...,디노의 경제 재테크이야기,blog.naver.com/yahoyaho08,20260114
2,홍라희 여사 삼성전자 주식 대량 매도 주가에 악재일까 기회일까,https://blog.naver.com/totoro3123/224151135821,반면 소식을 접하고 의견들을 찾아보니 이번 매각을 삼성전자가 더 높이 날아오르기 위...,너부리의 주식경제노트,blog.naver.com/totoro3123,20260118
3,물린 사람이 없는 삼성전자주가 0 년 전망은,https://blog.naver.com/goodbye202407/224138808514,0 년을 지나오며 삼성전자 주가를 두고 이런 말이 나옵니다 이 주식 물린 사람이 거...,여행가는 망고주스,blog.naver.com/goodbye202407,20260109
4,삼성전자 주식 조원 규모 매도하는 이유는 상속세 및 대출금,https://blog.naver.com/lmj400/224151180213,여러분은 이번 삼성가의 결정을 보며 어떤 생각이 드셨나요 상속세 제도에 대한 견해나...,웰커넥티드,blog.naver.com/lmj400,20260118
...,...,...,...,...,...,...
95,HBM 공급망 지도 좋음 삼성전자 SK하이닉스,https://blog.naver.com/going_tothe_moon/224138...,기업 SK하이닉스 삼성전자 마이크론 ASIC 설계자 ASIC Designer 특정 ...,고잉투더문,blog.naver.com/going_tothe_moon,20260108
96,삼성전자 분기 영업이익 0조원 기록,https://blog.naver.com/pokara61/224139368098,삼성전자 분기 실적이 발표되었다 분기영업이익 0조 달성으로 컨센서스 부합 삼성전자 ...,포카라의 실전투자,blog.naver.com/pokara61,20260108
97,삼성전자 밸류가 낮아서 업사이드도 높다 HBM 좋은 평가,https://blog.naver.com/pokara61/224119442972,삼성전자가 내년에는 HBM 시장에서 돌파구를 마련할 것인가 삼성전자의 HBM 가 엔...,포카라의 실전투자,blog.naver.com/pokara61,20251223
98,삼성전자 주가 오르자 삼성전자우 도 0만원 돌파,https://blog.naver.com/tearhunter/224134910389,삼성전자 강세 속 삼선전자우도 꾸준히 상승 삼성전자우 우선주 가 월 일 장중 0만원...,웹진 [Coin Choice],blog.naver.com/tearhunter,20260105


# 4. while 문과 requests를 이용해서 1100개 자료 수집하기

In [4]:
import os
import requests
import pandas as pd
from myfunc import text_clean
from dotenv import load_dotenv
load_dotenv() # 가장 아래에 두면 true가 출력되기 때문에 좋다.

True

* urllib를 사용해서 1100개 가져오는 코드

In [None]:
# result = {} # ! result 이동/ for문 안쪽에 있으면 계속 초기화 된다.


# for num in range(1, 1101, 100):
#     print(num)
#     if num > 1000:
#         num -= 1

#     # 네이버 검색 API 예제 - 블로그 검색
#     client_id = os.getenv('Client_ID')
#     client_secret = os.getenv('Client_secret')
#     encText = urllib.parse.quote("삼성전자")
#     parameters = f"&display=100&start={num}&sort=sim" # ! f-string 추가
#     url = "https://openapi.naver.com/v1/search/blog?query=" + encText + parameters # JSON 결과
#     # url = "https://openapi.naver.com/v1/search/blog.xml?query=" + encText # XML 결과
#     request = urllib.request.Request(url)
#     request.add_header("X-Naver-Client-Id",client_id)
#     request.add_header("X-Naver-Client-Secret",client_secret)
#     response = urllib.request.urlopen(request)
#     rescode = response.getcode()
#     if(rescode==200):
#         response_body = response.read()
#         response = response_body.decode('utf-8') # ! 추가 및 수정
#         data = json.loads(response) # ! 추가 및 수정
#     else:
#         print("Error Code:" + rescode)
    
    

#     for item in data['items']:
#         print(item)
#         for key,value in item.items():
#             if key in ['title', 'description']:
#                 value = text_clean(value)
#             result.setdefault(key, []).append(value) # ! 추가

            
# df = pd.DataFrame(result)
# df

* requests를 사용해서 1100개 가져오는 코드

In [24]:
keyword = '삼성전자'
url = "https://openapi.naver.com/v1/search/blog"
payload = dict(query=keyword, display=100,start=1,sort='sim')
headers = {"X-Naver-Client-Id" : os.getenv('Client_ID'),
           "X-Naver-Client-Secret":os.getenv('Client_secret')}

r = requests.get(url, params=payload, headers=headers)
print(r.url) # 옵션(url이 잘 만들어 졌는지 확인하는 용도)
print(r.status_code)
data = r.json()


result = {}
i = 0
while i < len(data['items']):
    item = data['items'][i]
    for key,value in item.items():
        if key in ('title', 'description'):
            vaule = text_clean(value)
        result.setdefault(key, []).append(value)
        
    i += 1
        
df = pd.DataFrame(result)
df

https://openapi.naver.com/v1/search/blog?query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&display=100&start=1&sort=sim
200


Unnamed: 0,title,link,description,bloggername,bloggerlink,postdate
0,['26 CES 1일차] 윈호텔 <b>삼성전자</b> 단독 전시 후기,https://blog.naver.com/yellowsoap/224152380712,오늘은 2026 CES 1일차 이야기로 윈호텔(Wynn Hotel)에서 열린 <b>...,세상의 모든 스토리! 우기도령,blog.naver.com/yellowsoap,20260120
1,외국인들 <b>삼성전자</b> 팔고 셀트리온 산다는데,https://blog.naver.com/yahoyaho08/224145850607,외국인들은 어떤 종목을 매수하고 있고 우리도 <b>삼성전자</b> 팔고 외국인들이 ...,디노의 경제 재테크이야기,blog.naver.com/yahoyaho08,20260114
2,"홍라희 여사 <b>삼성전자</b> 주식 대량 매도, 주가에 악재일까 기회일까?",https://blog.naver.com/totoro3123/224151135821,"반면, 소식을 접하고 의견들을 찾아보니 이번 매각을 <b>삼성전자</b>가 더 높이...",너부리의 주식경제노트,blog.naver.com/totoro3123,20260118
3,"물린 사람이 없는 <b>삼성전자</b>주가, 2026년 전망은?",https://blog.naver.com/goodbye202407/224138808514,2025년을 지나오며 <b>삼성전자</b> 주가를 두고 이런 말이 나옵니다. “이 ...,여행가는 망고주스,blog.naver.com/goodbye202407,20260109
4,<b>삼성전자</b> 주식 2조원 규모 매도하는 이유는(상속세 및 대출금),https://blog.naver.com/lmj400/224151180213,여러분은 이번 삼성가의 결정을 보며 어떤 생각이 드셨나요? 상속세 제도에 대한 견해...,웰커넥티드,blog.naver.com/lmj400,20260118
...,...,...,...,...,...,...
95,<b>삼성전자</b> : 레거시 디램의 왕이 돌아왔다!,https://blog.naver.com/pokara61/224134665685,HBM 시장에서 삼성은 선전할 것인가? <b>삼성전자</b>는 HBM 시장에서 올해...,포카라의 실전투자,blog.naver.com/pokara61,20260105
96,"HBM 공급망 지도 좋음 (<b>삼성전자</b>, SK하이닉스)",https://blog.naver.com/going_tothe_moon/224138...,"기업 -SK하이닉스, <b>삼성전자</b>, 마이크론 2) ASIC 설계자 (ASI...",고잉투더문,blog.naver.com/going_tothe_moon,20260108
97,<b>삼성전자</b> : 4분기 영업이익 20조원 기록,https://blog.naver.com/pokara61/224139368098,<b>삼성전자</b> 4분기 실적이 발표되었다. 분기영업이익 20조 달성으로 컨센서...,포카라의 실전투자,blog.naver.com/pokara61,20260108
98,<b>삼성전자</b> : 밸류가 낮아서 업사이드도 높다. HBM4 좋은 평가...,https://blog.naver.com/pokara61/224119442972,<b>삼성전자</b>가 내년에는 HBM4 시장에서 돌파구를 마련할 것인가? <b>삼...,포카라의 실전투자,blog.naver.com/pokara61,20251223


In [28]:
result = {}

while num < 

for num in range(1, 1101, 100):
    print(num)
    if num > 1000:
        num -= 1
while 
i = 0
i < 1101
i += 100
        
        
    keyword = '삼성전자'
    url = "https://openapi.naver.com/v1/search/blog"
    payload = dict(query=keyword, display=100,start=1,sort='sim')
    headers = {"X-Naver-Client-Id" : os.getenv('Client_ID'),
               "X-Naver-Client-Secret":os.getenv('Client_secret')}

    r = requests.get(url, params=payload, headers=headers)
    print(r.url) # 옵션(url이 잘 만들어 졌는지 확인하는 용도)
    print(r.status_code)
    data = r.json()

#     result = {}
    i = 0
    while i < len(data['items']):
        item = data['items'][i]
        for key,value in item.items():
            if key in ('title', 'description'):
                vaule = text_clean(value)
            result.setdefault(key, []).append(value)

        i += 1
        
df = pd.DataFrame(result)
df

1
https://openapi.naver.com/v1/search/blog?query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&display=100&start=1&sort=sim
200
101
https://openapi.naver.com/v1/search/blog?query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&display=100&start=1&sort=sim
200
201
https://openapi.naver.com/v1/search/blog?query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&display=100&start=1&sort=sim
200
301
https://openapi.naver.com/v1/search/blog?query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&display=100&start=1&sort=sim
200
401
https://openapi.naver.com/v1/search/blog?query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&display=100&start=1&sort=sim
200
501
https://openapi.naver.com/v1/search/blog?query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&display=100&start=1&sort=sim
200
601
https://openapi.naver.com/v1/search/blog?query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&display=100&start=1&sort=sim
200
701
https://openapi.naver.com/v1/search/blog?query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&display=100&start=1&sort=sim
200
801
https://openapi.naver.com/v1/s

Unnamed: 0,title,link,description,bloggername,bloggerlink,postdate
0,['26 CES 1일차] 윈호텔 <b>삼성전자</b> 단독 전시 후기,https://blog.naver.com/yellowsoap/224152380712,오늘은 2026 CES 1일차 이야기로 윈호텔(Wynn Hotel)에서 열린 <b>...,세상의 모든 스토리! 우기도령,blog.naver.com/yellowsoap,20260120
1,외국인들 <b>삼성전자</b> 팔고 셀트리온 산다는데,https://blog.naver.com/yahoyaho08/224145850607,외국인들은 어떤 종목을 매수하고 있고 우리도 <b>삼성전자</b> 팔고 외국인들이 ...,디노의 경제 재테크이야기,blog.naver.com/yahoyaho08,20260114
2,"홍라희 여사 <b>삼성전자</b> 주식 대량 매도, 주가에 악재일까 기회일까?",https://blog.naver.com/totoro3123/224151135821,"반면, 소식을 접하고 의견들을 찾아보니 이번 매각을 <b>삼성전자</b>가 더 높이...",너부리의 주식경제노트,blog.naver.com/totoro3123,20260118
3,"물린 사람이 없는 <b>삼성전자</b>주가, 2026년 전망은?",https://blog.naver.com/goodbye202407/224138808514,2025년을 지나오며 <b>삼성전자</b> 주가를 두고 이런 말이 나옵니다. “이 ...,여행가는 망고주스,blog.naver.com/goodbye202407,20260109
4,<b>삼성전자</b> 주식 2조원 규모 매도하는 이유는(상속세 및 대출금),https://blog.naver.com/lmj400/224151180213,여러분은 이번 삼성가의 결정을 보며 어떤 생각이 드셨나요? 상속세 제도에 대한 견해...,웰커넥티드,blog.naver.com/lmj400,20260118
...,...,...,...,...,...,...
1095,<b>삼성전자</b> : 레거시 디램의 왕이 돌아왔다!,https://blog.naver.com/pokara61/224134665685,HBM 시장에서 삼성은 선전할 것인가? <b>삼성전자</b>는 HBM 시장에서 올해...,포카라의 실전투자,blog.naver.com/pokara61,20260105
1096,"HBM 공급망 지도 좋음 (<b>삼성전자</b>, SK하이닉스)",https://blog.naver.com/going_tothe_moon/224138...,"기업 -SK하이닉스, <b>삼성전자</b>, 마이크론 2) ASIC 설계자 (ASI...",고잉투더문,blog.naver.com/going_tothe_moon,20260108
1097,<b>삼성전자</b> : 4분기 영업이익 20조원 기록,https://blog.naver.com/pokara61/224139368098,<b>삼성전자</b> 4분기 실적이 발표되었다. 분기영업이익 20조 달성으로 컨센서...,포카라의 실전투자,blog.naver.com/pokara61,20260108
1098,<b>삼성전자</b> : 밸류가 낮아서 업사이드도 높다. HBM4 좋은 평가...,https://blog.naver.com/pokara61/224119442972,<b>삼성전자</b>가 내년에는 HBM4 시장에서 돌파구를 마련할 것인가? <b>삼...,포카라의 실전투자,blog.naver.com/pokara61,20251223


* while문 로직

In [39]:
start_num = 1
while True:
    
    if start_num == 1001:
        start_num -= 1
    
    if start_num > 1000:
        break
    
    start_num += 100
    print(start_num)

101
201
301
401
501
601
701
801
901
1001
1100


In [5]:
result = {}

start_num = 1
while True:

    
    if start_num == 1001:
        start_num -= 1
    
    elif start_num > 1000:
        break

    print("start_num: ", start_num)     
#     print('start_num: ', start_num, end='\r')
    
    keyword = '삼성전자'
    url = "https://openapi.naver.com/v1/search/blog"
    payload = dict(query=keyword, display=100,start=start_num,sort='sim')
    headers = {"X-Naver-Client-Id":os.getenv('Client_ID'),
               "X-Naver-Client-Secret":os.getenv('Client_Secret')}

    r = requests.get(url, params=payload, headers=headers)
    print(r.url) # 옵션(url이 잘 만들어 졌는지 확인하는 용도)
    print(r.status_code)
    data = r.json()

    for item in data['items']:
        for key,value in item.items():
            if key in ('title', 'description'):
                value = text_clean(value)
            result.setdefault(key, []).append(value)

    start_num += 100 # 숫자 증가는 while문에서 마지막에 추가된다.(다음 페이지로 넘어가야 하니까)
        
df = pd.DataFrame(result)
df

start_num:  1
https://openapi.naver.com/v1/search/blog?query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&display=100&start=1&sort=sim
200
start_num:  101
https://openapi.naver.com/v1/search/blog?query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&display=100&start=101&sort=sim
200
start_num:  201
https://openapi.naver.com/v1/search/blog?query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&display=100&start=201&sort=sim
200
start_num:  301
https://openapi.naver.com/v1/search/blog?query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&display=100&start=301&sort=sim
200
start_num:  401
https://openapi.naver.com/v1/search/blog?query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&display=100&start=401&sort=sim
200
start_num:  501
https://openapi.naver.com/v1/search/blog?query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&display=100&start=501&sort=sim
200
start_num:  601
https://openapi.naver.com/v1/search/blog?query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&display=100&start=601&sort=sim
200
start_num:  701
https://openapi.naver.com/v1/search/blog?qu

Unnamed: 0,title,link,description,bloggername,bloggerlink,postdate
0,CES 일차 윈호텔 삼성전자 단독 전시 후기,https://blog.naver.com/yellowsoap/224152380712,오늘은 0 CES 일차 이야기로 윈호텔 Wynn Hotel 에서 열린 삼성전자 전시...,세상의 모든 스토리! 우기도령,blog.naver.com/yellowsoap,20260120
1,외국인들 삼성전자 팔고 셀트리온 산다는데,https://blog.naver.com/yahoyaho08/224145850607,외국인들은 어떤 종목을 매수하고 있고 우리도 삼성전자 팔고 외국인들이 사는 종목을 ...,디노의 경제 재테크이야기,blog.naver.com/yahoyaho08,20260114
2,물린 사람이 없는 삼성전자주가 0 년 전망은,https://blog.naver.com/goodbye202407/224138808514,0 년을 지나오며 삼성전자 주가를 두고 이런 말이 나옵니다 이 주식 물린 사람이 거...,여행가는 망고주스,blog.naver.com/goodbye202407,20260109
3,홍라희 여사 삼성전자 주식 대량 매도 주가에 악재일까 기회일까,https://blog.naver.com/totoro3123/224151135821,반면 소식을 접하고 의견들을 찾아보니 이번 매각을 삼성전자가 더 높이 날아오르기 위...,너부리의 주식경제노트,blog.naver.com/totoro3123,20260118
4,삼성전자 주식 조원 규모 매도하는 이유는 상속세 및 대출금,https://blog.naver.com/lmj400/224151180213,여러분은 이번 삼성가의 결정을 보며 어떤 생각이 드셨나요 상속세 제도에 대한 견해나...,웰커넥티드,blog.naver.com/lmj400,20260118
...,...,...,...,...,...,...
1095,삼성전자 주식 환율이 이렇게 오르면 이익인가 손해인가,https://blog.naver.com/minho2824/224152425935,가만히 생각해 보면 단순히 한국에서만 생활할 것이라면 삼성전자 주식이 상당히 오른 ...,자유로운 쿤이네 경제이야기,blog.naver.com/minho2824,20260119
1096,삼성전자 SK하이닉스 오픈AI 협업,https://blog.naver.com/alexia_story/224030227268,이 자리에는 구매의향서 LOI 체결에 참여한 전영현 삼성전자 부회장 최성안 삼성중공...,알렉시아의 꾸준하게...,blog.naver.com/alexia_story,20251003
1097,quot 미국 반도체 관세 00 경고 quot 삼성전자 SK하이닉스 주가,https://blog.naver.com/wjdxor54/224150675125,삼성과 하이닉스 반도체 관세 주가 영향은 우리에게 가장 중요한 건 이번 발언으로 내...,파트라슈의 주식이야기,blog.naver.com/wjdxor54,20260118
1098,삼성 사무용 프린터 복합기 삼성전자 사업자몰에서 할인받는법,https://blog.naver.com/xodud890/224049835317,삼성 사무용 프린터 삼성 복합기 삼성전자 사업자몰에서 할인받고 구매하는법 0월 특가...,sienna's story,blog.naver.com/xodud890,20251022


# keyword를 입력받아서 blog, news, book 카테고리에서 데이터 수집 후 결과를 각각 csv 파일로 저장하기
* naver_api에서 키워드와 관련된 news, blog, book 자료를 1100개씩 검색하고
* keyword_news_result.csv, keyword_blof_result.csv, keyword_book_result.csv 형태로 저장되도록 하세요.

In [43]:
keyword = input()
print(keyword)

핀테크
핀테크


* 실습

In [6]:
keyword = input()
print(keyword)

total_result = {}

naver_api_category = ['blog', 'news', 'book']
for category in naver_api_category:
    
    result = {}
    start_num = 1
    while True:

        if start_num == 1001:
            start_num -= 1

        elif start_num > 1000:
            break

        print("start_num: ", start_num)     
#     print('start_num: ', start_num, end='\r')

        url = f"https://openapi.naver.com/v1/search/{category}"
        payload = dict(query=keyword, display=100,start=start_num,sort='sim')
        headers = {"X-Naver-Client-Id" : os.getenv('Client_ID'),
                   "X-Naver-Client-Secret":os.getenv('Client_Secret')}

        r = requests.get(url, params=payload, headers=headers)
        print(r.url)
        print(r.status_code)
        data = r.json()

        for item in data['items']:
            for key,value in item.items():
                if key in ('title', 'description'):
                    value = text_clean(value)
                result.setdefault(key, []).append(value)

        start_num += 100
        
df = pd.DataFrame(result)
df

핀테크
핀테크
start_num:  1
https://openapi.naver.com/v1/search/blog?query=%ED%95%80%ED%85%8C%ED%81%AC&display=100&start=1&sort=sim
200
start_num:  101
https://openapi.naver.com/v1/search/blog?query=%ED%95%80%ED%85%8C%ED%81%AC&display=100&start=101&sort=sim
200
start_num:  201
https://openapi.naver.com/v1/search/blog?query=%ED%95%80%ED%85%8C%ED%81%AC&display=100&start=201&sort=sim
200
start_num:  301
https://openapi.naver.com/v1/search/blog?query=%ED%95%80%ED%85%8C%ED%81%AC&display=100&start=301&sort=sim
200
start_num:  401
https://openapi.naver.com/v1/search/blog?query=%ED%95%80%ED%85%8C%ED%81%AC&display=100&start=401&sort=sim
200
start_num:  501
https://openapi.naver.com/v1/search/blog?query=%ED%95%80%ED%85%8C%ED%81%AC&display=100&start=501&sort=sim
200
start_num:  601
https://openapi.naver.com/v1/search/blog?query=%ED%95%80%ED%85%8C%ED%81%AC&display=100&start=601&sort=sim
200
start_num:  701
https://openapi.naver.com/v1/search/blog?query=%ED%95%80%ED%85%8C%ED%81%AC&display=100&start=701&s

Unnamed: 0,title,link,image,author,discount,publisher,pubdate,isbn,description
0,핀테크 0 핀테크 혁명과 금융의 미래,https://search.shopping.naver.com/book/catalog...,https://shopping-phinf.pstatic.net/main_564418...,김종현,17480,한국금융연수원,20250826,9788928782796,본서에서는 세계 최초로 핀테크 산업의 발전을 단계로 구분하여 설명하는 핀테크 0 의...
1,핀테크 0 핀테크 혁명과 금융의 미래,https://search.shopping.naver.com/book/catalog...,https://shopping-phinf.pstatic.net/main_520007...,김종현,0,한국금융연수원,20241216,9788928782284,본서에서는 세계 최초로 핀테크 산업의 발전을 단계로 구분하여 설명하는 핀테크 0 의...
2,핀테크,https://search.shopping.naver.com/book/catalog...,https://shopping-phinf.pstatic.net/main_324383...,한석주,11400,커뮤니케이션북스,20151101,9791130441436,디지털 기술의 발달은 금융의 모든 것을 바꾸고 있다 기술 기반의 스타트업들과 비금융...
3,핀테크 IT와 금융이 만나는 새로운 세상,https://search.shopping.naver.com/book/catalog...,https://shopping-phinf.pstatic.net/main_325064...,강창호,0,한빛미디어,20150605,9788968482007,금융과 기술로 혁신하는 핀테크 시장을 선점하라 상시 연결된 디지털 세상에서 혁신적인...
4,핀테크와 법 제 판,https://search.shopping.naver.com/book/catalog...,https://shopping-phinf.pstatic.net/main_324417...,강현구^유주선^이성남,19800,씨아이알,20201112,9791156109020,핀테크의 영역과 그에 대한 법률문제의 간격을 어떻게 좁힐 수 있을 것인가 핀테크 관...
...,...,...,...,...,...,...,...,...,...
105,전국 체험마을 주소록 0 CD D프린터 IOT VR 가상현실 드론 바이오기업 스마트...,https://search.shopping.naver.com/book/catalog...,https://shopping-phinf.pstatic.net/main_466775...,한국콘텐츠미디어 편집부,215100,한국콘텐츠미디어,20240322,9791172340193,전국 체험마을 주소록을 분야별 지역별로 9건 관광 여가산업 상세정보를 업종별 지역별...
106,신남방 지역 주요국의 핀테크 발전과 협력방안 인도 태국 말레이시아 베트남 인도네시아...,https://search.shopping.naver.com/book/catalog...,https://shopping-phinf.pstatic.net/main_332340...,이충열^이종하^이선호^강성범,9500,대외경제정책연구원,20201231,9788932290201,이 책은 대외경제정책연구원의 신남방 지역 주요국의 핀테크 발전과 협력방안을 다룬 정...
107,핀테크 블록체인 기술이 적용된 온라인 시스템 전자결제 보안 인증 시장 전망과 핵심기...,https://search.shopping.naver.com/book/catalog...,https://shopping-phinf.pstatic.net/main_324381...,TF정보분석실,342000,트렌드포커스,20190429,9791188774074,차 산업혁명 시대에 핀테크와 블록체인이 핵심기술로 떠오르고 있습니다 핀테크는 금융서...
108,IoT기반 근거리 무선통신 핀테크 산업 현황과 무선전력 전송 및 무선충전 기술개발 동향,https://search.shopping.naver.com/book/catalog...,https://shopping-phinf.pstatic.net/main_324975...,TF정보분석실,279000,트렌드포커스,20150709,9791195558117,IoT는 작년에 이어 올해에도 ICT 시장을 뜨겁게 달구는 키워드 중 하나입니다 모...


In [8]:
import os
import requests
import pandas as pd
from myfunc import text_clean
from dotenv import load_dotenv
import time
load_dotenv() # 가장 아래에 두면 true가 출력되기 때문에 좋다.

True

In [9]:
keyword = input('검색할 키워드를 입력하세요: ')

for category in ['blog', 'news', 'book']:
    
    result = {}
    start_num = 1
    while True:

        if start_num == 1001:
            start_num -= 1
        elif start_num > 1000:
            break

        print("start_num: ", start_num)     
#     print('start_num: ', start_num, end='\r')

        url = f"https://openapi.naver.com/v1/search/{category}"
        payload = dict(query=keyword, display=100,start=start_num,sort='sim')
        headers = {"X-Naver-Client-Id" : os.getenv('Client_ID'),
                   "X-Naver-Client-Secret":os.getenv('Client_Secret')}

        r = requests.get(url, params=payload, headers=headers)
#         print(r.url)
#         print(r.status_code)
        data = r.json()

        for item in data['items']:
            for key,value in item.items():
                if key in ('title', 'description'):
                    value = text_clean(value)
                result.setdefault(key, []).append(value)

        start_num += 100
        
    df = pd.DataFrame(result)
    
    dir_name = "data"
    if not os.path.exists(dir_name):
        os.mkdir(dir_name)
        print(f"{dir_name}을 생성했습니다.")
    else:
        print(f"{dir_name}이 이미 있습니다.")
    
    df.to_csv(f'./data/{keyword}_{category}_result.csv')
    
    time.sleep(0.5)

검색할 키워드를 입력하세요: 스테이블코인
start_num:  1
start_num:  101
start_num:  201
start_num:  301
start_num:  401
start_num:  501
start_num:  601
start_num:  701
start_num:  801
start_num:  901
start_num:  1000
data이 이미 있습니다.
start_num:  1
start_num:  101
start_num:  201
start_num:  301
start_num:  401
start_num:  501
start_num:  601
start_num:  701
start_num:  801
start_num:  901
start_num:  1000
data이 이미 있습니다.
start_num:  1
start_num:  101
start_num:  201
start_num:  301
start_num:  401
start_num:  501
start_num:  601
start_num:  701
start_num:  801
start_num:  901
start_num:  1000
data이 이미 있습니다.


# naver_api 수집 코드 함수화하기
* naver_search 함수를 만들고 함수값으로 검색할 키워드를 입력하면
* naver_api에서 키워드와 관련된 news, blog, book 자료를 1100개씩 검색하고
* keyword_news_result.csv, keyword_blof_result.csv, keyword_book_result.csv 형태로 저장되도록 하세요.

* 답안

In [12]:
import os
import requests
import pandas as pd
from myfunc import text_clean
from dotenv import load_dotenv
import time
load_dotenv() # 가장 아래에 두면 true가 출력되기 때문에 좋다.

True

In [13]:
def naver_search(keyword):

    for category in ['blog', 'news', 'book']:

        result = {}
        start_num = 1
        while True:

            if start_num == 1001:
                start_num -= 1
            elif start_num > 1000:
                break

            print("start_num: ", start_num)     
#           print('start_num: ', start_num, end='\r')

            url = f"https://openapi.naver.com/v1/search/{category}"
            payload = dict(query=keyword, display=100,start=start_num,sort='sim')
            headers = {"X-Naver-Client-Id" : os.getenv('Client_ID'),
                       "X-Naver-Client-Secret":os.getenv('Client_Secret')}

            r = requests.get(url, params=payload, headers=headers)
    #         print(r.url)
    #         print(r.status_code)
            data = r.json()

            for item in data['items']:
                for key,value in item.items():
                    if key in ('title', 'description'):
                        value = text_clean(value)
                    result.setdefault(key, []).append(value)

            start_num += 100

        df = pd.DataFrame(result)

        dir_name = "data"
        if not os.path.exists(dir_name):
            os.mkdir(dir_name)
            print(f"{dir_name}을 생성했습니다.")
        else:
            print(f"{dir_name}이 이미 있습니다.")

        df.to_csv(f"./data/{keyword}_{category}_result_function.csv", encoding="utf8-sig")

        time.sleep(0.5)

In [1]:
naver_search("비트코인")

The history saving thread hit an unexpected error (OperationalError('attempt to write a readonly database')).History will not be written to the database.


NameError: name 'naver_search' is not defined

# 키워드와 카테고리를 입력하는대로 검색하고 출력하게 하기

In [78]:
def naver_search(keyword, *categories): #가변인수로 처리

    for category in categories:

        result = {}
        start_num = 1
        while True:

            if start_num == 1001:
                start_num -= 1
            elif start_num > 1000:
                break

            print("start_num: ", start_num)     
#           print('start_num: ', start_num, end='\r')

            url = f"https://openapi.naver.com/v1/search/{category}"
            payload = dict(query=keyword, display=100,start=start_num,sort='sim')
            headers = {"X-Naver-Client-Id" : os.getenv('Client_ID'),
                       "X-Naver-Client-Secret":os.getenv('Client_Secret')}

            r = requests.get(url, params=payload, headers=headers)
    #         print(r.url)
    #         print(r.status_code)
            data = r.json()

            for item in data['items']:
                for key,value in item.items():
                    if key in ('title', 'description'):
                        value = text_clean(value)
                    result.setdefault(key, []).append(value)

            start_num += 100

        df = pd.DataFrame(result)

        dir_name = "data"
        if not os.path.exists(dir_name):
            os.mkdir(dir_name)
            print(f"{dir_name}을 생성했습니다.")
        else:
            print(f"{dir_name}이 이미 있습니다.")

        df.to_csv(f"./data/{keyword}_{category}_result_function.csv")

        time.sleep(0.5)

In [79]:
naver_search("삼성전자", 'news', 'blog')

data이 이미 있습니다.:  1000
data이 이미 있습니다.:  1000
