# 22_네이버 뉴스 기사 수집

## 용어 정리 

### 1) Web Scraping ( 웹 스크랩핑)

컴퓨터 소프트웨어 기술로 웹 사이트에서 원하는 정보를 추출하는 것.

국내에서는 흔히 크롤링이라는 용어로 많이 알려져 있다.

하나의 페이지에서 데이터 수집

### 2) 웹 크롤러 

인터넷에 있는 웹 사이트를 방문해서 자료를 수집하는 일을 하는 프로그램.

즉, 하나의 페이지에서 파생되는 하위 페이지까지 일괄적으로 방문해서 수집하는 것을 의미.

엄청난 분량의 웹 문서를 사람이 일일이 구별해서 모으는 일은 불가능에 가깝기 때문에, 웹 문서 검색에서는 이를 자동으로 수행 해 준다.

링크를 따라다니면서 복수의 페이지에서 데이터를 수집

## #01. 필요한 모듈 참조

```shell
pip install --upgrade requests
pip install --upgrade bs4
```

In [9]:
import requests                     # 웹 페이지 요청 모듈
from bs4 import BeautifulSoup       # 웹 페이지 소스 코드 분석 모듈 

## #02. 수집 준비

### 1)  접속을 수행하기 위한 session 객체 생성

> 웹 페이지로 부터 데이터를 수집할 경우 항상 가장 처음에 위치해야 하는 코드 입니다.

In [10]:
# 접속 세션 만들기 
user_agent = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36"

session = requests.Session()
session.headers.update({'User-agent':user_agent, 'referer':None})

### 2) 접근할 페이지 주소 (네이버 뉴스 기사)

In [11]:
# content_url = "https://news.naver.com/main/read.nhn?mode=LSD&mid=shm&sid1=100&oid=032&aid=0003000463"
content_url ="https://news.naver.com/main/read.nhn?mode=LPOD&mid=sec&oid=001&aid=0011505454&isYeonhapFlash=Y&rc=N"

## #03. 데이터 수집

지정된 URL에 접속하고 접속 결과를 체크한다.

In [12]:
r = session.get(content_url)

# 결과 확인
if r.status_code != 200 :
    print("%d 에러가 발생했습니다." % r.status_code)
    quit()

## #04. 데이터 추출

URL에 접속해서 가져온 HTML 코드에서 분석을 원하는 부분을 추출한다.

### 1) 가져온 HTML 코드 확인

웹 페이지의 인코딩 형식을 확인하여 설정해야 한다.


In [13]:
# r.encoding = 'UTF-8'
# 깨지면 
r.encoding = "euc-kr"
r.text

'<!DOCTYPE HTML> \r\n<html lang="ko"> \r\n<head>\r\n<meta charset="euc-kr">\r\n<meta http-equiv="X-UA-Compatible" content="IE=edge">\r\n<meta name="referrer" contents="always">\r\n<meta name="viewport" content="width=1106" />\r\n<title>정부 "코로나19 완치율 50% 달성, 우리 사회가 축하할 성과"(종합) : 네이버 뉴스</title>\r\n\n\n\t\n\t\n\t\t\n\t\n\n\n\t\n\t\n\t\n\t\t\n\t\t\n\t\t\n\t\n\n<meta property="me2:post_tag"\t\tcontent="연합뉴스 : 네이버뉴스"/>\n<meta property="me2:category1"\t\tcontent="연합뉴스"/>\n<meta property="me2:category2"\t\tcontent="속보"/>\n<meta property="me2:image"\t\t\tcontent="https://imgnews.pstatic.net/image/001/2020/03/28/PYH2020032307330001300_P4_20200328121308020.jpg"/>\n\n<meta property="og:title"\t\t\tcontent="정부 &quot;코로나19 완치율 50% 달성, 우리 사회가 축하할 성과&quot;(종합)"/>\n<meta property="og:type"\t\t\tcontent="article"/>\n<meta property="og:url"\t\t\t\tcontent="https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&oid=001&aid=0011505454&sid1=001"/>\n<meta property="og:image"\t\t\tcontent="https://imgnews.psta

### 2) 기사 본문 추출하기 

In [14]:
# 웹 페이지의 소스코드를 사용하여 HTML 분석 객체로 생성
soup = BeautifulSoup(r.text, 'html.parser')

# CSS 선택자를 활용하여 가져오기를 원하는 부분 지정
# -> "#id"값 형식으로 지정
selector = soup.select('#articleBodyContents')

# 가져온 내용이 없다면?
if not selector:
    print("크롤링 실패")
    quit()
    
print(type(selector))    
print("-" * 50 )
print(len(selector))
print("-" * 50 )

selector

<class 'list'>
--------------------------------------------------
1
--------------------------------------------------


[<div class="_article_body_contents" id="articleBodyContents">
 <!-- 본문 내용 -->
 <!-- TV플레이어 -->
 <!-- // TV플레이어 -->
 <script type="text/javascript">
 // flash 오류를 우회하기 위한 함수 추가
 function _flash_removeCallback() {}
 </script>
 	
 	완치 4천811명·격리중 4천523명…"아직은 집단감염 줄여야 할 시기"<br/><br/>실내체육시설 407개소에 행정명령…방호복 국내 생산 늘려 수급 안정화<br/><br/>(서울=연합뉴스) 채새롬 기자 = 방역당국이 국내 신종 코로나바이러스 감염증(코로나19) 발생 이후 처음으로 28일 완치자 수가 치료 중인 환자 수를 넘어섰다며, 이는 우리 사회가 축하해야 할 성과라고 평가했다. <br/><br/>    그러나 지역사회 집단 감염이 이어지는 등 코로나19 확산 상황을 안심할 수 없어 국민들이 계속해 '사회적 거리두기'에 동참해야 한다고 강조했다.<br/><br/><span class="end_photo_org"><img alt="" src="https://imgnews.pstatic.net/image/001/2020/03/28/PYH2020032307330001300_P4_20200328121308020.jpg?type=w647"><em class="img_desc">코로나19 정례브리핑하는 윤태호 방역총괄반장(세종=연합뉴스) 김주형 기자 = 윤태호 중앙사고수습본부 방역총괄반장(보건복지부 공공보건정책관)이 23일 오전 세종시 정부세종청사에서 코로나19 대응 중앙재난안전대책본부 회의 결과 등 정례브리핑을 하고 있다. 이날 브리핑은 참석한 기자 없이 비대면으로 진행했다.<br/>    정부는 4월 5일까지 '사회적 거리두기' 강화 기간에 '공무원 복무관리 특별 지침'을 시행해 공공부문에서부터 신종 코로나바이러스 감염증(코로나19) 확산 억제에 앞장서겠다고

### 2) 추출한 본문 영역에서 불필요한 부분 제거/ 치환

#### 본문 영역에 대한 결과 얻기 

html의 id 속성을 통해 가져온 원소는 그 페이지 내에서 **고유한 영역**을 의미하므로,
select() 함수의 결과가 list라 하더라고 **실제 원소는 단 하나**만 존재한다.

그렇기 때문에 리스트에 대한 **0번째 요소에 직접 접근**해도 무관하다.

In [15]:
item = selector[0]

print(type(item))
print("-" * 50)
print(item)

<class 'bs4.element.Tag'>
--------------------------------------------------
<div class="_article_body_contents" id="articleBodyContents">
<!-- 본문 내용 -->
<!-- TV플레이어 -->
<!-- // TV플레이어 -->
<script type="text/javascript">
// flash 오류를 우회하기 위한 함수 추가
function _flash_removeCallback() {}
</script>
	
	완치 4천811명·격리중 4천523명…"아직은 집단감염 줄여야 할 시기"<br/><br/>실내체육시설 407개소에 행정명령…방호복 국내 생산 늘려 수급 안정화<br/><br/>(서울=연합뉴스) 채새롬 기자 = 방역당국이 국내 신종 코로나바이러스 감염증(코로나19) 발생 이후 처음으로 28일 완치자 수가 치료 중인 환자 수를 넘어섰다며, 이는 우리 사회가 축하해야 할 성과라고 평가했다. <br/><br/>    그러나 지역사회 집단 감염이 이어지는 등 코로나19 확산 상황을 안심할 수 없어 국민들이 계속해 '사회적 거리두기'에 동참해야 한다고 강조했다.<br/><br/><span class="end_photo_org"><img alt="" src="https://imgnews.pstatic.net/image/001/2020/03/28/PYH2020032307330001300_P4_20200328121308020.jpg?type=w647"><em class="img_desc">코로나19 정례브리핑하는 윤태호 방역총괄반장(세종=연합뉴스) 김주형 기자 = 윤태호 중앙사고수습본부 방역총괄반장(보건복지부 공공보건정책관)이 23일 오전 세종시 정부세종청사에서 코로나19 대응 중앙재난안전대책본부 회의 결과 등 정례브리핑을 하고 있다. 이날 브리핑은 참석한 기자 없이 비대면으로 진행했다.<br/>    정부는 4월 5일까지 '사회적 거리두기' 강화 기간에

#### 불필요한 태그들 제거하기 

##### `<script>`태그 제거

In [16]:
for target in item.find_all('script'):
    target.extract()
    
item    

<div class="_article_body_contents" id="articleBodyContents">
<!-- 본문 내용 -->
<!-- TV플레이어 -->
<!-- // TV플레이어 -->

	
	완치 4천811명·격리중 4천523명…"아직은 집단감염 줄여야 할 시기"<br/><br/>실내체육시설 407개소에 행정명령…방호복 국내 생산 늘려 수급 안정화<br/><br/>(서울=연합뉴스) 채새롬 기자 = 방역당국이 국내 신종 코로나바이러스 감염증(코로나19) 발생 이후 처음으로 28일 완치자 수가 치료 중인 환자 수를 넘어섰다며, 이는 우리 사회가 축하해야 할 성과라고 평가했다. <br/><br/>    그러나 지역사회 집단 감염이 이어지는 등 코로나19 확산 상황을 안심할 수 없어 국민들이 계속해 '사회적 거리두기'에 동참해야 한다고 강조했다.<br/><br/><span class="end_photo_org"><img alt="" src="https://imgnews.pstatic.net/image/001/2020/03/28/PYH2020032307330001300_P4_20200328121308020.jpg?type=w647"><em class="img_desc">코로나19 정례브리핑하는 윤태호 방역총괄반장(세종=연합뉴스) 김주형 기자 = 윤태호 중앙사고수습본부 방역총괄반장(보건복지부 공공보건정책관)이 23일 오전 세종시 정부세종청사에서 코로나19 대응 중앙재난안전대책본부 회의 결과 등 정례브리핑을 하고 있다. 이날 브리핑은 참석한 기자 없이 비대면으로 진행했다.<br/>    정부는 4월 5일까지 '사회적 거리두기' 강화 기간에 '공무원 복무관리 특별 지침'을 시행해 공공부문에서부터 신종 코로나바이러스 감염증(코로나19) 확산 억제에 앞장서겠다고 밝혔다. 2020.3.23 kjhpress@yna.co.kr</em></img></span><br/><br/>    윤태호 중앙사고수습본부 방역총괄반장(보건복지부 공공보건정책관)은 이날 정부세종청사에서 

#### `<a>` 태그 제거

In [17]:
for target in item.find_all('a'):
    target.extract()
    
item 

<div class="_article_body_contents" id="articleBodyContents">
<!-- 본문 내용 -->
<!-- TV플레이어 -->
<!-- // TV플레이어 -->

	
	완치 4천811명·격리중 4천523명…"아직은 집단감염 줄여야 할 시기"<br/><br/>실내체육시설 407개소에 행정명령…방호복 국내 생산 늘려 수급 안정화<br/><br/>(서울=연합뉴스) 채새롬 기자 = 방역당국이 국내 신종 코로나바이러스 감염증(코로나19) 발생 이후 처음으로 28일 완치자 수가 치료 중인 환자 수를 넘어섰다며, 이는 우리 사회가 축하해야 할 성과라고 평가했다. <br/><br/>    그러나 지역사회 집단 감염이 이어지는 등 코로나19 확산 상황을 안심할 수 없어 국민들이 계속해 '사회적 거리두기'에 동참해야 한다고 강조했다.<br/><br/><span class="end_photo_org"><img alt="" src="https://imgnews.pstatic.net/image/001/2020/03/28/PYH2020032307330001300_P4_20200328121308020.jpg?type=w647"><em class="img_desc">코로나19 정례브리핑하는 윤태호 방역총괄반장(세종=연합뉴스) 김주형 기자 = 윤태호 중앙사고수습본부 방역총괄반장(보건복지부 공공보건정책관)이 23일 오전 세종시 정부세종청사에서 코로나19 대응 중앙재난안전대책본부 회의 결과 등 정례브리핑을 하고 있다. 이날 브리핑은 참석한 기자 없이 비대면으로 진행했다.<br/>    정부는 4월 5일까지 '사회적 거리두기' 강화 기간에 '공무원 복무관리 특별 지침'을 시행해 공공부문에서부터 신종 코로나바이러스 감염증(코로나19) 확산 억제에 앞장서겠다고 밝혔다. 2020.3.23 kjhpress@yna.co.kr</em></img></span><br/><br/>    윤태호 중앙사고수습본부 방역총괄반장(보건복지부 공공보건정책관)은 이날 정부세종청사에서 

#### `<span>` 태그 제거

In [18]:
for target in item.find_all('span'):
    target.extract()
    
item 

<div class="_article_body_contents" id="articleBodyContents">
<!-- 본문 내용 -->
<!-- TV플레이어 -->
<!-- // TV플레이어 -->

	
	완치 4천811명·격리중 4천523명…"아직은 집단감염 줄여야 할 시기"<br/><br/>실내체육시설 407개소에 행정명령…방호복 국내 생산 늘려 수급 안정화<br/><br/>(서울=연합뉴스) 채새롬 기자 = 방역당국이 국내 신종 코로나바이러스 감염증(코로나19) 발생 이후 처음으로 28일 완치자 수가 치료 중인 환자 수를 넘어섰다며, 이는 우리 사회가 축하해야 할 성과라고 평가했다. <br/><br/>    그러나 지역사회 집단 감염이 이어지는 등 코로나19 확산 상황을 안심할 수 없어 국민들이 계속해 '사회적 거리두기'에 동참해야 한다고 강조했다.<br/><br/><br/><br/>    윤태호 중앙사고수습본부 방역총괄반장(보건복지부 공공보건정책관)은 이날 정부세종청사에서 열린 정례 브리핑에서 "오늘은 누적 확진자 수 중 완치된 확진자 수가 격리치료 중인 확진자보다 많아져 완치율 50%를 달성했다"며 "아직 갈 길은 멀지만, 완치율 50%는 우리 사회 모두가 함께 축하할 만한 자그마한 성과"라고 말했다.<br/><br/>    윤 반장은 "방역당국은 공격적인 진단검사와 역학조사를 통해 확진자와 접촉자를 찾아 격리해 감염전파를 막았고, 국민들께서는 사회적 거리두기에 적극적으로 동참했다"며 "의료진들은 찾아낸 확진환자를 안정적으로 치료하였기에 가능한 성과였다"고 설명했다.<br/><br/>    중앙방역대책본부에 따르면 이날 0시 기준 국내에서 코로나19에 걸렸다가 완치된 사람은 4천811명으로, 격리 상태에서 치료 중인 확진자 수(4천523명)를 추월했다. 올해 1월 20일 국내 첫 코로나19 환자가 발생한 지 68일 만이다. <br/><br/>    앞서 2월 18일 31번째 확진자가 나온 이후 대구·경북 지역 확진자가 급증하면서 신규 확진자 수는 80

#### `<div>` 태그 제거

In [19]:
for target in item.find_all('div'):
    target.extract()
    
item 

<div class="_article_body_contents" id="articleBodyContents">
<!-- 본문 내용 -->
<!-- TV플레이어 -->
<!-- // TV플레이어 -->

	
	완치 4천811명·격리중 4천523명…"아직은 집단감염 줄여야 할 시기"<br/><br/>실내체육시설 407개소에 행정명령…방호복 국내 생산 늘려 수급 안정화<br/><br/>(서울=연합뉴스) 채새롬 기자 = 방역당국이 국내 신종 코로나바이러스 감염증(코로나19) 발생 이후 처음으로 28일 완치자 수가 치료 중인 환자 수를 넘어섰다며, 이는 우리 사회가 축하해야 할 성과라고 평가했다. <br/><br/>    그러나 지역사회 집단 감염이 이어지는 등 코로나19 확산 상황을 안심할 수 없어 국민들이 계속해 '사회적 거리두기'에 동참해야 한다고 강조했다.<br/><br/><br/><br/>    윤태호 중앙사고수습본부 방역총괄반장(보건복지부 공공보건정책관)은 이날 정부세종청사에서 열린 정례 브리핑에서 "오늘은 누적 확진자 수 중 완치된 확진자 수가 격리치료 중인 확진자보다 많아져 완치율 50%를 달성했다"며 "아직 갈 길은 멀지만, 완치율 50%는 우리 사회 모두가 함께 축하할 만한 자그마한 성과"라고 말했다.<br/><br/>    윤 반장은 "방역당국은 공격적인 진단검사와 역학조사를 통해 확진자와 접촉자를 찾아 격리해 감염전파를 막았고, 국민들께서는 사회적 거리두기에 적극적으로 동참했다"며 "의료진들은 찾아낸 확진환자를 안정적으로 치료하였기에 가능한 성과였다"고 설명했다.<br/><br/>    중앙방역대책본부에 따르면 이날 0시 기준 국내에서 코로나19에 걸렸다가 완치된 사람은 4천811명으로, 격리 상태에서 치료 중인 확진자 수(4천523명)를 추월했다. 올해 1월 20일 국내 첫 코로나19 환자가 발생한 지 68일 만이다. <br/><br/>    앞서 2월 18일 31번째 확진자가 나온 이후 대구·경북 지역 확진자가 급증하면서 신규 확진자 수는 80

#### `<iframe>` 태그 제거

기사에 따라 `<iframe>` 태그가 없는 경우도 있다. (이 태그는 주로 광고 노출을 위해 사용된다.)

존재하지 않는 태그를 삭제하는 것은 아무런 문제가 되지 않으므로 기사 내용에 상관없이 수행된다.

In [20]:
for target in item.find_all('iframe'):
    target.extract()
    
item 

<div class="_article_body_contents" id="articleBodyContents">
<!-- 본문 내용 -->
<!-- TV플레이어 -->
<!-- // TV플레이어 -->

	
	완치 4천811명·격리중 4천523명…"아직은 집단감염 줄여야 할 시기"<br/><br/>실내체육시설 407개소에 행정명령…방호복 국내 생산 늘려 수급 안정화<br/><br/>(서울=연합뉴스) 채새롬 기자 = 방역당국이 국내 신종 코로나바이러스 감염증(코로나19) 발생 이후 처음으로 28일 완치자 수가 치료 중인 환자 수를 넘어섰다며, 이는 우리 사회가 축하해야 할 성과라고 평가했다. <br/><br/>    그러나 지역사회 집단 감염이 이어지는 등 코로나19 확산 상황을 안심할 수 없어 국민들이 계속해 '사회적 거리두기'에 동참해야 한다고 강조했다.<br/><br/><br/><br/>    윤태호 중앙사고수습본부 방역총괄반장(보건복지부 공공보건정책관)은 이날 정부세종청사에서 열린 정례 브리핑에서 "오늘은 누적 확진자 수 중 완치된 확진자 수가 격리치료 중인 확진자보다 많아져 완치율 50%를 달성했다"며 "아직 갈 길은 멀지만, 완치율 50%는 우리 사회 모두가 함께 축하할 만한 자그마한 성과"라고 말했다.<br/><br/>    윤 반장은 "방역당국은 공격적인 진단검사와 역학조사를 통해 확진자와 접촉자를 찾아 격리해 감염전파를 막았고, 국민들께서는 사회적 거리두기에 적극적으로 동참했다"며 "의료진들은 찾아낸 확진환자를 안정적으로 치료하였기에 가능한 성과였다"고 설명했다.<br/><br/>    중앙방역대책본부에 따르면 이날 0시 기준 국내에서 코로나19에 걸렸다가 완치된 사람은 4천811명으로, 격리 상태에서 치료 중인 확진자 수(4천523명)를 추월했다. 올해 1월 20일 국내 첫 코로나19 환자가 발생한 지 68일 만이다. <br/><br/>    앞서 2월 18일 31번째 확진자가 나온 이후 대구·경북 지역 확진자가 급증하면서 신규 확진자 수는 80

#### `<br>` 태그 치환

`<br>` 태그는 줄바꿈 문자를 의미하므로 `replace_with` 함수를 사용하여 개행문자(`\n`)로 치환한다.

In [21]:
for target in item.find_all('br'):
    target.replace_with("\n")
    
item 

<div class="_article_body_contents" id="articleBodyContents">
<!-- 본문 내용 -->
<!-- TV플레이어 -->
<!-- // TV플레이어 -->

	
	완치 4천811명·격리중 4천523명…"아직은 집단감염 줄여야 할 시기"

실내체육시설 407개소에 행정명령…방호복 국내 생산 늘려 수급 안정화

(서울=연합뉴스) 채새롬 기자 = 방역당국이 국내 신종 코로나바이러스 감염증(코로나19) 발생 이후 처음으로 28일 완치자 수가 치료 중인 환자 수를 넘어섰다며, 이는 우리 사회가 축하해야 할 성과라고 평가했다. 

    그러나 지역사회 집단 감염이 이어지는 등 코로나19 확산 상황을 안심할 수 없어 국민들이 계속해 '사회적 거리두기'에 동참해야 한다고 강조했다.



    윤태호 중앙사고수습본부 방역총괄반장(보건복지부 공공보건정책관)은 이날 정부세종청사에서 열린 정례 브리핑에서 "오늘은 누적 확진자 수 중 완치된 확진자 수가 격리치료 중인 확진자보다 많아져 완치율 50%를 달성했다"며 "아직 갈 길은 멀지만, 완치율 50%는 우리 사회 모두가 함께 축하할 만한 자그마한 성과"라고 말했다.

    윤 반장은 "방역당국은 공격적인 진단검사와 역학조사를 통해 확진자와 접촉자를 찾아 격리해 감염전파를 막았고, 국민들께서는 사회적 거리두기에 적극적으로 동참했다"며 "의료진들은 찾아낸 확진환자를 안정적으로 치료하였기에 가능한 성과였다"고 설명했다.

    중앙방역대책본부에 따르면 이날 0시 기준 국내에서 코로나19에 걸렸다가 완치된 사람은 4천811명으로, 격리 상태에서 치료 중인 확진자 수(4천523명)를 추월했다. 올해 1월 20일 국내 첫 코로나19 환자가 발생한 지 68일 만이다. 

    앞서 2월 18일 31번째 확진자가 나온 이후 대구·경북 지역 확진자가 급증하면서 신규 확진자 수는 800명대까지 늘고, 격리치료 중인 확진자는 이달 12일 기준 7천500명까지 증가한 바 있다. 이후 13일부터 15일

### 3)최종 텍스트 추출

#### 텍스트만 추출

앞뒤로 불필요한 개행문자(`\n`)이 포함되어 있다.

In [22]:
item.text

'\n\n\n\n\n\t\n\t완치 4천811명·격리중 4천523명…"아직은 집단감염 줄여야 할 시기"\n\n실내체육시설 407개소에 행정명령…방호복 국내 생산 늘려 수급 안정화\n\n(서울=연합뉴스) 채새롬 기자 = 방역당국이 국내 신종 코로나바이러스 감염증(코로나19) 발생 이후 처음으로 28일 완치자 수가 치료 중인 환자 수를 넘어섰다며, 이는 우리 사회가 축하해야 할 성과라고 평가했다. \n\n    그러나 지역사회 집단 감염이 이어지는 등 코로나19 확산 상황을 안심할 수 없어 국민들이 계속해 \'사회적 거리두기\'에 동참해야 한다고 강조했다.\n\n\n\n    윤태호 중앙사고수습본부 방역총괄반장(보건복지부 공공보건정책관)은 이날 정부세종청사에서 열린 정례 브리핑에서 "오늘은 누적 확진자 수 중 완치된 확진자 수가 격리치료 중인 확진자보다 많아져 완치율 50%를 달성했다"며 "아직 갈 길은 멀지만, 완치율 50%는 우리 사회 모두가 함께 축하할 만한 자그마한 성과"라고 말했다.\n\n    윤 반장은 "방역당국은 공격적인 진단검사와 역학조사를 통해 확진자와 접촉자를 찾아 격리해 감염전파를 막았고, 국민들께서는 사회적 거리두기에 적극적으로 동참했다"며 "의료진들은 찾아낸 확진환자를 안정적으로 치료하였기에 가능한 성과였다"고 설명했다.\n\n    중앙방역대책본부에 따르면 이날 0시 기준 국내에서 코로나19에 걸렸다가 완치된 사람은 4천811명으로, 격리 상태에서 치료 중인 확진자 수(4천523명)를 추월했다. 올해 1월 20일 국내 첫 코로나19 환자가 발생한 지 68일 만이다. \n\n    앞서 2월 18일 31번째 확진자가 나온 이후 대구·경북 지역 확진자가 급증하면서 신규 확진자 수는 800명대까지 늘고, 격리치료 중인 확진자는 이달 12일 기준 7천500명까지 증가한 바 있다. 이후 13일부터 15일 연속으로 매일 완치되는 환자가 새로 발견되는 확진자보다 많아지면서 격리치료 중인 확진자 수는 꾸준히 감소하는 추세다.\n\n    그는 "다만 

#### 앞뒤 공백 제거 

In [23]:
news_content = item.text.strip()
news_content

'완치 4천811명·격리중 4천523명…"아직은 집단감염 줄여야 할 시기"\n\n실내체육시설 407개소에 행정명령…방호복 국내 생산 늘려 수급 안정화\n\n(서울=연합뉴스) 채새롬 기자 = 방역당국이 국내 신종 코로나바이러스 감염증(코로나19) 발생 이후 처음으로 28일 완치자 수가 치료 중인 환자 수를 넘어섰다며, 이는 우리 사회가 축하해야 할 성과라고 평가했다. \n\n    그러나 지역사회 집단 감염이 이어지는 등 코로나19 확산 상황을 안심할 수 없어 국민들이 계속해 \'사회적 거리두기\'에 동참해야 한다고 강조했다.\n\n\n\n    윤태호 중앙사고수습본부 방역총괄반장(보건복지부 공공보건정책관)은 이날 정부세종청사에서 열린 정례 브리핑에서 "오늘은 누적 확진자 수 중 완치된 확진자 수가 격리치료 중인 확진자보다 많아져 완치율 50%를 달성했다"며 "아직 갈 길은 멀지만, 완치율 50%는 우리 사회 모두가 함께 축하할 만한 자그마한 성과"라고 말했다.\n\n    윤 반장은 "방역당국은 공격적인 진단검사와 역학조사를 통해 확진자와 접촉자를 찾아 격리해 감염전파를 막았고, 국민들께서는 사회적 거리두기에 적극적으로 동참했다"며 "의료진들은 찾아낸 확진환자를 안정적으로 치료하였기에 가능한 성과였다"고 설명했다.\n\n    중앙방역대책본부에 따르면 이날 0시 기준 국내에서 코로나19에 걸렸다가 완치된 사람은 4천811명으로, 격리 상태에서 치료 중인 확진자 수(4천523명)를 추월했다. 올해 1월 20일 국내 첫 코로나19 환자가 발생한 지 68일 만이다. \n\n    앞서 2월 18일 31번째 확진자가 나온 이후 대구·경북 지역 확진자가 급증하면서 신규 확진자 수는 800명대까지 늘고, 격리치료 중인 확진자는 이달 12일 기준 7천500명까지 증가한 바 있다. 이후 13일부터 15일 연속으로 매일 완치되는 환자가 새로 발견되는 확진자보다 많아지면서 격리치료 중인 확진자 수는 꾸준히 감소하는 추세다.\n\n    그는 "다만 대구의 한 병원에서 최근 집단

#### 추출 결과를 텍스트로 저장

In [24]:
with open("네이버뉴스.txt", "w", encoding="utf-8") as f:
    f.write(news_content)