# Week 10 - Website Crawling

## BeautifleSoup4 를 이용한 웹페이지 크롤링

### BeautifulSoup 모듈을 로딩한다.

In [1]:
from bs4 import BeautifulSoup

아래의 텍스트 라인은 샘플 HTML 문서이다. 실제로는 저장된 HTML파일을 불러오거나 웹에서 바로 HTML문서를 다운로드 받아 데이터 처리를 한다.

In [2]:
html_doc = "<html><body><h1>Mr. Belvedere Fan Club</h1><div id='nav'>navigation bar</div><div class='nav'>navigation class</div><div class='header'><a href='twitter_anywhere'>my twitter</a></div></body></html>"

BeautifulSoup의 "html.parser"를 이용하여 문서를 parsing한다. "html.parser" 외에 "xml", "html5lib" 등의 parser를 제공한다.
https://www.crummy.com/software/BeautifulSoup/bs4/doc/

In [3]:
soup = BeautifulSoup(html_doc, "html.parser")
soup

<html><body><h1>Mr. Belvedere Fan Club</h1><div id="nav">navigation bar</div><div class="nav">navigation class</div><div class="header"><a href="twitter_anywhere">my twitter</a></div></body></html>

In [4]:
print(type(soup))

<class 'bs4.BeautifulSoup'>


parsing된 HTML 문서를 보기 좋게 보여준다.

range를 사용하여 원하는 만큼만 볼 수 있다. `soup.prettify()[0:100]`

In [5]:
print(soup.prettify())

<html>
 <body>
  <h1>
   Mr. Belvedere Fan Club
  </h1>
  <div id="nav">
   navigation bar
  </div>
  <div class="nav">
   navigation class
  </div>
  <div class="header">
   <a href="twitter_anywhere">
    my twitter
   </a>
  </div>
 </body>
</html>


전체 문서에서 ```<h1>``` 인 요소들만 찾아 list로 반환한다.

In [6]:
heading = soup.find_all("h1")
heading

[<h1>Mr. Belvedere Fan Club</h1>]

요소의 내용(text)를 반환하기 위해서 `get_text()`를 사용한다. 

In [7]:
heading[0].get_text()

'Mr. Belvedere Fan Club'

<질문> ```heading.get_text()``` 는 에러가 나는 이유는?

In [8]:
divs = soup.find_all("div")
divs

[<div id="nav">navigation bar</div>,
 <div class="nav">navigation class</div>,
 <div class="header"><a href="twitter_anywhere">my twitter</a></div>]

여러 요소 중, class와 id 등으로 filtering 하기 위해서 두번째 패러미터를 사용한다.

In [9]:
divs = soup.find_all("div", class_="nav")
divs

[<div class="nav">navigation class</div>]

In [10]:
divs = soup.find_all("div", id="nav")
divs

[<div id="nav">navigation bar</div>]

In [11]:
id_list = []
divs = soup.find_all("div", class_="header")
for div in divs:
    if div.a["href"] == "twitter_anywhere":
        id_list.append(div.a.text) # text 는 get_text()와 동일하게 사용됨.
id_list

['my twitter']

## twitter 아이디와 사용자 이름 수집

twtkr_example.html 파일을 읽어 트위터 아이디와 사용자 이름을 수집해 보자. 수집된 id 에서 @ 기호를 삭제하여 출력한다.
* 예: u_simin, 유시민

In [12]:
from bs4 import BeautifulSoup

html_doc = ""
with open("data/twtkr_example.html") as file:
    html_doc = file.read()

soup = BeautifulSoup(html_doc, "html.parser")

In [13]:
divs = soup.find_all("div", class_="header")
for div in divs:
    print(div.cite.a["href"].replace("/", ""), div.cite.a.text)

u_simin 유시민
BBK_Sniper 정봉주
funronga 김용민
actormoon 문성근 (민주당,배우)
heenews 이정희 (통합진보당)
GH_PARK 박근혜 (새누리당)
HanMyeongSook 한명숙 (민주통합당)
moonriver365 문재인
sangjungsim 심상정
your_rights 최재천 (민주통합당)
kangkumsil 강금실
mentshin 신경민 (민주당,前앵커)
kanggigap 강기갑
Nakw 나경원 (새누리당)
Jungwook_Hong 홍정욱 (새누리당)
cheolsoo0919 안철수
jwp615 박지원 (민주통합당)
hcroh 노회찬
gihos1 서기호
hongshenx 홍세화 (진보신당)


## URL 가져와서 데이터 수집

In [14]:
import urllib.request
with urllib.request.urlopen("https://media.daum.net/ranking/bestreply/") as url:
    doc = url.read()
    soup = BeautifulSoup(doc, "html.parser")
    strongs = soup.find_all("strong", class_="tit_thumb")
    for strong in strongs:
        print(strong)
#         print(strong.a.text)
#         print(strong.a["href"])
        break

<strong class="tit_thumb">
<a class="link_txt" href="http://v.media.daum.net/v/20191102172347881">이언주 "과거사고 나발이고 미국·일본에 도움 청해야"</a>
<span class="info_news">뉴스1</span>
</strong>


## 실습 1: 데이터 수집을 위한 리스트 작성

위의 주소에서 수집하고자 하는 URL의 리스트를 작성해보자.

In [15]:
import urllib.request

url_list = []
with urllib.request.urlopen("https://media.daum.net/ranking/bestreply/") as url:
    doc = url.read()
    soup = BeautifulSoup(doc, "html.parser")
    strongs = soup.find_all("strong", class_="tit_thumb")
    for strong in strongs:
        url_list.append(strong.a["href"])
        
url_list

['http://v.media.daum.net/v/20191102172347881',
 'http://v.media.daum.net/v/20191102173844099',
 'http://v.media.daum.net/v/20191102193502450',
 'http://v.media.daum.net/v/20191103071007709',
 'http://v.media.daum.net/v/20191102210226320',
 'http://v.media.daum.net/v/20191102214216617',
 'http://v.media.daum.net/v/20191102202535003',
 'http://v.media.daum.net/v/20191102164621404',
 'http://v.media.daum.net/v/20191103095509769',
 'http://v.media.daum.net/v/20191103060512357',
 'http://v.media.daum.net/v/20191103081826218',
 'http://v.media.daum.net/v/20191103111455145',
 'http://v.media.daum.net/v/20191103131148205',
 'http://v.media.daum.net/v/20191102201012861',
 'http://v.media.daum.net/v/20191103101221064',
 'http://v.media.daum.net/v/20191102203818117',
 'http://v.media.daum.net/v/20191103133258587',
 'http://v.media.daum.net/v/20191102161326130',
 'http://v.media.daum.net/v/20191103060045262',
 'http://v.media.daum.net/v/20191102195455693',
 'http://v.media.daum.net/v/201911030857

## 실습 2: 기사 수집 1

#### 주어진 URL의 기사의 타이틀을 수집해보자.

In [16]:
from bs4 import BeautifulSoup
import urllib.request

base_url = "http://v.media.daum.net/v/20181103172202580"

with urllib.request.urlopen(base_url) as url:
    doc = url.read()
    soup = BeautifulSoup(doc, "html.parser")
    title = soup.find_all("h3", class_="tit_view")[0].text
    print(title)


나경원 "역사 부인하는 아베 발언 치졸..사과부터 하라"


#### 주어진 기사의 본문을 수집해 보자.

이 기사에는 figurecaption 부분이 있는데, 다음과 같은 코드로 제외한다. 

`unwanted = div.find("p", class_="link_figure")
unwanted.extract()`

In [17]:
from bs4 import BeautifulSoup
import urllib.request

base_url = "http://v.media.daum.net/v/20181103172202580"

with urllib.request.urlopen(base_url) as url:
    doc = url.read()
    soup = BeautifulSoup(doc, "html.parser")
    div = soup.find_all("div", class_="news_view")[0]
    unwanted = div.find("p", class_="link_figure")
    print(type(unwanted))
    unwanted.extract()
    unwanted = div.find("figure")
    unwanted.extract()
    print(div.text.strip())

<class 'bs4.element.Tag'>
【서울=뉴시스】유자비 기자 = 나경원 자유한국당 의원은 3일 아베 신조 일본 총리가 강제징용 사실을 부인하는 것과 관련, "역사적 사실을 부인하는 아베 총리의 발언은 치졸하기 짝이 없다"며 "사과부터 해야 할 것"이라고 비판했다. 
나 의원은 이날 자신의 페이스북을 통해 "한일협정의 국제법적 효력과 배상청구권에 대한 법적 논란을 차치하고 강제징용이란 역사적 사실을 부인하는 아베 총리의 발언은 치졸하기 짝이 없다"며 이같이 밝혔다.
그는 "아무리 국내정치와 국제재판에서 유리한 지위를 점유하기 위함이라고 해도 역사의 기본적인 내용을 바꿔 자발적 계약에 의한 모집 노동자라고 하는 것은 그들의 침략을 정당화하는 것과 다름없다"며 "아베 총리는 사과부터 해야 할 것"이라고 촉구했다. 
앞서 우리 대법원이 지난달 30일 일제 강제징용 배상 승소 판결을 내린 데 대해 아베 총리는 징용공이 아닌 '한반도 출신 노동자'라는 표현을 사용하는 등 강제징용 사실을 부인하려는 시도를 하고 있다. 
jabiu@newsis.com


#### 기자이름과 입력 날짜를 수집해보자.

In [18]:
from bs4 import BeautifulSoup
import urllib.request
from datetime import datetime as dt

base_url = "http://v.media.daum.net/v/20181103172202580"

with urllib.request.urlopen(base_url) as url:
    doc = url.read()
    soup = BeautifulSoup(doc, "html.parser")
    info_span = soup.find_all("span", class_="txt_info")
    journalist_name = info_span[0].text.strip()
    article_date = info_span[1].text.replace("입력", "").strip()
    article_date_conv = dt.strptime(article_date, "%Y.%m.%d. %H:%M")
    print(journalist_name, article_date_conv)

유자비 2018-11-03 17:22:00


#### 언론사 이름을 수집해보자.

In [19]:
from bs4 import BeautifulSoup
import urllib.request

base_url = "http://v.media.daum.net/v/20181103172202580"

with urllib.request.urlopen(base_url) as url:
    doc = url.read()
    soup = BeautifulSoup(doc, "html.parser")
    cp = soup.find_all("em", class_="info_cp")[0]
    print(cp.img["alt"])

뉴시스


## 실습 3: 기사 수집 2

#### 위의 내용을 바탕으로 댓글 많은 뉴스 전체 기사를 수집해서 JSON으로 저장해 보자.
1. 위의 코드를 합쳐서
    - 기사의 리스트 수집
    - 각 기사 내용 수집
2. JSON 저장

In [20]:
from bs4 import BeautifulSoup
import urllib.request
from datetime import datetime as dt

# 기사 URL 수집
url_list = []
with urllib.request.urlopen("https://media.daum.net/ranking/bestreply/") as url:
    doc = url.read()
    soup = BeautifulSoup(doc, "html.parser")
    strongs = soup.find_all("strong", class_="tit_thumb")
    for strong in strongs:
        url_list.append(strong.a["href"])
        
# 기사 내용 수집
for base_url in url_list:
    
    with urllib.request.urlopen(base_url) as url:
        doc = url.read()
        soup = BeautifulSoup(doc, "html.parser")

        # 기사 타이틀 수집
        title = soup.find_all("h3", class_="tit_view")[0].text.strip()
        print(title)

        # 기사 본문 수집
        div = soup.find_all("div", class_="news_view")[0]
        unwanted = div.find("figure")
        if unwanted:
            unwanted.extract()
        body = div.text.strip()
        print(body)

        # 기자이름, 날짜
        info = soup.find_all("span", class_="txt_info")
        if len(info) == 1:
            journalist_name = ""
            article_date = info[0].text.strip()
        else:
            journalist_name = info[0].text.strip()
            article_date = info[1].text.strip()

        print(journalist_name)
        print(article_date)

        # 신문사 이름
        cp = soup.find_all("em", class_="info_cp")[0]
        cp_name = cp.img["alt"]
        print(cp_name)
        
    print("\n\n============\n\n")

이언주 "과거사고 나발이고 미국·일본에 도움 청해야"
2일 청주서 열린 文정권 규탄집회서 외교정책 비판



(청주=뉴스1) 송근섭 기자 = 이언주 국회의원(무소속, 경기 광명을)은 2일 "북핵을 폐기하고 우리한테 필요한 도움이라면 과거사고 나발이고 무조건 (미국·일본에) 손잡고 도움을 청해야 한다"고 주장했다.
이 의원은 이날 충북 청주시 상당공원 인근에서 열린 '문재인 정권 규탄 집회'에 참석해 현 정부의 외교정책을 비판하며 이 같이 말했다.
그는 "(남북정상회담 이후) 1년 반이 지난 지금, 우리 국민들은 북핵이 없어지기는커녕 훨씬 고도화돼서 미사일 수십 발이 날아오면 꼼짝 못하는 것을 깨달았다"면서 "이런 상황에서 문재인 대통령은 우리와 생사를 같이 하는 나라들과 손잡고 북핵을 해결해야 되는 것 아니냐"고 목소리를 높였다.
이어 "과거사는 과거사이고, 앞으로 우리 아이들을 살리고 대한민국 생존을 위해 필요한 동지들과 손잡아야 한다"면서 "미국이든 일본이든 맹목적으로 추종하는 게 아니라 우리 생존을 위해 필요하다면 그들을 활용해야 한다고 생각한다"고 말했다.



           2일 충북 청주시 상당공원 인근 도로에서 충북자유민주시민연합 주최로 '문재인 정권 규탄집회'가 열렸다. 2019.11.2 © 뉴스1
          

그러면서 "이 와중에 문재인 정권은 한·미·일 군사동맹을 깨고 대한민국 생존과 정반대 방향으로 가고 있다"며 "이 사람들이 대한민국의 지도자가 맞느냐"고 반문했다.
또 "전략적 제휴가 필요한 일본·미국과 손잡는 걸 방해하면서 북한과의 평화정책에 올인하는 것에 더 이상 속아서는 안 된다"고 덧붙였다.
이 의원은 정부의 주 52시간 근로제 등을 언급하면서도 "우리도 모르게 사회주의에 물들어 가고 있다"고 주장하기도 했다.
충북자유민주시연합이 주최한 이날 집회에는 200여명이 참여했다. 자유한국당의 김양희 청주흥덕 당협위원장과 황영호 청주청원 조직위원장, 박정희 청주시의원, 최진현 전 시의원 등도 모습을 드러냈다.
연설대에 오른 

대구지검 진혜원 검사, 조국 내사 부인한 검찰에 의문 제기
(대구=연합뉴스) 홍창진 기자 = 대구지방검찰청 부부장급 검사가 소셜미디어를 통해 검찰이 조국 전 법무부 장관 일가 내사를 부인하는 것에 의문을 제기했다.
진혜원(44) 대구지검 서부지청 부부장 검사는 지난달 31일 페이스북에 "내사는 법령에 근거가 있는 행위다"며 '유시민의 알릴레오' 라이브 6회 영상을 링크했다.
검찰이 조 전 장관 일가를 내사했다는 증거로 윤석열 검찰총장이 장관 지명을 반대했다는 한 인사의 말을 공개한 방송이다.
진 검사는 검찰이 내사 사실을 부인하는 보도자료를 낸 데 대해 "내사는 입건 전에 당연히 하게 되어 있고, 내사하지 않고는 청문회 당일에 배우자를 기소하기도 어렵다"고 밝혔다.
이어 "그런데도 내사 사실 자체를 부인하는 이유는, 그 내사라는 것이 혹시 표적내사 또는 사찰이었다는 속내가 발각되는 것이 걱정되어서인지 의문을 가지게 된다"고 했다.
그는 사모펀드와 관련해 "내국인 사찰의 방법이 아니고서는, 내사 없이는 알 수도 없고 알아서도 안 되는 내용이라서 내사를 안 했다고 보기 어렵다는 것이 법률가로서의 판단이다"고 단언했다.
또 "내사를 했는지, 언제 시작했는지 여부의 증거는 검찰이 가지고 있으므로 검찰이 기록목록만 공개하면 될 일이라고 생각한다"고 덧붙였다.
이 글은 이틀 만에 '좋아요' 680여명, 댓글 115개, 공유 200여회 등 뜨거운 반응을 얻었다. 



realism@yna.co.kr
입력 2019.11.02. 20:25
수정 2019.11.02. 21:39
연합뉴스




표창원 의원 "선출직이든 임명직이든 공직을 맡을 생각은 없다" [인터뷰]
[경향신문] “문재인 정권 탄생에 기여한 사람으로 여하한 선출직이든 임명직이든 하지 않는 게 맞다고 생각했다. 경찰대에 들어가서 경찰을 하고, 다시 교수와 국회의원을 하는 등 공직에만 34년 있었다. 공직생활엔 국민 전체의 봉사자여야 한다는 의무감이 있어야 한다. 힘들고 늘 고민스러운 부분이다. 불출마와 함께 공직

[단독] 헌재 '지소미아 종료 위헌' 헌법소원 각하
헌재 "한·일 지소미아 종료, 북한의 남침으로 이어진다 인정 못해" / "국민 생존권·행복추구권 침해 인정 안돼" / 마지막까지 '재고' 설득에 매달리는 美·日




           문재인 대통령이 한·일 군사정보보호협정(GSOMIA·지소미아)을 종료하기로 결정한 것은 국민의 생명권을 침해해 위헌이라며 보수 성향 변호사와 예비역 장성들이 제기한 헌법소원이 헌법재판소에서 ‘각하’ 판정을 받았다.
         
한·일 지소미아 종료까지 20일도 채 안 남은 상황에서 미국과 일본 정부는 한국 정부에 연장을 강력히 촉구하고 있어 최종적으로 어떤 결론이 내려질지 주목된다.
◆헌재, '지소미아 종료 위헌' 헌법소원 각하
3일 법조계에 따르면 헌재는 지난 9월 한반도 인권과 통일을 위한 변호사모임(한변), 대한민국수호예비역장성단(대수장) 등 보수 단체들이 “문재인정부의 한·일 지소미아 종료 결정은 위헌임을 확인해달라”며 낸 헌법소원을 최근 각하했다.
각하란 헌법소원 제기에 필요한 법률적 조건을 충분히 갖추지 못해 헌법소원 자체가 성립하지 않으므로 위헌 여부를 더 깊이 따질 것도 없이 그냥 심리를 끝낸다는 뜻이다.



           지난 9월 한반도 인권과 통일을 위한 변호사모임(한변)과 대한민국수호예비역장성단(대수장) 회원들이 헌법재판소 앞에서 기자회견을 열고 “한·일 지소미아 종료 결정은 국민의 생명권을 위협해 위헌”이라고 주장하고 있다. 뉴시스
          


           한변과 대수장은 헌법소원 청구서에서 “대통령이 권력 통제 장치인 국무회의 심의나 국회 동의 절차 등을 거치지 않고 한·일 지소미아를 종료하는 것은 주권자인 국민들의 실질적인 선거권 행사를 무력화시키는 것”이라고 주장했다.
         
하지만 헌재는 “한·일 지소미아 종료 과정에서 헌법이나 국회법 등에 규정된 절차를 거치지 않았다고 하더라도, 그로 인하여 청구인들에게 구체적으로 어떠한 자유의 제한이나 의무의 부과, 

50대 아빠는 '햄버거'를 살 수 없었다
[프로불편러 박기자]무인화 흐름에 올라타지 못한 '디지털 소외계층'


[편집자주] 출근길 대중교통 안에서, 잠들기 전 눌러본 SNS에서…. 당신의 눈살을 찌푸리게 한 일상 속 불편한 이야기들, 프로불편러 박기자가 매주 일요일 전해드립니다.

#대학생 A씨(23)는 아빠에게 햄버거를 사다 달라고 부탁했다가 '아차' 했다. 무인단말기(키오스크) 이용이 쉽지 않을 거란 생각이 들어서다. 키오스크 사용법을 알려드리려 영상통화를 건 A씨는 땀을 잔뜩 흘리며 주문에 애를 먹고 있는 아빠의 모습에 깜짝 놀랐다. A씨의 설명에도 아빠는 결국 "못하겠다"며 포기했다. A씨는 "내가 직접 나가서 주문했다. 아빠가 50대 초반이시고, 친구분들 사이에선 나름 얼리 어답터신데…. 속상했다"고 전했다.



점원 대신 기계가 손님을 맞는 세상이 됐다. 주문·결제를 진행하고 각종 정보를 제공하는 키오스크는 패스트푸드점, 편의점, 공항, 영화관 등 곳곳을 점령하고 있다.

          거센 '무인화'(無人化) 바람에 '디지털 문맹'들은 맥을 못 추고 있다. 정보 기술의 변혁이 급속도로 이뤄지며 디지털 서비스에서 소외되는 계층이 생겨난 것. 기술의 발달이 오히려 또 다른 장벽을 만드는 상황이다. 초고령 사회 진입을 눈앞에 둔 지금 '디지털 소외'를 심각한 사회 문제로 인식해야 한다는 지적이 나온다.
          


━

공항 카운터에서 탑승권 발권하면 수수료 3000원…"기계 사용 못 하면 돈 더 내라는 거냐"

━


3일 항공업계에 따르면 제주항공은 지난 1일부터 광주와 무안공항을 제외한 국내선 공항 카운터에서 탑승권을 발급하는 승객을 대상으로 1인당 3000원을 부과한다. 3일까지 시범적으로 운영되며, 4일부터 본격 유상서비스로 전환된다.
         
수수료 부과 대상은 '모바일 탑승권이나 키오스크 이용이 가능하지만, 카운터에서 탑승권 발급을 희망하는 고객'이다. 유아동반승객, 교통약자, VIP승객 등은 수수료 부과 대상에서

한국당 영입 인재들 잇단 논란..다시 거리로 간 黃
이자스민 전 의원 탈당..정의당 입당 예정





<앵커>
자유한국당에선 내년 총선을 겨냥해서 지도부가 영입한 외부 인재들을 놓고 뒷말이 분분합니다. 박찬주 전 대장 건에 이어서 청년층 대표로 영입했다는 사람도 또 논란에 휩싸였습니다. 여기에 과거에 다문화 대표로 국회의원까지 지낸 이자스민 씨는 정의당으로 떠나면서 내부에서부터 비판이 나오고 있습니다.
남정민 기자입니다.
<기자>
황교안 대표가 직접 빨간색 당 점퍼를 입혀 주는 이 사람. 한국당 청년 영입인사 백경훈 씨입니다.
그런데 백 씨는 한국당 신보라 의원 비서의 남편이자 지난해 지방선거 한국당 예비후보로 등록까지 했던 인물입니다.
이미 당원인데 외부 영입인사라며 발표한 셈입니다.
박찬주 전 대장 소동에 이어 인재 영입 잡음이 잇따르는 상황에서 과거 새누리당 시절 다문화, 소수자 대변한다며 즉 외연을 넓힌다며 영입했던 이자스민 전 의원의 탈당 소식이 전해졌습니다.
한국당에서 더는 역할을 찾을 수 없다며 곧 정의당에 입당할 걸로 알려졌습니다.
중도층 확장의 기회가 돼야 할 인재 영입이 당의 한계만 부각했다는 내부 비판이 이어집니다.
장제원 의원은 소중한 지지율 상승 기회를 날린 뼈아픈 실책이라며 공개 비판했습니다.
리더십 위기, 인재영입 논란 와중에 황교안 대표는 오늘(2일)부터 한 달간 다시 전국 순회 집회에 나섰는데 당내 비판을 의식한 듯 이렇게 말했습니다.
[황교안/자유한국당 대표 : 잘해도 박수 치고, 못 해도 격려하세요. 내부 총질하지 말아야 하지 않겠습니까?]
총선이 다가올수록 보수 강화냐, 중도 확장이냐, 황 대표 리더십을 둘러싼 논란은 격화할 것으로 예상됩니다.
(영상취재 : 이병주·한일상, 영상편집 : 최혜영)    
남정민 기자jmnam@sbs.co.kr
남정민 기자
입력 2019.11.02. 20:27
SBS




'의원 정수 확대' 반대 76%..총예산 동결해도 65% "안돼"
KBS 일요진단 라이브 여론조사



(서울=뉴스1) 

'강원랜드 청탁' 권성동, 항소심 첫 공판..1심은 무죄
7일 항소심 1차 공판..직접 출석 예정 1심, 업무방해·직권남용 등 모두 무죄



【서울=뉴시스】정윤아 기자 = 강원랜드 채용 청탁 혐의로 1심에서 무죄를 받은 권성동(59) 자유한국당 의원의 항소심 재판이 이번주 시작된다. 
3일 법원에 따르면 서울고법 형사13부(부장판사 구회근)는 오는 7일 오전 11시 업무방해 등 혐의로 기소된 권 의원의 항소심 1차 공판을 진행한다. 
권 의원은 이날 공판에 출석할 예정이다. 권 의원 측은 이날 공판에서 1심과 마찬가지로 혐의를 부인하고 검찰의 기소 자체를 비판할 것으로 예상된다. 
권 의원은 지난 2012년 11월부터 이듬해 4월까지 강원랜드 1·2차 교육생을 선발하는 과정에서 청탁한 대상자 10여명을 합격시키기 위해 면접 대상자나 최종합격자 선정을 방해한 혐의 등으로 불구속 기소됐다. 
1심 재판부는 권 의원의 ▲1·2차 교육생 선발 관련 업무방해 ▲비서관 채용 청탁 관련 업무방해 및 제3자 뇌물 수수 ▲사외이사 선임 관련 직권남용 권리행사방해 혐의 모두 무죄로 봤다. 검찰은 불복해 항소했다. 
1심 선고 후 권 의원은 기자들과 만나 "검찰은 그동안 증거를 조작하고 무리한 주장을 통해 저를 정치적으로 매장했다"며 "더는 정치검찰에 의한 정치적 반대자에 대한 탄압행위는 일어나서는 안 된다고 생각한다"고 주장했다.
yoona@newsis.com
정윤아
입력 2019.11.03. 06:00
뉴시스




황교안 "삼권분립 거의 망가졌고 국회 하나 남아, 국민이 지켜줘야"
좌파독재 실정 보고대회..공수처 설치 저지 및 의원 정수 축소 요구내년 총선 승리 다짐.."이 정권 심판해서, 싸워 이기자"



(경남=뉴스1) 강대한 기자 = 자유한국당은 2일 오후 경남 창원시 마산합포구 대회의실에서 ‘좌파독재 실정 보고대회’를 열고 고위공직자번죄수사처(공수처) 설치 저지와 국회의원 정수 축소를 촉구하고 나섰다.
이날 보고대회에는 황교안 자유한국당 대표와 강석진 한국당 경남

'수능 성적순' 대학 서열화 고착..사교육 조장 우려도
[대학, 정시 확대 반대 왜?]② "'서연고 서성한' 불변"


 [편집자주]정부가 대학수학능력시험 위주 정시전형 확대를 추진하는 가운데 대학들의 반발이 거세지고 있다. 최근 신입생 선발 업무를 총괄하는 대학 입학처장들이 이례적으로 정부 방침에 반대하는 입장까지 내놨다. 학생·학부모을 비롯한 국민 대다수가 정시전형 확대를 요구하는데도 대학들이 왜 반기를 들었을까. 그 이유를 알아봤다.

(서울=뉴스1) 김재현 기자 = 대학들이 대학수학능력시험 위주 정시전형 확대에 반대하는 또 다른 이유는 '서열화 우려'다. 
수능 성적이 높은 학생이 합격하는 대학 순서대로 줄세우기가 이뤄져 이른바 '서연고 서성한 중경외시…' 등 대학 이름 앞 글자를 딴 서열이 더욱 공고해질 수 있다는 것이다.
예를 들면 2019학년도 대입 정시모집에서는 A대학 의대에 지원하려면 300점 만점 기준(이하 수능 영어 1등급 확보 전제 및 국어·수학·탐구 원점수 기준) 290점 이상을 받아야 하는 것으로 입시기관들은 추정했다. 이어 B대학 의대가 289점 이상, C대학 의대는 288점 이상으로 예측됐다. 
1점차 단위로 대학 줄세우기가 이뤄진 셈이다. 수험생들도 수능 성적에 따른 대학 서열을 감안해 대부분 지원한다.
익명을 요구한 대학 관계자는 "정시 확대로 기회의 불공정성을 완화할 수 있을지 몰라도 결과에 따른 불평등은 더 심각해질 수 있다"며 "수능 성적순대로 대학 서열이 명확히 드러나기 때문에 가뜩이나 심각한 학력·학벌주의는 더욱 고착화될 것"이라고 우려했다.
또 다른 대학 관계자는 "수능 성적에 따른 대학 피라미드 서열은 이를 지키고 뒤집으려는 대학 간의 지나친 경쟁을 야기할 수밖에 없다"며 "또 낮은 서열을 목도한 대학과 교직원들의 박탈감과 상실감도 줄 수 있다"고 말했다.
사교육 의존·조장 가능성도 제기된다. 매년 수능 종료 직후 입시사교육기관들은 이른바 '배치표'를 제작해 제공한다. 배치표는 입시기관이 수능 성적에 따라 지원가능한

적자에 손든 카드사.."해지하면 100만원 드려요"
[앵커]
         
"신용카드 해지하면 100만 원을 드립니다." 카드를 새로 만드는 것도 아니고 그만 쓰는 조건으로 돈을 준다는 것이니까 솔깃한 제안이죠. 그런데 정작 카드 사용자들 반응은 뜨뜻미지근합니다.
무슨 영문인지 전다빈 기자가 취재했습니다.
[기자]
155만 포인트, 92만 포인트, 105만 포인트.
SK플래닛이 시럽카드 사용자에게 주겠다는 OK캐쉬백 포인트입니다.
5만 포인트가 넘으면 현금으로 바꿀 수 있습니다.
유효기간까지 받는 카드혜택을 미리 받는 대신 절반으로 줄이는 조건입니다.
SK플래닛이 이런 이벤트를 벌이는 건 카드 혜택으로 나가는 돈이 감당이 되지 않기 때문입니다.
카드 이용자들에게 매달 30여억 원을 쓰고 있는데 카드 사용이 끝나는 2021년까지 나갈 돈이 900억 원이 넘습니다.
결국 적자를 조금이라도 줄여보겠다며 선지급 조건을 내걸어 울며 겨자 먹기로 해지 이벤트를 벌인 겁니다.
선착순으로 이벤트를 내놨지만 정작 39만 명의 시럽카드 사용자 반응은 뜨뜻미지근합니다.
카드사용액에 따라 매달 최대 10만 원 상당의 포인트를 꼬박꼬박 받는 것이 이득이기 때문입니다.
[고용진/시럽카드 이용자 : 저는 유지하려 하고 있어요. 25만 포인트 준다고 했는데, 22개월 동안 잘 써서 받는 포인트가 좀 더 좋을 것 같아서 해지를 안 하려고…]
시럽 카드는 SK플래닛이 애플리케이션 홍보를 위해 NH농협과 제휴해 만든 카드입니다.
2016년 출시 당시 신규발급이 쇄도하면서 적자 폭이 줄이기 위해 6개월 만에 발급을 중단했습니다.
전다빈 기자
입력 2019.11.02. 21:20
JTBC




간호조무사 1만명, 국회 앞 모여 "직종 차별 중단하라"
법정단체 인정 '의료법 개정안' 국회 통과 촉구



(서울=뉴스1) 황덕현 기자 = 간호조무사의 차별중단과 간호조무사협회 법정단체 인정을 촉구하는 집회가 주말 국회 앞에서 열렸다.
대한간호조무사협회(간무협)는 3일 오후 1시부터 서울 영등포구 

인재영입 첫발 꼬인 한국당..황교안, 이번주 2차 발표로 만회할까
박찬주 이어 백경훈 '세습영입' 논란..'청년·여성 중심' 구호 무색당내선 "'변혁'측과 통합이 우선" 주장도



(서울=뉴스1) 김민석 기자 = 내년 4·15 총선을 대비하는 자유한국당의 인재영입 작업이 시작부터 구설수에 오르면서 당내 논란이 커지고 있다. 박찬주 전 육군대장에 이어 백경훈 청년이 여는 미래 대표도 부적절 논란에 휩싸이면서다.
이에 황교안 대표의 리더십에 의문을 제기하는 목소리도 흘러나온다. 황 대표가 이번주 발표할 예정인 2차 인재영입 발표를 통해 논란을 불식하고 인재영입을 통한 총선 바람몰이에 성공할 수 있을지 주목된다. 
3일 정치권에 따르면 황 대표가 내년 4·15 총선에서 승리하려면 청년·여성 중심으로 혁신해야 한다고 밝혔음에도, 1차 영입인재 명단과 인물 면면은 그동안 강조해온 사항들을 무색하게 만들 정도여서 당 내부에서도 비판이 나오고 있다
황 대표는 올해 초·중순부터 일찌감치 총선 준비모드에 돌입하며 청년·여성 등 중도층으로 외연 확장을 달성해야 한다고 강조했다. 지난 5월31일 대표 취임 후 첫 연찬회에선 당의 미래를 위해 챙겨야 할 중점사항을 Δ인재영입 Δ당원교육 Δ여성·청년 친화정당으로 변화를 꼽았다.



           '깊어 먼 길을 나섰습니다' 표지(왼쪽) '황교안×2040 미래찾기' 포스터© 뉴스1
          

황 대표는 또 취임 100일을 기념해 '밤깊먼길' 에세이집을 내면서 연분홍색을 강조하는 등 강경·보수 이미지를 벗고 청년·여성층에 다가가려고 힘썼다. 지난 6월 국회 사랑재에 꽃다발을 든 사진을 포스터로 내세운 '황교안×2040 미래찾기' 콘서트도 열었다.
그러나 정작 발표한 1차 영입명단에는 백경훈 청년이 여는 미래 대표 외엔 젊은 인재 또는 참신한 여성인재도 눈에 띄지 않아 '외연확장', '중도층 포섭'과 거리가 먼 것 아니냐는 지적이 당 안팎에서 나왔다.
청년인재로 발탁된 백 대표도 신보라 청년 최고위원의 비서 남편인 것으

[박정호의 창업 실전강의]<89>숫자와 비율의 차이를 기억하라
창업 초기에는 자사 제품과 서비스를 홍보하기 위한 다양한 문안을 작업해야 한다. 홈페이지를 통해 홍보할 때도 문안 작성이 필요하며, 브로슈어 내지 리플렛을 제작할 때도 문안 작성이 필요하다. 또 제품 자체에 부착된 문안 내지 제품의 포장지에도 다양한 홍보 내지 설명 문구가 들어가야 한다.
하지만 대부분 창업기업들은 창업 초기 이런 작업에 대한 경험이 부족하기 때문에 다양한 부분에서 놓치는 것들이 많다. 특히 같은 내용이라 하더라도 어떠한 방식으로 표현하는 것이 보다 소비자에게 신뢰를 부여할 수 있는지에 대한 이해가 부족한 상황이다. 대부분 창업가는 단순히 홍보 문구 내지 카피에만 신경을 쓰고 있지만, 숫자로 이루어진 단순 사실을 전달할 때도 남다른 노하우가 필요함을 모르는 경우가 많은 듯하다.
일례로 높은 신뢰감을 형성하기 위해 '숫자'를 사용해야 하는지 '비율'을 사용해야 하는지를 보다 명확히 이해해야 한다. 더 나아가 같은 수치라 하더라도 이를 어떤 단위를 사용해 표시하느냐에 따라 소비자에게 상이한 인상을 줄 수 있다는 사실 또한 적극 활용해야 한다.
오하이오 주립대 연구팀은 3달러와 300센트라는 동일한 금액을 소비자가 실제 동일하게 인식하는지를 확인하기 위한 흥미로운 실험을 수행한 바 있다. 연구팀은 실험 참가자들을 둘로 나누고 각각의 실험집단에 협조해 주면 보상금을 주겠다고 제안한다. 이때 두 집단에 지급되는 보상금을 한 집단은 3달러로 다른 집단은 300센트로 구분해 제시하도록 설정했다.
3달러나 300센트는 사실 동일한 금액이기 때문에 두 집단의 협조 정도는 비슷한 수준이어야 한다. 그럼에도 불구하고 실험 결과 300센트를 제안받은 사람들이 3달러를 제안받은 사람들보다 협조 비율이 더 높은 것으로 확인됐다. 이런 실험 결과는 300센트를 더 가치 있게 받아들였다는 추론이 가능하다.
이런 실험 결과를 이미 많은 기업이 자사의 마케팅 활동 속에 빈번히 활용하고 있다. 가장 쉽게 확인할 수 

#### JSON 파일 만들기

```
import json
from collections import OrderedDict
 
# Ready for data
group_data = OrderedDict()
items = OrderedDict()
 
group_data["url"] = "http://......"
group_data["title"] = "article_title"
 
items["item1"] = "item_name1"
items["item2"] = "item_name2"
items["item3"] = "item_name3"
 
group_data["items"] = items
 
# Print JSON
print(json.dumps(group_data, ensure_ascii=False, indent="\t") )
```

In [21]:
from bs4 import BeautifulSoup
import urllib.request
import json
from collections import OrderedDict

# 기사 URL 수집
url_list = []
with urllib.request.urlopen("https://media.daum.net/ranking/bestreply/") as url:
    doc = url.read()
    soup = BeautifulSoup(doc, "html.parser")
    strongs = soup.find_all("strong", class_="tit_thumb")
    for strong in strongs:
        url_list.append(strong.a["href"])

# 기사 내용 수집
article_list = []
for base_url in url_list:
    
    articles = OrderedDict()
    with urllib.request.urlopen(base_url) as url:
        doc = url.read()
        soup = BeautifulSoup(doc, "html.parser")

        # 기사 타이틀 수집
        title = soup.find_all("h3", class_="tit_view")[0].text.strip()
#         print(title)
        articles["title"] = title
        articles["url"] = base_url

        # 기사 본문 수집
        div = soup.find_all("div", class_="news_view")[0]
        unwanted = div.find("figure")
        if unwanted:
            unwanted.extract()
        body = div.text.strip()
#         print(body)
        articles["body"] = body

        # 기자이름, 날짜
        info = soup.find_all("span", class_="txt_info")
        if len(info) == 1:
            journalist_name = ""
            article_date = info[0].text.strip()
        else:
            journalist_name = info[0].text.strip()
            article_date = info[1].text.strip()

#         print(journalist_name)
#         print(article_date)
        articles["journalist_name"] = journalist_name
        articles["article_date"] = article_date

        # 신문사 이름
        cp = soup.find_all("em", class_="info_cp")[0]
        cp_name = cp.img["alt"]
#         print(cp_name)
        articles["cp_name"] = cp_name
    
    article_list.append(articles)
#     print("\n\n============\n\n")
    
print(json.dumps(article_list, ensure_ascii=False, indent="\t"))

# Write JSON
with open('articles.json', 'w', encoding="utf-8") as make_file:
    json.dump(article_list, make_file, ensure_ascii=False, indent="\t")



[
	{
		"title": "이언주 \"과거사고 나발이고 미국·일본에 도움 청해야\"",
		"url": "http://v.media.daum.net/v/20191102172347881",
		"body": "2일 청주서 열린 文정권 규탄집회서 외교정책 비판\n\n\n\n(청주=뉴스1) 송근섭 기자 = 이언주 국회의원(무소속, 경기 광명을)은 2일 \"북핵을 폐기하고 우리한테 필요한 도움이라면 과거사고 나발이고 무조건 (미국·일본에) 손잡고 도움을 청해야 한다\"고 주장했다.\n이 의원은 이날 충북 청주시 상당공원 인근에서 열린 '문재인 정권 규탄 집회'에 참석해 현 정부의 외교정책을 비판하며 이 같이 말했다.\n그는 \"(남북정상회담 이후) 1년 반이 지난 지금, 우리 국민들은 북핵이 없어지기는커녕 훨씬 고도화돼서 미사일 수십 발이 날아오면 꼼짝 못하는 것을 깨달았다\"면서 \"이런 상황에서 문재인 대통령은 우리와 생사를 같이 하는 나라들과 손잡고 북핵을 해결해야 되는 것 아니냐\"고 목소리를 높였다.\n이어 \"과거사는 과거사이고, 앞으로 우리 아이들을 살리고 대한민국 생존을 위해 필요한 동지들과 손잡아야 한다\"면서 \"미국이든 일본이든 맹목적으로 추종하는 게 아니라 우리 생존을 위해 필요하다면 그들을 활용해야 한다고 생각한다\"고 말했다.\n\n\n\n           2일 충북 청주시 상당공원 인근 도로에서 충북자유민주시민연합 주최로 '문재인 정권 규탄집회'가 열렸다. 2019.11.2 © 뉴스1\n          \n\n그러면서 \"이 와중에 문재인 정권은 한·미·일 군사동맹을 깨고 대한민국 생존과 정반대 방향으로 가고 있다\"며 \"이 사람들이 대한민국의 지도자가 맞느냐\"고 반문했다.\n또 \"전략적 제휴가 필요한 일본·미국과 손잡는 걸 방해하면서 북한과의 평화정책에 올인하는 것에 더 이상 속아서는 안 된다\"고 덧붙였다.\n이 의원은 정부의 주 52시간 근로제 등을 언급하면서도 \"우리도 모르게 사회주의에 물들어 가고 있다\"고 주장하기도