<a href="https://colab.research.google.com/github/alfrizzle/NLP-Projects/blob/master/Korean_NLP_Practice.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# KoNLPy Practice

**[KoNLPy](https://konlpy.org/en/latest/#): Korean NLP in Python**

KoNLPy (pronounced “ko en el PIE”) is a Python package for natural language processing (NLP) of the Korean language. For installation directions, see [here](https://konlpy.org/en/latest/install/).

For users new to NLP, go to [Getting started](https://konlpy.org/en/latest/#start). For step-by-step instructions, follow the [User guide](https://konlpy.org/en/latest/#guide). For specific descriptions of each module, go see the [API](https://konlpy.org/en/latest/#api) documents.

References:

* https://www.youtube.com/watch?v=yUImPXmYO7M
* https://github.com/entelecheia/eKoNLPy
* https://pythonhosted.org/korean/ko/

Install konlpy library

In [None]:
pip install konlpy



## Okt Class

In [None]:
from konlpy.tag import Okt
from konlpy.utils import pprint
import pandas as pd 

from google.colab import files

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Go to this URL in a browser: https://accounts.google.com/o/oauth2/auth?client_id=947318989803-6bn6qk8qdgf4n4g3pfee6491hc0brc4i.apps.googleusercontent.com&redirect_uri=urn%3aietf%3awg%3aoauth%3a2.0%3aoob&scope=email%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdocs.test%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdrive%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdrive.photos.readonly%20https%3a%2f%2fwww.googleapis.com%2fauth%2fpeopleapi.readonly&response_type=code

Enter your authorization code:
··········
Mounted at /content/drive


In [None]:
import os
os.chdir('/content/drive/My Drive/Data Science/Datasets')

# Check working directory
!pwd

# Check files in directory
!ls

/content/drive/My Drive/Data Science/Datasets
gtd0718dist.csv  mspa-survey-data.csv  TestArticles.csv


## EDA

In [None]:
df = pd.read_csv('TestArticles.csv', encoding='utf8')
df.head()

Unnamed: 0,Title,Text
0,정부 “국가채무비율 2045년 꺾인다”…전문가 “비현실적”,2045년 국내총생산(GDP) 대비 국가채무비율이 최고 99%로 치솟을 수 있다는 ...
1,‘부동산 감독기구’ 결국 강행,지나친 시장 통제·감시와 개인정보·재산권 침해 위험이 있다는 비판에도 정부가 부동산...
2,"美 ""中 핵탄두 200여 기 보유...10년 후 최소 2배""",미국이 처음으로 중국의 핵탄두 보유 규모를 공개하며 중국을 압박했습니다.\n\n미 ...
3,"檢, '수뇌부 직무유기 의혹' 사건 무혐의 처분…""제 편 감싸기"" 비판",후배 검사의 '고소장 위조' 비위 사실을 알고도 적절한 징계를 하지 않은 혐의로 고...
4,카카오게임즈 청약 광풍…'사상 최대' 58조원 몰렸다,계속해서 주식 얘기 좀 해보겠습니다. 얼마전 일반 투자자에 공모주 청약을 받아 증거...


In [None]:
df.iloc[1]

Title                                     ‘부동산 감독기구’ 결국 강행
Text     지나친 시장 통제·감시와 개인정보·재산권 침해 위험이 있다는 비판에도 정부가 부동산...
Name: 1, dtype: object

Create sample text variable

In [None]:
text = '나는 사과를 먹고있다'

Initialize the class as an object

In [None]:
okt = Okt()

In [None]:
pprint(okt.nouns(text))

['나', '사과']


In [None]:
pprint(okt.morphs(text, norm=True, stem=True))

['나', '는', '사과', '를', '먹다']


In [None]:
pprint(okt.pos(text, norm=True, stem=True))

[('나', 'Noun'), ('는', 'Josa'), ('사과', 'Noun'), ('를', 'Josa'), ('먹다', 'Verb')]


In [None]:
pprint(okt.pos(text,norm=True, stem=True, join=True))

['나/Noun', '는/Josa', '사과/Noun', '를/Josa', '먹다/Verb']


## Hannanum Class

In [None]:
from konlpy.tag import Hannanum

In [None]:
hannanum = Hannanum()

In [None]:
pprint(hannanum.analyze('롯데마트의 흑마늘 양념 치킨이 논란이 되고 있다.'))

[[[('롯데마트', 'ncn'), ('의', 'jcm')],
  [('롯데마트의', 'ncn')],
  [('롯데마트', 'nqq'), ('의', 'jcm')],
  [('롯데마트의', 'nqq')]],
 [[('흑마늘', 'ncn')], [('흑마늘', 'nqq')]],
 [[('양념', 'ncn')]],
 [[('치킨', 'ncn'), ('이', 'jcc')],
  [('치킨', 'ncn'), ('이', 'jcs')],
  [('치킨', 'ncn'), ('이', 'ncn')]],
 [[('논란', 'ncpa'), ('이', 'jcc')],
  [('논란', 'ncpa'), ('이', 'jcs')],
  [('논란', 'ncpa'), ('이', 'ncn')]],
 [[('되', 'nbu'), ('고', 'jcj')],
  [('되', 'nbu'), ('이', 'jp'), ('고', 'ecc')],
  [('되', 'nbu'), ('이', 'jp'), ('고', 'ecs')],
  [('되', 'nbu'), ('이', 'jp'), ('고', 'ecx')],
  [('되', 'paa'), ('고', 'ecc')],
  [('되', 'paa'), ('고', 'ecs')],
  [('되', 'paa'), ('고', 'ecx')],
  [('되', 'pvg'), ('고', 'ecc')],
  [('되', 'pvg'), ('고', 'ecs')],
  [('되', 'pvg'), ('고', 'ecx')],
  [('되', 'px'), ('고', 'ecc')],
  [('되', 'px'), ('고', 'ecs')],
  [('되', 'px'), ('고', 'ecx')]],
 [[('있', 'paa'), ('다', 'ef')], [('있', 'px'), ('다', 'ef')]],
 [[('.', 'sf')], [('.', 'sy')]]]


In [None]:
pprint(hannanum.pos('롯데마트의 흑마늘 양념 치킨이 논란이 되고 있다.'))

[('롯데마트', 'N'),
 ('의', 'J'),
 ('흑마늘', 'N'),
 ('양념', 'N'),
 ('치킨', 'N'),
 ('이', 'J'),
 ('논란', 'N'),
 ('이', 'J'),
 ('되', 'P'),
 ('고', 'E'),
 ('있', 'P'),
 ('다', 'E'),
 ('.', 'S')]


In [None]:
pprint(hannanum.morphs(u'롯데마트의 흑마늘 양념 치킨이 논란이 되고 있다.'))

['롯데마트', '의', '흑마늘', '양념', '치킨', '이', '논란', '이', '되', '고', '있', '다', '.']


In [None]:
pprint(hannanum.morphs('롯데마트의 흑마늘 양념 치킨이 논란이 되고 있다.'))

['롯데마트', '의', '흑마늘', '양념', '치킨', '이', '논란', '이', '되', '고', '있', '다', '.']


In [None]:
text_02 = '美, "北 탄도미사일 개발 지원 말라" 전 세계에 주의보...남북경협 부담커진 韓'

In [None]:
pprint(hannanum.pos(text_02))

[('美', 'N'),
 (',', 'S'),
 ('"', 'S'),
 ('北', 'N'),
 ('탄도미사일', 'N'),
 ('개발', 'N'),
 ('지원', 'N'),
 ('말', 'P'),
 ('라', 'E'),
 ('"', 'S'),
 ('전', 'N'),
 ('세계', 'N'),
 ('에', 'J'),
 ('주의보', 'N'),
 ('...', 'S'),
 ('남북경협', 'N'),
 ('부담커진', 'N'),
 ('韓', 'N')]


## Kkma Class

In [None]:
from konlpy.tag import Kkma

Initiate Class

In [None]:
kkma = Kkma()

In [None]:
pprint(kkma.nouns(text_02))

['탄도',
 '탄도미사일',
 '미사일',
 '개발',
 '지원',
 '세계',
 '주의',
 '주의보',
 '보',
 '남북',
 '남북경협',
 '경협',
 '부담']


In [None]:
pprint(kkma.pos(text_02))

[('美', 'OH'),
 (',', 'SP'),
 ('"', 'SS'),
 ('北', 'OH'),
 ('탄도', 'NNG'),
 ('미사일', 'NNG'),
 ('개발', 'NNG'),
 ('지원', 'NNG'),
 ('말르', 'VV'),
 ('아', 'ECS'),
 ('"', 'SS'),
 ('전', 'MDT'),
 ('세계', 'NNG'),
 ('에', 'JKM'),
 ('주의', 'NNG'),
 ('보', 'NNG'),
 ('...', 'SE'),
 ('남북', 'NNG'),
 ('경협', 'NNG'),
 ('부담', 'NNG'),
 ('커지', 'VV'),
 ('ㄴ', 'ETD'),
 ('韓', 'OH')]


## Komoran Class

In [None]:
from konlpy.tag import Komoran

# Practice

Article link: https://news.naver.com/main/read.nhn?mode=LSD&mid=shm&sid1=100&oid=011&aid=0003791668

In [None]:
graf_01 = u'이는 미 대선을 두 달 앞두고 대북 리스크 관리를 외교적 성과로 내세운 도널드 트럼프 대통령이 북한에 단거리 탄도미사일 도발을 하지 말 것을 압박한 것으로 조심스럽게 관측된다. 특히 그간 트럼프 대통령이 북한의 단거리 탄도미사일 도발에 대해 대수롭지 않은 반응을 보여온 만큼 이번 조치는 11월 3일 미 대선을 염두에 뒀다는 해석이 나온다.'
graf_02 = u'미 국무부 국제안보비확산국(ISN)과 재무부 해외자산통제국(OFAC), 상무부 산업안보국은 이날 공동으로 북한의 탄도미사일 관련 조달활동에 대한 19장짜리 문건을 공개하며 전 세계 기업에 주의보를 발령했다. 해당 주의보는 탄도미사일 개발과 부품·기술 조달에 관여하는 북한의 기관들과 국제사회의 대북 제재 회피 수법을 전하면서, 기업이 고의든 실수든 이 제재를 어길 경우 처할 벌칙과 거래 금지 품목 등을 소개하는 내용을 담고 있다. 이 주의보는 기존에 이미 알려진 내용이지만 미 관계부처가 문건 형태로 만들어 북한과 거래하는 기업이 주의해야 할 사항을 일목요연하게 정리한 것은 이례적이라는 평가다.'

In [None]:
pprint(kkma.sentences(graf_01))

['이는 미 대선을 두 달 앞두고 대북 리스크 관리를 외교적 성과로 내세운 도 널드 트럼프 대통령이 북한에 단 거리 탄도 미사일 도발을 하지 '
 '말 것을 압박한 것으로 조심스럽게 관측된다.',
 '특히 그간 트럼프 대통령이 북한의 단거리 탄도 미사일 도발에 대해 대수롭지 않은 반응을 보여 온 만큼 이번 조치는 11월 3일 미 대선을 '
 '염두에 뒀다는 해석이 나온다.']


In [None]:
pprint(kkma.sentences(graf_02))

['미 국무부 국제안보 비 확산 국 (ISN) 과 재무부 해외자산 통제국 (OFAC), 상무부 산업 안 보국은 이날 공동으로 북한의 탄도 '
 '미사일 관련 조달활동에 대한 19 장짜리 문건을 공개하며 전 세계 기업에 주의보를 발령했다.',
 '해 당 주의보는 탄도 미사일 개발과 부품· 기술 조달에 관여하는 북한의 기관들과 국제사회의 대북 제재 회피 수법을 전하면서, 기업이 '
 '고의든 실수든 이 제재를 어길 경우 처할 벌칙과 거래 금지 품목 등을 소개하는 내용을 담고 있다.',
 '이 주의 보는 기존에 이미 알려 진 내용이지만 미 관계부처가 문건 형태로 만들어 북한과 거래하는 기업이 주의해야 할 사항을 일목요연하게 '
 '정리한 것은 이례적이라는 평가다.']


In [None]:
pprint(hannanum.pos(graf_01))

[('이', 'N'),
 ('는', 'J'),
 ('미', 'N'),
 ('대선', 'N'),
 ('을', 'J'),
 ('두', 'N'),
 ('달', 'N'),
 ('앞두', 'P'),
 ('고', 'E'),
 ('대북', 'N'),
 ('리스크', 'N'),
 ('관리', 'N'),
 ('를', 'J'),
 ('외교적', 'N'),
 ('성과', 'N'),
 ('로', 'J'),
 ('내세우', 'P'),
 ('ㄴ', 'E'),
 ('도널드', 'N'),
 ('트럼프', 'N'),
 ('대통령', 'N'),
 ('이', 'J'),
 ('북한', 'N'),
 ('에', 'J'),
 ('달', 'P'),
 ('ㄴ', 'E'),
 ('것', 'N'),
 ('이', 'J'),
 ('리', 'E'),
 ('탄도미사일', 'N'),
 ('도발', 'N'),
 ('을', 'J'),
 ('하', 'P'),
 ('지', 'E'),
 ('말', 'P'),
 ('ㄹ', 'E'),
 ('것', 'N'),
 ('을', 'J'),
 ('압박', 'N'),
 ('하', 'X'),
 ('ㄴ', 'E'),
 ('것', 'N'),
 ('으로', 'J'),
 ('조심', 'N'),
 ('스럽', 'X'),
 ('게', 'E'),
 ('관측', 'N'),
 ('되', 'X'),
 ('ㄴ다', 'E'),
 ('.', 'S'),
 ('특히', 'M'),
 ('그간', 'N'),
 ('트럼프', 'N'),
 ('대통령', 'N'),
 ('이', 'J'),
 ('북한', 'N'),
 ('의', 'J'),
 ('달', 'P'),
 ('ㄴ', 'E'),
 ('것', 'N'),
 ('이', 'J'),
 ('리', 'E'),
 ('탄도미사일', 'N'),
 ('도발', 'N'),
 ('에', 'J'),
 ('대', 'P'),
 ('어', 'E'),
 ('하', 'P'),
 ('어', 'E'),
 ('대수', 'N'),
 ('롭', 'X'),
 ('지', 'E'),
 ('않', 'P'),
 ('은', 'E

In [None]:
pprint(kkma.pos(graf_01))

[('일', 'VV'),
 ('는', 'ETD'),
 ('미', 'NNG'),
 ('대선', 'NNG'),
 ('을', 'JKO'),
 ('두', 'MDN'),
 ('달', 'NNG'),
 ('앞두', 'VV'),
 ('고', 'ECE'),
 ('대북', 'NNG'),
 ('리스크', 'NNG'),
 ('관리', 'NNG'),
 ('를', 'JKO'),
 ('외교적', 'NNG'),
 ('성과', 'NNG'),
 ('로', 'JKM'),
 ('내세우', 'VV'),
 ('ㄴ', 'ETD'),
 ('도', 'NNG'),
 ('널드', 'UN'),
 ('트럼프', 'NNG'),
 ('대통령', 'NNG'),
 ('이', 'JKS'),
 ('북한', 'NNG'),
 ('에', 'JKM'),
 ('닿', 'VV'),
 ('ㄴ', 'ETD'),
 ('거리', 'NNG'),
 ('탄도', 'NNG'),
 ('미사일', 'NNG'),
 ('도발', 'NNG'),
 ('을', 'JKO'),
 ('하', 'VV'),
 ('지', 'ECD'),
 ('말', 'VXV'),
 ('ㄹ', 'ETD'),
 ('것', 'NNB'),
 ('을', 'JKO'),
 ('압박', 'NNG'),
 ('하', 'XSV'),
 ('ㄴ', 'ETD'),
 ('것', 'NNB'),
 ('으로', 'JKM'),
 ('조심', 'NNG'),
 ('스럽', 'XSA'),
 ('게', 'ECD'),
 ('관측', 'NNG'),
 ('되', 'XSV'),
 ('ㄴ다', 'EFN'),
 ('.', 'SF'),
 ('특히', 'MAG'),
 ('그간', 'NNG'),
 ('트럼프', 'NNG'),
 ('대통령', 'NNG'),
 ('이', 'JKS'),
 ('북한', 'NNG'),
 ('의', 'JKG'),
 ('단', 'NNG'),
 ('거리', 'NNG'),
 ('탄도', 'NNG'),
 ('미사일', 'NNG'),
 ('도발', 'NNG'),
 ('에', 'JKM'),
 ('대하', 'VV'),
 ('어', 

In [None]:
# pprint(okt.pos(graf_01))

pprint(okt.pos(graf_01,norm=True, stem=True, join=True))

['이다/Verb',
 '밉다/Adjective',
 '대선/Noun',
 '을/Josa',
 '두/Noun',
 '달/Noun',
 '앞두다/Verb',
 '대북/Noun',
 '리스크/Noun',
 '관리/Noun',
 '를/Josa',
 '외교/Noun',
 '적/Suffix',
 '성과/Noun',
 '로/Josa',
 '내/Determiner',
 '세운/Noun',
 '도널드/Noun',
 '트럼프/Noun',
 '대통령/Noun',
 '이/Josa',
 '북한/Noun',
 '에/Josa',
 '단거리/Noun',
 '탄도미사일/Noun',
 '도발/Noun',
 '을/Josa',
 '하다/Verb',
 '말/Noun',
 '것/Noun',
 '을/Josa',
 '압박/Noun',
 '한/Josa',
 '것/Noun',
 '으로/Josa',
 '조심/Noun',
 '스럽게/Josa',
 '관측/Noun',
 '되다/Verb',
 './Punctuation',
 '특히/Adverb',
 '그간/Noun',
 '트럼프/Noun',
 '대통령/Noun',
 '이/Josa',
 '북한/Noun',
 '의/Josa',
 '단거리/Noun',
 '탄도미사일/Noun',
 '도발/Noun',
 '에/Josa',
 '대해/Noun',
 '대수롭다/Adjective',
 '않다/Verb',
 '반응/Noun',
 '을/Josa',
 '보이다/Verb',
 '온/Noun',
 '만큼/Noun',
 '이번/Noun',
 '조치/Noun',
 '는/Josa',
 '11월/Number',
 '3일/Number',
 '밉다/Adjective',
 '대선/Noun',
 '을/Josa',
 '염두/Noun',
 '에/Josa',
 '두다/Verb',
 '해석/Noun',
 '이/Josa',
 '나오다/Verb',
 './Punctuation']


# Google Translate

References:

* https://pypi.org/project/googletrans/
* https://towardsdatascience.com/translate-a-pandas-data-frame-using-googletrans-library-fb0aa7fca592

In [None]:
pip install googletrans

Collecting googletrans
  Downloading https://files.pythonhosted.org/packages/71/3a/3b19effdd4c03958b90f40fe01c93de6d5280e03843cc5adf6956bfc9512/googletrans-3.0.0.tar.gz
Collecting httpx==0.13.3
[?25l  Downloading https://files.pythonhosted.org/packages/54/b4/698b284c6aed4d7c2b4fe3ba5df1fcf6093612423797e76fbb24890dd22f/httpx-0.13.3-py3-none-any.whl (55kB)
[K     |████████████████████████████████| 61kB 3.3MB/s 
[?25hCollecting hstspreload
[?25l  Downloading https://files.pythonhosted.org/packages/cc/6e/a09233eb83cebe00543c94ac921af936937cf448ccdd46aaf6f432d4f2dd/hstspreload-2020.9.2-py3-none-any.whl (950kB)
[K     |████████████████████████████████| 952kB 9.6MB/s 
[?25hCollecting sniffio
  Downloading https://files.pythonhosted.org/packages/b3/82/4bd4b7d9c0d1dc0fbfbc2a1e00138e7f3ab85bc239358fe9b78aa2ab586d/sniffio-1.1.0-py3-none-any.whl
Collecting rfc3986<2,>=1.3
  Downloading https://files.pythonhosted.org/packages/78/be/7b8b99fd74ff5684225f50dd0e865393d2265656ef3b4ba9eaaaffe622b8/

In [None]:
from googletrans import Translator

In [None]:
translator = Translator()

In [None]:
translated = translator.translate(graf_01)
translated.text

"It is carefully observed that President Donald Trump, who put up a diplomatic achievement in managing risks to North Korea, two months before the US presidential election, pressed North Korea against provoking short-range ballistic missiles. In particular, as President Trump has shown a modest response to North Korea's provocation of short-range ballistic missiles, it is interpreted that this action was made with the US presidential election in mind on November 3."

In [None]:
graf_01

'이는 미 대선을 두 달 앞두고 대북 리스크 관리를 외교적 성과로 내세운 도널드 트럼프 대통령이 북한에 단거리 탄도미사일 도발을 하지 말 것을 압박한 것으로 조심스럽게 관측된다. 특히 그간 트럼프 대통령이 북한의 단거리 탄도미사일 도발에 대해 대수롭지 않은 반응을 보여온 만큼 이번 조치는 11월 3일 미 대선을 염두에 뒀다는 해석이 나온다.'

# Read CSV

In [None]:
from csv import reader

Read and print csv row by row

In [None]:
# open file in read mode
with open('TestArticles.csv', 'r') as read_obj:
    # pass the file object to reader() to get the reader object
    csv_reader = reader(read_obj)
    # Iterate over each row in the csv using reader object
    for row in csv_reader:
        # row variable is a list that represents a row in csv
        print(row)

['\ufeffTitle', 'Text']
['정부 “국가채무비율 2045년 꺾인다”…전문가 “비현실적”', '2045년 국내총생산(GDP) 대비 국가채무비율이 최고 99%로 치솟을 수 있다는 정부 공식 전망이 나왔다. 기획재정부는 이런 내용의 ‘2020~2060년 장기재정전망’을 2일 내놨다. 기재부는 현상 유지, 성장률 하락세 완화, 인구 감소 폭 둔화 등 세 가지 시나리오를 가정했다.\n\n현상 유지 시나리오에 따르면 국가채무비율은 계속 상승해 97(2042년)~99%(2045년)에서 정점을 찍는다. 재정위기를 우려해야 할 수준이다. 이는 실질성장률이 2020년대 평균 2.3%에서 2050년대 0.5%로 떨어지고 인구는 2060년까지 올해 대비 894만 명, 생산가능인구(15~64세)는 1678만 명 줄어든 걸 상정했다.']
['‘부동산 감독기구’ 결국 강행', '지나친 시장 통제·감시와 개인정보·재산권 침해 위험이 있다는 비판에도 정부가 부동산 시장 감독기구 설립을 강행한다.\n\n홍남기 부총리 겸 기획재정부 장관은 2일 부동산 시장 점검 관계장관회의에서 “(부동산 시장을) 상시 모니터링하고, 불법행위 등을 포착·적발해 신속히 단속·처벌하는 상시 정부 조직을 만든다”고 밝혔다. 가칭 ‘부동산거래분석원’이다. 현재 국토교통부와 금융감독원, 국세청, 검찰, 경찰 등의 7개 기관, 13명의 인력으로 구성돼 운영 중인 임시 조직(태스크포스)인 ‘불법행위 대응반’을 상당 규모로 확대하는 방향이다.\n\n문재인 정부 들어 23번에 걸친 부동산 대책에도 시장 과열이 잡히지 않자 정부는 관리·감독기구 신설을 결정했다.']
['美 "中 핵탄두 200여 기 보유...10년 후 최소 2배"', '미국이 처음으로 중국의 핵탄두 보유 규모를 공개하며 중국을 압박했습니다.\n\n미 국방부는 중국이 보유한 핵탄두는 200여 기이며, 10년 뒤에는 최소 2배로 증가할 것이라고 전망했습니다.\n\n김태현 기자의 보도입니다.']
['檢, \'수뇌부 직무유기 의혹\' 사건 무혐의 처분…

Read specific columns from a csv file while iterating line by line

In [None]:
from csv import DictReader

In [None]:
# iterate over each line as a ordered dictionary and print only few column by column name
with open('TestArticles.csv', 'r') as read_obj:
    csv_dict_reader = DictReader(read_obj)
    for row in csv_dict_reader:
        print(row['Text'])

2045년 국내총생산(GDP) 대비 국가채무비율이 최고 99%로 치솟을 수 있다는 정부 공식 전망이 나왔다. 기획재정부는 이런 내용의 ‘2020~2060년 장기재정전망’을 2일 내놨다. 기재부는 현상 유지, 성장률 하락세 완화, 인구 감소 폭 둔화 등 세 가지 시나리오를 가정했다.

현상 유지 시나리오에 따르면 국가채무비율은 계속 상승해 97(2042년)~99%(2045년)에서 정점을 찍는다. 재정위기를 우려해야 할 수준이다. 이는 실질성장률이 2020년대 평균 2.3%에서 2050년대 0.5%로 떨어지고 인구는 2060년까지 올해 대비 894만 명, 생산가능인구(15~64세)는 1678만 명 줄어든 걸 상정했다.
지나친 시장 통제·감시와 개인정보·재산권 침해 위험이 있다는 비판에도 정부가 부동산 시장 감독기구 설립을 강행한다.

홍남기 부총리 겸 기획재정부 장관은 2일 부동산 시장 점검 관계장관회의에서 “(부동산 시장을) 상시 모니터링하고, 불법행위 등을 포착·적발해 신속히 단속·처벌하는 상시 정부 조직을 만든다”고 밝혔다. 가칭 ‘부동산거래분석원’이다. 현재 국토교통부와 금융감독원, 국세청, 검찰, 경찰 등의 7개 기관, 13명의 인력으로 구성돼 운영 중인 임시 조직(태스크포스)인 ‘불법행위 대응반’을 상당 규모로 확대하는 방향이다.

문재인 정부 들어 23번에 걸친 부동산 대책에도 시장 과열이 잡히지 않자 정부는 관리·감독기구 신설을 결정했다.
미국이 처음으로 중국의 핵탄두 보유 규모를 공개하며 중국을 압박했습니다.

미 국방부는 중국이 보유한 핵탄두는 200여 기이며, 10년 뒤에는 최소 2배로 증가할 것이라고 전망했습니다.

김태현 기자의 보도입니다.
후배 검사의 '고소장 위조' 비위 사실을 알고도 적절한 징계를 하지 않은 혐의로 고발된 전·현직 검찰 수뇌부 인사들에 대해 검찰이 일괄 무혐의 처분을 내렸다. 검찰은 이 사건을 맡았던 경찰의 자료요구에도 미온적으로 대응해왔다. 검찰이 '제 식구 감싸기 의혹 사건'을 제 식구 감싸기 식으로 처리했다는 비판

Read csv file without header

In [None]:
from csv import reader

In [None]:
# skip first line i.e. read header first and then iterate over each row od csv as a list
with open('TestArticles.csv', 'r') as read_obj:
    csv_reader = reader(read_obj)
    header = next(csv_reader)
    # Check file as empty
    if header != None:
        # Iterate over each row after the header in the csv
        for row in csv_reader:
            # row variable is a list that represents a row in csv
            print(row)

['정부 “국가채무비율 2045년 꺾인다”…전문가 “비현실적”', '2045년 국내총생산(GDP) 대비 국가채무비율이 최고 99%로 치솟을 수 있다는 정부 공식 전망이 나왔다. 기획재정부는 이런 내용의 ‘2020~2060년 장기재정전망’을 2일 내놨다. 기재부는 현상 유지, 성장률 하락세 완화, 인구 감소 폭 둔화 등 세 가지 시나리오를 가정했다.\n\n현상 유지 시나리오에 따르면 국가채무비율은 계속 상승해 97(2042년)~99%(2045년)에서 정점을 찍는다. 재정위기를 우려해야 할 수준이다. 이는 실질성장률이 2020년대 평균 2.3%에서 2050년대 0.5%로 떨어지고 인구는 2060년까지 올해 대비 894만 명, 생산가능인구(15~64세)는 1678만 명 줄어든 걸 상정했다.']
['‘부동산 감독기구’ 결국 강행', '지나친 시장 통제·감시와 개인정보·재산권 침해 위험이 있다는 비판에도 정부가 부동산 시장 감독기구 설립을 강행한다.\n\n홍남기 부총리 겸 기획재정부 장관은 2일 부동산 시장 점검 관계장관회의에서 “(부동산 시장을) 상시 모니터링하고, 불법행위 등을 포착·적발해 신속히 단속·처벌하는 상시 정부 조직을 만든다”고 밝혔다. 가칭 ‘부동산거래분석원’이다. 현재 국토교통부와 금융감독원, 국세청, 검찰, 경찰 등의 7개 기관, 13명의 인력으로 구성돼 운영 중인 임시 조직(태스크포스)인 ‘불법행위 대응반’을 상당 규모로 확대하는 방향이다.\n\n문재인 정부 들어 23번에 걸친 부동산 대책에도 시장 과열이 잡히지 않자 정부는 관리·감독기구 신설을 결정했다.']
['美 "中 핵탄두 200여 기 보유...10년 후 최소 2배"', '미국이 처음으로 중국의 핵탄두 보유 규모를 공개하며 중국을 압박했습니다.\n\n미 국방부는 중국이 보유한 핵탄두는 200여 기이며, 10년 뒤에는 최소 2배로 증가할 것이라고 전망했습니다.\n\n김태현 기자의 보도입니다.']
['檢, \'수뇌부 직무유기 의혹\' 사건 무혐의 처분…"제 편 감싸기" 비판', "후배 검사의 '

In [None]:
import csv

file_csv = open('TestArticles.csv')
data_csv = csv.reader(file_csv)
list_csv = list(data_csv)

list_csv[1:6]
 
for column in list_csv:
  print(column[0], '//', column[1])

﻿Title // Text
정부 “국가채무비율 2045년 꺾인다”…전문가 “비현실적” // 2045년 국내총생산(GDP) 대비 국가채무비율이 최고 99%로 치솟을 수 있다는 정부 공식 전망이 나왔다. 기획재정부는 이런 내용의 ‘2020~2060년 장기재정전망’을 2일 내놨다. 기재부는 현상 유지, 성장률 하락세 완화, 인구 감소 폭 둔화 등 세 가지 시나리오를 가정했다.

현상 유지 시나리오에 따르면 국가채무비율은 계속 상승해 97(2042년)~99%(2045년)에서 정점을 찍는다. 재정위기를 우려해야 할 수준이다. 이는 실질성장률이 2020년대 평균 2.3%에서 2050년대 0.5%로 떨어지고 인구는 2060년까지 올해 대비 894만 명, 생산가능인구(15~64세)는 1678만 명 줄어든 걸 상정했다.
‘부동산 감독기구’ 결국 강행 // 지나친 시장 통제·감시와 개인정보·재산권 침해 위험이 있다는 비판에도 정부가 부동산 시장 감독기구 설립을 강행한다.

홍남기 부총리 겸 기획재정부 장관은 2일 부동산 시장 점검 관계장관회의에서 “(부동산 시장을) 상시 모니터링하고, 불법행위 등을 포착·적발해 신속히 단속·처벌하는 상시 정부 조직을 만든다”고 밝혔다. 가칭 ‘부동산거래분석원’이다. 현재 국토교통부와 금융감독원, 국세청, 검찰, 경찰 등의 7개 기관, 13명의 인력으로 구성돼 운영 중인 임시 조직(태스크포스)인 ‘불법행위 대응반’을 상당 규모로 확대하는 방향이다.

문재인 정부 들어 23번에 걸친 부동산 대책에도 시장 과열이 잡히지 않자 정부는 관리·감독기구 신설을 결정했다.
美 "中 핵탄두 200여 기 보유...10년 후 최소 2배" // 미국이 처음으로 중국의 핵탄두 보유 규모를 공개하며 중국을 압박했습니다.

미 국방부는 중국이 보유한 핵탄두는 200여 기이며, 10년 뒤에는 최소 2배로 증가할 것이라고 전망했습니다.

김태현 기자의 보도입니다.
檢, '수뇌부 직무유기 의혹' 사건 무혐의 처분…"제 편 감싸기" 비판 // 후배 검사의 '고소장 위조' 비위 