<알림>
* 프로그램 실행 전, 다음 파이썬 라이브러리들을 설치해주세요.
   - pip install requests
   - pip install beautifulsoup4
* python problem.py 로 실행해주세요
* 만약 html 파일을 사용하실 경우, 같은 경로 아래 (WMP_yeongsu파일)에 저장해주세요
* 출력단위는 사용자가 임의로 종료할 때까지 여러 번 입력할 수 있도록 구성했습니다
* url 입력은 꼭 https:// 를 넣어주시고, file 입력은 .html 을 넣어주세요

<프로그램 요약>
* `requests`를 활용하여 웹 페이지를 읽어옵니다 (또는 html 파일은 open합니다)
* `beutifulsoup`을 활용하여 웹 페이지를 파싱합니다 (TXT 또는 HTML 버전에 맞게 데이터를 저장합니다)
* 정규식을 활용하여 알파벳만 구성된 string과 숫자만 구성된 string으로 나눕니다
* 아스키 코드를 활용하여 알파벳 string(AbBbCc..)을 오름차순으로 정렬합니다
   - A: 65, B: 66, ... a: 97, b: 98 로 파이썬으로 아스키 코드가 구성됩니다
   - 간단한 계산으로 A: 130, a: 131, B: 132, b: 133, .. 이 되도록 구성합니다
   - 표준 sort함수를 사용하여 정렬 후, 다시 알파벳으로 복호화를 해줍니다
* 표준 sort함수를 활용하여 숫자 string을 오름차순으로 정렬합니다
* 알파벳 string과 숫자 string 중에서 짧은 길이에 맞춰, 교차출력을 합니다. 따라서, 알파벳과 숫자 string 중 어느 하나라도 길이가 0이면 출력결과가 없습니다.
* '%' 연산자와 slicing list 기법을 활용해서 출력단위에 맞게 몫과 나머지를 출력합니다 

In [3]:
"""
by Yeongsu Kim, 2018.11.06
"""
import sys, os
import re
from bs4 import BeautifulSoup  
import requests

def main():

	page_name = input(">> URL 또는 FILE 이름을 입력해주세요 -> ")
	#print(page_name)

	## Loading page with `Requests`
	if 'https://' in page_name: # Request GET으로 웹 페이지 읽어오기
		try:
			data = requests.get(page_name).text
		except:
			sys.exit('[ERROR] 올바르지 않은 URL 입니다.')
	elif '.html' in page_name: # 파일 읽기
		with open(page_name, 'r', encoding='UTF-8') as f:
			data = f.read()
	else:
		sys.exit('[ERROR] URL은 https:// 을 FILE은 .html 을 명시해주세요.')
	#print(data)

	## Parsing page with `BeutifulSoup`
	data = BeautifulSoup(data, 'lxml')
	
	ver = int(input('>> TXT는 1 을 HTML은 2 을 입력해주세요 -> '))
	if ver == 1: # txt
		data = str(data)
	elif ver == 2: # html
		data = data.get_text()
	else:
		sys.exit('[ERROR] 1번 또는 2번만 입력해주세요.')
	#print(data)
	
	## Filtering String with Regular Expression
	data_letters = re.sub(r"[^A-Za-z]+", '', data) # only letters
	data_numbers = re.sub(r"[^0-9]+", '', data) # only numbers
	#print(data_letters)
	#print(data_numbers)
	
	## Sorting letters
	encoded = [ord(x)*2 if ord(x)<95 else ord(x)*2+34-97 for x in data_letters]
	encoded.sort()
	sorted_letters = ''.join([chr(int(x/2)) if x%2==0 else chr(x-(34+int((x-131)/2))) for x in encoded])
	
	## Sorting numbers
	sorted_numbers = ''.join(sorted(data_numbers))
	
	## Merging two strings
	min_len = min(len(sorted_letters), len(sorted_numbers))
	result = ''.join([x+y for x, y in zip(sorted_letters[:min_len], sorted_numbers[:min_len])])
	
	while True:
		try:
			nat_num = int(input(">> 출력단위(1~500)를 입력해주세요 (0:종료) -> "))
			if nat_num == 0: break
			
			if len(result) < nat_num:
				quotient = ''
				remainder = result
			else:
				ref = len(result) % nat_num
				if ref == 0:
					quotient = result
					remainder = ''					
				else:
					quotient = result[:-ref]
					remainder = result[-ref:]
				
			print('>> 몫: \t', quotient)
			print('>> 나머지:', remainder)
			print('\n')
		
		except KeyboardInterrupt:
			break

```
test.html 파일 내용: <br>
<html lang="ko">hello09428947u832947HLKJIOAEIOVJ3094890J234</html>
```

In [4]:
main()

>> URL 또는 FILE 이름을 입력해주세요 -> test.html
>> TXT는 1 을 HTML은 2 을 입력해주세요 -> 2
>> 출력단위(1~500)를 입력해주세요 (0:종료) -> 3
>> 몫: 	 A0E0e0H2h2I2I3J3J3J4K4L4l4l4O7O7o8u8
>> 나머지: V8


>> 출력단위(1~500)를 입력해주세요 (0:종료) -> 5
>> 몫: 	 A0E0e0H2h2I2I3J3J3J4K4L4l4l4O7O7o8u
>> 나머지: 8V8


>> 출력단위(1~500)를 입력해주세요 (0:종료) -> 10
>> 몫: 	 A0E0e0H2h2I2I3J3J3J4K4L4l4l4O7
>> 나머지: O7o8u8V8


>> 출력단위(1~500)를 입력해주세요 (0:종료) -> 30
>> 몫: 	 A0E0e0H2h2I2I3J3J3J4K4L4l4l4O7
>> 나머지: O7o8u8V8


>> 출력단위(1~500)를 입력해주세요 (0:종료) -> 47
>> 몫: 	 
>> 나머지: A0E0e0H2h2I2I3J3J3J4K4L4l4l4O7O7o8u8V8


>> 출력단위(1~500)를 입력해주세요 (0:종료) -> 23
>> 몫: 	 A0E0e0H2h2I2I3J3J3J4K4L
>> 나머지: 4l4l4O7O7o8u8V8


>> 출력단위(1~500)를 입력해주세요 (0:종료) -> 17
>> 몫: 	 A0E0e0H2h2I2I3J3J3J4K4L4l4l4O7O7o8
>> 나머지: u8V8


>> 출력단위(1~500)를 입력해주세요 (0:종료) -> 13
>> 몫: 	 A0E0e0H2h2I2I3J3J3J4K4L4l4
>> 나머지: l4O7O7o8u8V8


>> 출력단위(1~500)를 입력해주세요 (0:종료) -> exit


ValueError: invalid literal for int() with base 10: 'exit'

In [5]:
main()

>> URL 또는 FILE 이름을 입력해주세요 -> https://www.naver.com/
>> TXT는 1 을 HTML은 2 을 입력해주세요 -> 1
>> 출력단위(1~500)를 입력해주세요 (0:종료) -> 13
>> 몫: 	 A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0

>> 출력단위(1~500)를 입력해주세요 (0:종료) -> 477
>> 몫: 	 A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0A0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a0a

>> 출력단위(1~500)를 입력해주세요 (0:종료) -> exit


ValueError: invalid literal for int() with base 10: 'exit'

In [None]:
a