##**Requests_Quickstart**
> - https://docs.python-requests.org/en/latest/user/quickstart/

>> ### **Make a Request**

In [1]:
import requests

In [2]:
# HTTP GET 요청은 웹 서버에서 정보를 검색하는 데 사용됩니다. 이 요청은 데이터를 서버로 보내지 않고,
# 서버에서 제공하는 정보나 리소스를 가져옵니다.
r = requests.get('https://api.github.com/events')
r

<Response [200]>

In [3]:
# HTTP POST 요청을 'https://httpbin.org/post URL로 보냅니다. '.
# 이 요청으로 보내는 데이터는 {'key': 'value'} 사전 형식입니다. 이 데이터는 요청 본문의 일부로 서버에 전송됩니다.

r = requests.post('https://httpbin.org/post', data={'key': 'value'})
r

<Response [200]>

In [6]:
# HTTP PUT 요청을 'https://httpbin.org/put URL로 보냅니다. '.
# POST 요청과 마찬가지로 요청 본문에 이 요청과 함께 {'key': 'value'} 데이터도 전송합니다.
# PUT 요청은 일반적으로 서버의 기존 리소스를 업데이트하는 데 사용됩니다. POST와 유사하지만 기존 데이터를 업데이트하는 데 자주 사용됩니다.
r = requests.put('https://httpbin.org/put', data={'key': 'value'})
r

<Response [200]>

In [5]:

r = requests.delete('https://httpbin.org/delete')
r

<Response [200]>

In [8]:
# HTTP HEAD 방법은 리소스의 본문 내용을 실제로 요청하지 않고 웹 서버에서 리소스의 헤더를 요청하는 데 사용됩니다.
# HTTP HEAD 요청을 보내면 서버는 콘텐츠 유형, 콘텐츠 길이, 다양한 메타데이터 등의 정보를 포함하여 리소스와 관련된 헤더로 응답하지만
# 리소스의 실제 콘텐츠를 보내지는 않습니다. 이는 리소스에 대한 메타데이터만 필요하고 전체 리소스를 다운로드하고 싶지 않을 때 유용합니다.
r = requests.head('https://httpbin.org/get')
r

<Response [200]>

In [9]:
r.headers

{'Date': 'Thu, 07 Sep 2023 04:34:45 GMT', 'Content-Type': 'application/json', 'Content-Length': '306', 'Connection': 'keep-alive', 'Server': 'gunicorn/19.9.0', 'Access-Control-Allow-Origin': '*', 'Access-Control-Allow-Credentials': 'true'}

In [None]:
# HTTP OPTIONS 메서드는 서버에서 지원하는 HTTP 메서드 및 헤더 옵션을 조회하기 위해 사용됩니다.
# OPTIONS 요청을 보내면 서버는 해당 엔드포인트 또는 리소스에 대한 지원되는 HTTP 메서드 목록과 다른 헤더 옵션을 반환합니다.
# 이 메서드는 주로 CORS (Cross-Origin Resource Sharing)와 같은 웹 보안 및 권한 관련 설정을 확인하기 위해 사용됩니다.
r = requests.options('https://httpbin.org/get')
r

<Response [200]>

>> ### **Passing Parameters In URLs**

In [13]:
r = requests.get('https://httpbin.org/get')
print(r.text)

{
  "args": {}, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.31.0", 
    "X-Amzn-Trace-Id": "Root=1-64f95330-7d311db33d5b3ff353e1d74c"
  }, 
  "origin": "34.16.157.21", 
  "url": "https://httpbin.org/get"
}



In [17]:
payload = {'key1': 'value1', 'key2': 'value2'}
r = requests.get('https://httpbin.org/get', params=payload)
r

<Response [200]>

In [16]:
print(r.url)

https://httpbin.org/get?key1=value1&key2=value2


In [18]:
print(r.text)

{
  "args": {
    "key1": "value1", 
    "key2": "value2"
  }, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.31.0", 
    "X-Amzn-Trace-Id": "Root=1-64f953a5-20f865044ee5879a57ca19c9"
  }, 
  "origin": "34.16.157.21", 
  "url": "https://httpbin.org/get?key1=value1&key2=value2"
}



In [19]:
r = requests.get('https://httpbin.org/get')
r

<Response [200]>

In [20]:
print(r.url)

https://httpbin.org/get


In [21]:
print(r.text)

{
  "args": {}, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.31.0", 
    "X-Amzn-Trace-Id": "Root=1-64f95410-28c4968301d8fd397d0b235e"
  }, 
  "origin": "34.16.157.21", 
  "url": "https://httpbin.org/get"
}



In [22]:
payload = {'key1': 'value1', 'key2': ['value2', 'value3']}

r = requests.get('https://httpbin.org/get', params=payload)

print(r.url)

https://httpbin.org/get?key1=value1&key2=value2&key2=value3


In [None]:
print(r.text)

>> ### **Response Content**

In [24]:
r = requests.get('https://api.github.com/events')
r.text

'[{"id":"31655585833","type":"PushEvent","actor":{"id":5080126,"login":"wizardforcel","display_login":"wizardforcel","gravatar_id":"","url":"https://api.github.com/users/wizardforcel","avatar_url":"https://avatars.githubusercontent.com/u/5080126?"},"repo":{"id":687090634,"name":"CyberCommy/biqu520net-140001-150000","url":"https://api.github.com/repos/CyberCommy/biqu520net-140001-150000"},"payload":{"repository_id":687090634,"push_id":14950762854,"size":1,"distinct_size":1,"ref":"refs/heads/master","head":"2342464c133d82a6849326bf020a111b657fd082","before":"7de686167876da5df2aa69f74fbc0bd661b3305e","commits":[{"sha":"2342464c133d82a6849326bf020a111b657fd082","author":{"email":"562826179@qq.com","name":"wizardforcel"},"message":"add 我在东京斩断不死 - 没用的铅笔 - 152CHS.epub","distinct":true,"url":"https://api.github.com/repos/CyberCommy/biqu520net-140001-150000/commits/2342464c133d82a6849326bf020a111b657fd082"}]},"public":true,"created_at":"2023-09-07T04:35:51Z","org":{"id":132496677,"login":"Cyber

In [25]:
print(r.text)

[{"id":"31655585833","type":"PushEvent","actor":{"id":5080126,"login":"wizardforcel","display_login":"wizardforcel","gravatar_id":"","url":"https://api.github.com/users/wizardforcel","avatar_url":"https://avatars.githubusercontent.com/u/5080126?"},"repo":{"id":687090634,"name":"CyberCommy/biqu520net-140001-150000","url":"https://api.github.com/repos/CyberCommy/biqu520net-140001-150000"},"payload":{"repository_id":687090634,"push_id":14950762854,"size":1,"distinct_size":1,"ref":"refs/heads/master","head":"2342464c133d82a6849326bf020a111b657fd082","before":"7de686167876da5df2aa69f74fbc0bd661b3305e","commits":[{"sha":"2342464c133d82a6849326bf020a111b657fd082","author":{"email":"562826179@qq.com","name":"wizardforcel"},"message":"add 我在东京斩断不死 - 没用的铅笔 - 152CHS.epub","distinct":true,"url":"https://api.github.com/repos/CyberCommy/biqu520net-140001-150000/commits/2342464c133d82a6849326bf020a111b657fd082"}]},"public":true,"created_at":"2023-09-07T04:35:51Z","org":{"id":132496677,"login":"CyberC

>>> **"pretty-print"를 의미하는 pprint 모듈을 가져옵니다. 'pprint' 모듈은 데이터 구조(예: 사전 또는 JSON)를 보다 읽기 쉽고 형식화된 방식으로 인쇄하는 모듈**

In [None]:
import pprint

pprint.pprint(r.text)

In [27]:
r.encoding

'utf-8'

>> ### **Binary Response Content**

In [None]:
r.content

>> ### **JSON Response Content**

In [None]:
r = requests.get('https://api.github.com/events')
r.json()

In [30]:
d_json = r.json()

In [31]:
type(d_json)

list

In [32]:
len(d_json)

30

In [33]:
for text in d_json:
    print(text)

{'id': '31655594847', 'type': 'PushEvent', 'actor': {'id': 10789485, 'login': 'crimsonmagick', 'display_login': 'crimsonmagick', 'gravatar_id': '', 'url': 'https://api.github.com/users/crimsonmagick', 'avatar_url': 'https://avatars.githubusercontent.com/u/10789485?'}, 'repo': {'id': 667652836, 'name': 'crimsonmagick/llama-cpp-java-bindings', 'url': 'https://api.github.com/repos/crimsonmagick/llama-cpp-java-bindings'}, 'payload': {'repository_id': 667652836, 'push_id': 14950767568, 'size': 1, 'distinct_size': 1, 'ref': 'refs/heads/master', 'head': '90edeeb7ba4e350db2df678d6baacf4a59490594', 'before': '05d597e0b9429c969e12e22017f6bee8dba48abf', 'commits': [{'sha': '90edeeb7ba4e350db2df678d6baacf4a59490594', 'author': {'email': 'welbyseely@gmail.com', 'name': 'Welby Seely'}, 'message': "Started working on getting the library ready for a 0.0.1 publish. To start with, we'll need to package it up as jars.", 'distinct': True, 'url': 'https://api.github.com/repos/crimsonmagick/llama-cpp-java-b

>> ### **데이터 구조 이해 해보기**

In [None]:
import pandas as pd

for text in d_json:
    display(pd.DataFrame(text))
    print('*'*100)

>> ### **BeautifulSoup**

In [None]:
from bs4 import BeautifulSoup

>> ### **Quick Start**

In [None]:
soup = BeautifulSoup("<p>Some<b>bad<i>HTML")

In [None]:
soup

<html><body><p>Some<b>bad<i>HTML</i></b></p></body></html>

In [None]:
print(soup.prettify())

<html>
 <body>
  <p>
   Some
   <b>
    bad
    <i>
     HTML
    </i>
   </b>
  </p>
 </body>
</html>


In [None]:
soup.find(string="bad")

'bad'

In [None]:
soup.i

<i>HTML</i>

In [None]:
soup = BeautifulSoup("<tag1>Some<tag2/>bad<tag3>XML", "xml")
print(soup.prettify())

<?xml version="1.0" encoding="utf-8"?>
<tag1>
 Some
 <tag2/>
 bad
 <tag3>
  XML
 </tag3>
</tag1>


## **실전문제**

In [None]:
url = 'https://www.lieder.net/lieder/get_text.html?TextId=21635'

In [None]:
response = requests.get(url)
response

<Response [200]>

In [None]:
soup = BeautifulSoup(response.text)

In [None]:
print(soup.prettify())

In [None]:
div_element = soup.find('div', {'id': 'the-tr', 'class': 'text the-tr'})
pre_element = div_element.find('pre')
text = pre_element.get_text()
pprint.pprint(text)

('Beautiful Soup, so rich and green,\n'
 'Waiting in a hot tureen!\n'
 'Who for such dainties would not stoop?\n'
 'Soup of the evening, beautiful Soup!\n'
 'Beautiful Soup!\n'
 'Beautiful Soup!\n'
 'Soup of the evening,\n'
 'Beautiful, beautiful Soup!\n'
 '\n'
 'Beautiful Soup!  Who cares for fish,\n'
 'Game, or any other dish?\n'
 'Who would not give all else for two\n'
 'Pennyworth only of beautiful Soup?\n'
 'Beautiful Soup!\n'
 'Beautiful Soup!\n'
 'Soup of the evening,\n'
 'Beautiful, beautiful soup!')


In [None]:
for i in text.split():
    if i == 'Beautiful':
        print(i)
    if i == 'Beautiful'.lower():
        print(i)

Beautiful
beautiful
Beautiful
Beautiful
beautiful
Beautiful
beautiful
Beautiful
Beautiful
beautiful
