In [1]:
# telnetによる任意のサーバーの任意のポートに接続
# telnet www.google.com 80

In [2]:
# pythonのhttp:
# clientは、クライアントサイドの処理を行う
# serverはPythonによるウェブサーバー開発を助ける
# cookiesとcookiejarは、複数のサイトアクセスにまたがって必要な情報を保存するクッキーを管理する
# urllibはhttpの上で実行される
# requestはクライアントの要求を処理する
# responseはサーバーの応答を処理する
# parseはURLを部品に切り分ける

In [3]:
import urllib.request as ur
url = 'https://raw.githubusercontent.com/koki0702/introducing-python/master/dummy_api/fortune_cookie_random1.txt'
conn = ur.urlopen(url)
print(conn)

<http.client.HTTPResponse object at 0x10d8ceeb8>


In [4]:
# connはいくつかのメソッドをもつHTTPResponseオブジェクト
data = conn.read()
print(data)

b'You will be surprised by a loud noise.\\r\\n\\n[codehappy] http://iheartquotes.com/fortune/show/20447\n'


In [5]:
# 応答の中でも特に重要なのはHTTPステータコード
print(conn.status)

200


In [6]:
# HTTPステータコード
# 1xx (情報)
# サーバーは要求を受け取ったが、クライアントに対して知らせるべき追加情報がある
# 2xx (成功)
# 要求は正しく機能した。200以外の成功コードには、追加情報が含まれている
# 3xx (リダイレクト)
# リソースが移動しているので、応答はクライアントに対して新しいURLを返す
# 4xx (クライアントエラー)
# クライアントサイドに問題がある。有名な404(見つからない)などがある
# 500 (サーバーエラー)
# 500は汎用のエラーコード。502(不正なゲートウェイ)はウェブサーバーとバックエンドアプリケーションサーバーの間の
# 接続に問題があったときに返される。

In [7]:
# ウェブサーバーは、好みの形式でデータを送り返すことができる。通常はHTML, CSS, JavaScriptなどだが
# プレーンテキストもできる
# データ形式は、HTTP応答ヘッダーのContent-Typeで指定されている
print(conn.getheader('Content-Type'))

text/plain; charset=utf-8


In [8]:
# text/plainはMIMEタイプ, HTMLのMIMEタイプはtext/html
# 外は?
for key, value in conn.getheaders():
    print(key, "+++", value)

Content-Security-Policy +++ default-src 'none'; style-src 'unsafe-inline'; sandbox
Strict-Transport-Security +++ max-age=31536000
X-Content-Type-Options +++ nosniff
X-Frame-Options +++ deny
X-XSS-Protection +++ 1; mode=block
ETag +++ "eea0cb5830ed402a56a2ac014699cc3fb9478f36"
Content-Type +++ text/plain; charset=utf-8
Cache-Control +++ max-age=300
X-Geo-Block-List +++ 
X-GitHub-Request-Id +++ E86E:C297:884016:8EE9B4:5A6DBA85
Content-Length +++ 99
Accept-Ranges +++ bytes
Date +++ Sun, 28 Jan 2018 11:56:53 GMT
Via +++ 1.1 varnish
Connection +++ close
X-Served-By +++ cache-itm18827-ITM
X-Cache +++ MISS
X-Cache-Hits +++ 0
X-Timer +++ S1517140614.723668,VS0,VE153
Vary +++ Authorization,Accept-Encoding
Access-Control-Allow-Origin +++ *
X-Fastly-Request-ID +++ 1a3731fd3f3b20957dd4b25844a150a442fd0eb6
Expires +++ Sun, 28 Jan 2018 12:01:53 GMT
Source-Age +++ 0


In [9]:
# サード・パーティ製のrequestsによるWebの基礎
import requests
url = 'https://raw.githubusercontent.com/koki0702/\
introducing-python/master/dummy_api/fortune_cookie_random2.txt'
resp = requests.get(url)
resp

<Response [200]>

In [10]:
print(resp.text)

I know that there are people who do not love their fellow man, and I people like that!
    -- Tom Lehrer, Satirist and Professor
    [codehappy] http://iheartquotes.com/fortune/show/21465



In [11]:
# ウェブサーバーのフレームワークには以下の様な機能がある
# ルーティング（URLを解析してサーバー関数呼び出しを行う）
# テンプレート（動的に情報を組み込めるHTMLファイル）
# デバック

In [12]:
# Pythonによるもっとも単純なウェブサーバー
# python -m http.server

In [13]:
# フレームワーク
# Bottle
from bottle import route, run

@route('/')
def home():
    return "It isn't fancy, but it's my home page."

run(host='localhost', port=9999)

Bottle v0.12.13 server starting up (using WSGIRefServer())...
Listening on http://localhost:9999/
Hit Ctrl-C to quit.



In [15]:
# bottle2.py
from bottle import route, run, static_file

@route('/')
def main():
    return static_file('index.html', root='.')

run(host='localhost', port=9999)

Bottle v0.12.13 server starting up (using WSGIRefServer())...
Listening on http://localhost:9999/
Hit Ctrl-C to quit.



In [25]:
# bottle3.py
from bottle import route, run, static_file

@route('/')
def home():
    return static_file('index.html', root='.')

@route('/echo/<thing>')
def echo(thing):
    return ("Say hello to my little friend: %s!" % thing)

run(host='localhost', port=9999)

Bottle v0.12.13 server starting up (using WSGIRefServer())...
Listening on http://localhost:9999/
Hit Ctrl-C to quit.



In [26]:
# bottle_test.py ※クライアントサイド
import requests

resp = requests.get('http://localhost:9999/echo/Mothra')
if resp.status_code == 200 and resp.text == 'Say hello to my little friend: Mothra!':
    print('It worked! That almost never happens!')
else:
    print('Argh, got this:', resp.text)

ConnectionError: HTTPConnectionPool(host='localhost', port=9999): Max retries exceeded with url: /echo/Mothra (Caused by NewConnectionError('<urllib3.connection.HTTPConnection object at 0x108cc22b0>: Failed to establish a new connection: [Errno 61] Connection refused',))

In [27]:
# Flask
# flask1.py
from flask import Flask

# Flaskの静的ファイルのフォルダホームディレクトリはstaticであり、そのディレクトリのファイルに対するURLも
# /staticで始まる。そこで、ホームディレクトリを'.'（カレントディレクトリに移動し、URLのプレフィックスも''にして）
# /というURLがindex.htmlファイルにマッピングされるようにする
app = Flask(__name__, static_folder='.', static_url_path='')

@app.route('/')
def home():
    return app.send_static_file('index.html')

@app.route('/echo/<thing>')
def echo(thing):
    return thing

app.run(port=9999, debug=True)

 * Running on http://127.0.0.1:9999/ (Press CTRL+C to quit)
 * Restarting with stat


SystemExit: 1

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)


In [16]:
# Bottleにできなくて、Flaskにできること
# -> テンプレートシステムのjinja2 !!!
# templatesというディレクトリを作り、flask2.htmlを中に作る
# flask2.py
from flask import Flask, render_template

app = Flask(__name__, static_folder='.', static_url_path='')

@app.route('/echo/<thing>')
def echo(thing):
    return render_template('flask2.html', thing=thing)

app.run(port=9999, debug=True)

 * Running on http://127.0.0.1:9999/ (Press CTRL+C to quit)
 * Restarting with stat


SystemExit: 1

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)


In [17]:
# URLパスの一部という形で引数渡し
# flask3a.py
from flask import Flask, render_template

app = Flask(__name__, static_folder='.', static_url_path='')

@app.route('/echo/<thing>')
def echo(thing):
    return render_template('flask3.html', thing=thing, place=place)

app.run(port=9000, debug=True)

 * Running on http://127.0.0.1:9000/ (Press CTRL+C to quit)
 * Restarting with stat


SystemExit: 1

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)


In [22]:
# flask3b.py
from flask import Flask, render_template, request

app = Flask(__name__, static_folder='.', static_url_path='')

@app.route('/echo/')
def echo():
    thing = request.args.get('thing')
    place = request.args.get('place')
    return render_template('flask3.html', thing=thing, place=place)

app.run(host='localhost', port=8000, debug=True)

 * Running on http://localhost:8000/ (Press CTRL+C to quit)
 * Restarting with stat


SystemExit: 1

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)


In [23]:
# flask3c.py
from flask import Flask, render_template, request

app = Flask(__name__, static_folder='.', static_url_path='')

@app.route('/echo/')
def echo():
    kwargs = {}
    kwargs['thing'] = request.args.get('thing')
    kwargs['place'] = request.args.get('place')
    return render_template('flask3.html', **kwargs)


app.run(host='localhost', port=8000, debug=True)

OSError: [Errno 48] Address already in use

In [18]:
# webbrowserモジュール
import antigravity

In [19]:
# ブラウザーにURLをロードして表示
import webbrowser
url = 'http://www.python.org/'
webbrowser.open(url)

True

In [20]:
# 新しいウィンドウにデータをURLをロードする ※ブラウザによって、挙動が変わる
webbrowser.open_new(url)

True

In [21]:
# 新しいタブにデータをロード
webbrowser.open_new_tab('http://www.python.org')

True

In [2]:
# BeautifulSoupによるHTMLの解析
def get_links(url):
    import requests
    from bs4 import BeautifulSoup as soup
    result = requests.get(url)
    page = result.text
    doc = soup(page, 'html.parser')
    links = [element.get('href') for element in doc.find_all('a')]
    return links

url = 'http://boingboing.net/'
print('Links in', url)
for num, link in enumerate(get_links(url), start=1):
    print(num, link)
print()

Links in http://boingboing.net/
1 https://boingboing.net
2 http://boingboing.net/sub
3 https://boingboing.net/search
4 https://store.boingboing.net
5 javascript:void(0)
6 http://boingboing.net/blog
7 http://bbs.boingboing.net
8 https://bbs.boingboing.net/faq
9 http://store.boingboing.net
10 mailto:pubsupport@stackcommerce.com
11 http://boingboing.net/about
12 http://boingboing.net/contact
13 http://boingboing.net/advertise
14 http://boingboing.net/privacy
15 http://boingboing.net/tos
16 https://boingboing.net/2018/01/25/animation-summarizes-all-of.html
17 https://boingboing.net/tag/Say-my-name
18 https://boingboing.net/2018/01/25/animation-summarizes-all-of.html
19 https://boingboing.net/author/blazenhoff_1
20 https://boingboing.net/2018/01/26/what-scam-artists-can-teach-us.html
21 https://boingboing.net/tag/genetic-fallacy
22 https://boingboing.net/2018/01/26/what-scam-artists-can-teach-us.html
23 https://boingboing.net/author/mark_frauenfelder_1
24 https://boingboing.net/2018/01/25/t