#### Reference
<li><a href="https://www.youtube.com/user/schafer5">Corey Schafer YouTube Channel</a></li>
<li><a href="https://docs.python.org/3/tutorial/modules.html">Official Python text on modules</a></li>
<li><a href="https://docs.python.org/3.6/library/index.html">Official Python text on standard libraries</a></li>

#### Arranged By
<li><a href="https://github.com/TheSunsik/wrapups/tree/master/Python/Basics">Sunsik Kim</a></li>

# 1. Modules and Packages

## (1) Module

확장자가 .py인 임의의 Python script를 모듈이라고 한다. 현재 script에서 다른 모듈에서 정의된 객체나 함수가 필요할 때, 대부분의 경우에 "import 모듈명"의 형식으로 현재 script에서 해당 모듈의 변수, 함수 등을 이용할 수 있게 한다. 이렇게 할 수 있는 것은 "import 모듈명"이라는 문장을 실행하면 (1)그 모듈이 어디있는지 찾아서 (2)그 모듈을 처음부터 끝까지 한 번 실행하기 때문이다.<br><br>
&ensp;&ensp; (1) Module search path : list of **built-in modules** → paths in **sys.path**<br>
&emsp;&emsp;&emsp;`built-in modules` : 이 텍스트의 주제로, 이 중 몇개가 이 텍스트에서 곧 다뤄질 예정.<br>
&emsp;&emsp;&emsp;`sys.path` : 이들 중 하나인 sys에는 path라는 객체가 있는데, built-in module의 목록에서 다 찾아도 없으면 이 **객체에 있는 경로들** 순서대로 찾음<br>
&emsp;&emsp;&emsp;&emsp;1) 먼저 현재 script file이 저장된 경로(저장되지 않았다면 현재 working directory)<br>
&emsp;&emsp;&emsp;&emsp;2) 그 다음엔 PYTHONPATH(https://docs.python.org/3/using/cmdline.html#envvar-PYTHONPATH)<br>
&ensp;&ensp; (2) 한번 실행한다는 게 모듈 내 변수를 global environment에 올리는게 아니라 그 모듈의 이름을 global symbol table에 올린다는 뜻임.<br>
&ensp;&ensp;&emsp;&emsp;예를 들어 os라는 built-in module을 import했다면(import os) os라는 이름이 모듈로써 global symbol table에 올라가고, <br>
&ensp;&ensp;&emsp;&emsp;이에 따라 이 모듈에 있는 getcwd 함수를 os.getcwd(os 모듈의 getcwd함수) 이런 식으로 사용할 수 있게 되는 것임.

임의의 모듈에 적용할 수 있는 함수로 <b>dir()</b>이 있는데, 이 함수는 <b>모듈 이름을 input</b>으로 받아 그 <b>모듈이 정의하는 이름들의 list를 output</b>으로 출력한다. 이를 통해 해당 모듈로 실행할 수 있는 함수들의 list를 확인할 수 있다. 예를 들어, dir(builtins)를 통해 Python의 모든 예약 언어(reserved words)들의 목록을 조회할 수 있다

In [52]:
import builtins
# print(dir(builtins))

참고로, `__name__`이라는 기본 내장 객체가 있는데, 이 객체는 한 script안에서 여러 개의 module을 attach할 때, buffer(커서라고 생각하면 편함)의 위치를 알려주는 기능을 한다. 예를 들어, 현재 script안에서 \_\_name__을 출력해보면 \_\_main__이라고 나온다.

In [1]:
print(__name__)

__main__


이는 buffer가 현재 작업중인 script에 있다는 것을 의미한다. 하지만 이때 alpha라는 module을 import하고, 그 안에 print(\_\_name__)을 입력해 놓았다면, alpha.py라는 출력값을 얻게 된다. 이는 module을 initialize할 때 buffer가 alpha.py에 있고, 따라서 그 위치가 출력되기 때문이다.

## (2) Package

여러 개의 모듈을 포함하고 있는 폴더를 말한다. 당연히 여러 패키지가 다시 하나의 폴더에 포함되는 경우가 있을 수 있는데, 이 경우엔 package-subpackage-module이라는 개념어를 사용해 이 구조를 표현한다. 패키지 역시 "import 패키지명"을 실행해서 global symbol table에 추가시키는데, 패키지의 search path는 sys.path와 같다.<br>이때 일반 폴더와 패키지를 구분해서 인식하게 하는 것은 \_\_init\_\_모듈의 존재다. 내용에 상관없이 이 모듈이 있어야 해당 폴더를 패키지 또는 패키지의 일부로 인식한다. "import 패키지명"을 해서 search path에서 해당하는 패키지(즉, 폴더)를 찾았다면 이 파일이 가장 먼저 실행된다. 이 파일은 빈 script로 있어도 되지만, \_\_all\_\_객체를 등 여러가지 내용을 추가하는 것이 효과적인 initialization에 도움이 된다.

# 2. os Module

In [2]:
import os

현재 작업환경의 운영체제에 대한 정보를 얻을 수 있게 해주는 모듈이다. 다음과 같은 함수들이 정의되어 있다:<br>
<br>
<li>os.<b>getcwd</b> : 현재 working directory 출력</li>
<li>os.<b>chdir</b> : working directory 변경</li>
<li>os.<b>listdir</b> : 현재 디렉토리 내 파일 및 폴더 출력</li><br>

<li>os.<b>makedirs</b> : 어떤 경로를 만들고자 할 때, 그에 필요한 모든 폴더 만듬(mkdir의 상위호환)</li>
<li>os.<b>rmdir</b> : 지정한 디렉토리 하나를 삭제(removedirs의 하위호환이지만 안전)</li>
<li>os.<b>rename</b> : 현재 디렉토리 내 파일 및 폴더의 이름 변경</li>

In [3]:
os.makedirs("dumb/dumber") # (1)
os.chdir("./dumb") # (2)
os.rename("dumber", "dumbest") # (3)
os.rmdir("dumbest") # (4)
os.chdir("..") # (5)
os.rmdir("dumb") # (6)

working directory를 띄워놓고 위 코드를 실행시키면 화면에서 아무것도 일어나지 않은 것 처럼 보이지만, 실제로는: **(1)** dumb 폴더가 생성되고 그 안에 dumber라는 폴더가 생성된 후, **(2)** 생성한 dumb 폴더로 디렉토리를 이동시킨 다음 **(3)** 그 안에 또 생성시켰던 dumber 폴더의 이름을 dumbest로 바꾼 후 **(4)** 그 폴더를 삭제한 다음에 **(5)** dumb의 상위 폴더로 디렉토리를 이동한 다음 **(6)** dumb 폴더를 지웠다. 즉, 생성한 폴더 2개를 다시 다 지웠기 때문에 아무 일도 없었던 것처럼 보이게 된다. 추가로:
<ol>
    <li>os.mkdir("dumb") → os.chdir("./dumb") → os.mkdir("dumber")와 같은 과정을 makedirs함수를 통해서는 한 줄만으로 표현할 수 있기 때문에 makedirs가 mkdir 함수의 상위호환이라고 할 만하다.</li>
    <li><b>경로를 표현할 때 .는 현재 디렉토리를 의미</b>한다. 예를 들어 현재 디렉토리가 C:\Users\User\Desktop이라면 "./dumb"은 C:\Users\User\Desktop\dumb을 의미하게 된다.</li>
    <li>위에서도 언급했지만, ".."는 현재 디렉토리의 상위 디렉토리를 의미한다.</li>
</ol>

<li>os.<b>walk</b> : 한 디렉토리를 input으로 넣으면 그 디렉토리 하부에 있는 모든 경로들과 그 경로 각각의 폴더, 파일을 tuple형태로 반환함<br>
예를 들어, "C://Users//grainpowder//Desktop//github//wrapups/Python/" 디렉토리에 Basics폴더가 있고,

In [4]:
os.chdir("..")
os.listdir()

['Basics']

그 하부에는 .ipynb_checkpoints폴더와 다음 4개의 파일이 있고,

In [5]:
os.chdir("./Basics")
os.listdir()

['.ipynb_checkpoints',
 '1. Basic Python Objects_Concepts.ipynb',
 '2. Basic Python Objects_Usage.ipynb',
 '3. Standard Libraries.ipynb',
 '4. PIP and Virtual Environment.ipynb']

.ipynb_checkpoints 폴더에는 다음 4개의 파일이 있다고 하자.

In [6]:
os.chdir("./.ipynb_checkpoints/")
os.listdir()

['1. Basic Python Objects_Concepts-checkpoint.ipynb',
 '2. Basic Python Objects_Usage-checkpoint.ipynb',
 '3. Standard Libraries-checkpoint.ipynb',
 '4. PIP and Virtual Environment-checkpoint.ipynb']

즉, 현재 directory(".")를 "C://Users//grainpowder//Desktop//github//wrapups/Python/"라 할 때 다음과 같은 트리 구조가 형성되어 있는 것이다:

<ul>
    <li>"."("C://Users//grainpowder//Desktop//github//wrapups/Python/")
        <ul>
            <li>Basics</li>
            <ul>
                <li>.ipynb_checkpoints
                    <ul>
                        <li>1. Basic Python Objects_Concepts-checkpoint.ipynb</li>
                        <li>2. Basic Python Objects_Usage-checkpoint.ipynb</li>
                        <li>3. Standard Libraries-checkpoint.ipynb</li>
                        <li>4. PIP and Virtual Environment-checkpoint.ipynb</li>
                    </ul></li>
                <li>1. Basic Python Objects_Concepts.ipynb</li>
                <li>2. Basic Python Objects_Usage.ipynb</li>
                <li>3. Standard Libraries.ipynb</li>
                <li>4. PIP and Virtual Environment.ipynb</li>
            </ul>
        </ul></li>
</ul>

이와 같은 구조의 C://Users//grainpowder//Desktop//github//wrapups/Python/에 os.walk를 적용하면 세 개의 원소로 이루어진 튜플 세 개를 참조할 수 있는 generator를 얻게 된다. list로 이를 참조하게 해 그 형태를 보면 다음과 같다:

In [7]:
os.chdir("../..") # 현재 directory를 C://Users//grainpowder//Desktop//github//wrapups/Python/로 만듦
walk_list = list(os.walk("."))
walk_list

[('.', ['Basics'], []),
 ('.\\Basics',
  ['.ipynb_checkpoints'],
  ['1. Basic Python Objects_Concepts.ipynb',
   '2. Basic Python Objects_Usage.ipynb',
   '3. Standard Libraries.ipynb',
   '4. PIP and Virtual Environment.ipynb']),
 ('.\\Basics\\.ipynb_checkpoints',
  [],
  ['1. Basic Python Objects_Concepts-checkpoint.ipynb',
   '2. Basic Python Objects_Usage-checkpoint.ipynb',
   '3. Standard Libraries-checkpoint.ipynb',
   '4. PIP and Virtual Environment-checkpoint.ipynb'])]

이 중 './Basics'폴더에 해당하는 두 번째 원소를 들여다보면 다음과 같다.:

In [8]:
walk_list[1]

('.\\Basics',
 ['.ipynb_checkpoints'],
 ['1. Basic Python Objects_Concepts.ipynb',
  '2. Basic Python Objects_Usage.ipynb',
  '3. Standard Libraries.ipynb',
  '4. PIP and Virtual Environment.ipynb'])

'.\\Basics'를 통해 해당 폴더의 경로를, \['.ipynb_checkpoints'\]를 통해 해당 폴더 내 폴더를, \['1. Basic Python Objects_Concepts.ipynb', ...를 통해 해당 폴더 내 파일의 정보를 담고 있음을 알 수 있다.

<li>os.<b>stat</b> : 입력한 폴더나 파일에 대한 통계값을 제공하는 함수</li>

In [9]:
os.stat(".")

os.stat_result(st_mode=16895, st_ino=1407374883610701, st_dev=1679685516, st_nlink=1, st_uid=0, st_gid=0, st_size=4096, st_atime=1547964295, st_mtime=1547964295, st_ctime=1547484905)

In [10]:
os.stat(".").st_mtime # 마지막으로 수정된 시간의 timestamp

1547964295.0058906

이 중에서 시간과 관련된 정보들은 timestamp라는 형태로 저장되어 있는데, datetime 모듈을 활용해야 이를 가독성있는 시간 정보로 바꿀 수 있다.

In [11]:
from datetime import datetime # 이 패키지를 통해 읽을 수 있는 날짜로 바꿀 수 있음
print(datetime.fromtimestamp(os.stat(".").st_mtime))

2019-01-20 15:04:55.005891


In [17]:
print(os.environ.get("HOME"))

None


# 3. datetime Module

In [19]:
import datetime
import pytz
d = datetime.date(2019, 1, 28) # no leading zero!
print(d)

2019-01-28


In [22]:
tday = datetime.date.today()
print(tday, tday.year, tday.month, tday.day)

2019-01-20 2019 1 20


In [23]:
print(tday.weekday(), tday.isoweekday())
# weekday : monday 0, sunday 6
# isoweekday : monday 1 sunday 7

6 7


In [27]:
# time delta : diff between two date
tdelta = datetime.timedelta(days = 7)
print(datetime.date.today() + tdelta)

2019-01-27


In [29]:
bday = datetime.date(2019, 1, 27)
till_bday = bday - tday
print(till_bday.days)

7


In [30]:
print(till_bday.total_seconds())

604800.0


In [31]:
dt = datetime.datetime(2016, 7, 26, 12, 30, 45, 100000)
print(dt) # datetime으로는 milisecond까지 지정할 수 있음

2016-07-26 12:30:45.100000


In [33]:
print(dt.date(), "||", dt.time())

2016-07-26 || 12:30:45.100000


In [35]:
print(dt + tdelta)

2016-08-02 12:30:45.100000


In [37]:
# timezone aware datetime
dt = datetime.datetime(2016, 7, 27, 12, 30, 45, tzinfo = pytz.UTC)
print(dt) # +00:00 : UTC offset

2016-07-27 12:30:45+00:00


In [38]:
dt_today = datetime.datetime.today() # current local datetime with timezone of none
dt_now = datetime.datetime.now() # current local datetime with empty timezone(user can specify)

In [42]:
dt_utcnow = datetime.datetime.now(tz=pytz.UTC)
print(dt_utcnow) # time zone aware datetime

2019-01-20 11:27:34.360731+00:00


In [43]:
dt_mtn = dt_utcnow.astimezone(pytz.timezone('US/Mountain')) # changing timezone
print(dt_mtn)

pytz : provides large list of timezone

In [45]:
for tz in pytz.all_timezones:
    print(tz)

Africa/Abidjan
Africa/Accra
Africa/Addis_Ababa
Africa/Algiers
Africa/Asmara
Africa/Asmera
Africa/Bamako
Africa/Bangui
Africa/Banjul
Africa/Bissau
Africa/Blantyre
Africa/Brazzaville
Africa/Bujumbura
Africa/Cairo
Africa/Casablanca
Africa/Ceuta
Africa/Conakry
Africa/Dakar
Africa/Dar_es_Salaam
Africa/Djibouti
Africa/Douala
Africa/El_Aaiun
Africa/Freetown
Africa/Gaborone
Africa/Harare
Africa/Johannesburg
Africa/Juba
Africa/Kampala
Africa/Khartoum
Africa/Kigali
Africa/Kinshasa
Africa/Lagos
Africa/Libreville
Africa/Lome
Africa/Luanda
Africa/Lubumbashi
Africa/Lusaka
Africa/Malabo
Africa/Maputo
Africa/Maseru
Africa/Mbabane
Africa/Mogadishu
Africa/Monrovia
Africa/Nairobi
Africa/Ndjamena
Africa/Niamey
Africa/Nouakchott
Africa/Ouagadougou
Africa/Porto-Novo
Africa/Sao_Tome
Africa/Timbuktu
Africa/Tripoli
Africa/Tunis
Africa/Windhoek
America/Adak
America/Anchorage
America/Anguilla
America/Antigua
America/Araguaina
America/Argentina/Buenos_Aires
America/Argentina/Catamarca
America/Argentina/ComodRivad

In [48]:
# naive datetime -> timezone aware datetime
# astimezone() cant be applied to a naive datetime
dt_mtn = datetime.datetime.now()
mtn_tz = pytz.timezone('US/Mountain') # grab certain timezone
dt_mtn = mtn_tz.localize(dt_mtn) # localize certain datetime into timezone aware datetime by grabbed timezone

In [49]:
print(dt_mtn.strftime('%B %d, %Y')) # Datetime to string

January 20, 2019


In [51]:
print(datetime.datetime.strptime('July 26, 2016', '%B %d, %Y')) # String to datetime

2016-07-26 00:00:00


# 4. random Module

# 5. csv Module

# 6. re Module