# 운영체제(Operating System) 이용

운영체제도 프로그램이므로 실행에 필요한 변수를 정의하고 사용한다.
응용 프로그램은 운영체제 내에서 실행되기 때문에 운영체제는 응용 프로그램의 환경으로 볼 수 있다.
이런 의미로 운영체제에서 정의한 변수를 환경변수라고 한다.
응용 프로그램은 환경변수를 비롯한 운영체제에 대한 정보 뿐만 아니라 운영체제가 제공하는 기능도 이용해야 한다.
이를 지원하기 위한 라이브러리가 `os`이다.

In [None]:
import os

환경변수에 대한 정보는 `environ` 객체를 통해 얻을 수 있다.
이 객체는 `dict` 객체와 유사한 방법으로 이용할 수 있다.
즉 `[]` 연산자를 이용해서 환경변수를 조회하거나 추가할 수 있다.

Note: `set` 명령으로 명령창에서 환경변수를 조회할 수 있다.
특정 환경변수의 값을 조회할 때는 `echo %환경변수%` 명령을 내리면 된다.

In [None]:
print(os.environ)



In [None]:
print(os.environ['HOME'])
# print(os.environ['HOMEPATH'])
print(os.environ['PATH'])
print(os.environ['LD_LIBRARY_PATH'])
print(os.environ['HOSTNAME'])

/root
/usr/local/bin:/usr/local/nvidia/bin:/usr/local/cuda/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/tools/node/bin:/tools/google-cloud-sdk/bin:/opt/bin
/usr/local/nvidia/lib:/usr/local/nvidia/lib64
eb9a885aac0c


## 운영체제에 관한 정보 알아보기

예를 들어 Colab이 실행되는 운영체제에 관한 정보는 다음과 같이 확인 할 수 있다. 
Jupyter Notebook에서 운영체제의 명령을 내릴 때는 ! 을 쓴 다음에 명령을 내리면 된다.

In [None]:
# 파이썬의 버전 알아보기
!python --version

Python 3.6.7


In [None]:
# Colab이 실행되는 가상 컴퓨터의 운영체제가 무엇인지 확인 할 수 있다. 
!cat /etc/issue.net

Ubuntu 18.04.2 LTS


In [None]:
# Colab이 실행되는 가상 컴퓨터의 CPU 사양을 알아볼 수 있다.
!head /proc/cpuinfo

processor	: 0
vendor_id	: GenuineIntel
cpu family	: 6
model		: 63
model name	: Intel(R) Xeon(R) CPU @ 2.30GHz
stepping	: 0
microcode	: 0x1
cpu MHz		: 2300.000
cache size	: 46080 KB
physical id	: 0


In [None]:
# Colab이 실행되는 가상 컴퓨터의 메모리에 관한 정보를 알아볼 수 있다.
!head -n 3 /proc/meminfo

MemTotal:       13335268 kB
MemFree:        11583908 kB
MemAvailable:   12687372 kB


In [None]:
# Colab이 실행되는 가상 컴퓨터의 파일시스템에 대해 알아볼 수 있다.
!df -h

Filesystem      Size  Used Avail Use% Mounted on
overlay          49G   23G   24G  49% /
tmpfs           6.4G     0  6.4G   0% /dev
tmpfs           6.4G     0  6.4G   0% /sys/fs/cgroup
tmpfs           6.4G  8.0K  6.4G   1% /var/colab
/dev/sda1        55G   24G   32G  44% /etc/hosts
shm             6.0G     0  6.0G   0% /dev/shm
tmpfs           6.4G     0  6.4G   0% /sys/firmware


In [None]:
# Jupyter Notebook의 런타임 탭에서 런타임 유형 변경을 클릭 후 하드웨어 가속기를 GPU로 변경하면
# GPU에 관한 정보를 확인할 수 있다.

!nvidia-smi

Mon May 27 14:27:03 2019       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 418.67       Driver Version: 410.79       CUDA Version: 10.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|   0  Tesla T4            Off  | 00000000:00:04.0 Off |                    0 |
| N/A   42C    P8    15W /  70W |      0MiB / 15079MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|  No ru

## `import` 문장에서 기재된 모듈을 검색할 경로

파이썬 프로그램에서 모듈 또는 패키지를 `import할 때 모듈 이름만 기재한다.
즉 모듈이 어떤 디렉토리에 있는지는 기재하지 않는다.
왜냐하면 모듈이나 패키지를 검색할 경로가 이미 지정되어 있기 때문이다.
`import` 문장에 기재된 모듈을 검색할 경로는 `sys` 모듈의 `path`에 저장되어 있다.
`sys.path`는 리스트이며 프로그램 내에서 새로운 경로를 추가할 수도 있다.

In [None]:
import sys
print(sys.path)

['', '/env/python', '/usr/lib/python36.zip', '/usr/lib/python3.6', '/usr/lib/python3.6/lib-dynload', '/usr/local/lib/python3.6/dist-packages', '/usr/lib/python3/dist-packages', '/usr/local/lib/python3.6/dist-packages/IPython/extensions', '/root/.ipython']


## 디렉토리 관리

### 디렉토리 구분 문자

디렉토리는 계층구조를 가지므로 한 디렉토리를 나타내는 문자열에는 상위 디렉토리와 하위 디렉토리를 구분하기 위해 정해진 문자를 사용한다.
이를 디렉토리 구분 문자(delimiter, separator)라고 하면 운영체제에 따라 구분 문자가 다르다.
리눅스 계열의 운영체제에서는 `/`를 구분 문자로 사용하고, 윈도우 계열의 운영체제에서는 `\`를 구분 문자로 사용한다.
운영체제의 디렉토리 구분 문자는 `os.sep`에 저장되어 있다.
프로그램을 작성할 때는 디렉토리 구분 문자를 직접 입력하지 않고 `os.sep`를 이용하는 것이 좋다. 

In [2]:
import os
os.sep

'/'

경로는 문자열이므로 문자열의 메소드를 이용하여 경로를 조작할 수 있다.
특히 `split()`, `join()` 메소드는 매우 유용하다.

In [3]:
path = "C:" + os.sep + "Users" + os.sep + "joong"
print(path)

C:/Users/joong


In [4]:
import os
path = os.path.join("C:", "Users", "joong")
print(path)

C:/Users/joong


In [5]:
path = os.sep.join(["C:", "Users", "joong"])
print(path)

C:/Users/joong


## 여러 구분 문자

운영체제에 따라 달라질 수 있는 구분 문자에는 디렉토리 구분 문자 외에도 줄 바꿈 문자, 파일 이름과 파일 확장자 사이에 사용하는 구분문자가 있다.
이 구분 문자는 `os.extsep`와 `os.linesep`에 저장되어 있다.

In [10]:
print(os.extsep)
print(os.extsep)
os.linesep

.
.


'\n'

In [15]:
path = os.getcwd()
print(path)

splitted_path = path.split(os.sep)
print(splitted_path)

joined_path = os.sep.join(splitted_path)
print(joined_path)

/content <class 'str'>
['', 'content']
/content


현재 디렉토리와 상위 디렉토리를 간단히 지정하기 위한 문자열이 있는데 이들은 `os.curdir`와 `os.pardir`에 저장되어 있다.

In [11]:
print(os.curdir)
print(os.pardir)

.
..


In [12]:
!ls .

sample_data


In [13]:
!ls ..

bin	 datalab  home	 lib64	opt   run   sys		       tools
boot	 dev	  lib	 media	proc  sbin  tensorflow-1.15.2  usr
content  etc	  lib32  mnt	root  srv   tmp		       var


## 파일과 디렉토리 관리

### 현재 디렉토리와 이렉토리 이동

현재 위치한 디렉토리는 `os.getcwd()`를 이용하면 알 수 있다. 
현재 디렉토리를 다른 디렉토리로 이동하려면 `os.chdir(이동할디렉토리)`를 이용하면 된다.

In [14]:
os.getcwd()

'/content'

In [18]:
cwd = os.getcwd()
print(cwd)

os.chdir(os.environ['HOME'])
print(os.getcwd())

os.chdir(cwd)
print(os.getcwd())

/content
/root
/content


### 파일과 디렉토리 목록 조회

지정한 디렉토리 내에 위치한 파일이나 디렉토리의 이름은 `os.listdir()` 함수를 이용하면 알 수 있다.

In [None]:
os.listdir('/content')

['.config', 'gdrive', 'sample_data']

In [None]:
from google.colab import drive
drive.mount('/content/drive')

In [19]:
os.listdir('/content' + os.sep + 'sample_data')

['anscombe.json',
 'README.md',
 'california_housing_train.csv',
 'california_housing_test.csv',
 'mnist_train_small.csv',
 'mnist_test.csv']

In [20]:
for ele in os.listdir():
    print(ele, end=', ')

.config, sample_data, 

### 디렉토리 생성과 삭제

함수	| 설명
--- | ---
os.makedirs 또는 os.mkdir(디렉토리) | 디렉토리를 생성한다.
os.removedirs 또는 os.rmdir(디렉토리) | 디렉토리를 삭제한다.단, 디렉터리가 비어있어야 삭제가 가능하다.
os.rename(old_file_name, new_file_name)	| old_file_name을 new_file_name이라는 이름으로 바꾼다.

In [None]:
newdir = os.getcwd() + os.sep + "newdir"
os.mkdir(newdir)
if 'newdir' in os.listdir():
    print('succeeded to create a directory')
else:
    print("failed to create a directory")

succeeded to create a directory


In [None]:
os.listdir()

['.profile',
 '.bashrc',
 '.local',
 'newdir',
 '.config',
 '.keras',
 '.bash_history',
 '.ipython',
 '.cache',
 '.node-gyp',
 '.npm',
 '.jupyter',
 '.gsutil']

In [None]:
os.removedirs(newdir)
if 'newdir' in os.listdir():
    print('failed to remove a directory')
else:
    print("succeeded to remove a directory")

succeeded to remove a directory


In [None]:
os.listdir()

['.profile',
 '.bashrc',
 '.local',
 '.config',
 '.keras',
 '.bash_history',
 '.ipython',
 '.cache',
 '.node-gyp',
 '.npm',
 '.jupyter',
 '.gsutil']

현재 디렉토리 하위에 디렉토리를 만들거나 하위 디렉토리로 이동할 때는 디렉토리 이름만 인자로 주면 된다.

In [None]:
if not os.path.exists('backup'):
    os.mkdir('backup')
print(os.getcwd())
os.listdir('backup')

/root


[]

In [None]:
print(', '.join(os.listdir()))

.bashrc, .profile, .ipython, backup, .local, .keras, .npm, .node-gyp, .config, .cache, .jupyter, .gsutil


파일을 복사하거나 이동할 때는 `shutil` 모듈에 정의된 `copy()`, `move()` 함수를 이용한다.
다음은 현재 디렉토리에 있는 파일 중에서 확장자가 `ipynb`, `jpg`,`'png`인 모든 파일을 하위 디렉토리 `backup`에 복사하는 프로그램이다.

In [None]:
import shutil as sh
dst = 'backup'
exts = ('ipynb', 'jpg', 'png') # 반드시 튜플로 지정해야 한다.
for file in os.listdir():
    if file.endswith(exts):
        sh.copy(file, dst)

In [None]:
', '.join(os.listdir(dst))

''

## 경로 처리

경로와 관련한 작업에는 다음과 같은 것들이 있다.

1. 경로의 존재 여부 검사
2. 파일에 대한 경로에서 파일 이름과 그 외 부분의 분리
3. 상대경로를 절대경로로 변환
4. 디렉토리 이름을 연결하여 경로 만들기

`os.path` 모듈에 이를 위한 함수 `exists()`, `basename()`, `dirname()`, `split()`, `join()`이 정의되어 있다.

In [None]:
import os.path
path ='/content/sample_data'
os.chdir(path)
print(os.getcwd())
print(os.path.exists(path))

file = os.sep.join([path, "mnist_test.csv"])
print(os.path.basename(file))
print(os.path.dirname(file))
split_path = os.path.split(file)
print(split_path)
os.sep.join(split_path)

/content/sample_data
True
mnist_test.csv
/content/sample_data
('/content/sample_data', 'mnist_test.csv')


'/content/sample_data/mnist_test.csv'

In [None]:
os.getcwd()

'/content/sample_data'

In [None]:
import pandas as pd

sample_data = pd.read_csv('california_housing_test.csv')

In [None]:
sample_data.head()

Unnamed: 0,longitude,latitude,housing_median_age,total_rooms,total_bedrooms,population,households,median_income,median_house_value
0,-122.05,37.37,27.0,3885.0,661.0,1537.0,606.0,6.6085,344700.0
1,-118.3,34.26,43.0,1510.0,310.0,809.0,277.0,3.599,176500.0
2,-117.81,33.78,27.0,3589.0,507.0,1484.0,495.0,5.7934,270500.0
3,-118.36,33.82,28.0,67.0,15.0,49.0,11.0,6.1359,330000.0
4,-119.67,36.33,19.0,1241.0,244.0,850.0,237.0,2.9375,81700.0


## `pathlib` library

디렉토리나 파일에 대한 경로를 객체지향적인 방법으로 처리하려면 `pathlib` 모듈을 이용하는 것이 좋다.
`pathlib.Path` 클래스의 객체를 생성하고 메소들를 이용하여 대부분의 작업을 할 수 있다.

In [33]:
import pathlib
import os

# 현재 디렉토리에 대한 Path 객체를 생성한다.
path = pathlib.Path(os.getcwd())
print(path, type(path))

/content <class 'pathlib.PosixPath'>


In [22]:
print(path.is_dir())

True


In [23]:
print(path.is_file())

False


In [24]:
for fn in path.iterdir():
    print(fn)

/content/.config
/content/sample_data


In [25]:
print(path.absolute())
print(path.parent)
print(path.root)

/content
/
/


In [26]:
subdir = path / "temp"
print(type(subdir), subdir)

<class 'pathlib.PosixPath'> /content/temp


In [27]:
print(subdir.exists())

False


In [28]:
subdir.mkdir()

In [29]:
print(subdir.is_dir())

True


In [30]:
for fn in path.iterdir():
    print(fn)

/content/.config
/content/temp
/content/sample_data


In [31]:
subdir.rmdir()

In [32]:
for fn in path.iterdir():
    print(fn)

/content/.config
/content/sample_data


## 연습문제

1. 현재 디렉토리를 알아보시오.
2. 환경변수와 그 값을 알아보시오.
3. 새로운 환경변수를 추가해보시오.
4. 현재 디렉토리 상위에 library라는 이름의 새로운 디렉토리를 생성하시오.
5. 현재 디렉토리에 있는 jupyter notebook을 library 디렉토리에 복사하시오,
6. 현재 운영체제에서 사용하는 디렉토리 구분문자를 알아보시오.
7. 연동된 구글 드라이브에 dataset 디렉토리를  생성하시오.