# 운영체제(Operating System) 이용

운영체제도 프로그램이므로 실행에 필요한 변수를 정의하고 사용한다.
응용 프로그램은 운영체제 내에서 실행되기 때문에 운영체제는 응용 프로그램의 환경으로 볼 수 있다.
이런 의미로 운영체제에서 정의한 변수를 환경변수라고 한다.
응용 프로그램은 환경변수를 비롯한 운영체제에 대한 정보 뿐만 아니라 운영체제가 제공하는 기능도 이용해야 한다.
이를 지원하기 위한 라이브러리가 `os`이다.

In [0]:
import os

환경변수에 대한 정보는 `environ` 객체를 통해 얻을 수 있다.
이 객체는 `dict` 객체와 유사한 방법으로 이용할 수 있다.
즉 `[]` 연산자를 이용해서 환경변수를 조회하거나 추가할 수 있다.

Note: `set` 명령으로 명령창에서 환경변수를 조회할 수 있다.
특정 환경변수의 값을 조회할 때는 `echo %환경변수%` 명령을 내리면 된다.

In [0]:
print(os.environ)



In [0]:
print(os.environ['HOME'])
# print(os.environ['HOMEPATH'])
print(os.environ['PATH'])
print(os.environ['LD_LIBRARY_PATH'])
print(os.environ['HOSTNAME'])

/root
/usr/local/bin:/usr/local/nvidia/bin:/usr/local/cuda/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/tools/node/bin:/tools/google-cloud-sdk/bin:/opt/bin
/usr/local/nvidia/lib:/usr/local/nvidia/lib64
eb9a885aac0c


## Colab의 운영 환경을 확인 할 수 있다. 

Jupyter Notebook에서 운영체제의 명령을 내릴 때는 ! 을 쓴 다음에 내리면 된다.

In [0]:
!python --version

Python 3.6.7


In [0]:
# 운영체제
# Colab는 우분투(Ununtu) 운영체제임을 확인 할 수 있다. 
!cat /etc/issue.net

Ubuntu 18.04.2 LTS


In [0]:
# CPU 사양
!head /proc/cpuinfo

processor	: 0
vendor_id	: GenuineIntel
cpu family	: 6
model		: 63
model name	: Intel(R) Xeon(R) CPU @ 2.30GHz
stepping	: 0
microcode	: 0x1
cpu MHz		: 2300.000
cache size	: 46080 KB
physical id	: 0


In [0]:
# 메모리 사양
!head -n 3 /proc/meminfo

MemTotal:       13335268 kB
MemFree:        11583908 kB
MemAvailable:   12687372 kB


In [0]:
# 디스크 사양
!df -h

Filesystem      Size  Used Avail Use% Mounted on
overlay          49G   23G   24G  49% /
tmpfs           6.4G     0  6.4G   0% /dev
tmpfs           6.4G     0  6.4G   0% /sys/fs/cgroup
tmpfs           6.4G  8.0K  6.4G   1% /var/colab
/dev/sda1        55G   24G   32G  44% /etc/hosts
shm             6.0G     0  6.0G   0% /dev/shm
tmpfs           6.4G     0  6.4G   0% /sys/firmware


In [0]:
# 명령줄에서 런타임 탭에서 런타임 유형 변경을 클릭 후 하드웨어 가속기를 GPU로 변경하면 다음과 같은 정보를 확인할 수 있다.

!nvidia-smi

Mon May 27 14:27:03 2019       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 418.67       Driver Version: 410.79       CUDA Version: 10.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|   0  Tesla T4            Off  | 00000000:00:04.0 Off |                    0 |
| N/A   42C    P8    15W /  70W |      0MiB / 15079MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|  No ru

## `import` 문장에서 기재된 모듈을 검색할 경로

`import` 문장에 기재된 모듈을 검색할 경로는 `sys` 모듈의 `path`에 리스트로 알아볼 수 있다.
`path`에 리스트에 새로운 경로를 추가할 수 있다.

In [0]:
import sys
print(sys.path)

['', '/env/python', '/usr/lib/python36.zip', '/usr/lib/python3.6', '/usr/lib/python3.6/lib-dynload', '/usr/local/lib/python3.6/dist-packages', '/usr/lib/python3/dist-packages', '/usr/local/lib/python3.6/dist-packages/IPython/extensions', '/root/.ipython']


## 디렉토리 관리

### 디렉토리 구분 문자

운영체제에 따라 디렉토리 구분 문자(delimiter, separator)가 다르다.
현재 사용하는 운영체제의 디렉토리 구분 문자는 `os.sep`에 저장되어 있다.
프로그램을 작성할 때는 디렉토리 구분 문자를 직접 입력하지 않고 `os.sep`를 이용하는 것이 좋다. 

In [0]:
os.sep

'/'

경로는 문자열이므로 문자열의 메소드를 이용할 수도 있다.
특히 `split()`, `join()` 메소드는 매우 유용하다.

In [0]:
path = "C:" + os.sep + "Users" + os.sep + "joong"
print(path)

C:/Users/joong


In [2]:
import os
path = os.path.join("C:", "Users", "joong")
print(path)

C:/Users/joong


In [3]:
path = os.sep.join(["C:", "Users", "joong"])
print(path)

C:/Users/joong


## 여러 구분 문자

운영체제에 따라 달라질 수 있는 구분 문자에는 디렉토리 구분 문자 외에도 줄 바꿈 문자, 파일이름과 확장자 구분문자가 있다.
이 구분 문자는 `os.extsep`와 `os.linesep`에 저장되어 있다.

In [4]:
print(os.extsep)
os.linesep

.


'\n'

현재 디렉토리와 상위 디렉토리를 나타내는 문자는 `os.curdir`와 `os.pardir`에 저장되어 있다.

In [5]:
print(os.curdir)
print(os.pardir)

.
..


In [6]:
!ls .

sample_data


In [7]:
!ls ..

bin	 datalab  home	 lib64	opt   run   swift		tmp    var
boot	 dev	  lib	 media	proc  sbin  sys			tools
content  etc	  lib32  mnt	root  srv   tensorflow-2.0.0a0	usr


## 파일과 디렉토리 관리

### 현재 디렉토리

현재 자신의 디렉토리의 위치를 알고자 할때는 `os.getcwd()`를 이용하면 된다.  디렉토리의 위치를 변경하고자 한다면 `os.chdir(path)`를 이용하여 변경할 수 있다. 로컬환경에서는 유용하다. 

In [0]:
os.getcwd()

'/content'

In [0]:
path = os.getcwd()
print(path)

splitted_path = path.split(os.sep)
print(splitted_path)

joined_path = os.sep.join(splitted_path)
print(joined_path)

/content
['', 'content']
/content


In [0]:
#os.getcwd()

'/root'

### 디렉토리 이동

In [0]:
cwd = os.getcwd()
print(cwd)
print(os.environ['HOME'])
os.chdir('/content')
print(os.getcwd())

/content
/root
/content


In [0]:
os.getcwd()

'/content'

`cd`으로 이동할 수 있다. 

In [0]:
cd root

/root


In [0]:
print(os.getcwd())

/root


## 파일과 디렉토리 목록 조회

In [0]:
os.listdir('/content')

['.config', 'gdrive', 'sample_data']

In [0]:
os.listdir('/content' + os.sep + 'sample_data')

['README.md',
 'anscombe.json',
 'mnist_train_small.csv',
 'mnist_test.csv',
 'california_housing_test.csv',
 'california_housing_train.csv']

In [0]:
for ele in os.listdir():
    print(ele, end=', ')

.profile, .bashrc, .local, .config, .keras, .bash_history, .ipython, .cache, .node-gyp, .npm, .jupyter, .gsutil, 

### 디렉토리 생성과 삭제

함수	| 설명
--- | ---
os.makedirs 또는 os.mkdir(디렉토리) | 디렉토리를 생성한다.
os.removedirs 또는 os.rmdir(디렉토리) | 디렉토리를 삭제한다.단, 디렉터리가 비어있어야 삭제가 가능하다.
os.rename(old_file_name, new_file_name)	| old_file_name을 new_file_name이라는 이름으로 바꾼다.

In [0]:
newdir = os.getcwd() + os.sep + "newdir"
os.mkdir(newdir)
if 'newdir' in os.listdir():
    print('succeeded to create a directory')
else:
    print("failed to create a directory")

succeeded to create a directory


In [0]:
os.listdir()

['.profile',
 '.bashrc',
 '.local',
 'newdir',
 '.config',
 '.keras',
 '.bash_history',
 '.ipython',
 '.cache',
 '.node-gyp',
 '.npm',
 '.jupyter',
 '.gsutil']

In [0]:
os.removedirs(newdir)
if 'newdir' in os.listdir():
    print('failed to remove a directory')
else:
    print("succeeded to remove a directory")

succeeded to remove a directory


In [0]:
os.listdir()

['.profile',
 '.bashrc',
 '.local',
 '.config',
 '.keras',
 '.bash_history',
 '.ipython',
 '.cache',
 '.node-gyp',
 '.npm',
 '.jupyter',
 '.gsutil']

현재 디렉토리 하위에 디렉토리를 만들거나 하위 디렉토리로 이동할 때는 디렉토리 이름만 인자로 주면 된다.

In [0]:
if not os.path.exists('backup'):
    os.mkdir('backup')
print(os.getcwd())
os.listdir('backup')

/root


[]

In [0]:
print(', '.join(os.listdir()))

.bashrc, .profile, .ipython, backup, .local, .keras, .npm, .node-gyp, .config, .cache, .jupyter, .gsutil


파일을 복사하거나 이동할 때는 `shutil` 모듈에 정의된 `copy()`, `move()` 함수를 이용한다.
다음은 현재 디렉토리에 있는 파일 중에서 확장자가 `ipynb`, `jpg`,`'png`인 모든 파일을 하위 디렉토리 `backup`에 복사하는 프로그램이다.

In [0]:
import shutil as sh
dst = 'backup'
exts = ('ipynb', 'jpg', 'png') # 반드시 튜플로 지정해야 한다.
for file in os.listdir():
    if file.endswith(exts):
        sh.copy(file, dst)

In [0]:
', '.join(os.listdir(dst))

''

## 경로 처리

경로와 관련한 작업에는 다음과 같은 것들이 있다.

1. 경로의 존재 여부 검사
2. 파일에 대한 경로에서 파일 이름과 그 외 부분의 분리
3. 상대경로를 절대경로로 변환
4. 디렉토리 이름을 연결하여 경로 만들기

`os.path` 모듈에 이를 위한 함수 `exists()`, `basename()`, `dirname()`, `split()`, `join()`이 정의되어 있다.

In [0]:
import os.path
path ='/content/sample_data'
os.chdir(path)
print(os.getcwd())
print(os.path.exists(path))

file = os.sep.join([path, "mnist_test.csv"])
print(os.path.basename(file))
print(os.path.dirname(file))
split_path = os.path.split(file)
print(split_path)
os.sep.join(split_path)

/content/sample_data
True
mnist_test.csv
/content/sample_data
('/content/sample_data', 'mnist_test.csv')


'/content/sample_data/mnist_test.csv'

In [0]:
os.getcwd()

'/content/sample_data'

In [0]:
import pandas as pd

sample_data = pd.read_csv('california_housing_test.csv')

In [0]:
sample_data.head()

Unnamed: 0,longitude,latitude,housing_median_age,total_rooms,total_bedrooms,population,households,median_income,median_house_value
0,-122.05,37.37,27.0,3885.0,661.0,1537.0,606.0,6.6085,344700.0
1,-118.3,34.26,43.0,1510.0,310.0,809.0,277.0,3.599,176500.0
2,-117.81,33.78,27.0,3589.0,507.0,1484.0,495.0,5.7934,270500.0
3,-118.36,33.82,28.0,67.0,15.0,49.0,11.0,6.1359,330000.0
4,-119.67,36.33,19.0,1241.0,244.0,850.0,237.0,2.9375,81700.0


## 연습문제

1. 현재 디렉토리를 알아보시오.
2. 환경변수와 그 값을 알아보시오.
3. 새로운 환경변수를 추가해보시오.
4. 현재 디렉토리 상위에 library라는 이름의 새로운 디렉토리를 생성하시오.
5. 현재 디렉토리에 있는 jupyter notebook을 library 디렉토리에 복사하시오,
6. 현재 운영체제에서 사용하는 디렉토리 구분문자를 알아보시오.

In [0]:
#2. 환경변수와 그 값을 알아보시오
print(os.environ)



In [0]:
for k, v in os.environ.items():
  print(k)

In [0]:
#3,4번
os.getcwd()

'/content'

In [0]:
os.mkdir('../library')

In [0]:
import shutil as sh

sh.copy('sample_data/mnist_test.csv', 'library')

'library'

In [0]:
os.listdir('/library')

[]

## 구글 드라이브와 연동

Colab을 이용할 때 구글 드라이브와 연동하여 데이터나 모델을 불러오거나 저장 할 수 있다. 구글 드라이브와 연동하기 위해서는 google.colab 모듈의 drive 클래스를 이용하면 된다. 

이용시에 한번의 인증을 받아야 한다. 

In [0]:
from google.colab import drive

drive.mount('/content/gdrive')

Go to this URL in a browser: https://accounts.google.com/o/oauth2/auth?client_id=947318989803-6bn6qk8qdgf4n4g3pfee6491hc0brc4i.apps.googleusercontent.com&redirect_uri=urn%3Aietf%3Awg%3Aoauth%3A2.0%3Aoob&scope=email%20https%3A%2F%2Fwww.googleapis.com%2Fauth%2Fdocs.test%20https%3A%2F%2Fwww.googleapis.com%2Fauth%2Fdrive%20https%3A%2F%2Fwww.googleapis.com%2Fauth%2Fdrive.photos.readonly%20https%3A%2F%2Fwww.googleapis.com%2Fauth%2Fpeopleapi.readonly&response_type=code

Enter your authorization code:
··········
Mounted at /content/gdrive


In [0]:
# 연동한 구글드라이브 폴더로 이동
cd gdrive

/content/gdrive


In [0]:
os.listdir('/content/gdrive/My Drive')

['Colab Notebooks',
 '잡동사니',
 '발표자료',
 '일거리',
 '농업관련논문',
 'anomaly detection with generative adversarial networks.pdf',
 'On the difficulty of training Recurrent Neural Networks_Pascanu2013.pdf',
 'How to Construct Deep Recurrent Neural Networks.pdf',
 'Python Study',
 '박사논문관련',
 '인공지능론',
 '교재']

## 연습문제

연동된 구글 드라이브에 dataset 디렉토리를  생성하시오

In [0]:
cd ..

/content


In [0]:
#현재 디렉토리 위치를 확인한다. 
print(os.getcwd())
print(os.listdir())

/content
['.config', 'gdrive', 'sample_data']


In [0]:
# 디렉토리에 이동 후 폴더 생성
os.chdir('gdrive/My Drive')
dataset_dir = os.getcwd() + os.sep + "dataset"
os.mkdir(dataset_dir)
if 'dataset' in os.listdir():
    print('succeeded to create a directory')
else:
    print("failed to create a directory")

succeeded to create a directory


In [0]:
os.listdir()

['Colab Notebooks',
 '잡동사니',
 '발표자료',
 '일거리',
 'anomaly detection with generative adversarial networks.pdf',
 'On the difficulty of training Recurrent Neural Networks_Pascanu2013.pdf',
 'How to Construct Deep Recurrent Neural Networks.pdf',
 'Python Study',
 '박사논문관련',
 '인공지능론',
 '교재',
 'dataset']

In [0]:
# 현재 디렉토리를 확인한다. 
os.getcwd()

'/content/gdrive/My Drive'

In [0]:
os.removedirs('dataset')
if 'dataset' in os.listdir():
    print('failed to remove a directory')
else:
    print("succeeded to remove a directory")

succeeded to remove a directory
