Skip to content

Latest commit

 

History

History
106 lines (53 loc) · 6.28 KB

DeepLearning_Neural.md

File metadata and controls

106 lines (53 loc) · 6.28 KB

딥러닝 - 신경망으로 숫자에서 패턴찾기

지난 글에서 딥러닝이 어떤 분야에 영향을 줬고, 간단하게 딥러닝의 개요에 대해 설명했다.

이번 글에서는 어떤 식으로 정보를 습득하고 스스로를 강화하는지에 대해 설명하려고 한다.

1. 숫자

컴퓨터에서 처리하는 과정

컴퓨터는 일종의 계산기라고 볼 수 있다. 컴퓨터의 모든 동작은 계산기처럼 동작하면서 이루어진다.

그 말은 1 + 1 = 2 의 과정이나, 게임을 하는 것이나, 카톡으로 영상을 보내는 것이나 비슷한 과정이라는말이다.

모두 컴퓨터가 숫자를 저장하고 숫자를 전송하는 과정이다. 카메라나 컴퓨터, 스마트폰의 메모리 안에는 이런 숫자들이 저장된다.

심지어 더 파고들면 단순하게 010101이 저장되어있는 것이다. 컴퓨터는 2진법으로 처리하기 때문이다.

다시 사용자에게 가는 과정

모니터는 처리된 숫자를 받아서 다시 빛으로 변환해 주는 원리로 동작한다.

가장 쉬운 예로 전구를 들 수 있다.

스크린샷 2023-04-02 오전 8 19 14

전구가 꺼지고 켜지는 것을 0, 1로 한다고 해보자. 0이면 꺼지고, 1이면 켜진다. 심지어 좀더 좋은 전구는 0.3 0.5 0.7 이렇게 올라가는 것으로 밝기를 조절 가능한 전구도 있다.

이 전구가 10 X 10 해서 총 100개의 전구가 있다고 해봤을때, 이 각각의 전구를 0과 1사이의 숫자를 주면 멀리서 보면 그림을 그릴 수가 있다. 디지털 액정 같은 것이 이런 원리다.

LCD든 LED 든 모니터를 확대해서 보면 실제로 전구가 모여있는 것을 볼 수 있다. 일반 전구로도 이런 방식으로 흑백 그림을 만들어 낼 수 있는데, 그걸 넘어서 전구가 RGB(레드, 그린, 블루)색상의 전구를 가지고 모든 색상을 만들어 낼 수가 있다.

초등학교 미술 시간을 생각해보면 빨강 초록 파랑 색상을 섞는 색상표를 본적이 있다. 이걸 가산혼합이라고 한다. 또 과학시간에는 빨강 초록 파랑색의 빛을 섞는 색상표를 본적이 있다. 이걸 감산혼합이라고 한다. 가산혼합은 모두 섞이면 검정색이 된다. 가산혼합은 빼는 것인데, 모두 겹치면 하양색이 된다.

스크린샷 2023-04-02 오전 8 30 25

+23.04.01

이걸 이용해서 전구가 켜지고 꺼지는 정보를 보냄으로 화면이 그려진다.

또한 1초에 이 그림(사진)을 몇번 보여주냐에 따라 영상의 부드러운 정도가 달라질 수 있다.

우리가 흔히 보는 FPS(Frames Per Second)를 이용해 30fps, 60 fps, 240fps 라고 표시하는 것이 이런 것이다.

1초에 이 숫자더미를 몇번 보내주느냐에 따라 달라진다.

소리

그림이나 영상이 숫자로 표현되는 것처럼, 사실 소리도 숫자로 표현이 가능하다.

우리가 소리를 느낄 수 있는 것은 공기가 귀를 때리는 과정이다. 소리는 파동으로 이루어져있다. 음파라고 한다. 이 파동이 귀를 때려서 (고막을 흔들어서) 머리에 전달면서 소리를 느끼는 것이다.

이렇게 컴퓨터는 메모리로 들어올때, 숫자로 모든것을 변환하고, 처리하여, 다시 우리가 이해할 수 있는 방법으로 만드는 것이다.

과거 사용해오는 LP판을 자세히 들여다보면 아래와 같다.

스크린샷 2023-04-02 오전 9 16 59

스크린샷 2023-04-02 오전 9 18 35

들리는 소리를 그대로 LP판에 소리의 떨림을 저장하고,

반대로 소리를 낼 때에는, 기록된 소리를 바들이 따라가면서 진동을 전달한다. 전달된 진동을 스피커의 진동을 통해 다시 실제 소리로 변환한다. 그러면 그 소리는 다시 우리 귀를 통해 뇌에 전달되는 것이다.

소리의 디지털화 과정

이걸 디지털로 변환하고자한다면, 아날로그와 달리 다시 이걸 숫자로 만들어야한다.

CD의 경우 44.1kHz라는 말을 사용한다. 이말은 44,100이라는 뜻이다.

위에서 30, 60 FPS로 전달되었던 그림,영상과 달리 음성과 음파는 그정도로는 전달이 안된다.

그래서 1초를 44,100번으로 쪼개서 전달을 하는 것이다.

그리고 우리가 사용하는 보통 휴대폰은 16kHz, 즉 16000번을 쪼개서 전달한다.

보통 고음질이라고 부르는 것은 192kHz거나 그 두배인 384kHz를 사용한다. 그래서 음질의 차이가 있기때문에 음질이 낮은 mp3로는 CD로 들을 수 있는 음성을다 못들을 수 있다.

소리의 압축과정

스크린샷 2023-04-02 오후 1 05 51

소리를 압축하면 할 수록 크기는 작아지지만 손실은 많아진다. 그래서 대부분의 사람들이 차이를 못느낄 정도로만 압축한 것이 mp3로 압축하는 방식이다.

영상의 압축과정은 소리와는 달리 이전 이미지와 새로운 이미지의 차이만 기록하는 과정이다.

+23.4.2

2. 패턴

3. 신경망

스크린샷 2023-04-01 오전 8 08 59

참고 링크