## 장치관리

### [PyCUDA]() : CUDA 바인딩 라이브러리
- Python을 위한 CUDA(Compute Unified Device Architecture) 바인딩 라이브러리
- PyCUDA를 사용하면 Python 코드 내에서 직접 CUDA 함수를 호출하고, 고성능 GPU 연산을 수행 가능

- 설치

    ```shell
    > pip install pycuda
    ```

#### 주요기능
- 직접적인 CUDA 프로그래밍: Python 내에서 CUDA C 코드를 작성하고 실행
- GPU 메모리 관리: GPU 메모리 할당 및 해제, 데이터 전송 관리
- 커스텀 커널 작성: 사용자 정의 CUDA 커널 작성 및 실행 지원
- 자동 메모리 관리: Python 객체의 수명에 따른 자동 GPU 메모리 관리

In [None]:
!pip install pycuda

Collecting pycuda
  Downloading pycuda-2025.1.tar.gz (1.7 MB)
     ---------------------------------------- 0.0/1.7 MB ? eta -:--:--
     ---------------------------------------- 1.7/1.7 MB 30.4 MB/s eta 0:00:00
  Installing build dependencies: started
  Installing build dependencies: finished with status 'done'
  Getting requirements to build wheel: started
  Getting requirements to build wheel: finished with status 'done'
  Preparing metadata (pyproject.toml): started
  Preparing metadata (pyproject.toml): finished with status 'done'
Collecting pytools>=2011.2 (from pycuda)
  Downloading pytools-2025.1.2-py3-none-any.whl.metadata (3.0 kB)
Downloading pytools-2025.1.2-py3-none-any.whl (92 kB)
Building wheels for collected packages: pycuda
  Building wheel for pycuda (pyproject.toml): started
  Building wheel for pycuda (pyproject.toml): still running...
  Building wheel for pycuda (pyproject.toml): still running...
  Building wheel for pycuda (pyproject.toml): finished with status 'do


[notice] A new release of pip is available: 24.3.1 -> 25.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip


: 

#### 사용예

In [2]:
import pycuda.autoinit
import pycuda.driver as cuda
import numpy

# NumPy 배열 초기화
a = numpy.random.randn(4,4)

# 배열을 단일 정밀도로 변환
a = a.astype(numpy.float32)

# GPU에 메모리 할당 및 데이터 전송
a_gpu = cuda.mem_alloc(a.nbytes)
cuda.memcpy_htod(a_gpu, a)

In [3]:
a_gpu

<pycuda._driver.DeviceAllocation at 0x1b6f4027700>