 # Data Science (JULIA)

# 3. Downloads

* Downloads 패키지는 libcurl(the multiprotocol file transfer library)을 이용하여 외부 API와의 통신을 지원하는 패키지로 2개의 함수, 3개의 타입으로 그 구성은 단순하지만 파워풀하다. 

    - **download(url)** 함수는 주어진 url로부터 파일을 다운받거나 결과물 또는 임시 경로로 저장하는 함수이다.
    
    - **request(url)** 함수는 download와 유사하게 주어진 url로부터 들어오는 response 객체를 캡쳐하여 상태를 확인하며, RequestError를 리턴하는 특징이 있다.


* 1.6버전부터 표준라이브러리(standard library)로 채택되었고 1.3 및 1.5 버전에서도 사용 가능하다.

---
**(FUNCTION)**

**download**

* syntax

```Julia
download(url, [ output = tempname() ];
    [ method = "GET", ]
    [ headers = <none>, ]
    [ timeout = <none>, ]
    [ progress = <none>, ]
    [ verbose = false, ]
    [ debug = <none>, ]
    [ downloader = <default>, ]
) -> output
```

* arguments
    * ```url :: AbstractString```
    * ```output :: Union{AbstractString, AbstractCmd, IO}```
    * ```method :: AbstractString```
    * ```headers :: Union{AbstractVector, AbstractDict}```
    * ```timeout :: Real```
    * ```progress :: (total::Integer, now::Integer) --> Any```
    * ```verbose :: Bool```
    * ```debug :: (type, message) --> Any```
    * ```downloader :: Downloader```


**request**

* syntax

```Julia
request(url;
    [ input = <none>, ]
    [ output = <none>, ]
    [ method = input ? "PUT" : output ? "GET" : "HEAD", ]
    [ headers = <none>, ]
    [ timeout = <none>, ]
    [ progress = <none>, ]
    [ verbose = false, ]
    [ debug = <none>, ]
    [ throw = true, ]
    [ downloader = <default>, ]
) -> Union{Response, RequestError}
```

* arguments
    * ```url :: AbstractString```
    * ```input :: Union{AbstractString, AbstractCmd, IO}```
    * ```output :: Union{AbstractString, AbstractCmd, IO}```
    * ```method :: AbstractString```
    * ```headers :: Union{AbstractVector, AbstractDict}```
    * ```timeout :: Real```
    * ```progress :: (dl_total, dl_now, ul_total, ul_now) --> Any```
    * ```verbose :: Bool```
    * ```debug :: (type, message) --> Any```
    * ```throw :: Bool```
    * ```downloader :: Downloader```

--- 

**(TYPE)**

**Response**

```Julia
struct Response
    proto   :: String
    url     :: String
    status  :: Int
    message :: String
    headers :: Vector{Pair{String,String}}
end
```

**RequestError**

```Julia
struct RequestError <: ErrorException
    url      :: String
    code     :: Int
    message  :: String
    response :: Response
end
```

**Downloader**

```Julia
Downloader(; [ grace::Real = 30 ])
```


In [1]:
using Downloads

* **download** 함수는 패키지에서 export 되지 않기 때문에 **```Module.function```** 형식의 구문을 사용해야 함

In [4]:
# JuliaDataScience 깃헙의 project.toml 파일을 다운로드 하기 

url = "https://raw.githubusercontent.com/JuliaDataScience/JuliaDataScience/main/Project.toml"

my_file = Downloads.download(url) # tempfile() being created

"C:\\Users\\jeffr\\AppData\\Local\\Temp\\jl_oVIHOxM7gT"

* toml 파일
> * **"Tom's Obvious Minimal Language"** 의 약자인 **TOML**은 구성 파일 작성을 위한 최소한의 의미에 초점을 맞춘 비교적 새롭고 인기 있는 파일 형식. 파일 형식은 GitHub의 전 CEO인 Tom Preston-Werner가 제작
> * 보통 줄리아의 project.toml은 프로젝트에 사용된 패키지의 버전을 명시하며 환경 구성을 나타내고 있음(pip의 freeze와 유사한 역할이라고 생각한다면 이해하기 쉬움

* 디폴트 인수만 이용하면 다운로드된 파일의 경로(path)를 반환함

* readlines 함수를 이용해 읽어들일 수 있다.

In [3]:
readlines(my_file)[1:4]

4-element Vector{String}:
 "name = \"JDS\""
 "uuid = \"6c596d62-2771-44f8-8373-3ec4b616ee9d\""
 "authors = [\"Jose Storopoli\", \"Rik Huijzer\", \"Lazaro Alonso\"]"
 ""

In [5]:
readlines(my_file)

52-element Vector{String}:
 "name = \"JDS\""
 "uuid = \"6c596d62-2771-44f8-8373-3ec4b616ee9d\""
 "authors = [\"Jose Storopoli\", \"Rik Huijzer\", \"Lazaro Alonso\"]"
 ""
 "[deps]"
 "Books = \"939d5c6b-51ae-42e7-97ca-7564d0d4ad91\""
 "CSV = \"336ed68f-0bac-5ca0-87d4-7b16caf5d00b\""
 "CairoMakie = \"13f3f980-e62b-5c42-98c6-ff1f3baf88f0\""
 "CategoricalArrays = \"324d7699-5711-5eae-9e2f-1d82baa6b597\""
 "ColorSchemes = \"35d6a980-a343-548e-a6ea-1d62b119f2f4\""
 "Colors = \"5ae59095-9a9b-59fe-a467-6f913c188581\""
 "DataFrames = \"a93c6f00-e57d-5684-b7b6-d8193f3e46c0\""
 "Dates = \"ade2ca70-3891-5945-98fb-dc099432e06a\""
 ⋮
 "Distributions = \"0.25\""
 "FileIO = \"1\""
 "GLMakie = \"0.6\""
 "GeometryBasics = \"0.4\""
 "ImageMagick = \"1\""
 "LaTeXStrings = \"1\""
 "Makie = \"0.17\""
 "QuartzImageIO = \"0.7\""
 "Reexport = \"1.1\""
 "StatsBase = \"0.33\""
 "TestImages = \"1\""
 "XLSX = \"0.8\""

* 반응형 웹 등 더 복잡한 HTTP 인터랙션들이 있는 경우에는 ```HTTP.jl``` 패키지를 사용 가능

    > **(HTTP.jl)** https://github.com/JuliaWeb/HTTP.jl