# Pandas csv 읽는 방법 

WSM이 아직 제대로 http 관련 모듈을 갖추지 않은 관계로 그냥은 통상적인 방식으로 웹 상의 파일을 끌어올 수 없다. 크게 두 가지 해결책이 존재 

1. [pyodide-http](https://github.com/koenvo/pyodide-http) 패키지 이용: 기존 http 관련 패키지를 패치하는 방식. 호환성이 떨어질 수 있음 
2. pyodide 내부 http 명령어를 활용한다. 
3. js를 이용한다. 

2,3의 방식은 파일을 읽는 데에는 활용할 수 있으나 기존 requests 등 패키지에 기반한 다른 패키지가 pyodide 내에서 제대로 작동하지 않는다. 이 점에서 1이 장점이지만 호환성이 완벽하지는 않은 듯 싶다. 

In [6]:
import pandas as pd
test_URL = "https://support.staffbase.com/hc/en-us/article_attachments/360009197031/username.csv"
data = pd.read_csv(test_URL)

-------------------------------------
## pyodide-http 패키지 활용

In [3]:
%pip -q install pyodide-http
import pandas as pd 
import pyodide_http 
pyodide_http.patch_all()  # Patch all libraries

In [5]:
data = pd.read_csv(test_URL, delimiter=";")
data

Unnamed: 0,Username,Identifier,First name,Last name
0,booker12,9012,Rachel,Booker
1,grey07,2070,Laura,Grey
2,johnson81,4081,Craig,Johnson
3,jenkins46,9346,Mary,Jenkins
4,smith79,5079,Jamie,Smith


-------------------------------------
## `pyodide.http` 활용

In [7]:
import pyodide as pyd
raw_data = pd.read_csv(pyd.http.open_url(test_URL), delimiter=";")
raw_data

Unnamed: 0,Username,Identifier,First name,Last name
0,booker12,9012,Rachel,Booker
1,grey07,2070,Laura,Grey
2,johnson81,4081,Craig,Johnson
3,jenkins46,9346,Mary,Jenkins
4,smith79,5079,Jamie,Smith


-------------------------------------
## js 패키지 활용

In [4]:
import pandas as pd
from js import fetch

res = await fetch(test_URL)
text = await res.text()

filename = 'data.csv'

with open(filename, 'w') as f:
    f.write(text)

data = pd.read_csv(filename, sep=';')
data

Unnamed: 0,Username,Identifier,First name,Last name
0,booker12,9012,Rachel,Booker
1,grey07,2070,Laura,Grey
2,johnson81,4081,Craig,Johnson
3,jenkins46,9346,Mary,Jenkins
4,smith79,5079,Jamie,Smith


In [5]:
from pyodide.http import pyfetch
import pickle, numpy

URL = "https://raw.githubusercontent.com/jmshea/digicom-jupyter/main/content/signals.pkl"
res = await pyfetch(URL)
stream = await res.bytes()

data = pickle.loads(stream)
data

{'S': array([[ 3.09016994e-01,  5.87785252e-01,  8.09016994e-01,
          9.51056516e-01,  1.00000000e+00,  9.51056516e-01,
          8.09016994e-01,  5.87785252e-01,  3.09016994e-01,
          1.22464680e-16, -3.09016994e-01, -5.87785252e-01,
         -8.09016994e-01, -9.51056516e-01, -1.00000000e+00,
         -9.51056516e-01, -8.09016994e-01, -5.87785252e-01,
         -3.09016994e-01, -2.44929360e-16,  3.09016994e-01,
          5.87785252e-01,  8.09016994e-01,  9.51056516e-01,
          1.00000000e+00,  9.51056516e-01,  8.09016994e-01,
          5.87785252e-01,  3.09016994e-01,  3.67394040e-16,
         -3.09016994e-01, -5.87785252e-01, -8.09016994e-01,
         -9.51056516e-01, -1.00000000e+00, -9.51056516e-01,
         -8.09016994e-01, -5.87785252e-01, -3.09016994e-01,
         -4.89858720e-16,  3.09016994e-01,  5.87785252e-01,
          8.09016994e-01,  9.51056516e-01,  1.00000000e+00,
          9.51056516e-01,  8.09016994e-01,  5.87785252e-01,
          3.09016994e-01,  6.123234