# Ładowanie danych do CAS

## Parsowanie danych po stronie klienta i załadowanie do CAS

In [None]:
import swat, os
os.environ['CAS_CLIENT_SSL_CA_LIST'] = 'C:\\temp\\trustedcerts.pem'
conn = swat.CAS('adres-kontrolera-cas', 8777, 'uzytkownik', 'haslo')

W katalogu `dane` znajduje sie plik `iris.csv` o strukturze jak poniżej.

`"sepal_length","sepal_width","petal_length","petal_width","variety"
5.1,3.5,1.4,.2,"Setosa"
4.9,3,1.4,.2,"Setosa"
4.7,3.2,1.3,.2,"Setosa"
...
6.5,3,5.2,2,"Virginica"
6.2,3.4,5.4,2.3,"Virginica"
5.9,3,5.1,1.8,"Virginica"`

Aby sparsować plik CSV oraz załadować dane do CAS możemy użyć tych samych funkcji co w module `pandas` tj. `read_csv`, `read_table`, `read_excel` itp.

Kompletna lista obsługiwanych typów plików oraz przykłądy użycia: https://sassoftware.github.io/python-swat/api.html#client-side-files

In [None]:
iris = conn.read_csv('../dane/iris.csv')
iris

W wyniku wywołania `read_csv`, plik `iris.csv` został sprasowany i wysłany do serwera CAS. Po stronie serwera, w domyślnej (tzw. aktywnej bibliotece) została utworzona tabela o strukturze jak wskazany plik CSV i wypełniona danymi z tego pliku. Aktywną biblioteką jest `CASUSER(nazwaUzytkownika)`

Ponieważ nie podaliśmy nazwy tabeli to serwer przypisał jej losową nazwę. Zwrócony obiekt (`CASTable`) jest tzw. uchwytem do naszej tabeli znajdującej się w pamięci serwera CAS. Nie jest samą tabelą a tylko elementem za pomocą którego możemy operować na tabeli. 

Mając naszą tabelę w CAS oraz używając uchwytu możemy wywoływać akcje. Część z dostępnych akcji pokrywa się z tymi, które są w module `pandas`.

In [None]:
iris.tableInfo()

In [None]:
iris.tableDetails()

In [None]:
iris.columnInfo()

In [None]:
iris.head()

In [None]:
iris.tail()

In [None]:
iris.summary()

Więcej akcji poznamy później.

In [None]:
iris.dropTable()

## Wysłanie danych do serwera CAS i parsowanie po stronie serwera

Parsowanie dużego pliku może zająć więcej czasu niż gdybyśmy wysłali go do serwera i pozwolili serwerowi go sparsować.

Do wysłania pliku na serwer służy funkcja `upload_file()`

In [None]:
iris = conn.upload_file('../dane/iris.csv')
iris

W tym przypadku tabela otrzymała nazwę taką samą jak plik czyli IRIS.

In [None]:
iris.dropTable()

## Ładowanie danych bezpośrednio przez serwer CAS

Jeżeli dane mamy zapisane na serwerze, w konkretnej bibliotece możemy poprosić serwer CAS aby je nam załadował. W tym przypadku dane znajdują się w mojej bibliotece `CASUSER` czyli w katalogu `(/home/nazwa_uzytkownika/cas)` na serwerze.

In [None]:
iris = conn.load_path('iris.csv')

In [None]:
iris.head()

In [None]:
iris.dropTable()

Aby wyświetlić wszystkie obecnie załadowane tabele w aktywnej bibliotece należy użyć akcji `tableInfo` z zestawu akcji `table`.

In [None]:
conn.table.tableInfo()

In [None]:
conn.terminate()

## Ćwiczenie 1

1\. Utwórz sesję CAS o nazwie `conn1`.

2\. Załąduj plik `cars.csv` zanajdujący się w katalogu za danymi. Użyj parsowania po stronie klienta.

3\. Upewnij się, że dane zostały załadowane popranie i odpowiedz na pytania:

a) Jaka jest nazwa biblioteki oraz tabeli po stronie CAS do której załadowane dane.

b) Ile jest kolumn i wierszy w tabeli?

4\. Powołaj drugą sesję w CAS o nazwie `conn2`.

a). Czy załadowana za w pierwszej sesji tabela jest widoczna w drugiej sesji?

5\. Załaduj do pamięci CAS ten sam plik co pierwszej sesji. Tym razem użyj parsowania po stronie serwera.

6\. Upewnij się, że dane zostały załadowane popranie. (tableInfo,head itp.)

7\. Usuń załadowane dane a następnie zakończ wszystkie powołane sesje.