## Introduction to Python

### Pengenalan Python

**Python** adalah bahasa pemrograman tingkat tinggi (high level programming language) yang mudah dibaca dan mudah dipelajari. Python banyak digunakan dalam berbagai bidang seperti :  
- Data Science
- Machine Learning
- Web Development
- Automation
- Artificial Intelligence  
- Python dibuat oleh Guido van Rossum pada tahun 1991 

**Mengapa Python Populer?**  
Beberapa alasan Python sangat populer :  
- Sintaks sederhana dan mudah dipahami
- Banyak library dan framework
- Komunitas besar
- Cocok untuk pemula hingga profesional
- Banyak digunakan di industri teknologi   

Dalam konteks Data Science, Python sering digunakan karena memiliki library seperti :  
- NumPy
- Pandas
- Matplotlib
- Scikit-learn

### Aturan Penulisan Python (Basic Syntax Rules)

Python memiliki aturan penulisan yang harus diikuti agar program bisa berjalan dengan benar.  
**A. Case Sensitive**  
Python bersifat **case-sensitive**, artinya huruf besar dan kecil dianggap berbeda

In [8]:
nama = "Smith"
Nama = "Sam Smith"

**nama** dan **Nama** dianggap sebagai dua variabel yang berbeda.

**B. Indentation**  
Python menggunakan indentasi (spasi di awal baris) untuk menentukan blok kode.

In [9]:
if 5 > 2:
    print("Lima lebih besar dari dua.")

Lima lebih besar dari dua.


Indentasi biasanya menggunakan **4 spasi**  
Tanpa indentasi yang benar, program akan error.

**C. Comment (Komentar)**  
Komentar digunakan untuk memberi penjelasan pada kode.  
Komentar satu baris : 

In [10]:
# Ini adalah komentar satu baris

Komentar multi baris : 

In [11]:
"""
Ini adalah komentar
lebih dari satu baris
"""

'\nIni adalah komentar\nlebih dari satu baris\n'

Komentar tidak akan dieksekusi oleh program

**D. Penamaan Variabel**  
Aturan dasar :  
- Tidak boleh diawali angka  
- Tidak boleh menggunakan spasi
- Tidak boleh menggunakan simbol khusus seperti @,#,$
- Boleh menggunakan underscore _

In [12]:
# Contoh yang benar
nama_user = "Smith"
total_gaji = 5000000

In [13]:
# Contoh yang salah
1nama_user = "Smith"
total gaji = 5000000

SyntaxError: invalid syntax (26478330.py, line 2)

### Variabel pada Python

**Apa itu variabel?**  
Variabel adalah tempat untuk menyimpan data.  
Contoh : 

In [14]:
"""
nama menyimpan teks
umur menyimpan angka
"""

nama = "Smith"
umur = 30

Python tidak perlu mendeklarasikan tipe data secara manual. Tipe data akan ditentukan otomatis. 

### Tipe Data pada Python

**A. Integer (int)**  
Digunakan untuk angka bulat

In [15]:
umur = 30
jumlah = 50

**B. Float**  
Digunakan untuk angka desimal

In [16]:
tinggi = 160.5
berat = 68.5

**C. String (str)**  
Digunakan untuk teks.

In [17]:
"""
String bisa menggunakan tanda petik satu
atau tanda petik dua"
"""

nama = "Smith"
kota = 'Jakarta'

**D. Boolean (bool)**  
Digunakan untuk nilai benar atau salah

In [18]:
is_active = True
is_login = False

Nilainya hanya :
- True
- false

**E. List**  
Digunakan untuk menyimpan banyak data dalam satu variabel

In [19]:
"""
List menggunakan tanda kurung siku []
"""

buah = ["apel", "jeruk", "pisang"]
angka = [1, 2, 3, 4, 5]

**F. Tuple**  
Mirip dengan list, tetapi tidak bisa diubah (immutable)

In [20]:
"""
Menggunakan tanda kurung biasa ()
"""

koordinat = (10, 20)

**G. Dictionary**  
Menyimpan data dalam bentuk pasangan key dan value

In [21]:
"""
Menggunakan tanda kurung kurawal {}
"""

data = {
    "nama": "Smith",
    "umur": 30,
    "kota": "Jakarta"
}

### Mengecek Tipe Data

Untuk mengetahui tipe data suatu variabel, gunakan fungsi :

In [24]:
print(type(nama))

<class 'str'>


### Operasi Numerik pada Python

In [26]:
a = 10
b = 3

print(a + b)       # penjumlahan
print(a - b)       # pengurangan
print(a * b)       # perkalian
print(a / b)       # pembagian
print(a // b)      # pembagian bulat
print(a % b)       # modulus (sisa bagi)
print(a ** b)      # pangkat

13
7
30
3.3333333333333335
3
1
1000


Dalam data science, ini sering dipakai untuk:  
- Hitung rata-rata
- Normalisasi
- Perhitungan statistik sederhana

### Operasi String

In [28]:
nama = "Sam"
print(nama + " Smith")     # concatenation
print(nama.lower())        # huruf kecil
print(nama.upper())        # huruf besar
print(len(nama))           # panjang string

Sam Smith
sam
SAM
3


Dipakai untuk: 
- Cleaning text data
- Feature engineering pada NLP

### Operasi pada List

In [30]:
angka = [1, 2, 3]

print(angka.append(4))
print(angka.remove(2))
print(len(angka))
print(angka[0])

None
None
3
1


List sering dipakai untuk:
- Menyimpan kumpulan data
- Iterasi dengan loop
- Input awal sebelum masuk ke numpy/pandas

### Dictionary (Penting untuk struktur data)

In [32]:
data = {
    "nama" : "Sam",
    "umur" : 26
}

print(data["nama"])
print(data.keys())
print(data.values())

Sam
dict_keys(['nama', 'umur'])
dict_values(['Sam', 26])


Mirip struktur JSON. Sangap penting untuk API dan data processing

### Package pada Python

**Apa itu Package?**  
Package = kumpulan modul/library yang berisi fungsi siap pakai.  
Tanpa package, kita harus bikin semuanya dari nol.  

Install package  :  
**pip install nama_package**  

Contoh :  
pip install numpy  

Import package :  
**import numpy as np**  

### Package Penting untuk Data Science

#### Pandas

**Pandas** digunakan untuk manipulasi dan analisis data tabular.  
Dipakai untuk : 
- Baca CSV
- Cleaning data
- Filtering
- Grouping

Contoh : 

In [34]:
import pandas as pd

df = pd.read_csv("data.csv")
df.head()

Unnamed: 0,No.,Nama,Umur
0,1,Ardi,21
1,2,Andre,22
2,3,Budi,23
3,4,Tina,25
4,5,Anti,28


#### NumPy

Untuk operasi numerik dan array  
Kenapa penting?  
- Lebih cepat dari list
- Mendukung operasi matematis kompleks  

Contoh : 

In [35]:
import numpy as np

arr = np.array([3, 2, 1])
arr.mean()

2.0

#### Matplotlib/Seaborn

Digunakan untuk visualisasi data

#### Scikit-learn

Digunakan untuk proses machine learning :
- Classification 
- Regression
- Clustering