# Regula Expression

Regular expression (regex) adalah sebuah pola (pattern) yang digunakan untuk mencari, mencocokkan, dan memanipulasi teks berdasarkan aturan tertentu. Regex sering digunakan dalam pemrograman, pengolahan data, atau pencarian teks untuk menemukan string yang sesuai dengan pola tertentu.

In [4]:
import re 

s = "Myskill: portal for any learning path"

#match adalah tempat taro re search
# ' ' kata yang ingin kita cari
# tempat taro string yang kita cari

match = re.search(r'for', s)
# .start indeks awal pada string begitu end sebaliknya

print("start index:", match.start())
print("end index:", match.end())

name = "Aditya dengan ipk 350"

#Cari semua angka dalam teks: \d+
match = re.search(r'\d+', name)
print('ipk :', match.start())
print('ipk :', match.end())

a = "hari ini gw ingin ke perpusnas"
print("index pertama :", match.start())

start index: 16
end index: 19
ipk : 18
ipk : 21
index pertama : 18


In [10]:
import re 

#Tapi dengan r'...', Python akan mengabaikan pengolahan escape character dan membiarkan string apa adanya.

coba = "hallo nama saya windardi, nomor rumah saya adalah 63"
match = re.search(r'\d+', coba)
print("index pertama :", match.start())
print("index terakhir :", match.end())

print()

trial = "saya lahir pada 10 april 1997"
match = re.search(r'\d+', trial)
print("index pertama :", match.start())
print("index terakhir :", match.end())

match = re.search(r'lahir', trial)
print("index pertama :", match.start())
print("index terakhir :", match.end())

r = r'(\d+)'
match = re.findall(r, trial)
print(match)

index pertama : 50
index terakhir : 52

index pertama : 16
index terakhir : 18
index pertama : 5
index terakhir : 10
['10', '1997']


# MetaCharacter
Dalam regular expression (regex), metacharacters adalah karakter khusus yang punya arti khusus dan tidak dianggap sebagai teks biasa. Mereka digunakan untuk membentuk pola pencocokan.



## jenis jenis metacharacter

### ✅ Daftar Metacharacters Umum di Regex:

| Metachar | Arti                                                                                                                                                    |                         |                                 |
| -------- | ------------------------------------------------------------------------------------------------------------------------------------------------------- | ----------------------- | ------------------------------- |
| `.`      | Mewakili **1 karakter apa pun** (kecuali newline `\n`)                                                                                                  |                         |                                 |
| `^`      | Menandai **awal string**                                                                                                                                |                         |                                 |
| `$`      | Menandai **akhir string**                                                                                                                               |                         |                                 |
| `*`      | **0 atau lebih** dari karakter sebelumnya                                                                                                               |                         |                                 |
| `+`      | **1 atau lebih** dari karakter sebelumnya                                                                                                               |                         |                                 |
| `?`      | **0 atau 1** dari karakter sebelumnya (opsional)                                                                                                        |                         |                                 |
| `[]`     | **Character class** – cocok dengan **salah satu karakter** di dalamnya, contoh: `[aeiou]`                                                               |                         |                                 |
| \`       | \`                                                                                                                                                      | **Atau**, contoh: \`cat | dog\` cocokkan "cat" atau "dog" |
| `()`     | **Grouping** dan menangkap subpattern                                                                                                                   |                         |                                 |
| `\`      | Escape character – digunakan untuk meloloskan metacharacter (misalnya `\.` cocokkan titik literal) atau menggunakan kode khusus seperti `\d`, `\w`, dll |                         |                                 |


### 🔢 Metacharacters Khusus (dengan \)

| Kode | Arti                                                            |
| ---- | --------------------------------------------------------------- |
| `\d` | Digit (angka `0–9`)                                             |
| `\D` | Bukan digit                                                     |
| `\w` | Word character (`a-z`, `A-Z`, `0-9`, dan `_`)                   |
| `\W` | Bukan word character                                            |
| `\s` | Whitespace (spasi, tab, newline)                                |
| `\S` | Bukan whitespace                                                |
| `\b` | Word boundary (batas antara karakter dan spasi atau tanda baca) |
| `\B` | Bukan word boundary                                             |


### 🛑 Jika kamu ingin mencocokkan metacharacter sebagai karakter biasa, kamu harus escape dengan \

Contoh:

1. Pola \. cocokkan titik .

2. Pola \* cocokkan bintang *

In [13]:
import re 

s = "Adgan167@gmail.com"

# without using \
match = re.search(r'.', s)
print(match)

# using \
match = re.search(r'\.', s)
print(match)

<re.Match object; span=(0, 1), match='A'>
<re.Match object; span=(14, 15), match='.'>



# Module Regex -re library

## re.findall()

re.findall() adalah fungsi di Python dari modul re (regular expression) yang digunakan untuk:

Menemukan semua kemunculan dari pola regex dalam sebuah string, lalu mengembalikannya sebagai daftar (list).

In [None]:
import re

# A sample text string where regular expression
# is searched.
string = """Hello my student id is 923472387 and
            my friend's number student id Is 234130324
            no telp aditya 082298221785"""


# mencari angka atau digit di string text
regex = r'\d+'
match = re.findall(regex, string)
print(match)

['923472387', '234130324', '082298221785']


## re.compile()

re.compile() digunakan untuk membuat objek regex yang bisa digunakan berulang kali — fungsinya adalah mengompilasi pola regex sekali saja, lalu bisa dipakai beberapa kali dengan metode seperti .search(), .match(), atau .findall().

In [15]:
import re 

# compile() membuat ekspresi regular
# kelas karakter [a-e],
# yang setara dengan [abcde].
# kelas [abcde] akan cocok dengan string yang
# mengandung karakter 'a', 'b', 'c', 'd', atau 'e'.
p = re.compile('[a-e]', flags=re.IGNORECASE)

# findall() searches for the Regular Expression
# and return a list upon finding
print(p.findall("Aditya pramana putra"))


['A', 'd', 'a', 'a', 'a', 'a', 'a']


In [21]:
# contoh kedua 

import re 

# \d sama dengan [0 - 9]
p = re.compile(r'\d')
print(p.findall("I went to him at 11 A.M. on 4th July 1886"))

# \d+ akan sama dengan group di [0-9], group
# di [0-9] akan mencari angka satu atau lebih
p = re.compile(r'\d+')
print(p.findall("I went to him at 11 A.M. on 4th July 1886"))
print(p.findall("I went to him at 11 A.M. on 4th July 1886"))

['1', '1', '4', '1', '8', '8', '6']
['11', '4', '1886']
['11', '4', '1886']


## re.split()

re.split() adalah fungsi di modul re Python yang digunakan untuk:

Memecah string berdasarkan pola regex tertentu, seperti split() biasa tapi lebih fleksibel karena bisa pakai pola kompleks.

### ✅ Format Umum:

`re.split(pattern, string)`

1. pattern: pola regex yang digunakan sebagai pemisah

2. string: teks yang akan dipecah

### 🔍 Contoh 1: Pisahkan teks berdasarkan spasi
```python
import re

teks = "Ini contoh teks"
hasil = re.split(r'\s+', teks)

print(hasil)  # Output: ['Ini', 'contoh', 'teks']```

* \s+ = satu atau lebih spasi/tab/newline

### 🔍 Contoh 2: Pisahkan berdasarkan koma atau titik koma

```python
teks = "apel,jeruk;pisang"
hasil = re.split(r'[;,]', teks)

print(hasil)  # Output: ['apel', 'jeruk', 'pisang']```

* [;,] = cocokkan koma atau titik koma

### 🔍 Contoh 3: Pisahkan dengan angka

```python
teks = "halo123dunia45python"
hasil = re.split(r'\d+', teks)

print(hasil)  # Output: ['halo', 'dunia', 'python']```


In [23]:
from re import split

# '\W+' menunjukkan Karakter Non-Alfanumerik
# atau sekumpulan karakter. Setelah menemukan ','
# atau spasi ' ', fungsi split() akan memecah
# string dari titik tersebut.

print(split(r'\W+', 'Words, words , Words'))
print(split(r'\W+', "Word's words Words"))

# Here ':', ' ' ,',' are not AlphaNumeric thus,
# the point where splitting occurs
print(split(r'\W+', 'On 12th Jan 2016, at 11:02 AM'))

# '\d+' denotes Numeric Characters or group of
# characters Splitting occurs at '12', '2016',
# '11', '02' only
print(split(r'\d+', 'On 12th Jan 2016, at 11:02 AM'))

['Words', 'words', 'Words']
['Word', 's', 'words', 'Words']
['On', '12th', 'Jan', '2016', 'at', '11', '02', 'AM']
['On ', 'th Jan ', ', at ', ':', ' AM']


In [None]:
# Example 2

import re

# Pemisahan hanya akan terjadi sekali, pada
# '12', daftar yang dikembalikan akan memiliki panjang 2.

print(re.split(r'\d+','On 12th Jan 2016, at 11:02 AM',1))
print(re.split(r'\d+','On 12th Jan 2016, at 11:02 AM'))
#angka di ganti dengan split yang ingin kita tentukan dalam parameter

# 'Boy' dan 'boy' akan diperlakukan sama ketika
# flags = re.IGNORECASE
print(re.split(r'[a-f]+', 'Aey, Boy oh boy, come here', flags=re.IGNORECASE))
print(re.split(r'[a-f]+', 'Aey, Boy oh boy, come here'))

['On ', 'th Jan 2016, at 11:02 AM']
['On ', 'th Jan ', ', at ', ':', ' AM']
['', 'y, ', 'oy oh ', 'oy, ', 'om', ' h', 'r', '']
['A', 'y, Boy oh ', 'oy, ', 'om', ' h', 'r', '']


## re.sub()


`re.sub()` adalah fungsi di Python dari modul `re` yang digunakan untuk:

Mencari pola dalam string dan menggantinya dengan string yang baru.

Fungsi ini sangat berguna untuk memanipulasi teks berdasarkan pola tertentu (misalnya mengganti semua angka dengan tanda `#`, atau mengganti kata tertentu).

### ✅ Format Umum:
```python
re.sub(pattern, pengganti, string)
```

- `pattern`: Pola regex yang akan dicari.
- `pengganti`: String pengganti untuk mengganti pola yang cocok.
- `string`: Teks yang ingin diproses.

### 🔍 Contoh 1: Ganti Semua Angka dengan Tanda `#`
```python
import re

teks = "Ada 3 apel dan 12 jeruk."
hasil = re.sub(r'\d+', '#', teks)

print(hasil)  # Output: "Ada # apel dan # jeruk."
```
Penjelasan:
- `\d+` cocok dengan angka (satu atau lebih digit).
- Semua angka diganti dengan `#`.

### 🔍 Contoh 2: Ganti Huruf Kecil dengan Huruf Besar
```python
teks = "halo dunia"
hasil = re.sub(r'[a-z]', lambda x: x.group().upper(), teks)

print(hasil)  # Output: "HALO DUNIA"
```
Penjelasan:
- `[a-z]` cocok dengan huruf kecil.
- Menggunakan fungsi lambda untuk mengganti huruf kecil dengan huruf besar.

### 🔍 Contoh 3: Hapus Semua Tanda Baca
```python
teks = "Halo! Apa kabar?"
hasil = re.sub(r'[^\w\s]', '', teks)

print(hasil)  # Output: "Halo Apa kabar"
```
Penjelasan:
- `[^\w\s]` cocok dengan semua karakter bukan huruf atau spasi.
- Tanda baca dihapus.

### 📌 Perbedaan `re.sub()` dan `str.replace()`:
- `re.sub()` lebih fleksibel karena bisa menggunakan pola regex untuk mencari dan mengganti.
- `str.replace()` hanya mengganti substring secara langsung tanpa menggunakan pola regex.

In [27]:
import re

# Pola Regular Expression 'ub' mencocokkan string pada "Subject" dan "Uber". 
# Karena perbedaan huruf besar/kecil diabaikan menggunakan flag, 
# 'ub' akan mencocokkan dua kali dalam string tersebut.
# Setelah mencocokkan, 'ub' diganti dengan '~*' pada "Subject", 
# dan pada "Uber", 'Ub' diganti.

print(re.sub(r'ub', '~*', 'Subject has Uber booked already',
             flags=re.IGNORECASE))

# Consider the Case Sensitivity, 'Ub' in
# "Uber", will not be replaced.
print(re.sub(r'ub', '~*', 'Subject has Uber booked already'))

# As count has been given value 1, the maximum
# times replacement occurs is 1
print(re.sub(r'ub', '~*', 'Subject has Uber booked already',
             count=1, flags=re.IGNORECASE))

# 'r' before the pattern denotes RE, \s is for
# start and end of a String.
print(re.sub(r'\sAND\s', ' & ', 'Baked Beans And Spam',
             flags=re.IGNORECASE))

print(re.sub('ti','ty','Aditia adiTia pramana putra',count = 1,flags = re.IGNORECASE))
print(re.sub(r'ti','ty','Aditia adiTia pramana putra',flags = re.IGNORECASE))
print(re.sub(r'ti','ty','Aditia adiTia pramana putra'))

S~*ject has ~*er booked already
S~*ject has Uber booked already
S~*ject has Uber booked already
Baked Beans & Spam
Aditya adiTia pramana putra
Aditya aditya pramana putra
Aditya adiTia pramana putra


# re.subn()


# Penjelasan `re.subn()` dalam Python

`re.subn()` adalah fungsi dari modul `re` di Python yang mirip dengan `re.sub()`, tetapi dengan **tambahan informasi jumlah penggantian yang terjadi**.

## 📌 Perbedaan dengan `re.sub()`
- `re.sub()` hanya mengembalikan string hasil penggantiannya.
- `re.subn()` mengembalikan **tuple** berupa:
  ```python
  (hasil_string, jumlah_penggantian)
  ```

## ✅ Format Umum
```python
re.subn(pattern, pengganti, string)
```

- `pattern`: Pola regex yang dicari.
- `pengganti`: String pengganti untuk mengganti pola.
- `string`: Teks yang ingin diproses.

## 🔍 Contoh Penggunaan
```python
import re

teks = "satu dua tiga dua dua"
hasil = re.subn(r'dua', 'empat', teks)

print(hasil)
# Output: ('satu empat tiga empat empat', 3)
```

### Penjelasan:
- Semua kata `'dua'` diganti dengan `'empat'`.
- Fungsi mengembalikan tuple:
  - `'satu empat tiga empat empat'` → hasil string setelah penggantian.
  - `3` → jumlah penggantian yang dilakukan.

---

Gunakan `re.subn()` jika kamu **perlu tahu berapa kali penggantian terjadi**, selain hanya mendapatkan hasil string.

In [None]:
import re 

print(re.subn('ub', '~*', 'Subject has Uber booked already'))

t = re.subn('ub', '~*', 'Subject has Uber booked already',
            flags=re.IGNORECASE)
print(t)
print(len(t))

# This will give same output as sub() would have
print(t[0])

('S~*ject has Uber booked already', 1)


# re.Escape()


# Penjelasan `re.escape()` dalam Python

re.escape() merupakan fungsi dalam modul `re` (regular expression) untuk "escape" karakter-karakter khusus dalam ekspresi reguler. Fungsi ini digunakan untuk memastikan bahwa karakter-karakter khusus yang biasa digunakan dalam regular expression (seperti `*`, `+`, `?`, `(`, `)`, dan sebagainya) tidak diperlakukan sebagai bagian dari pola ekspresi reguler, tetapi sebagai karakter biasa.

## Penjelasan tentang `re.escape()`

Fungsi `re.escape()` akan mengonversi semua karakter khusus dalam string yang diberikan menjadi urutan karakter yang aman untuk digunakan dalam ekspresi reguler. Misalnya, jika kamu memiliki sebuah string yang berisi karakter-karakter khusus dan ingin mencocokkannya secara literal dalam ekspresi reguler, kamu dapat menggunakan `re.escape()` untuk menghindari masalah.

## Contoh Penggunaan:

```python
import re

# Misalnya kita ingin mencari string "hello*world" secara literal
text = "hello*world"

# Tanpa escape, karakter '*' akan dianggap sebagai operator dalam ekspresi reguler
pattern = re.compile("hello*world")  # Ini tidak akan mencocokkan string "hello*world" secara literal

# Menggunakan re.escape() untuk mencocokkan string dengan benar
escaped_text = re.escape(text)  # Ini akan mengubah "*" menjadi "\*" untuk mencocokkan secara literal
pattern = re.compile(escaped_text)

# Mencocokkan dengan string yang kita inginkan
match = pattern.search("hello*world is a pattern")
if match:
    print("Match found!")
else:
    print("No match.")
```

### Output:

```bash
Match found!
```

## Penjelasan:

`re.escape(text)` mengubah teks "hello*world" menjadi "hello\*world", yang kemudian bisa digunakan dalam ekspresi reguler tanpa risiko bahwa `*` akan diartikan sebagai operator khusus (yang artinya "0 atau lebih dari karakter sebelumnya").

Jadi, `re.escape()` sangat berguna untuk menghindari konflik dengan karakter khusus ketika kamu ingin mencocokkan string secara literal dalam ekspresi reguler.

## Kapan Menggunakan `re.escape()`?

- Ketika kamu perlu mencocokkan teks yang mengandung karakter khusus dalam ekspresi reguler (misalnya, `*`, `+`, `.`), dan kamu ingin karakter tersebut dianggap sebagai bagian dari teks biasa.
- Ketika bekerja dengan input yang dinamis atau data yang tidak dapat diprediksi, di mana karakter-karakter khusus mungkin ada, dan kamu perlu memastikan pola ekspresi reguler kamu tetap aman.

In [29]:
import re 

# escape() mengembalikan string dengan tanda BackSlash '\'
# di depan setiap karakter non-alfanumerik
# Pada contoh pertama, hanya spasi (' ') yang bukan alfanumerik
# Pada contoh kedua, spasi (' '), tanda topi '^', tanda minus '-', tanda kurung siku '[]', dan backslash '\'
# semuanya bukan karakter alfanumerik

print(re.escape("This is Awesome even 1 AM"))
print(re.escape("I Asked what is this [a-9], he said \t ^WoW"))

This\ is\ Awesome\ even\ 1\ AM
I\ Asked\ what\ is\ this\ \[a\-9\],\ he\ said\ \	\ \^WoW


# re.search()


# Penjelasan `re.search()` dalam Python

Fungsi `re.search()` di Python digunakan untuk **mencari pola (pattern)** dalam sebuah string. Fungsi ini akan mengembalikan objek **match** jika pola ditemukan **di mana saja dalam string** (bukan harus di awal), dan **`None`** jika tidak ditemukan.

---

## 🧠 Sintaks

```python
re.search(pattern, string, flags=0)
```

- `pattern`: pola regex yang ingin dicari.
- `string`: teks tempat pencarian dilakukan.
- `flags`: (opsional) untuk mengatur pencarian, seperti `re.IGNORECASE`, `re.MULTILINE`, dll.

---

## ✅ Contoh Penggunaan

```python
import re

text = "Halo dunia"
match = re.search("dunia", text)

if match:
    print("Pola ditemukan!")
else:
    print("Tidak ditemukan.")
```

### Output:

```
Pola ditemukan!
```

---

## ⚠️ Perbedaan dengan `re.match()`

- `re.match()` hanya mencocokkan **di awal string**.
- `re.search()` mencocokkan **di mana saja dalam string**.

---

## 📝 Contoh Tambahan

```python
import re

text = "Nomor: 123-456-7890"
pattern = r"\d{3}-\d{3}-\d{4}"  # mencari pola nomor telepon

match = re.search(pattern, text)
if match:
    print("Nomor ditemukan:", match.group())
```

### Output:

```
Nomor ditemukan: 123-456-7890
```

---

`re.search()` sangat berguna saat kamu ingin mengecek apakah sebuah pola **muncul di mana saja dalam string**, bukan hanya di awal.


In [None]:
# A Python program to demonstrate working of re.match().
import re

# Lets use a regular expression to match a date string
# in the form of Month name followed by day number
regex = r"([a-zA-Z]+) (\d+)"

match = re.search(regex, "I was Born on June 24")

if match != None:

    # We reach here when the expression "([a-zA-Z]+) (\d+)"
    # matches the date string.

    # This will print [14, 21), since it matches at index 14
    # and ends at 21.
    print ("Match at index %s, %s" % (match.start(), match.end()))

    # We us group() method to get all the matches and
    # captured groups. The groups contain the matched values.
    # In particular:
    # match.group(0) always returns the fully matched string
    # match.group(1) match.group(2), ... return the capture
    # groups in order from left to right in the input string
    # match.group() is equivalent to match.group(0)

    # So this will print "June 24"
    print ("Full match: %s" % (match.group(0)))

    # So this will print "June"
    print ("Month: %s" % (match.group(1)))

    # So this will print "24"
    print ("Day: %s" % (match.group(2)))

else:
    print ("The regex pattern does not match.")

matc di index 15, 22
full match: in 2004
first group: in
second group: 2004


# Match Object



In [31]:
import re

s = "Greeting to MYSKILL PORTAL"

# here x is the match object
res = re.search(r"\bG", s)

print(res.re)
print(res.string)
print(res.start())
print(res.end())
print(res.span())

a= 'Gw kece dari lahir\naditya pramana Putra'

res = re.search(r"\bP", a)

print(res.re)
print(res.string)
print(res.start())
print(res.end())
print(res.span())

re.compile('\\bG')
Greeting to MYSKILL PORTAL
0
1
(0, 1)
re.compile('\\bP')
Gw kece dari lahir
aditya pramana Putra
34
35
(34, 35)


In [32]:
import re

s = "Welcome to SeedsLand"

# here x is the match object
res = re.search(r"\bSee", s)

print(res.re)
print(res.string)
print(res.start())
print(res.end())
print(res.span())

re.compile('\\bSee')
Welcome to SeedsLand
11
14
(11, 14)


In [33]:
import re

s = "Welcome to MySkill"

# here x is the match object
res = re.search(r"\D{3} t", s)

print(res.group())

d = "Welco1me to MySkill"

# here x is the match object
res = re.search(r"\w{3} t", d)

print(res.group())

ome t
1me t


# Regex : Search, Match Find All

In [34]:
# A Python program to demonstrate working of re.match().
import re

# Lets use a regular expression to match a date string
# in the form of Month name followed by day number
regex = r"([a-zA-Z]+) (\d+)"

match = re.search(regex, "I was born on June 24")

if match != None:

	# We reach here when the expression "([a-zA-Z]+) (\d+)"
	# matches the date string.

	# This will print [14, 21), since it matches at index 14
	# and ends at 21.
	print ("Match at index %s, %s" % (match.start(), match.end()))

	# We us group() method to get all the matches and
	# captured groups. The groups contain the matched values.
	# In particular:
	# match.group(0) always returns the fully matched string
	# match.group(1) match.group(2), ... return the capture
	# groups in order from left to right in the input string
	# match.group() is equivalent to match.group(0)

	# So this will print "June 24"
	print ("Full match: %s" % (match.group(0)))

	# So this will print "June"
	print ("Month: %s" % (match.group(1)))

	# So this will print "24"
	print ("Day: %s" % (match.group(2)))

else:
	print ("The regex pattern does not match.")


Match at index 14, 21
Full match: June 24
Month: June
Day: 24


In [35]:
# A Python program to demonstrate working
# of re.match().
import re

# a sample function that uses regular expressions
# to find month and day of a date.
def findMonthAndDate(string):

	regex = r"([a-zA-Z]+) (\d+)"
	match = re.match(regex, string)

	if match == None:
		print ("Not a valid date")
		return

	print ("Given Data: %s" % (match.group()))
	print ("Month: %s" % (match.group(1)))
	print ("Day: %s" % (match.group(2)))


# Driver Code
findMonthAndDate("April 24")
print("")
findMonthAndDate("June 24")
print("")
findMonthAndDate("a Desember 24")

Given Data: April 24
Month: April
Day: 24

Given Data: June 24
Month: June
Day: 24

Not a valid date


In [41]:
# A Python program to demonstrate working of
# findall()
import re

# A sample text string where regular expression
# is searched.
string = """Hello my Number is 123456789 and
            my friend's number is 987654321"""

# A sample regular expression to find digits.
regex = r'\d+'

match = re.search(regex, string)
print(match)

<re.Match object; span=(19, 28), match='123456789'>


# re.Verbose 


# Penjelasan `re.VERBOSE` dalam Python

`re.VERBOSE` (juga bisa ditulis `re.X`) adalah **flag** dalam modul `re` Python yang memungkinkan kamu menulis ekspresi reguler (regex) dengan **format lebih jelas dan mudah dibaca**.

---

## 🎯 Tujuan `re.VERBOSE`

Agar kamu bisa:

1. Menyisipkan **spasi** dan **baris baru** untuk memperjelas bagian regex.
2. Menambahkan **komentar** dengan simbol `#`.

---

## 📘 Contoh Tanpa `re.VERBOSE` (satu baris):

```python
import re

pattern = re.compile(r"\d{4}-\d{2}-\d{2}")
```

Regex di atas mencocokkan tanggal dalam format `YYYY-MM-DD`, tapi sulit dibaca.

---

## ✅ Contoh Dengan `re.VERBOSE`:

```python
pattern = re.compile(r"""
    \d{4}      # Tahun (4 digit)
    -           # Tanda hubung
    \d{2}      # Bulan (2 digit)
    -           # Tanda hubung
    \d{2}      # Tanggal (2 digit)
""", re.VERBOSE)
```

Regex-nya sama, tetapi jauh lebih mudah dimengerti berkat komentar dan format multiline.

---

## ⚠️ Catatan Penting:

- Dalam mode `VERBOSE`, **spasi dan baris baru diabaikan** kecuali:
  - Di dalam `[...]` (character class),
  - Atau jika spasi ditulis eksplisit: `\ `

---

## 🧪 Contoh Lengkap:

```python
import re

pattern = re.compile(r"""
    \b          # Batas kata
    \d{3}       # 3 digit angka
    -           # Tanda hubung
    \d{2}       # 2 digit angka
    \b          # Batas kata
""", re.VERBOSE)

text = "Kode pos: 123-45"
match = pattern.search(text)
if match:
    print("Cocok:", match.group())
```

### Output:

```
Cocok: 123-45
```

---

`re.VERBOSE` sangat berguna ketika kamu sedang menulis regex kompleks yang sulit dipahami dalam satu baris.

In [42]:
# Without Using VERBOSE
regex_email = re.compile(r'^([a-z0-9_\.-]+)@([0-9a-z\.-]+)\.([a-z\.]{2, 6})$',
			re.IGNORECASE)

# Using VERBOSE
regex_email = re.compile(r"""
			^([a-z0-9_\.-]+)			 # local Part
			@							 # single @ sign
			([0-9a-z\.-]+)			 # Domain name
			\.						 # single Dot .
			([a-z]{2,6})$				 # Top level Domain
			""",re.VERBOSE | re.IGNORECASE)

In [43]:
# Python3 program to show the Implementation of VERBOSE in RegEX
import re

def validate_email(email):

	# RegexObject = re.compile( Regular expression, flag )
	# Compiles a regular expression pattern into
	# a regular expression object
	regex_email=re.compile(r"""
							^([a-z0-9_\.-]+)				 # local Part
						@
							([0-9a-z\.-]+)				 # Domain name
						\.							 # single Dot .
							([a-z]{2,6})$				 # Top level Domain
						""",re.VERBOSE | re.IGNORECASE)

	# RegexObject is matched with the desired
	# string using fullmatch function
	# In case a match is found, search()
	# returns a MatchObject Instance
	res=regex_email.fullmatch(email)

	#If match is found, the string is valid
	if res:
		print("{} is Valid. Details are as follow:".format(email))

		#prints first part/personal detail of Email Id
		print("Local:{}".format(res.group(1)))

		#prints Domain Name of Email Id
		print("Domain:{}".format(res.group(2)))

		#prints Top Level Domain Name of Email Id
		print("Top Level domain:{}".format(res.group(3)))
		print()

	else:
		#If match is not found,string is invalid
		print("{} is Invalid".format(email))

# Driver Code
validate_email("aliceinwonderland@gmail.com")
validate_email("harrypotter@yahoo.com@")
validate_email("Crucialllife@.com")


aliceinwonderland@gmail.com is Valid. Details are as follow:
Local:aliceinwonderland
Domain:gmail
Top Level domain:com

harrypotter@yahoo.com@ is Invalid
Crucialllife@.com is Invalid


In [44]:
# Python3 program to show the Implementation of VERBOSE in RegEX
import re

def user_instagram(instagram):

	regex_instagram=re.compile(r"""
            ^@							           # single @ sign
						([a-z0-9_\.-]+)				 # name user Part
						""",re.VERBOSE | re.IGNORECASE)

	res=regex_instagram.fullmatch(instagram)

	if res:
		print("{} is Valid. Details are as follow:".format(instagram))

		print("name user:{}".format(res.group(1)))

	else:
		#If match is not found,string is invalid
		print("{} is Invalid".format(instagram))

# Driver Code
user_instagram("@aditpramna")
user_instagram("aditya167")
user_instagram("aditya@pram")
user_instagram("@winardi1004")

@aditpramna is Valid. Details are as follow:
name user:aditpramna
aditya167 is Invalid
aditya@pram is Invalid
@winardi1004 is Valid. Details are as follow:
name user:winardi1004


In [45]:

import re

def validate_email(email):


	regex_email=re.compile(r"""
						^([a-z0-9_\.-]+)				 # local Part
						@							 # single @ sign
							([0-9a-z\.-]+)				 # Domain name
						\.							 # single Dot .
							([a-z]{2,6})$				 # Top level Domain
						""",re.VERBOSE | re.IGNORECASE)


	res=regex_email.fullmatch(email)

	if res:
		print("{} is Valid. Details are as follow:".format(email))


		print("Local:{}".format(res.group()))


		print("Domain:{}".format(res.group(2)))

		print("Top Level domain:{}".format(res.group(3)))
		print()

	else:

		print("{} is Invalid".format(email))


validate_email("adgan167@gmail.com")
validate_email("aditpramna1@@gmail.com")
validate_email("adityapramana107@gmail.,com")
validate_email("Awinardi1004@gmail.com")



adgan167@gmail.com is Valid. Details are as follow:
Local:adgan167@gmail.com
Domain:gmail
Top Level domain:com

aditpramna1@@gmail.com is Invalid
adityapramana107@gmail.,com is Invalid
Awinardi1004@gmail.com is Valid. Details are as follow:
Local:Awinardi1004@gmail.com
Domain:gmail
Top Level domain:com

