# Email

**Penjelasan Regex:**

- `\b`: Word boundary (batas kata).
- `[A-Za-z0-9._%+-]+`: Bagian pertama dari email, mencakup huruf, angka, dan beberapa simbol yang diizinkan.
- `@`: Karakter literal untuk memisahkan bagian lokal dan domain email.
- `[A-Za-z0-9.-]+`: Nama domain yang diizinkan.
- `\.`: Karakter titik literal yang memisahkan domain dan ekstensi.
- `[A-Za-z]{2,}`: TLD (Top-Level Domain) yang berisi setidaknya dua huruf.
- `\b`: Menutup batas kata.

In [2]:
import re
sentence = "Silakan kirim email ke saya di alamat john.doe@gmail.com."
regex_code = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}\b'

email = re.search(regex_code, sentence)
print(email.group() if email else "No match")

john.doe@gmail.com


# Nomor Telepon

**Penjelasan Regex:**

- `\+?`: Mencocokkan tanda `+` (opsional).
- `\d{1,3}`: Mencocokkan 1 hingga 3 digit (biasanya kode negara, misalnya `+62`).
- `[- ]?`: Mencocokkan spasi atau tanda `-` (opsional).
- `\(?\d{2,3}\)?`: Mencocokkan 2 atau 3 digit kode area, yang mungkin berada dalam tanda kurung `()`.
- `[- ]?`: Mencocokkan spasi atau tanda `-` (opsional).
- `\d{3,4}`: Mencocokkan 3 atau 4 digit pertama dari nomor telepon.
- `[- ]?`: Mencocokkan spasi atau tanda `-` (opsional).
- `\d{3,4}`: Mencocokkan 3 atau 4 digit terakhir dari nomor telepon.

In [4]:
sentence = "Hubungi saya di nomor telepon +62 812-3456-7890."
regex_code = r'\+?\d{1,3}[- ]?\(?\d{2,3}\)?[- ]?\d{3,4}[- ]?\d{3,4}'

no_telp = re.search(regex_code, sentence)
print(no_telp.group() if no_telp else "No match")

+62 812-3456-7890


# URL

**Penjelasan Regex untuk URL:**

- `https?`: Mencocokkan `http` atau `https`. Tanda tanya `?` membuat `s` opsional.
- `:\/\/`: Mencocokkan literal `://`.
- `(www\.)?`: Mencocokkan `www.` jika ada. Ini opsional karena tanda `?` setelahnya.
- `[A-Za-z0-9.-]+`: Mencocokkan nama domain yang terdiri dari huruf besar/kecil, angka, titik (`.`), atau tanda minus (`-`).
- `\.`: Karakter literal titik (`.`) yang memisahkan nama domain dan TLD.
- `[A-Za-z]{2,6}`: Mencocokkan Top-Level Domain (TLD) yang memiliki panjang antara 2 hingga 6 karakter (misalnya, `com`, `net`, `org`).
- `\/?`: Mencocokkan slash (`/`) di akhir URL, opsional karena tanda `?`.

In [6]:
sentence = "Untuk informasi lebih lanjut, kunjungi situs kami di https://www.contoh.com."
regex_code = r'https?:\/\/(www\.)?[A-Za-z0-9.-]+\.[A-Za-z]{2,6}\/?'

url = re.search(regex_code, sentence)
print(url.group() if url else "No match")

https://www.contoh.com
