<a href="https://colab.research.google.com/github/davidivan13/Python-Fundamental/blob/main/Regular_Expressions_(Advanced_Techniques).ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Simple


## contoh 1

 Validasi Alamat Email

In [2]:
import re

email_pattern = r'^[\w\.-]+@[\w\.-]+\.\w+$'
email = "example@email.com"

if re.match(email_pattern, email):
    print("Email valid.")
else:
    print("Email tidak valid.")


Email valid.


Penjelasan:

Dalam contoh ini, kita menggunakan ekspresi reguler (email_pattern) yang mencocokkan alamat email dengan format yang benar.

Ekspresi ini memeriksa karakter sebelum "@" dan setelahnya, serta domain.

Jika alamat email cocok dengan pola ini, kita menyatakan bahwa email itu valid.

## contoh 2

Ekstraksi Domain dari Alamat Email

In [3]:
import re

email = "example@rocketmail.com"

domain = re.search(r'@([\w\.-]+)', email).group(1)

print("Domain:", domain)


Domain: rocketmail.com


Penjelasan:

Dalam contoh ini, kita menggunakan ekspresi reguler untuk mengekstraksi domain dari alamat email.
Ekspresi ini mencari tanda "@" dan kemudian mengambil karakter setelahnya hingga karakter pemisah seperti ".".
Hasilnya adalah ekstraksi domain dari alamat email.

# Intermediate

## contoh 1

Ekstraksi Semua Tautan dari Halaman HTML

In [4]:
import re

html = """
<a href="https://example.com">Link 1</a>
<a href="https://openai.com">Link 2</a>
<p>Not a link</p>
"""

links = re.findall(r'href=["\'](https?://\S+)["\']', html)

for link in links:
    print("Tautan:", link)


Tautan: https://example.com
Tautan: https://openai.com


Penjelasan:

Dalam contoh ini, kita menggunakan re.findall untuk mengekstraksi semua tautan dari halaman HTML.

Ekspresi reguler ini mencari tautan yang dimulai dengan "http://" atau "https://" dalam atribut href di elemen HTML.

## contoh 2

 Mengekstraksi URL dari Teks HTML

In [5]:
import re

html = """
Visit our website at <a href="https://example.com">Example</a>
Click <a href="https://openai.com">here</a> for more info.
"""

links = re.findall(r'<a [^>]*href=["\'](https?://\S+)["\']', html)

for link in links:
    print("Tautan:", link)


Tautan: https://example.com
Tautan: https://openai.com


Penjelasan:

Contoh ini menunjukkan cara mengekstraksi URL dari teks HTML yang mungkin memiliki lebih banyak atribut di dalam tag anchor (\<a>\).
Ekspresi reguler ini mencocokkan tag anchor (\<a>\) yang memiliki atribut href dan mengekstraksi URL-nya.

# Advanced

## contoh 1

Validasi Nomor Telepon dengan Format yang Berbeda

In [6]:
import re

phone_numbers = ["+1 123-456-7890", "555-5555", "123.456.7890", "+44 20 7123 1234"]

phone_pattern = r'^\+\d{1,3}\s?\d{1,3}[-. ]\d{1,4}[-. ]\d{1,4}$'

for phone in phone_numbers:
    if re.match(phone_pattern, phone):
        print(f"Nomor Telepon '{phone}' valid.")
    else:
        print(f"Nomor Telepon '{phone}' tidak valid.")


Nomor Telepon '+1 123-456-7890' valid.
Nomor Telepon '555-5555' tidak valid.
Nomor Telepon '123.456.7890' tidak valid.
Nomor Telepon '+44 20 7123 1234' valid.


Penjelasan:

Dalam contoh ini, kita menggunakan ekspresi reguler (phone_pattern) untuk memvalidasi nomor telepon dengan berbagai format, termasuk kode internasional.

Ekspresi ini memeriksa apakah nomor telepon cocok dengan pola yang ditentukan.

## contoh 2

Ekstraksi Kode Area dari Nomor Telepon

In [7]:
import re

phone_number = "+62 123-456-7890"

area_code = re.search(r'\+(\d{1,3})', phone_number).group(1)

print("Kode Area:", area_code)


Kode Area: 62


Penjelasan:

Dalam contoh ini, kami menggunakan ekspresi reguler untuk mengekstraksi kode area dari nomor telepon yang mungkin memiliki kode internasional.
Ekspresi ini mencari tanda "+" diikuti oleh satu hingga tiga digit dan mengambil digit tersebut sebagai kode area.