In [1]:
from vietnamadminunits.database import get_data
from vietnamadminunits.pandas import standardize_admin_unit_columns, convert_address_column
from vietnamadminunits import parse_address, ParseMode, convert_address, ConvertMode
import pandas as pd

## Testing core functions

In [None]:
# Parse a new administrative unit address
address = '70 Nguyễn Sỹ Sách, Tan Son, tp.HCM'

admin_unit = parse_address(address)

print(admin_unit)

In [None]:
# Parse an old administrative unit address
address = '70 nguyễn sỹ sách, p.15, Tân Bình, Tp.HCM' # Old administrative unit address structure

admin_unit = parse_address(address, mode='LEGACY', level=3) # Use 'LEGACY' or ParseMode.LEGACY for mode

print(admin_unit)

In [None]:
# Convert address
address = '70 nguyễn sỹ sách, p.15, Tân Bình, Tp.HCM' # Old administrative unit address structure

admin_unit = convert_address(address)

print(admin_unit)

In [None]:
# Get data
print(get_data(limit=2))
print('-'*50)
print(get_data(table='admin_units_legacy', limit=2))

## Testing multiple functions with DataFrame

In [None]:
# Standardize new administrative unit columns
df = pd.DataFrame(get_data(fields=['province', 'ward']))
df = standardize_admin_unit_columns(df, province='province', ward='ward', short_name=False)
df

In [None]:
df.describe()

In [None]:
# Standardize new administrative unit columns
df = pd.DataFrame(get_data(fields=['provinceShort', 'wardShort']))
df = standardize_admin_unit_columns(df, province='provinceShort', ward='wardShort', short_name=True)
df

In [None]:
df.describe()

In [None]:
# Standardize old administrative unit columns
df = pd.DataFrame(get_data(fields=['province', 'district', 'ward'], table='admin_units_legacy'))
df = standardize_admin_unit_columns(df, province='province', district='district', ward='ward', parse_mode='LEGACY', short_name=False)
df

In [None]:
df.describe()

In [None]:
# Standardize old administrative unit columns
df = pd.DataFrame(get_data(fields=['provinceShort', 'districtShort', 'wardShort'], table='admin_units_legacy'))
df = standardize_admin_unit_columns(df, province='provinceShort', district='districtShort', ward='wardShort', parse_mode='LEGACY', short_name=True)
df

In [None]:
df.describe()

In [None]:
# Convert old administrative unit columns to new administrative unit columns
df = pd.DataFrame(get_data(fields=['province', 'district', 'ward'], table='admin_units_legacy'))
df = standardize_admin_unit_columns(df, province='province', district='district', ward='ward', convert_mode='CONVERT_2025', short_name=False)
df

In [None]:
df.describe()

In [8]:
data = {
    'address': [
        'Ngã 4 xóm ao dài, thôn Tự Khoát, Xã Ngũ Hiệp, Huyện Thanh Trì, Hà Nội',
        '50 ngõ 133 thái hà, hà nội, Phường Trung Liệt, Quận Đống Đa, Hà Nội',
        'P402 CT9A KĐT VIỆT HƯNG, Phường Đức Giang, Quận Long Biên, Hà Nội',
        '169/8A, Thoại Ngọc Hầu, Phường Phú Thạnh, Quận Tân Phú, TP. Hồ Chí Minh',
        '02 lê đại hành, phường 15, quận 11, tp.hcm, Phường 15, Quận 11, TP. Hồ Chí Minh'
    ]
}

df = pd.DataFrame(data)

converted_df = convert_address_column(df, address='address', short_name=False)
print(converted_df.to_markdown(index=False))

| address                                                                         | converted_address                                        |
|:--------------------------------------------------------------------------------|:---------------------------------------------------------|
| Ngã 4 xóm ao dài, thôn Tự Khoát, Xã Ngũ Hiệp, Huyện Thanh Trì, Hà Nội           | Ngã 4 Xóm Ao Dài, Xã Thanh Trì, Thủ đô Hà Nội            |
| 50 ngõ 133 thái hà, hà nội, Phường Trung Liệt, Quận Đống Đa, Hà Nội             | 50 Ngõ 133 Thái Hà, Phường Đống Đa, Thủ đô Hà Nội        |
| P402 CT9A KĐT VIỆT HƯNG, Phường Đức Giang, Quận Long Biên, Hà Nội               | P402 Ct9A Kđt Việt Hưng, Phường Việt Hưng, Thủ đô Hà Nội |
| 169/8A, Thoại Ngọc Hầu, Phường Phú Thạnh, Quận Tân Phú, TP. Hồ Chí Minh         | 169/8A, Phường Phú Thạnh, Thành phố Hồ Chí Minh          |
| 02 lê đại hành, phường 15, quận 11, tp.hcm, Phường 15, Quận 11, TP. Hồ Chí Minh | 02 Lê Đại Hành, Phường Phú Thọ, Thành phố Hồ Chí Minh    |

In [9]:
data = [
    {'province': 'Thành phố Hồ Chí Minh', 'district': 'Quận 1', 'ward': 'Phường Tân Định'},
    {'province': 'Thành phố Hồ Chí Minh', 'district': 'Quận 1', 'ward': 'Phường Đa Kao'},
    {'province': 'Thành phố Hồ Chí Minh', 'district': 'Quận 1', 'ward': 'Phường Bến Nghé'},
    {'province': 'Thành phố Hồ Chí Minh', 'district': 'Quận 1', 'ward': 'Phường Bến Thành'},
    {'province': 'Thành phố Hồ Chí Minh', 'district': 'Quận 1', 'ward': 'Phường Nguyễn Thái Bình'}
]

df = pd.DataFrame(data)

standardized_df = standardize_admin_unit_columns(df, province='province', district='district', ward='ward', convert_mode='CONVERT_2025')

print(standardized_df.to_markdown(index=False))

| province              | district   | ward                    | standardized_province   | standardized_ward   |
|:----------------------|:-----------|:------------------------|:------------------------|:--------------------|
| Thành phố Hồ Chí Minh | Quận 1     | Phường Tân Định         | Hồ Chí Minh             | Tân Định            |
| Thành phố Hồ Chí Minh | Quận 1     | Phường Đa Kao           | Hồ Chí Minh             | Sài Gòn             |
| Thành phố Hồ Chí Minh | Quận 1     | Phường Bến Nghé         | Hồ Chí Minh             | Sài Gòn             |
| Thành phố Hồ Chí Minh | Quận 1     | Phường Bến Thành        | Hồ Chí Minh             | Bến Thành           |
| Thành phố Hồ Chí Minh | Quận 1     | Phường Nguyễn Thái Bình | Hồ Chí Minh             | Bến Thành           |
