## Thuật toán tìm khoảng cách đơn điệu của phương trình đa thức nội suy 

In [None]:
import numpy as np
import pandas as pd
import math
from numpy.polynomial import polynomial as P

def load_universal_data(filepath):
    """
    Hàm đọc dữ liệu mạnh mẽ, tự động phát hiện định dạng hàng ngang hoặc dọc.
    - Xử lý dấu phẩy (,) và dấu chấm (.).
    - Xử lý ký tự BOM (Byte Order Mark) từ Excel.
    - Bỏ qua các dòng trống hoặc dòng tiêu đề.
    """
    processed_lines = []
    try:
        with open(filepath, 'r', encoding='utf-8-sig') as f:
            # 1. Đọc tất cả các dòng
            all_lines = f.readlines()
            
            # 2. Làm sạch từng dòng
            for line in all_lines:
                line = line.strip() # Bỏ khoảng trắng thừa
                if not line: # Bỏ qua dòng trống
                    continue
                line = line.replace(',', '.') # Xử lý dấu phẩy
                processed_lines.append(line)
                
    except FileNotFoundError:
        raise IOError(f"LỖI: Không tìm thấy file '{filepath}'.")
    except Exception as e:
        raise IOError(f"LỖI: Không thể đọc file '{filepath}'. Lỗi: {e}")

    # 3. Kiểm tra và phân tích định dạng
    if len(processed_lines) == 0:
        # Nếu file không có dữ liệu gì
        return np.array([])
    
    elif len(processed_lines) == 1:
        # --- ĐỊNH DẠNG HÀNG NGANG ---
        # Chỉ có 1 dòng dữ liệu duy nhất
        print(f"    (Phát hiện định dạng hàng ngang trong file {filepath})")
        try:
            data = np.fromstring(processed_lines[0], sep=' ')
            return data
        except Exception as e:
            raise ValueError(f"LỖI: Dữ liệu hàng ngang trong file '{filepath}' không hợp lệ. Lỗi: {e}")
            
    else:
        # --- ĐỊNH DẠNG HÀNG DỌC ---
        # Có nhiều hơn 1 dòng
        print(f"    (Phát hiện định dạng hàng dọc trong file {filepath})")
        data = []
        for i, line in enumerate(processed_lines):
            try:
                # Thử chuyển đổi từng dòng thành 1 con số
                value = float(line)
                data.append(value)
            except ValueError:
                # Nếu thất bại (ví dụ: dòng chứa chữ hoặc nhiều số)
                print(f"    (Cảnh báo: Bỏ qua dòng {i+1} không hợp lệ: '{line}')")
                pass
        return np.array(data)

# --- Chương trình chính cho Ô nạp dữ liệu ---
try:
    # 1. Nạp dữ liệu thô (sử dụng hàm mới)
    x_coords_raw = load_universal_data('FileX.txt')
    y_coords_raw = load_universal_data('FileY.txt')

    if len(x_coords_raw) == 0 or len(y_coords_raw) == 0:
        raise ValueError("LỖI: Một trong hai file không chứa dữ liệu số hợp lệ.")
    if len(x_coords_raw) != len(y_coords_raw):
        raise ValueError("LỖI: Số lượng điểm x và y không khớp.")
    
    # 2. SẮP XẾP TĂNG DẦN (giữ nguyên logic của bạn)
    print("Đang sắp xếp dữ liệu theo x tăng dần...")
    sort_indices = np.argsort(x_coords_raw)
    x_coords = x_coords_raw[sort_indices]
    y_coords = y_coords_raw[sort_indices]
    
    # 3. In kết quả đã sắp xếp
    print("\nDữ liệu đã được đọc và sắp xếp thành công!")
    print(f"Tổng số {len(x_coords)} điểm đã được nạp.")
    print("-" * 50)
    print("Các mốc x (đã sắp xếp tăng dần):", x_coords.tolist())
    print("Các giá trị y (tương ứng):", y_coords.tolist())
    
except (IOError, ValueError) as e:
    print(str(e))

    (Phát hiện định dạng hàng dọc trong file FileX.txt)
    (Phát hiện định dạng hàng dọc trong file FileY.txt)
Đang sắp xếp dữ liệu theo x tăng dần...

Dữ liệu đã được đọc và sắp xếp thành công!
Tổng số 104 điểm đã được nạp.
--------------------------------------------------
Các mốc x (đã sắp xếp tăng dần): [1.0, 1.115, 1.23, 1.345, 1.46, 1.575, 1.69, 1.805, 1.92, 2.035, 2.15, 2.265, 2.38, 2.495, 2.61, 2.725, 2.84, 2.955, 3.07, 3.185, 3.3, 3.415, 3.53, 3.645, 3.76, 3.875, 3.99, 4.105, 4.22, 4.335, 4.45, 4.565, 4.68, 4.795, 4.91, 5.025, 5.14, 5.255, 5.37, 5.485, 5.6, 5.715, 5.83, 5.945, 6.06, 6.175, 6.29, 6.405, 6.52, 6.635, 6.75, 6.865, 6.98, 7.095, 7.21, 7.325, 7.44, 7.555, 7.67, 7.785, 7.9, 8.015, 8.13, 8.245, 8.36, 8.475, 8.59, 8.705, 8.82, 8.935, 9.05, 9.165, 9.28, 9.395, 9.51, 9.625, 9.74, 9.855, 9.97, 10.085, 10.2, 10.315, 10.43, 10.545, 10.66, 10.775, 10.89, 11.005, 11.12, 11.235, 11.35, 11.465, 11.58, 11.695, 11.81, 11.925, 12.04, 12.155, 12.27, 12.385, 12.5, 12.615, 12.73, 12

In [None]:
def get_monotonic_intervals_table(x_data, y_data):
    """
    Phân tích và TRẢ VỀ một DataFrame chứa các khoảng đơn điệu.
    """
    print("\n" + "="*50)
    print("--- PHÂN TÍCH CÁC KHOẢNG ĐƠN ĐIỆU ---")
    
    columns = ["Giá trị đơn điệu", "x_đầu vào", "y_đầu vào", "x_đầu ra", "y_đầu ra", "start_idx", "end_idx"]
    intervals_data = []
    
    if len(x_data) < 2:
        print("Cần ít nhất 2 điểm để phân tích.")
        return pd.DataFrame(columns=columns)

    trends = np.sign(np.diff(y_data))
    start_idx = 0
    current_trend = trends[0]
    
    def get_trend_str(t):
        if t > 0: return "TĂNG"
        if t < 0: return "GIẢM"
        return "KHÔNG ĐỔI"

    for i in range(1, len(trends)):
        if trends[i] != current_trend:
            intervals_data.append([
                get_trend_str(current_trend),
                x_data[start_idx], y_data[start_idx],
                x_data[i], y_data[i],
                start_idx, i # Lưu lại chỉ số
            ])
            start_idx = i
            current_trend = trends[i]
            
    intervals_data.append([
        get_trend_str(current_trend),
        x_data[start_idx], y_data[start_idx],
        x_data[-1], y_data[-1],
        start_idx, len(x_data) - 1 # Lưu lại chỉ số cuối cùng
    ])
    
    df = pd.DataFrame(intervals_data, columns=columns)
    return df

# --- Thực thi và hiển thị bảng ---
try:
    df_intervals = get_monotonic_intervals_table(x_coords, y_coords)
    
    # Hiển thị bảng (bỏ 2 cột chỉ số cuối)
    display(df_intervals.style.format("{:g}", subset=df_intervals.columns[1:5])
            .hide(subset=["start_idx", "end_idx"], axis=1))
    
except NameError:
    print("LỖI: Biến 'x_coords' và 'y_coords' chưa được định nghĩa. Vui lòng chạy Ô 1 trước.")


--- PHÂN TÍCH CÁC KHOẢNG ĐƠN ĐIỆU ---


Unnamed: 0,Giá trị đơn điệu,x_đầu vào,y_đầu vào,x_đầu ra,y_đầu ra
0,TĂNG,1.0,-5.1991,3.415,-1.0193
1,GIẢM,3.415,-1.0193,3.53,-1.0264
2,TĂNG,3.53,-1.0264,5.255,-0.4917
3,GIẢM,5.255,-0.4917,5.37,-0.5137
4,TĂNG,5.37,-0.5137,5.83,-0.4215
5,GIẢM,5.83,-0.4215,5.945,-0.425
6,TĂNG,5.945,-0.425,6.175,-0.33
7,GIẢM,6.175,-0.33,6.405,-0.3815
8,TĂNG,6.405,-0.3815,6.865,-0.2574
9,GIẢM,6.865,-0.2574,6.98,-0.3142


In [3]:
def find_isolation_interval(x_data, y_data, y_prime):
    """
    Tìm khoảng (x_k, x_{k+1}) sao cho y_prime nằm giữa y_k và y_{k+1}.
    """
    found_intervals = []
    for i in range(len(y_data) - 1):
        y_k = y_data[i]
        y_k_plus_1 = y_data[i+1]
        
        # Kiểm tra xem y_prime có nằm giữa 2 giá trị y hay không
        if (y_k <= y_prime <= y_k_plus_1) or (y_k >= y_prime >= y_k_plus_1):
            # Nếu tìm thấy, lưu lại thông tin
            interval_info = {
                "k": i,
                "x_k": x_data[i],
                "y_k": y_k,
                "x_k+1": x_data[i+1],
                "y_k+1": y_k_plus_1
            }
            found_intervals.append(interval_info)
            
    return found_intervals

# --- Thực thi tìm khoảng cách ly ---
try:
    y_prime_input = float(input("Nhập giá trị y' (y_bar) bạn muốn tìm x: "))
    
    intervals = find_isolation_interval(x_coords, y_coords, y_prime_input)
    
    if intervals: # Nếu danh sách không rỗng
        print("\n" + "="*50)
        print(f"--- ĐÃ TÌM THẤY {len(intervals)} KHOẢNG CÁCH LY NGHIỆM CHO y' = {y_prime_input} ---")
        
        for i, interval in enumerate(intervals):
            print(f"\nKhoảng {i+1}:")
            print(f"  Chỉ số k = {interval['k']}")
            print(f"  Mốc (x_k, y_k) = ({interval['x_k']:g}, {interval['y_k']:g})")
            print(f"  Mốc (x_{interval['k']+1}, y_{interval['k']+1}) = ({interval['x_k+1']:g}, {interval['y_k+1']:g})")
        print("="*50)
    else:
        print(f"\nLỖI: Không tìm thấy khoảng cách ly nào chứa giá trị y' = {y_prime_input}.")

except ValueError:
    print("LỖI: Giá trị nhập vào không phải là một con số.")
except NameError:
    print("LỖI: Biến 'x_coords' và 'y_coords' chưa được định nghĩa. Vui lòng chạy Ô 1 trước.")


--- ĐÃ TÌM THẤY 1 KHOẢNG CÁCH LY NGHIỆM CHO y' = -1.43 ---

Khoảng 1:
  Chỉ số k = 13
  Mốc (x_k, y_k) = (2.495, -1.5127)
  Mốc (x_14, y_14) = (2.61, -1.3977)


In [None]:
def find_isolation_intervals(x_data, y_data, y_prime):
    """
    Tìm TẤT CẢ các khoảng (x_k, x_{k+1}) sao cho y_prime nằm giữa y_k và y_{k+1}.
    """
    found_intervals = []
    for i in range(len(y_data) - 1):
        y_k, y_k_plus_1 = y_data[i], y_data[i+1]
        if (y_k <= y_prime <= y_k_plus_1) or (y_k >= y_prime >= y_k_plus_1):
            found_intervals.append({
                "k": i, "x_k": x_data[i], "y_k": y_k,
                "x_k+1": x_data[i+1], "y_k+1": y_k_plus_1
            })
    return found_intervals

# --- Thực thi tìm khoảng cách ly và trích xuất dữ liệu ---
try:
    y_prime_input = float(input("Nhập giá trị y' (y_bar) bạn muốn tìm x: "))
    
    # Lấy danh sách các khoảng cách ly
    isolation_intervals = find_isolation_intervals(x_coords, y_coords, y_prime_input)
    
    if not isolation_intervals:
        print(f"\nLỖI: Không tìm thấy khoảng cách ly nào chứa giá trị y' = {y_prime_input}.")
    else:
        print("\n" + "="*70)
        print(f"--- ĐÃ TÌM THẤY {len(isolation_intervals)} KHOẢNG CÁCH LY NGHIỆM CHO y' = {y_prime_input} ---")
        
        # Lặp qua từng khoảng cách ly tìm được
        for i, interval in enumerate(isolation_intervals):
            k_index = interval['k']
            
            # Tìm xem khoảng này thuộc khoảng đơn điệu nào
            parent_monotonic_interval = None
            for _, mono_interval in df_intervals.iterrows():
                # Kiểm tra xem k_index có nằm trong [start_idx, end_idx) không
                if mono_interval['start_idx'] <= k_index < mono_interval['end_idx']:
                    parent_monotonic_interval = mono_interval
                    break
            
            if parent_monotonic_interval is not None:
                print(f"\n--- Khoảng cách ly {i+1} (k={k_index}) ---")
                print(f"  Nằm trong khoảng đơn điệu {parent_monotonic_interval['Giá trị đơn điệu']} "
                      f"(từ x={parent_monotonic_interval['x_đầu vào']:g} đến x={parent_monotonic_interval['x_đầu ra']:g})")
                
                # Trích xuất và in dữ liệu của KHOẢNG ĐƠN ĐIỆU đó
                start_idx = int(parent_monotonic_interval['start_idx'])
                end_idx = int(parent_monotonic_interval['end_idx'])
                
                # Cắt mảng (end_idx là chỉ số, nên cần +1 để bao gồm nó)
                x_subset = x_coords[start_idx : end_idx + 1]
                y_subset = y_coords[start_idx : end_idx + 1]
                
                print("\n  >>> DỮ LIỆU CỦA KHOẢNG ĐƠN ĐIỆU ĐỂ SAO CHÉP:")
                print("  Dòng X:")
                print("  " + " ".join(map(str, x_subset)))
                print("\n  Dòng Y:")
                print("  " + " ".join(map(str, y_subset)))
            else:
                 print(f"\n--- Khoảng cách ly {i+1} (k={k_index}) ---")
                 print("  (Không tìm thấy khoảng đơn điệu cha tương ứng - có thể là điểm cuối?)")
        print("="*70)

except ValueError:
    print("LỖI: Giá trị nhập vào không phải là một con số.")
except NameError:
    print("LỖI: Biến 'x_coords', 'y_coords' hoặc 'df_intervals' chưa được định nghĩa. Vui lòng chạy Ô 1 và Ô 2 trước.")


--- ĐÃ TÌM THẤY 1 KHOẢNG CÁCH LY NGHIỆM CHO y' = -1.43 ---

--- Khoảng cách ly 1 (k=13) ---
  Nằm trong khoảng đơn điệu TĂNG (từ x=1 đến x=3.415)

  >>> DỮ LIỆU CỦA KHOẢNG ĐƠN ĐIỆU ĐỂ SAO CHÉP:
  Dòng X:
  1.0 1.115 1.23 1.345 1.46 1.575 1.69 1.805 1.92 2.035 2.15 2.265 2.38 2.495 2.61 2.725 2.84 2.955 3.07 3.185 3.3 3.415

  Dòng Y:
  -5.1991 -4.3239 -3.7284 -3.2661 -2.9082 -2.6225 -2.3954 -2.2098 -2.0282 -1.8916 -1.7967 -1.6635 -1.5819 -1.5127 -1.3977 -1.3814 -1.2792 -1.2786 -1.2207 -1.1791 -1.093 -1.0193


In [7]:
import numpy as np
import pandas as pd
import math

def load_data_robust(filepath):
    """
    Hàm đọc dữ liệu dạng cột từ file txt một cách mạnh mẽ.
    (Giữ nguyên hàm load_data_robust như trước)
    """
    data = []
    try:
        with open(filepath, 'r', encoding='utf-8-sig') as f:
            for line in f:
                line = line.strip()
                if not line: continue
                line = line.replace(',', '.')
                try:
                    value = float(line)
                    data.append(value)
                except ValueError:
                    pass
    except FileNotFoundError:
        raise IOError(f"LỖI: Không tìm thấy file '{filepath}'.")
    except Exception as e:
        raise IOError(f"LỖI: Không thể đọc file '{filepath}'. Lỗi: {e}")
    return np.array(data)

# --- Chương trình chính cho Ô nạp dữ liệu ---
try:
    # 1. Nạp dữ liệu thô
    x_coords_raw = load_data_robust('FileX.txt')
    y_coords_raw = load_data_robust('FileY.txt')

    if len(x_coords_raw) == 0 or len(y_coords_raw) == 0:
        raise ValueError("LỖI: Một trong hai file không chứa dữ liệu số hợp lệ.")
    if len(x_coords_raw) != len(y_coords_raw):
        raise ValueError("LỖI: Số lượng điểm x và y không khớp.")
        
    # >>> THAY ĐỔI QUAN TRỌNG: SẮP XẾP THEO Y TĂNG DẦN <<<
    print("Đang sắp xếp dữ liệu theo y tăng dần (cho nội suy ngược)...")
    sort_indices = np.argsort(y_coords_raw) # Lấy chỉ số sắp xếp theo y
    
    # Áp dụng chỉ số sắp xếp cho cả x và y
    x_coords_sorted_by_y = x_coords_raw[sort_indices]
    y_coords_sorted = y_coords_raw[sort_indices]
    
    # Kiểm tra điều kiện đơn điệu (bắt buộc cho hàm ngược)
    if len(np.unique(y_coords_sorted)) != len(y_coords_sorted):
        raise ValueError("LỖI: Các giá trị y bị trùng lặp. Không thể thực hiện nội suy hàm ngược.")

    # 3. In kết quả đã sắp xếp
    print("Dữ liệu đã được đọc và sắp xếp theo y thành công!")
    print(f"Tổng số {len(x_coords_sorted_by_y)} điểm đã được nạp.")
    print("-" * 50)
    print("5 mốc x đầu tiên (đã sắp xếp theo y):", x_coords_sorted_by_y[:5].tolist())
    print("5 giá trị y đầu tiên (đã sắp xếp tăng dần):", y_coords_sorted[:5].tolist())
    
except (IOError, ValueError) as e:
    print(str(e))

Đang sắp xếp dữ liệu theo y tăng dần (cho nội suy ngược)...
LỖI: Các giá trị y bị trùng lặp. Không thể thực hiện nội suy hàm ngược.


In [None]:
def extract_k_points_by_y(y_data_sorted, x_data_sorted, y_prime, k):
    """
    Trích xuất k điểm (x, y) gần nhất xung quanh y_prime,
    từ các mảng đã được sắp xếp theo y.
    """
    N = len(y_data_sorted)
    
    # 1. Kiểm tra k hợp lệ
    if k > N:
        print(f"Cảnh báo: Yêu cầu k={k} điểm, nhưng chỉ có {N} điểm. Sẽ sử dụng tất cả {N} điểm.")
        return y_data_sorted, x_data_sorted, 0
    
    # 2. Tìm chỉ số của mốc y gần nhất (bên trái y_prime)
    start_index = np.searchsorted(y_data_sorted, y_prime) - 1
    
    # 3. Tính toán vị trí bắt đầu lý tưởng để cắt
    ideal_start = start_index - (k // 2) + 1
    
    # 4. Điều chỉnh vị trí bắt đầu để xử lý các vùng biên
    final_start = max(0, ideal_start)
    final_start = min(final_start, N - k)
            
    # 5. Cắt mảng để lấy đúng k điểm
    k_y_data = y_data_sorted[final_start : final_start + k]
    k_x_data = x_data_sorted[final_start : final_start + k]
    
    return k_x_data, k_y_data, final_start

print("Hàm 'extract_k_points_by_y' đã được định nghĩa.")

Hàm 'extract_k_points_by_y' đã được định nghĩa.


In [8]:
# --- Thiết lập đầu vào ---
y_prime_target = -1.43                                # Giá trị y' (y_bar) bạn muốn tìm x
k_points = 6                                        # Số lượng mốc nội suy bạn muốn sử dụng (ví dụ: 9)

# --- Thực thi trích xuất ---
try:
    # Truyền vào các mảng đã sắp xếp theo y
    k_x, k_y, start_idx = extract_k_points_by_y(y_coords_sorted, x_coords_sorted_by_y, 
                                                y_prime_target, k_points)
    
    print(f"--- Trích xuất {k_points} điểm có mốc y gần nhất với y' = {y_prime_target} ---")
    
    # In ra kết quả (DataFrame)
    df_extracted = pd.DataFrame({
        'Vị trí (chỉ số gốc sau khi sắp xếp)': range(start_idx, start_idx + k_points),
        'y_trích_xuất (mốc mới)': k_y,
        'x_trích_xuất (giá trị mới)': k_x
    })
    
    display(df_extracted.style.format("{:g}"))
    
    print("\nCác mốc này đã sẵn sàng để được sử dụng cho 'Phương pháp hàm ngược' (ví dụ: P(y))")
    
    # --- In ra dữ liệu để sao chép ---
    print("\n" + "="*50)
    print(">>> Dữ liệu X (đã trích xuất) để sao chép vào FileX.txt (theo chiều ngang):")
    print(" ".join(map(str, k_x)))
    
    print("\n>>> Dữ liệu Y (đã trích xuất) để sao chép vào FileY.txt (theo chiều ngang):")
    print(" ".join(map(str, k_y)))
    print("="*50)
    
except NameError:
    print("LỖI: Biến 'x_coords_sorted_by_y' hoặc 'y_coords_sorted' chưa được định nghĩa. Vui lòng chạy Ô 1 trước.")

--- Trích xuất 6 điểm có mốc y gần nhất với y' = -1.43 ---


Unnamed: 0,Vị trí (chỉ số gốc sau khi sắp xếp),y_trích_xuất (mốc mới),x_trích_xuất (giá trị mới)
0,11,-1.6635,2.265
1,12,-1.5819,2.38
2,13,-1.5127,2.495
3,14,-1.3977,2.61
4,15,-1.3814,2.725
5,16,-1.2792,2.84



Các mốc này đã sẵn sàng để được sử dụng cho 'Phương pháp hàm ngược' (ví dụ: P(y))

>>> Dữ liệu X (đã trích xuất) để sao chép vào FileX.txt (theo chiều ngang):
2.265 2.38 2.495 2.61 2.725 2.84

>>> Dữ liệu Y (đã trích xuất) để sao chép vào FileY.txt (theo chiều ngang):
-1.6635 -1.5819 -1.5127 -1.3977 -1.3814 -1.2792
