In [12]:
import openpyxl
import pandas as pd
import re

# Mở file Excel
wb = openpyxl.load_workbook('etcd_sum.xlsx')
sheet = wb.active

# Tạo danh sách để lưu trữ dữ liệu đã tách
data = []

# Duyệt qua tất cả các dòng trong sheet
for row in sheet.iter_rows(min_row=2, values_only=True):
    parameter, value = row
    
    # Tách các phần từ parameter
    parts = parameter.split('.')

    # Loại bỏ các chỉ số mảng (ví dụ [0], [1], ...)
    cleaned_parts = [re.sub(r'\[\d*\]', '', part) for part in parts]
    
    # Lưu trữ các phần vào một danh sách
    levels = parts
    while len(levels) < 5:  # Đảm bảo có đủ 5 cột cấp độ
        levels.append('')
    
    # Thêm dữ liệu vào list
    data.append(levels + [value])

# Chuyển dữ liệu thành DataFrame
df = pd.DataFrame(data, columns=['Level 1', 'Level 2', 'Level 3', 'Level 4', 'Level 5', 'Value'])

# Lưu vào file Excel mới
df.to_excel('step1.xlsx', index=False)

print("File đã được chuyển đổi thành công!")
df


File đã được chuyển đổi thành công!


Unnamed: 0,Level 1,Level 2,Level 3,Level 4,Level 5,Value
0,spec,containers[0],command[0],,,etcd
1,spec,containers[0],command[1],,,--advertise-client-urls=https://10.0.111.33:2379
2,spec,containers[0],command[2],,,--cert-file=/etc/kubernetes/pki/etcd/server.crt
3,spec,containers[0],command[3],,,--client-cert-auth=true
4,spec,priorityClassName,,,,system-node-critical
5,spec,volumes[0],hostPath,path,,/etc/kubernetes/pki/etcd
6,spec,volumes[0],hostPath,type,,DirectoryOrCreate
7,spec,volumes[0],name,,,etcd-certs
8,spec,volumes[1],hostPath,path,,/var/lib/etcd
9,spec,volumes[1],hostPath,type,,DirectoryOrCreate


In [13]:
import openpyxl
import pandas as pd
import re
import yaml

# Mở file Excel
wb = openpyxl.load_workbook('etcd_sum.xlsx')
sheet = wb.active

# Tạo danh sách để lưu trữ dữ liệu đã tách
data = []

# Duyệt qua tất cả các dòng trong sheet
for row in sheet.iter_rows(min_row=2, values_only=True):
    parameter, value = row
    
    # Tách các phần từ parameter
    parts = parameter.split('.')
    
    # Loại bỏ các chỉ số mảng (ví dụ [0], [1], ...)
    cleaned_parts = [re.sub(r'\[\d+\]', '', part) for part in parts]
    
    # Lưu trữ các phần vào một danh sách
    levels = cleaned_parts
    while len(levels) < 5:  # Đảm bảo có đủ 5 cột cấp độ
        levels.append('')
    
    # Thêm dữ liệu vào list
    data.append(levels + [value])

# Chuyển dữ liệu thành DataFrame
df = pd.DataFrame(data, columns=['Level 1', 'Level 2', 'Level 3', 'Level 4', 'Level 5', 'Value'])

# Loại bỏ các cột trống
df = df.dropna(axis=1, how='all')

# Loại bỏ các hàng có cấp độ cuối cùng giống nhau, chỉ giữ lại hàng đầu tiên
df = df.drop_duplicates(subset=['Level 5'], keep='first')

# Chuyển đổi DataFrame thành dạng dict
result_dict = {'spec': {}}

for index, row in df.iterrows():
    levels = row[['Level 1', 'Level 2', 'Level 3', 'Level 4', 'Level 5']].tolist()
    value = row['Value']
    
    # Đặt giá trị vào trong dictionary theo cấu trúc cấp độ
    current_dict = result_dict['spec']
    for level in levels[:-1]:  # Các cấp độ trừ cấp cuối cùng
        if level not in current_dict:
            current_dict[level] = {}
        current_dict = current_dict[level]
    
    # Đặt giá trị vào cấp cuối cùng
    current_dict[levels[-1]] = value

# Chuyển đổi dictionary thành YAML
yaml_output = yaml.dump(result_dict, default_flow_style=False)

# Lưu vào file YAML
with open('hdcbbcbcbcbcbcbcbcbc.yaml', 'w') as yaml_file:
    yaml_file.write(yaml_output)

print("File YAML đã được tạo và các hàng có cấp độ cuối giống nhau đã được loại bỏ!")


File YAML đã được tạo và các hàng có cấp độ cuối giống nhau đã được loại bỏ!


In [14]:
import openpyxl
import pandas as pd
import re

# Mở file Excel
wb = openpyxl.load_workbook('etcd_sum.xlsx')
sheet = wb.active

# Tạo danh sách để lưu trữ dữ liệu đã tách
data = []

# Duyệt qua tất cả các dòng trong sheet
for row in sheet.iter_rows(min_row=2, values_only=True):
    parameter, value = row
    
    # Tách các phần từ parameter
    parts = parameter.split('.')
    
    # Loại bỏ các chỉ số mảng (ví dụ [0], [1], ...)
    cleaned_parts = [re.sub(r'\[\d*\]', '', part) for part in parts]
    
    # Lưu trữ các phần vào một danh sách
    levels = cleaned_parts
    while len(levels) < 5:  # Đảm bảo có đủ 5 cột cấp độ
        levels.append('')
    
    # Thêm dữ liệu vào list
    data.append(levels + [value])

# Chuyển dữ liệu thành DataFrame
df = pd.DataFrame(data, columns=['Level 1', 'Level 2', 'Level 3', 'Level 4', 'Level 5', 'Value'])

# Loại bỏ các cột trống
df = df.dropna(axis=1, how='all')

# Lưu vào file Excel mới
# df.to_excel('output_cleaned_no_empty_columns.xlsx', index=False)

print("File đã được chuyển đổi và loại bỏ các cột trống thành công!")
df


File đã được chuyển đổi và loại bỏ các cột trống thành công!


Unnamed: 0,Level 1,Level 2,Level 3,Level 4,Level 5,Value
0,spec,containers,command,,,etcd
1,spec,containers,command,,,--advertise-client-urls=https://10.0.111.33:2379
2,spec,containers,command,,,--cert-file=/etc/kubernetes/pki/etcd/server.crt
3,spec,containers,command,,,--client-cert-auth=true
4,spec,priorityClassName,,,,system-node-critical
5,spec,volumes,hostPath,path,,/etc/kubernetes/pki/etcd
6,spec,volumes,hostPath,type,,DirectoryOrCreate
7,spec,volumes,name,,,etcd-certs
8,spec,volumes,hostPath,path,,/var/lib/etcd
9,spec,volumes,hostPath,type,,DirectoryOrCreate


In [15]:
import openpyxl
import pandas as pd
import re
import numpy as np

# Mở file Excel
wb = openpyxl.load_workbook('etcd_sum.xlsx')
sheet = wb.active

# Tạo danh sách để lưu trữ dữ liệu đã tách
data = []

# Duyệt qua tất cả các dòng trong sheet
for row in sheet.iter_rows(min_row=2, values_only=True):
    parameter, value = row
    
    # Tách các phần từ parameter
    parts = parameter.split('.')
    
    # Loại bỏ các chỉ số mảng (ví dụ [0], [1], ...)
    cleaned_parts = [re.sub(r'\[\d*\]', '', part) for part in parts]
    
    # Lưu trữ các phần vào một danh sách
    levels = cleaned_parts
    while len(levels) < 5:  # Đảm bảo có đủ 5 cột cấp độ
        levels.append('')
    
    # Thêm dữ liệu vào list
    data.append(levels + [value])

# Chuyển dữ liệu thành DataFrame
df = pd.DataFrame(data, columns=['Level 1', 'Level 2', 'Level 3', 'Level 4', 'Level 5', 'Value'])

# Thay thế các chuỗi rỗng ('') thành NaN
df.replace('', np.nan, inplace=True)

# Loại bỏ các cột trống (cột chỉ chứa NaN)
df = df.dropna(axis=1, how='all')

# # Lưu vào file Excel mới
# df.to_excel('output_cleaned_no_empty_columns.xlsx', index=False)

print("File đã được chuyển đổi và loại bỏ các cột trống thành công!")
df


File đã được chuyển đổi và loại bỏ các cột trống thành công!


  df.replace('', np.nan, inplace=True)


Unnamed: 0,Level 1,Level 2,Level 3,Level 4,Value
0,spec,containers,command,,etcd
1,spec,containers,command,,--advertise-client-urls=https://10.0.111.33:2379
2,spec,containers,command,,--cert-file=/etc/kubernetes/pki/etcd/server.crt
3,spec,containers,command,,--client-cert-auth=true
4,spec,priorityClassName,,,system-node-critical
5,spec,volumes,hostPath,path,/etc/kubernetes/pki/etcd
6,spec,volumes,hostPath,type,DirectoryOrCreate
7,spec,volumes,name,,etcd-certs
8,spec,volumes,hostPath,path,/var/lib/etcd
9,spec,volumes,hostPath,type,DirectoryOrCreate


In [20]:
import openpyxl
import pandas as pd
import re
import numpy as np

# Mở file Excel
wb = openpyxl.load_workbook('etcd_sum.xlsx')
sheet = wb.active

# Tạo danh sách để lưu trữ dữ liệu đã tách
data = []

# Duyệt qua tất cả các dòng trong sheet
for row in sheet.iter_rows(min_row=2, values_only=True):
    parameter, value = row
    
    # Tách các phần từ parameter
    parts = parameter.split('.')
    
    # Loại bỏ các chỉ số mảng (ví dụ [0], [1], ...)
    cleaned_parts = [re.sub(r'\[\d*\]', '', part) for part in parts]
    
    # Lưu trữ các phần vào một danh sách
    levels = cleaned_parts
    while len(levels) < 5:  # Đảm bảo có đủ 5 cột cấp độ
        levels.append('')
    
    # Thêm dữ liệu vào list
    data.append(levels + [value])

# Chuyển dữ liệu thành DataFrame
df = pd.DataFrame(data, columns=['Level 1', 'Level 2', 'Level 3', 'Level 4', 'Level 5', 'Value'])

# Thay thế các chuỗi rỗng ('') thành NaN
df.replace('', np.nan, inplace=True)

# Loại bỏ tất cả các hàng chứa giá trị NaN
df = df.dropna(axis=0, how='any')

# # Lưu vào file Excel mới
# df.to_excel('output_cleaned_no_nan_values.xlsx', index=False)

print("File đã được chuyển đổi và loại bỏ các giá trị NaN thành công!")
df


File đã được chuyển đổi và loại bỏ các giá trị NaN thành công!


  df.replace('', np.nan, inplace=True)


Unnamed: 0,Level 1,Level 2,Level 3,Level 4,Level 5,Value


In [None]:
found = False
for i in range(5):
    for j in range(5):
        if :
            found = True
            break
    if found:
        break