# Antenna Planning

In [1]:
import os
import pandas as pd

def read_antenna_planning_files(directory):
    """
    读取指定目录中的天线安装规划文件，并规整列名，检查和删除重复行。

    参数:
    directory (str): 包含天线安装规划文件的目录路径。

    返回值:
    pd.DataFrame: 合并后的DataFrame，包含规整后的列名，并删除重复行。
    """
    # 列出目录中的所有文件
    files = os.listdir(directory)

    # 过滤出文件名包含“天线安装规划”关键字的CSV文件
    antenna_files = [file for file in files if '天线安装规划' in file and file.endswith('.csv')]

    # 定义要读取的列
    columns_to_read = ['网元标识', '远端射频单元编号', '本地小区标识1']

    # 初始化一个空的DataFrame列表
    dfs = []

    # 读取每个CSV文件并添加到DataFrame列表中
    for file in antenna_files:
        file_path = os.path.join(directory, file)
        df = pd.read_csv(file_path, encoding='gbk', usecols=columns_to_read)  # 根据需要调整编码格式
        dfs.append(df)

    # 合并所有DataFrame
    combined_df = pd.concat(dfs, ignore_index=True)

    # 删除重复数据
    combined_df = combined_df.drop_duplicates()

    # 重命名列
    combined_df.columns = ['网元标识', '射频单元编号', '小区本地ID']

    # 检查和删除重复行
    initial_row_count = combined_df.shape[0]
    combined_df = combined_df.drop_duplicates()
    final_row_count = combined_df.shape[0]

    if initial_row_count != final_row_count:
        print(f"Removed {initial_row_count - final_row_count} duplicate rows.")

    return combined_df

# 使用示例
Datadir = r'C:\Users\zhuak\Desktop\Geography\MobileData'
df_AP = read_antenna_planning_files(Datadir)

# 显示前10行数据
print(df_AP.head(10))

       网元标识  射频单元编号  小区本地ID
0   6355826       2       6
4   6355826       3       1
8   6355826       0       4
12  6355826       5       3
16  6355826       1       5
20  6355826       4       2
24  6311444       1       2
28  6311444       0       1
32  6311444       2       3
36  6355609       2       3


# Radio Frequency Planning

In [2]:
import os
import pandas as pd

def read_rf_planning_files(directory):
    """
    读取指定目录中的射频单元规划文件，并规整列名，检查和删除重复行。

    参数:
    directory (str): 包含射频单元规划文件的目录路径。

    返回值:
    pd.DataFrame: 合并后的DataFrame，包含规整后的列名，并删除重复行。
    """
    # 列出目录中的所有文件
    files = os.listdir(directory)

    # 过滤出文件名包含“射频单元规划”关键字的CSV文件
    rf_files = [file for file in files if '射频单元规划' in file and file.endswith('.csv')]

    # 定义要读取的列
    columns_to_read = ['网元标识', '射频单元编号', '射频单元RRU安装经度', '射频单元RRU安装纬度']

    # 初始化一个空的DataFrame列表
    dfs = []

    # 读取每个CSV文件并添加到DataFrame列表中
    for file in rf_files:
        file_path = os.path.join(directory, file)
        df = pd.read_csv(file_path, encoding='gbk', usecols=columns_to_read)  # 根据需要调整编码格式
        dfs.append(df)

    # 合并所有DataFrame
    combined_df = pd.concat(dfs, ignore_index=True)

    # 删除重复数据
    combined_df = combined_df.drop_duplicates()

    # 重命名列
    combined_df.columns = ['网元标识', '射频单元编号', 'Longitude', 'Latitude']

    # 检查和删除重复行
    initial_row_count = combined_df.shape[0]
    combined_df = combined_df.drop_duplicates()
    final_row_count = combined_df.shape[0]

    if initial_row_count != final_row_count:
        print(f"Removed {initial_row_count - final_row_count} duplicate rows.")

    return combined_df

# 使用示例
Datadir = r'C:\Users\zhuak\Desktop\Geography\MobileData'
df_RF = read_rf_planning_files(Datadir)

# 显示前10行数据
print(df_RF.head(10))

      网元标识  射频单元编号   Longitude   Latitude
0  6334965       2  110.744614  32.068618
1  6334965       1  110.744614  32.068618
2  6334965       0  110.744614  32.068618
3  6337302       5  110.739594  32.053898
4  6337302       3  110.739594  32.053898
5  6337302       4  110.739594  32.053898
6  6337302       1  110.739594  32.053898
7  6337302       2  110.739594  32.053898
8  6337302       0  110.739594  32.053898
9  6337436       0  111.484500  32.541830


# Cell parameters

In [3]:
import os
import pandas as pd

def read_cell_planning_files(directory):
    """
    读取指定目录中的小区规划文件，并规整列名，检查和删除重复行。

    参数:
    directory (str): 包含小区规划文件的目录路径。

    返回值:
    pd.DataFrame: 合并后的DataFrame，包含规整后的列名，并删除重复行。
    """
    # 列出目录中的所有文件
    files = os.listdir(directory)

    # 过滤出文件名包含“NR小区”关键字的CSV文件
    cell_files = [file for file in files if 'NR小区' in file and file.endswith('.csv')]

    # 定义要读取的列
    columns_to_read = ['网元标识', '小区本地ID', '小区友好名']

    # 初始化一个空的DataFrame列表
    dfs = []

    # 读取每个CSV文件并添加到DataFrame列表中
    for file in cell_files:
        file_path = os.path.join(directory, file)
        df = pd.read_csv(file_path, encoding='gbk', usecols=columns_to_read)  # 根据需要调整编码格式
        dfs.append(df)

    # 合并所有DataFrame
    combined_df = pd.concat(dfs, ignore_index=True)

    # 删除重复数据
    combined_df = combined_df.drop_duplicates()

    # 重命名列
    combined_df.columns = ['网元标识', '小区本地ID', '小区友好名']

    # 检查和删除重复行
    initial_row_count = combined_df.shape[0]
    combined_df = combined_df.drop_duplicates()
    final_row_count = combined_df.shape[0]

    if initial_row_count != final_row_count:
        print(f"Removed {initial_row_count - final_row_count} duplicate rows.")

    return combined_df

# 使用示例
Datadir = r'C:\Users\zhuak\Desktop\Geography\MobileData'
df_CP = read_cell_planning_files(Datadir)

# 显示前10行数据
print(df_CP.head(10))

      网元标识  小区本地ID              小区友好名
0  6334808       0    丹江农机驾校-D5H-2611
1  6334808       5  丹江丹赵路郑家湾-D5H-2613
2  6334808       4  丹江丹赵路郑家湾-D5H-2612
3  6334808       3  丹江丹赵路郑家湾-D5H-2611
4  6334936       0   房县解湾村委会-D5H-2611
5  6334936       1   房县解湾村委会-D5H-2612
6  6311642       3      通城灿良-D5H-2613
7  6311642       2      通城灿良-D5H-2612
8  6335023       2     林区小当阳-D5H-2613
9  6334892       7    房县熊家凹2-D5H-2612


# Read HuBei MAP

In [4]:
import os
import pandas as pd
import geopandas as gpd

def read_hubei_map_files(directory, filename):
    """
    读取指定目录中的湖北Map文件。

    参数:
    directory (str): 包含湖北Map文件的目录路径。
    filename (str): 湖北Map文件的文件名。

    返回值:
    gpd.GeoDataFrame: 读取的GeoDataFrame。
    """
    # 构建文件路径
    file_path = os.path.join(directory, filename)

    # 读取GeoJSON文件
    gdf = gpd.read_file(file_path)

    return gdf

# 使用示例
GosDir = r'C:\Users\zhuak\Desktop\Geography'
gdffile = '湖北省村级边界.geojson'
gdf = read_hubei_map_files(GosDir, gdffile)

# 显示前10行数据
print(gdf.head(10))

   OBJECTID SJGZQYMC DSJGZQYMC QXJGZQYMC XZJGZQYMC CJGZQYMC  SHAPE_AREA  \
0     576.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇     杨柘坪村    0.001183   
1     577.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇     龙潭坪村    0.001642   
2     578.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇     立志坪村    0.002743   
3     579.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇     雪山河村    0.003297   
4     580.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇     杜家冲村    0.001725   
5     581.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇     五尖山村    0.001821   
6     582.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇      麻池村    0.002221   
7     583.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇      西湾村    0.000692   
8     584.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇      重溪村    0.001702   
9     585.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇     朱栗山村    0.001061   

   SHAPE_LEN                                           geometry  
0   0.240019  MULTIPOLYGON (((110.99976 30.33573, 110.99901 ...  
1   0.260185  MULTIPOLYGON (((110.92990 30

# File Integration

In [5]:
import pandas as pd
import geopandas as gpd
from shapely.geometry import Point

def process_rf_ap_cp(df_ap, df_rf, df_cp, gdf):
    """
    合并天线规划数据、射频单元规划数据和小区规划数据，并与地理数据进行空间连接。

    参数:
    df_ap (pd.DataFrame): 天线规划数据。
    df_rf (pd.DataFrame): 射频单元规划数据。
    df_cp (pd.DataFrame): 小区规划数据。
    gdf (gpd.GeoDataFrame): 地理数据。

    返回值:
    gpd.GeoDataFrame: 合并后的GeoDataFrame，包含规整后的列名。
    """
    # 合并天线规划数据和射频单元规划数据
    df_rfap = pd.merge(df_ap, df_rf, how='inner', 
                       left_on=['网元标识', '射频单元编号'],
                       right_on=['网元标识', '射频单元编号'],
                       suffixes=('_df_AP', '_df_RF'))

    # 选择并重命名列
    df_rfap = df_rfap[['网元标识', '小区本地ID', '射频单元编号', 'Longitude', 'Latitude']]

    # 合并射频单元规划数据和小区规划数据
    df_rac = pd.merge(df_rfap, df_cp, how='inner', 
                      left_on=['网元标识', '小区本地ID'],
                      right_on=['网元标识', '小区本地ID'],
                      suffixes=('_df_RFAP', '_df_CP'))

    # 选择并重命名列
    df_rac = df_rac[['网元标识', '小区本地ID', '小区友好名', 'Longitude', 'Latitude']]

    # 创建几何图形列表（点）
    geometry = [Point(xy) for xy in zip(df_rac['Longitude'], df_rac['Latitude'])]

    # 将 pandas DataFrame 转换为 GeoDataFrame
    df_rac = gpd.GeoDataFrame(df_rac, geometry=geometry)

    # 设置 CRS
    if df_rac.crs is None:
        df_rac = df_rac.set_crs(gdf.crs)

    # 空间连接
    gdf_rac = gpd.sjoin(df_rac, gdf, how='inner', predicate='within')

    # 选择并重命名列
    gdf_rac = gdf_rac[['网元标识', '小区本地ID', '小区友好名', 'Longitude', 'Latitude', 'SJGZQYMC', 'DSJGZQYMC', 'QXJGZQYMC', 'XZJGZQYMC', 'CJGZQYMC']].rename(
        columns={'SJGZQYMC': '省份', 'DSJGZQYMC': '地市', 'QXJGZQYMC': '县区', 'XZJGZQYMC': '镇区', 'CJGZQYMC': '村区'}
    )

    return gdf_rac

# 使用示例

gdf_RAC = process_rf_ap_cp(df_AP, df_RF, df_CP, gdf)

# 显示结果
print(gdf_RAC.head(10))

         网元标识  小区本地ID                小区友好名   Longitude   Latitude   省份   地市  \
0     6334965       0     房县小草咖啡1-D5H-2611  110.744614  32.068618  湖北省  十堰市   
1     6334965       1     房县小草咖啡1-D5H-2612  110.744614  32.068618  湖北省  十堰市   
574   6334987       1     房县小草咖啡2-D5H-2612  110.744426  32.065918  湖北省  十堰市   
575   6334987       0     房县小草咖啡2-D5H-2611  110.744426  32.065918  湖北省  十堰市   
3876  6337299       3      房县滨河花园-D5H-2611  110.743071  32.062452  湖北省  十堰市   
3877  6337299       4      房县滨河花园-D5H-2612  110.743071  32.062452  湖北省  十堰市   
2     6337302       0       房县劳动局-D5H-2611  110.739594  32.053898  湖北省  十堰市   
3     6337302       5  房县联关(凤凰山路)-D5H-2613  110.739594  32.053898  湖北省  十堰市   
4     6337302       3  房县联关(凤凰山路)-D5H-2611  110.739594  32.053898  湖北省  十堰市   
5     6337302       4  房县联关(凤凰山路)-D5H-2612  110.739594  32.053898  湖北省  十堰市   

      县区   镇区    村区  
0     房县  城关镇  北关社区  
1     房县  城关镇  北关社区  
574   房县  城关镇  北关社区  
575   房县  城关镇  北关社区  
3876  房县  城关镇  北关社区 

# Read KPI file and Regular format

In [6]:
import os
import pandas as pd
import re

def read_and_process_kpi_files(directory, keyword='DT_PowerBI指标通报计数器_', file_extension='.csv'):
    """
    读取指定目录中的KPI文件，合并、处理日期和字符串列、转换特定列的数据类型、提取列名中的代码，并删除重复行和特定列。

    参数:
    directory (str): 包含KPI文件的目录路径。
    keyword (str): 文件名中包含的关键字，默认值为 'DT_PowerBI指标通报计数器_'。
    file_extension (str): 文件扩展名，默认值为 '.csv'。

    返回值:
    pd.DataFrame: 处理后的DataFrame，包含所有读取的KPI数据，并删除了重复行。
    """
    # 列出目录中的所有文件
    files = os.listdir(directory)
    print(f"目录中的所有文件: {files}")  # 调试信息

    # 过滤出包含特定关键字的CSV文件
    kpi_files = [file for file in files if keyword in file and file.lower().endswith(file_extension)]
    print(f"过滤出的文件: {kpi_files}")  # 调试信息

    # 初始化一个空的DataFrame列表
    dfs = []

    # 读取每个CSV文件并添加到DataFrame列表中
    for file in kpi_files:
        file_path = os.path.join(directory, file)
        print(f"正在读取文件: {file_path}")  # 调试信息
        try:
            df = pd.read_csv(file_path, skiprows=2, header=0, encoding='cp936', na_values=["n/a", "na", "-"])
            df.columns = df.columns.str.replace(' ', '')  # 去除列名中的空格
            dfs.append(df)
            print(f"成功读取文件: {file_path}")  # 调试信息
        except UnicodeDecodeError as e:
            print(f"读取文件时发生编码错误：{e}")
        except Exception as e:
            print(f"读取文件时发生其他错误：{e}")

    # 检查是否成功读取了任何文件
    if not dfs:
        print("没有成功读取任何文件，请检查文件路径和过滤条件。")
        return pd.DataFrame()  # 返回空的DataFrame
    else:
        # 合并所有DataFrame
        df_kpi = pd.concat(dfs, ignore_index=True)
        
        # 删除重复行
        df_kpi = df_kpi.drop_duplicates()

        # 处理日期列
        date_columns = ['开始时间', '结束时间']
        for column_date in date_columns:
            df_kpi[column_date] = df_kpi[column_date].astype(str).str.split().str[0]
            df_kpi[column_date] = pd.to_datetime(df_kpi[column_date], errors='coerce')
            df_kpi[column_date] = df_kpi[column_date].dt.strftime('%Y-%m-%d')

        # 拆分字符串列
        df_kpi[["小区名称", "Other"]] = df_kpi["对象"].str.split('\(g', n=1, expand=True)
        df_kpi[["NB", "nrCellCfg"]] = df_kpi["Other"].str.split(',', n=1, expand=True)
        df_kpi["NB"] = df_kpi["NB"].str.lstrip('NB=')
        df_kpi["nrCellCfg"] = df_kpi["nrCellCfg"].str.lstrip('nrCellCfg=').str.rstrip(')')
        df_kpi.drop(columns=["对象", "Other"], inplace=True)

        # 获取列的总数
        num_columns = len(df_kpi.columns)

        # 创建新的列顺序：最后三列 + 所有其他列（除去最后三列）
        new_order = df_kpi.columns[-3:].tolist() + df_kpi.columns[:-3].tolist()

        # 重新索引以更改列顺序
        df_kpi = df_kpi[new_order]

        # 转换特定列的数据类型
        int_columns = df_kpi.loc[:, 'gNB请求释放的5QI为1的Flow数(R2035_003)[个]':'gNBRRC连接建立成功次数-moVideoCall(R1001_019)[次]'].columns
        for col in int_columns:
            df_kpi[col] = pd.to_numeric(df_kpi[col], errors='coerce').fillna(0).astype(float).astype(int)

        float_columns = ['5QI为1的平均Flow数(K1009_001)[个]', '5QI为2的平均Flow数(K1009_002)[个]']
        for col in float_columns:
            df_kpi[col] = pd.to_numeric(df_kpi[col], errors='coerce').fillna(0).round(2)

        # 删除 '小区名称' 列
        df_kpi = df_kpi.drop(columns=['小区名称'])

        # 单位从0.01KB改为KB
        df_kpi['小区用户面RLC SDU上行尾包字节数(R1501_005)[0.01KByte]'] = df_kpi['小区用户面RLC SDU上行尾包字节数(R1501_005)[0.01KByte]'] / 100
        df_kpi['小区用户面RLC SDU下行尾包字节数(R1501_006)[0.01KByte]'] = df_kpi['小区用户面RLC SDU下行尾包字节数(R1501_006)[0.01KByte]'] / 100

        # 定义函数来提取括号中的内容
        def extract_code(column_name):
            match = re.search(r'\((.*?)\)', column_name)
            if match:
                return match.group(1)
            return column_name

        # 替换 DataFrame 的列名
        df_kpi.columns = df_kpi.columns.to_series().apply(extract_code)

        return df_kpi

# 使用示例
KPIDir = r'C:\Users\zhuak\Desktop\Geography\MobileData'
df_KPI = read_and_process_kpi_files(KPIDir)

# 显示前10行数据
if not df_KPI.empty:
    print(df_KPI.head(10))
else:
    print("没有数据可显示。")

# 使用示例
KPIDir = r'C:\Users\zhuak\Desktop\Geography\MobileData'
df_KPI = read_and_process_kpi_files(KPIDir)

# 显示前10行数据
if not df_KPI.empty:
    print(df_KPI.head(10))
else:
    print("没有数据可显示。")

目录中的所有文件: ['1one.csv', '700MNR小区(3100600).csv', '700M射频单元规划(3000322).csv', 'df_KPI_utf8.csv', 'DT_BBU功耗_FDD_20240904000000_20240911000000.CSV', 'DT_BBU功耗_TDD_20240904000000_20240911000000.CSV', 'DT_PowerBI指标通报计数器_FDD_20240904000000_20240911000000.CSV', 'DT_PowerBI指标通报计数器_TDD_20240904000000_20240911000000.CSV', 'DT_RRU功耗_FDD_20240904000000_20240911000000.CSV', 'DT_RRU功耗_TDD_20240904000000_20240911000000.CSV', 'FDD天线安装规划(3000323).csv', 'TDDNR小区(3100600).csv', 'TDD天线安装规划(3000323).csv', 'TDD射频单元规划(3000322).csv']
过滤出的文件: ['DT_PowerBI指标通报计数器_FDD_20240904000000_20240911000000.CSV', 'DT_PowerBI指标通报计数器_TDD_20240904000000_20240911000000.CSV']
正在读取文件: C:\Users\zhuak\Desktop\Geography\MobileData\DT_PowerBI指标通报计数器_FDD_20240904000000_20240911000000.CSV
成功读取文件: C:\Users\zhuak\Desktop\Geography\MobileData\DT_PowerBI指标通报计数器_FDD_20240904000000_20240911000000.CSV
正在读取文件: C:\Users\zhuak\Desktop\Geography\MobileData\DT_PowerBI指标通报计数器_TDD_20240904000000_20240911000000.CSV
成功读取文件: C:\Users\zhuak\Desktop\Geog

In [7]:
df_KPI.head(10)

Unnamed: 0,NB,nrCellCfg,开始时间,结束时间,Nr小区工作频段,MHz,逻辑小区id,R2035_003,R2035_013,R2035_026,...,R1001_001,R1001_004,R1001_007,R1001_008,R1001_012,R1001_015,R1001_018,R1001_019,K1009_001,K1009_002
0,6299318,1,2024-09-04,2024-09-05,band28(758~803MHz)(28),30(5),1.0,1,1,46,...,9884,2432,98,0,9848,2428,98,0,7.47,0.21
1,6299318,1,2024-09-05,2024-09-06,band28(758~803MHz)(28),30(5),1.0,2,2,61,...,9702,2508,100,0,9668,2505,100,0,5.65,0.36
2,6299318,1,2024-09-06,2024-09-07,band28(758~803MHz)(28),30(5),1.0,3,3,74,...,14232,3982,125,0,14185,3978,125,0,8.54,0.32
3,6299318,1,2024-09-07,2024-09-08,band28(758~803MHz)(28),30(5),1.0,5,5,131,...,17243,4610,137,0,17172,4600,136,0,11.19,0.6
4,6299318,1,2024-09-08,2024-09-09,band28(758~803MHz)(28),30(5),1.0,2,2,53,...,13964,4258,125,0,13883,4248,124,0,6.63,0.36
5,6299318,1,2024-09-09,2024-09-10,band28(758~803MHz)(28),30(5),1.0,5,4,63,...,10206,2876,84,0,10166,2867,84,0,3.54,0.2
6,6299318,1,2024-09-10,2024-09-11,band28(758~803MHz)(28),30(5),1.0,3,3,63,...,13395,3690,102,0,13332,3681,102,0,4.52,0.3
7,6299318,2,2024-09-04,2024-09-05,band28(758~803MHz)(28),30(5),2.0,10,10,179,...,24187,4855,187,0,24102,4845,186,0,15.42,0.56
8,6299318,2,2024-09-05,2024-09-06,band28(758~803MHz)(28),30(5),2.0,13,13,210,...,26347,6148,213,0,26267,6141,213,0,14.45,0.69
9,6299318,2,2024-09-06,2024-09-07,band28(758~803MHz)(28),30(5),2.0,7,7,227,...,28881,6504,229,0,28773,6495,228,0,17.0,0.8


# transport NAS MariaDB

In [25]:
import os
import pandas as pd
import re
from sqlalchemy import create_engine, text, Table, Column, MetaData, String, Integer, Float, Date
from sqlalchemy.exc import SQLAlchemyError
from sqlalchemy.pool import QueuePool
import time

# 数据库连接信息
DB_USER = 'root'
DB_PASSWORD = 'root1234'
DB_HOST = '27.16.178.213'
DB_PORT = 3306
DB_NAME = 'NewDBone'
TABLE_NAME = 'NetworkPerformance'

def create_db_engine(user, password, host, port, db_name=None, charset='utf8mb4'):
    """
    创建数据库引擎
    """
    if db_name:
        connection_string = f"mysql+pymysql://{user}:{password}@{host}:{port}/{db_name}?charset={charset}"
    else:
        connection_string = f"mysql+pymysql://{user}:{password}@{host}:{port}?charset={charset}"
    
    return create_engine(connection_string, poolclass=QueuePool, pool_size=5, max_overflow=10, pool_timeout=30, pool_recycle=3600)

def create_database(engine, db_name):
    """
    创建数据库（如果不存在）
    """
    with engine.connect() as connection:
        try:
            connection.execute(text(f"CREATE DATABASE IF NOT EXISTS {db_name} CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci"))
            print(f"Database {db_name} created or already exists.")
        except SQLAlchemyError as e:
            print(f"Error creating database: {e}")
            exit(1)

def generate_table_columns(df):
    """
    根据DataFrame生成数据表的列定义
    """
    columns = []
    for column_name, dtype in df.dtypes.items():
        if pd.api.types.is_integer_dtype(dtype):
            columns.append(Column(column_name, Integer))
        elif pd.api.types.is_float_dtype(dtype):
            columns.append(Column(column_name, Float))
        elif pd.api.types.is_datetime64_any_dtype(dtype):
            columns.append(Column(column_name, Date))
        else:
            columns.append(Column(column_name, String(255)))
    return columns

def create_table(engine, table_name, columns):
    """
    创建数据表（如果不存在）
    """
    metadata = MetaData()
    table = Table(table_name, metadata, *columns, mysql_charset='utf8mb4')
    with engine.connect() as connection:
        try:
            table.create(connection, checkfirst=True)
            print(f"Table {table_name} created or already exists.")
        except SQLAlchemyError as e:
            print(f"Error creating table: {e}")
            exit(1)
    return table

def upload_data_to_table(df, table_name, engine, columns):
    """
    上传数据到数据表
    """
    try:
        df.to_sql(table_name, con=engine, if_exists='append', index=False, dtype={col.name: col.type for col in columns})
        print(f"Data uploaded successfully to table {table_name} in database {DB_NAME}.")
    except SQLAlchemyError as e:
        print(f"Error uploading data: {e}")
        exit(1)

# 创建数据库引擎（不指定数据库）
engine = create_db_engine(DB_USER, DB_PASSWORD, DB_HOST, DB_PORT)

# 创建数据库（如果不存在）
create_database(engine, DB_NAME)

# 使用新创建的数据库
engine = create_db_engine(DB_USER, DB_PASSWORD, DB_HOST, DB_PORT, DB_NAME)

# 自动生成数据表的列定义
columns = generate_table_columns(df_KPI)

# 创建数据表（如果不存在）
table = create_table(engine, TABLE_NAME, columns)

# 上传数据到数据表
upload_data_to_table(df_KPI, TABLE_NAME, engine, columns)

Database NewDBone created or already exists.
Table NetworkPerformance created or already exists.
Data uploaded successfully to table NetworkPerformance in database NewDBone.


In [29]:
import pandas as pd
# 定义保存路径和文件名
GosDir = r'C:\Users\zhuak\Desktop\Geography'
file_name = 'gdf_RAC.xlsx'
file_path = os.path.join(GosDir, file_name)

# 保存为 Excel 文件
gdf_RAC.to_excel(file_path, index=False)
gdf_RAC.head()

Unnamed: 0,网元标识,小区本地ID,小区友好名,Longitude,Latitude,省份,地市,县区,镇区,村区
0,6334965,0,房县小草咖啡1-D5H-2611,110.744614,32.068618,湖北省,十堰市,房县,城关镇,北关社区
1,6334965,1,房县小草咖啡1-D5H-2612,110.744614,32.068618,湖北省,十堰市,房县,城关镇,北关社区
574,6334987,1,房县小草咖啡2-D5H-2612,110.744426,32.065918,湖北省,十堰市,房县,城关镇,北关社区
575,6334987,0,房县小草咖啡2-D5H-2611,110.744426,32.065918,湖北省,十堰市,房县,城关镇,北关社区
3876,6337299,3,房县滨河花园-D5H-2611,110.743071,32.062452,湖北省,十堰市,房县,城关镇,北关社区
