# Antenna Planning

In [7]:
import os
import pandas as pd

def read_antenna_planning_files(directory):
    """
    读取指定目录中的天线安装规划文件，并规整列名，检查和删除重复行。

    参数:
    directory (str): 包含天线安装规划文件的目录路径。

    返回值:
    pd.DataFrame: 合并后的DataFrame，包含规整后的列名，并删除重复行。
    """
    # 列出目录中的所有文件
    files = os.listdir(directory)

    # 过滤出文件名包含“天线安装规划”关键字的CSV文件
    antenna_files = [file for file in files if '天线安装规划' in file and file.endswith('.csv')]

    # 定义要读取的列
    columns_to_read = ['网元标识', '远端射频单元编号', '本地小区标识1']

    # 初始化一个空的DataFrame列表
    dfs = []

    # 读取每个CSV文件并添加到DataFrame列表中
    for file in antenna_files:
        file_path = os.path.join(directory, file)
        df = pd.read_csv(file_path, encoding='gbk', usecols=columns_to_read)  # 根据需要调整编码格式
        dfs.append(df)

    # 合并所有DataFrame
    combined_df = pd.concat(dfs, ignore_index=True)

    # 删除重复数据
    combined_df = combined_df.drop_duplicates()

    # 重命名列
    combined_df.columns = ['网元标识', '射频单元编号', '小区本地ID']

    # 检查和删除重复行
    initial_row_count = combined_df.shape[0]
    combined_df = combined_df.drop_duplicates()
    final_row_count = combined_df.shape[0]

    if initial_row_count != final_row_count:
        print(f"Removed {initial_row_count - final_row_count} duplicate rows.")

    return combined_df

# 使用示例
Datadir = r'C:\Users\zhuak\Desktop\Geography\MobileData'
df_AP = read_antenna_planning_files(Datadir)

# 显示前10行数据
print(df_AP.head(10))

       网元标识  射频单元编号  小区本地ID
0   6355826       2       6
4   6355826       3       1
8   6355826       0       4
12  6355826       5       3
16  6355826       1       5
20  6355826       4       2
24  6311444       1       2
28  6311444       0       1
32  6311444       2       3
36  6355609       2       3


# Radio Frequency Planning

In [8]:
import os
import pandas as pd

def read_rf_planning_files(directory):
    """
    读取指定目录中的射频单元规划文件，并规整列名，检查和删除重复行。

    参数:
    directory (str): 包含射频单元规划文件的目录路径。

    返回值:
    pd.DataFrame: 合并后的DataFrame，包含规整后的列名，并删除重复行。
    """
    # 列出目录中的所有文件
    files = os.listdir(directory)

    # 过滤出文件名包含“射频单元规划”关键字的CSV文件
    rf_files = [file for file in files if '射频单元规划' in file and file.endswith('.csv')]

    # 定义要读取的列
    columns_to_read = ['网元标识', '射频单元编号', '射频单元RRU安装经度', '射频单元RRU安装纬度']

    # 初始化一个空的DataFrame列表
    dfs = []

    # 读取每个CSV文件并添加到DataFrame列表中
    for file in rf_files:
        file_path = os.path.join(directory, file)
        df = pd.read_csv(file_path, encoding='gbk', usecols=columns_to_read)  # 根据需要调整编码格式
        dfs.append(df)

    # 合并所有DataFrame
    combined_df = pd.concat(dfs, ignore_index=True)

    # 删除重复数据
    combined_df = combined_df.drop_duplicates()

    # 重命名列
    combined_df.columns = ['网元标识', '射频单元编号', 'Longitude', 'Latitude']

    # 检查和删除重复行
    initial_row_count = combined_df.shape[0]
    combined_df = combined_df.drop_duplicates()
    final_row_count = combined_df.shape[0]

    if initial_row_count != final_row_count:
        print(f"Removed {initial_row_count - final_row_count} duplicate rows.")

    return combined_df

# 使用示例
Datadir = r'C:\Users\zhuak\Desktop\Geography\MobileData'
df_RF = read_rf_planning_files(Datadir)

# 显示前10行数据
print(df_RF.head(10))

      网元标识  射频单元编号   Longitude   Latitude
0  6334965       2  110.744614  32.068618
1  6334965       1  110.744614  32.068618
2  6334965       0  110.744614  32.068618
3  6337302       5  110.739594  32.053898
4  6337302       3  110.739594  32.053898
5  6337302       4  110.739594  32.053898
6  6337302       1  110.739594  32.053898
7  6337302       2  110.739594  32.053898
8  6337302       0  110.739594  32.053898
9  6337436       0  111.484500  32.541830


# Cell parameters

In [9]:
import os
import pandas as pd

def read_cell_planning_files(directory):
    """
    读取指定目录中的小区规划文件，并规整列名，检查和删除重复行。

    参数:
    directory (str): 包含小区规划文件的目录路径。

    返回值:
    pd.DataFrame: 合并后的DataFrame，包含规整后的列名，并删除重复行。
    """
    # 列出目录中的所有文件
    files = os.listdir(directory)

    # 过滤出文件名包含“NR小区”关键字的CSV文件
    cell_files = [file for file in files if 'NR小区' in file and file.endswith('.csv')]

    # 定义要读取的列
    columns_to_read = ['网元标识', '小区本地ID', '小区友好名']

    # 初始化一个空的DataFrame列表
    dfs = []

    # 读取每个CSV文件并添加到DataFrame列表中
    for file in cell_files:
        file_path = os.path.join(directory, file)
        df = pd.read_csv(file_path, encoding='gbk', usecols=columns_to_read)  # 根据需要调整编码格式
        dfs.append(df)

    # 合并所有DataFrame
    combined_df = pd.concat(dfs, ignore_index=True)

    # 删除重复数据
    combined_df = combined_df.drop_duplicates()

    # 重命名列
    combined_df.columns = ['网元标识', '小区本地ID', '小区友好名']

    # 检查和删除重复行
    initial_row_count = combined_df.shape[0]
    combined_df = combined_df.drop_duplicates()
    final_row_count = combined_df.shape[0]

    if initial_row_count != final_row_count:
        print(f"Removed {initial_row_count - final_row_count} duplicate rows.")

    return combined_df

# 使用示例
Datadir = r'C:\Users\zhuak\Desktop\Geography\MobileData'
df_CP = read_cell_planning_files(Datadir)

# 显示前10行数据
print(df_CP.head(10))

      网元标识  小区本地ID              小区友好名
0  6334808       0    丹江农机驾校-D5H-2611
1  6334808       5  丹江丹赵路郑家湾-D5H-2613
2  6334808       4  丹江丹赵路郑家湾-D5H-2612
3  6334808       3  丹江丹赵路郑家湾-D5H-2611
4  6334936       0   房县解湾村委会-D5H-2611
5  6334936       1   房县解湾村委会-D5H-2612
6  6311642       3      通城灿良-D5H-2613
7  6311642       2      通城灿良-D5H-2612
8  6335023       2     林区小当阳-D5H-2613
9  6334892       7    房县熊家凹2-D5H-2612


# Read HuBei MAP

In [10]:
import os
import pandas as pd
import geopandas as gpd

def read_hubei_map_files(directory, filename):
    """
    读取指定目录中的湖北Map文件。

    参数:
    directory (str): 包含湖北Map文件的目录路径。
    filename (str): 湖北Map文件的文件名。

    返回值:
    gpd.GeoDataFrame: 读取的GeoDataFrame。
    """
    # 构建文件路径
    file_path = os.path.join(directory, filename)

    # 读取GeoJSON文件
    gdf = gpd.read_file(file_path)

    return gdf

# 使用示例
GosDir = r'C:\Users\zhuak\Desktop\Geography'
gdffile = '湖北省村级边界.geojson'
gdf = read_hubei_map_files(GosDir, gdffile)

# 显示前10行数据
print(gdf.head(10))

   OBJECTID SJGZQYMC DSJGZQYMC QXJGZQYMC XZJGZQYMC CJGZQYMC  SHAPE_AREA  \
0     576.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇     杨柘坪村    0.001183   
1     577.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇     龙潭坪村    0.001642   
2     578.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇     立志坪村    0.002743   
3     579.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇     雪山河村    0.003297   
4     580.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇     杜家冲村    0.001725   
5     581.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇     五尖山村    0.001821   
6     582.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇      麻池村    0.002221   
7     583.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇      西湾村    0.000692   
8     584.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇      重溪村    0.001702   
9     585.0      湖北省       宜昌市  长阳土家族自治县      都镇湾镇     朱栗山村    0.001061   

   SHAPE_LEN                                           geometry  
0   0.240019  MULTIPOLYGON (((110.99976 30.33573, 110.99901 ...  
1   0.260185  MULTIPOLYGON (((110.92990 30

# File Integration

In [11]:
import pandas as pd
import geopandas as gpd
from shapely.geometry import Point

def process_rf_ap_cp(df_ap, df_rf, df_cp, gdf):
    """
    合并天线规划数据、射频单元规划数据和小区规划数据，并与地理数据进行空间连接。

    参数:
    df_ap (pd.DataFrame): 天线规划数据。
    df_rf (pd.DataFrame): 射频单元规划数据。
    df_cp (pd.DataFrame): 小区规划数据。
    gdf (gpd.GeoDataFrame): 地理数据。

    返回值:
    gpd.GeoDataFrame: 合并后的GeoDataFrame，包含规整后的列名。
    """
    # 合并天线规划数据和射频单元规划数据
    df_rfap = pd.merge(df_ap, df_rf, how='inner', 
                       left_on=['网元标识', '射频单元编号'],
                       right_on=['网元标识', '射频单元编号'],
                       suffixes=('_df_AP', '_df_RF'))

    # 选择并重命名列
    df_rfap = df_rfap[['网元标识', '小区本地ID', '射频单元编号', 'Longitude', 'Latitude']]

    # 合并射频单元规划数据和小区规划数据
    df_rac = pd.merge(df_rfap, df_cp, how='inner', 
                      left_on=['网元标识', '小区本地ID'],
                      right_on=['网元标识', '小区本地ID'],
                      suffixes=('_df_RFAP', '_df_CP'))

    # 选择并重命名列
    df_rac = df_rac[['网元标识', '小区本地ID', '小区友好名', 'Longitude', 'Latitude']]

    # 创建几何图形列表（点）
    geometry = [Point(xy) for xy in zip(df_rac['Longitude'], df_rac['Latitude'])]

    # 将 pandas DataFrame 转换为 GeoDataFrame
    df_rac = gpd.GeoDataFrame(df_rac, geometry=geometry)

    # 设置 CRS
    if df_rac.crs is None:
        df_rac = df_rac.set_crs(gdf.crs)

    # 空间连接
    gdf_rac = gpd.sjoin(df_rac, gdf, how='inner', predicate='within')

    # 选择并重命名列
    gdf_rac = gdf_rac[['网元标识', '小区本地ID', '小区友好名', 'Longitude', 'Latitude', 'SJGZQYMC', 'DSJGZQYMC', 'QXJGZQYMC', 'XZJGZQYMC', 'CJGZQYMC']].rename(
        columns={'SJGZQYMC': '省份', 'DSJGZQYMC': '地市', 'QXJGZQYMC': '县区', 'XZJGZQYMC': '镇区', 'CJGZQYMC': '村区'}
    )

    return gdf_rac

# 使用示例

gdf_RAC = process_rf_ap_cp(df_AP, df_RF, df_CP, gdf)

# 显示结果
print(gdf_RAC.head(10))

         网元标识  小区本地ID                小区友好名   Longitude   Latitude   省份   地市  \
0     6334965       0     房县小草咖啡1-D5H-2611  110.744614  32.068618  湖北省  十堰市   
1     6334965       1     房县小草咖啡1-D5H-2612  110.744614  32.068618  湖北省  十堰市   
574   6334987       1     房县小草咖啡2-D5H-2612  110.744426  32.065918  湖北省  十堰市   
575   6334987       0     房县小草咖啡2-D5H-2611  110.744426  32.065918  湖北省  十堰市   
3876  6337299       3      房县滨河花园-D5H-2611  110.743071  32.062452  湖北省  十堰市   
3877  6337299       4      房县滨河花园-D5H-2612  110.743071  32.062452  湖北省  十堰市   
2     6337302       0       房县劳动局-D5H-2611  110.739594  32.053898  湖北省  十堰市   
3     6337302       5  房县联关(凤凰山路)-D5H-2613  110.739594  32.053898  湖北省  十堰市   
4     6337302       3  房县联关(凤凰山路)-D5H-2611  110.739594  32.053898  湖北省  十堰市   
5     6337302       4  房县联关(凤凰山路)-D5H-2612  110.739594  32.053898  湖北省  十堰市   

      县区   镇区    村区  
0     房县  城关镇  北关社区  
1     房县  城关镇  北关社区  
574   房县  城关镇  北关社区  
575   房县  城关镇  北关社区  
3876  房县  城关镇  北关社区 