In [1]:
import pandas as pd
import os

# 데이터 디렉토리 경로 설정
base_dir = './전국중독관리센터/'

# 파일 로드 함수
def load_csv(filename, encoding=None):
    try:
        filepath = os.path.join(base_dir, filename)
        if encoding:
            return pd.read_csv(filepath, encoding=encoding)
        else:
            # 인코딩 자동 감지 시도
            try:
                return pd.read_csv(filepath)
            except UnicodeDecodeError:
                # UTF-8 실패시 CP949 시도
                return pd.read_csv(filepath, encoding='cp949')
    except Exception as e:
        print(f"파일 로드 중 오류가 발생했습니다 ({filename}): {str(e)}")
        return None


# 데이터프레임을 저장할 딕셔너리
dfs = {}

# 파일 목록
files = [
    ('df1', '1.강원_중독관리센터_목록.csv'),
    ('df2', '2.경남_중독관리센터_목록.csv'),
    ('df3', '3.경북_중독관리센터_목록.csv'),
    ('df4', '4.경상남도_중독관리통합지원센터_20221231.csv', 'cp949'),
    ('df5', '5.광주광역시_중독관리센터 현황_20241029.csv', 'cp949'),
    ('df6', '6.대구광역시_정신건강복지센터 현황_20241112.csv', 'cp949'),
    ('df7', '7.대전광역시_대전광역시 중독관리통합지원센터_20210617.csv', 'cp949'),
    ('df8', '8.부산_중독관리센터_목록.csv'),
    ('df9', '9.서울_중독관리센터_목록.csv'),
    ('df10', '10.울산_중독관리센터_목록.csv'),
    ('df11', '11.인천광역시_중독관리센터 현황_20240919.csv', 'cp949'),
    ('df12', '12.전남_중독관리센터_목록.csv'),
    ('df13', '13.전북_중독관리센터_목록.csv'),
    ('df14', '14.제주_중독관리센터_목록_업데이트.csv'),
    ('df15', '15.경기_중독관리통합지원센터현황.csv', 'cp949'),
    ('df16', '16.충남_중독관리센터_목록.csv'),
    ('df17', '17.충북_중독관리센터_목록_업데이트.csv')
]

# 모든 파일 로드 - 딕셔너리와 변수 둘 다에 저장
for file_info in files:
    if len(file_info) == 2:
        df_name, filename = file_info
        loaded_df = load_csv(filename)
        dfs[df_name] = loaded_df
        # 전역 변수로 설정
        globals()[df_name] = loaded_df
    else:
        df_name, filename, encoding = file_info
        loaded_df = load_csv(filename, encoding)
        dfs[df_name] = loaded_df
        # 전역 변수로 설정
        globals()[df_name] = loaded_df

# 로드된 데이터프레임 확인
successful_loads = 0
for df_name, df in dfs.items():
    if df is not None:
        print(f"{df_name} 로드 성공: {df.shape}")
        successful_loads += 1
    else:
        print(f"{df_name} 로드 실패")

print(f"\n총 {len(files)}개 중 {successful_loads}개 파일 로드 성공")

df1 로드 성공: (3, 7)
df2 로드 성공: (6, 7)
df3 로드 성공: (3, 7)
df4 로드 성공: (6, 4)
df5 로드 성공: (5, 9)
df6 로드 성공: (12, 4)
df7 로드 성공: (3, 8)
df8 로드 성공: (4, 7)
df9 로드 성공: (3, 7)
df10 로드 성공: (2, 7)
df11 로드 성공: (5, 4)
df12 로드 성공: (2, 7)
df13 로드 성공: (4, 7)
df14 로드 성공: (3, 7)
df15 로드 성공: (10, 9)
df16 로드 성공: (2, 7)
df17 로드 성공: (2, 7)

총 17개 중 17개 파일 로드 성공


In [2]:
df1=df1.drop(columns=['팩스','이메일'])
df1=df1.rename(columns={'전화':'전화번호'})
df2=df2.drop(columns=['팩스','이메일'])
df2=df2.rename(columns={'전화':'전화번호'})
df3=df3.drop(columns=['팩스','이메일'])
df3=df3.rename(columns={'전화':'전화번호'})
df4.head()
df4=df4.drop(columns=['연번'])
df4=df4.rename(columns={'기 관 명':'센터명','주 소':'소재지'})
df4['시도명']='경남'
df5=df5.drop(columns=['연번','운영형태','운영주체','센터장','근무인력','데이터기준일자'])
df5=df5.rename(columns={'자치구(센터명)':'센터명','소재지도로명주소':'소재지','전화번호':'전화번호'})
df5['시도명']='광주광역시'
df6=df6.drop(columns=['구명'])
df6['시도명']='대구광역시'
df6=df6.rename(columns={'상호명':'센터명','주소':'소재지','연락처':'전화번호'})
df7=df7.drop(columns=['연번','센터장','수탁기관','설치','종사자 수'])
df7=df7.rename(columns={'명칭':'센터명'})
df7['시도명']='대구광역시'
df8=df8.drop(columns=['이메일','팩스'])
df8=df8.rename(columns={'전화':'전화번호'})
df9=df9.drop(columns=['이메일','팩스'])
df9=df9.rename(columns={'전화':'전화번호'})
df10=df10.drop(columns=['이메일','팩스'])
df10=df10.rename(columns={'전화':'전화번호'})
df11=df11.drop(columns=['연번'])
df11=df11.rename(columns={'시설명':'센터명'})
df11['시도명']='인천광역시'
df12=df12.drop(columns=['이메일','팩스'])
df12=df12.rename(columns={'전화':'전화번호'})
df13=df13.drop(columns=['이메일','팩스'])
df13=df13.rename(columns={'전화':'전화번호'})
df14=df14.drop(columns=['이메일','팩스'])
df14=df14.rename(columns={'전화':'전화번호'})
df15=df15.drop(columns=['소재지우편번호','소재지지번주소','시군명'])
df15=df15.rename(columns={'홈페이지주소':'홈페이지','전화':'전화번호','소재지도로명주소':'소재지','WGS84위도':'위도','WGS84경도':'경도'})
df15['시도명']='경기도'
df16=df16.drop(columns=['팩스','이메일'])
df16=df16.rename(columns={'전화':'전화번호'})
df17=df17.drop(columns=['팩스','이메일'])
df17=df17.rename(columns={'전화':'전화번호'})

In [3]:
# 데이터프레임 리스트 만들기
dfs = [df1, df2, df3, df5, df6, df7, df8, df9, df10, df11, df12, df13, df14, df15, df16, df17]
# 행 기준으로 합치기 (아래로 쌓기)
data = pd.concat(dfs, axis=0, ignore_index=True)
data.head(10)
data.shape

(69, 7)

In [4]:
# output 디렉토리가 없으면 생성
if not os.path.exists('output'):
    os.makedirs('output')
    print("'output' 디렉토리가 생성되었습니다.")

# 이제 파일 저장
data.to_csv('output/전국중독관리센터_목록.csv', index=False)
data=pd.read_csv('output/전국중독관리센터_목록.csv')

In [5]:
data.head()

Unnamed: 0,시도명,센터명,소재지,전화번호,홈페이지,위도,경도
0,강원,강릉중독관리통합지원센터,강릉시 경강로 2279 강맥빌딩 A동 2층,033-653-9668,,,
1,강원,원주시중독관리통합지원센터,원주시 원일로 139 원주건강문화센터 지하 1층,033-748-5119,http://alja.yonsei.ac.kr,,
2,강원,춘천중독관리통합지원센터,춘천시 삭주로 84 수인빌딩 3층,033-255-3482,www.alcoholfree.or.kr,,
3,경남,경남광역중독관리통합지원센터,경남 창원시 의창구 동읍 동읍로 457번길 48 (경남사회복지센터),055-239-1400,https://www.gnmhc.or.kr/sub02/sub03_01.php,,
4,경남,김해중독관리통합지원센터,"경남 김해시 주촌면 주선로 29-1, 건강생활지원센터 1층",055-314-0317,http://www.ghacc.co.kr,,


In [6]:
import pandas as pd
import requests
import time
import urllib.parse
import re
import os  # 경로 처리를 위한 모듈 추가

# 상대 경로로 API 키 파일 읽어오기
# 현재 작업 디렉토리 기준으로 상대 경로 지정
api_key_path = 'map_key.txt'  # 현재 디렉토리에 있는 경우

try:
    with open(api_key_path, 'r') as f:
        api_key = f.read().strip()  # 공백과 줄바꿈 제거
    print(f"API 키를 성공적으로 불러왔습니다.")
except FileNotFoundError:
    print(f"파일을 찾을 수 없습니다: {api_key_path}")
    print(f"현재 작업 디렉토리: {os.getcwd()}")
    api_key = ''  # 빈 API 키 설정

# 위도, 경도를 추출하는 함수
def get_coordinates_kakao(address):
    url = 'https://dapi.kakao.com/v2/local/search/address.json'
    
    headers = {
        'Authorization': f'KakaoAK {api_key}'
    }
    
    # 우편번호 제거
    cleaned_address = re.sub(r'\(우\)\d+\s+', '', address)
    
    # 첫 번째 시도: 원래 주소로 검색
    params = {
        'query': cleaned_address
    }
    
    try:
        response = requests.get(url, headers=headers, params=params)
        response.raise_for_status()
        result = response.json()
        
        if result['documents']:
            latitude = float(result['documents'][0]['y'])
            longitude = float(result['documents'][0]['x'])
            return latitude, longitude
        
        # 두 번째 시도: 쉼표(,) 이후의 상세 정보 제거
        simplified_address = cleaned_address.split(',')[0]
        params = {'query': simplified_address}
        
        response = requests.get(url, headers=headers, params=params)
        result = response.json()
        
        if result['documents']:
            latitude = float(result['documents'][0]['y'])
            longitude = float(result['documents'][0]['x'])
            print(f"쉼표 제거 후 찾음: {simplified_address}")
            return latitude, longitude
        
        # 세 번째 시도: 괄호와 그 안의 내용 제거 (동명 등)
        no_brackets_address = re.sub(r'\([^)]*\)', '', simplified_address).strip()
        if no_brackets_address != simplified_address:
            params = {'query': no_brackets_address}
            response = requests.get(url, headers=headers, params=params)
            result = response.json()
            
            if result['documents']:
                latitude = float(result['documents'][0]['y'])
                longitude = float(result['documents'][0]['x'])
                print(f"괄호 제거 후 찾음: {no_brackets_address}")
                return latitude, longitude
        
        # 네 번째 시도: 도로명 주소의 '번길' 형식 수정 시도
        if '번길' in no_brackets_address:
            # 도로명+번호만 추출해서 검색
            road_parts = re.search(r'(.+로|.+길)\s*\d+', no_brackets_address)
            if road_parts:
                road_address = road_parts.group(0)
                params = {'query': road_address}
                response = requests.get(url, headers=headers, params=params)
                result = response.json()
                
                if result['documents']:
                    latitude = float(result['documents'][0]['y'])
                    longitude = float(result['documents'][0]['x'])
                    print(f"도로명 주소 수정 후 찾음: {road_address}")
                    return latitude, longitude
        
        # 오타 수정 시도 (예: '소광주광역시' -> '광주광역시')
        if '소광주광역시' in address:
            corrected_address = address.replace('소광주광역시', '광주광역시')
            return get_coordinates_kakao(corrected_address)  # 재귀적으로 다시 시도
            
        print(f"주소를 찾을 수 없습니다: {address}")
        return None, None
    
    except Exception as e:
        print(f"에러 발생: {e} (주소: {cleaned_address})")
        return None, None

# 데이터가 존재하는 경우에만 실행
if not data.empty and '소재지' in data.columns:
    # 데이터프레임의 각 주소에 대해 위도, 경도 추출
    for idx, row in data.iterrows():
        address = row['소재지']
        latitude, longitude = get_coordinates_kakao(address)
        
        # 위도, 경도 업데이트
        data.at[idx, '위도'] = latitude
        data.at[idx, '경도'] = longitude
        
        # API 호출 제한을 고려한 딜레이
        time.sleep(0.5)  # 카카오 API 사용 정책에 맞게 조정 필요
    
    print("위치 정보 추출 완료")
    # 결과 확인
    print(data.head())
    
    # 결과를 CSV 파일로 저장하려면 아래 주석을 해제하세요
    # data.to_csv('geocoded_data.csv', index=False)
else:
    print("데이터가 비어있거나 '소재지' 열이 없습니다.")

API 키를 성공적으로 불러왔습니다.
주소를 찾을 수 없습니다: 경남 창원시 성산구 중앙대로 162번길 8, 4층
쉼표 제거 후 찾음: 대구광역시 북구 침산남로9길 27
위치 정보 추출 완료
  시도명             센터명                                    소재지          전화번호  \
0  강원    강릉중독관리통합지원센터                강릉시 경강로 2279 강맥빌딩 A동 2층  033-653-9668   
1  강원   원주시중독관리통합지원센터             원주시 원일로 139 원주건강문화센터 지하 1층  033-748-5119   
2  강원    춘천중독관리통합지원센터                     춘천시 삭주로 84 수인빌딩 3층  033-255-3482   
3  경남  경남광역중독관리통합지원센터  경남 창원시 의창구 동읍 동읍로 457번길 48 (경남사회복지센터)  055-239-1400   
4  경남    김해중독관리통합지원센터       경남 김해시 주촌면 주선로 29-1, 건강생활지원센터 1층  055-314-0317   

                                         홈페이지         위도          경도  
0                                         NaN  37.766694  128.910995  
1                    http://alja.yonsei.ac.kr  37.351550  127.946803  
2                       www.alcoholfree.or.kr  37.883397  127.740265  
3  https://www.gnmhc.or.kr/sub02/sub03_01.php  35.309594  128.651150  
4                      http://www.ghacc.co.kr  35.234777  128.845757 

In [7]:
data.loc[data['센터명']=='창원중독관리통합지원센터','위도']=35.2278113
data.loc[data['센터명']=='창원중독관리통합지원센터','경도']=128.6855882

In [8]:
data.isnull().sum()

시도명      0
센터명      0
소재지      0
전화번호     1
홈페이지    27
위도       0
경도       0
dtype: int64

In [9]:
data.to_csv('output/전국중독관리센터_목록.csv', index=False, encoding='utf-8-sig')

In [10]:
data.head()

Unnamed: 0,시도명,센터명,소재지,전화번호,홈페이지,위도,경도
0,강원,강릉중독관리통합지원센터,강릉시 경강로 2279 강맥빌딩 A동 2층,033-653-9668,,37.766694,128.910995
1,강원,원주시중독관리통합지원센터,원주시 원일로 139 원주건강문화센터 지하 1층,033-748-5119,http://alja.yonsei.ac.kr,37.35155,127.946803
2,강원,춘천중독관리통합지원센터,춘천시 삭주로 84 수인빌딩 3층,033-255-3482,www.alcoholfree.or.kr,37.883397,127.740265
3,경남,경남광역중독관리통합지원센터,경남 창원시 의창구 동읍 동읍로 457번길 48 (경남사회복지센터),055-239-1400,https://www.gnmhc.or.kr/sub02/sub03_01.php,35.309594,128.65115
4,경남,김해중독관리통합지원센터,"경남 김해시 주촌면 주선로 29-1, 건강생활지원센터 1층",055-314-0317,http://www.ghacc.co.kr,35.234777,128.845757


In [11]:
data2 = pd.read_csv('여성가족부_청소년쉼터 현황_20240930.csv', encoding='cp949')

In [12]:
try:
    with open(api_key_path, 'r') as f:
        KAKAO_API_KEY = f.read().strip()  # 공백과 줄바꿈 제거
    print(f"API 키를 성공적으로 불러왔습니다.")
except FileNotFoundError:
    print(f"파일을 찾을 수 없습니다: {api_key_path}")
    print(f"현재 작업 디렉토리: {os.getcwd()}")
    KAKAO_API_KEY = ""  # 빈 API 키 설정

# 헤더 설정
headers = {"Authorization": f"KakaoAK {KAKAO_API_KEY}"}

# 데이터 불러오기
try:
    data2 = pd.read_csv('여성가족부_청소년쉼터 현황_20240930.csv', encoding='cp949')
    data2 = data2.rename(columns={'시설명': '센터명', '대표전화': '전화번호', '시도': '시도명'})
    data2['시도명'] = data2['시도명'] + ' ' + data2['시군구']
    data2 = data2.drop(columns=['데이터기준일자'])
    
    # 도로명 주소와 좌표를 저장할 새 열 추가
    data2['도로명주소'] = None
    data2['위도'] = None
    data2['경도'] = None
    
    # 각 센터에 대해 카카오 지도 API로 주소 검색
    for idx, row in data2.iterrows():
        try:
            # 센터명에서 괄호와 그 안의 내용 제거 (검색용)
            center_name = re.sub(r'\([^)]*\)', '', row['센터명']).strip()
            
            # 검색 키워드 생성 (정제된 센터명 + 시도명으로 정확도 향상)
            query = f"{center_name} {row['시도명']}"
            
            # 검색 정보 출력
            print(f"검색 중: {row['센터명']} → 검색어: {query}")
            
            # 카카오 로컬 API 호출
            url = "https://dapi.kakao.com/v2/local/search/keyword.json"
            params = {"query": query}
            response = requests.get(url, headers=headers, params=params)
            
            # 응답 확인
            if response.status_code == 200:
                result = response.json()
                if result['documents']:
                    # 첫 번째 검색 결과의 도로명 주소와 좌표 저장
                    data2.at[idx, '도로명주소'] = result['documents'][0]['road_address_name']
                    data2.at[idx, '위도'] = result['documents'][0]['y']  # 위도 (y 좌표)
                    data2.at[idx, '경도'] = result['documents'][0]['x']  # 경도 (x 좌표)
                    print(f"검색 성공: {row['센터명']} -> {result['documents'][0]['road_address_name']} (위도: {result['documents'][0]['y']}, 경도: {result['documents'][0]['x']})")
                else:
                    print(f"검색 결과 없음: {row['센터명']}")
                    
                    # 두 번째 시도: 시도명 없이 센터명만으로 검색
                    query_center_only = center_name
                    print(f"  재시도: 센터명만으로 검색 -> {query_center_only}")
                    params = {"query": query_center_only}
                    response = requests.get(url, headers=headers, params=params)
                    
                    if response.status_code == 200:
                        result = response.json()
                        if result['documents']:
                            data2.at[idx, '도로명주소'] = result['documents'][0]['road_address_name']
                            data2.at[idx, '위도'] = result['documents'][0]['y']
                            data2.at[idx, '경도'] = result['documents'][0]['x']
                            print(f"  재검색 성공: {row['센터명']} -> {result['documents'][0]['road_address_name']}")
                        else:
                            print(f"  재검색 결과 없음: {row['센터명']}")
            else:
                print(f"API 호출 실패: {response.status_code} - {row['센터명']}")
            
            # API 호출 제한을 피하기 위한 대기 (초당 최대 요청 수 제한 때문)
            time.sleep(0.5)
            
        except Exception as e:
            print(f"오류 발생: {row['센터명']} - {str(e)}")

    # 결과 확인
    print(data2.head())
    
    # 결과를 CSV 파일로 저장 (필요시 주석 해제)
    # data2.to_csv('청소년쉼터_위치정보.csv', index=False, encoding='utf-8-sig')
    
except Exception as e:
    print(f"데이터 로드 중 오류 발생: {str(e)}")

API 키를 성공적으로 불러왔습니다.
검색 중: 서울시립일시청소년쉼터(이동형, 서북) → 검색어: 서울시립일시청소년쉼터 서울 종로구
검색 결과 없음: 서울시립일시청소년쉼터(이동형, 서북)
  재시도: 센터명만으로 검색 -> 서울시립일시청소년쉼터
  재검색 성공: 서울시립일시청소년쉼터(이동형, 서북) -> 서울 용산구 만리재로 156-1
검색 중: 서울시립일시청소년쉼터(이동형, 서남) → 검색어: 서울시립일시청소년쉼터 서울 종로구
검색 결과 없음: 서울시립일시청소년쉼터(이동형, 서남)
  재시도: 센터명만으로 검색 -> 서울시립일시청소년쉼터
  재검색 성공: 서울시립일시청소년쉼터(이동형, 서남) -> 서울 용산구 만리재로 156-1
검색 중: 서울시립일시청소년쉼터(이동형, 동북) → 검색어: 서울시립일시청소년쉼터 서울 강동구
검색 결과 없음: 서울시립일시청소년쉼터(이동형, 동북)
  재시도: 센터명만으로 검색 -> 서울시립일시청소년쉼터
  재검색 성공: 서울시립일시청소년쉼터(이동형, 동북) -> 서울 용산구 만리재로 156-1
검색 중: 서울시립일시청소년쉼터(이동형, 동남) → 검색어: 서울시립일시청소년쉼터 서울 강동구
검색 결과 없음: 서울시립일시청소년쉼터(이동형, 동남)
  재시도: 센터명만으로 검색 -> 서울시립일시청소년쉼터
  재검색 성공: 서울시립일시청소년쉼터(이동형, 동남) -> 서울 용산구 만리재로 156-1
검색 중: 서울시립용산일시청소년쉼터(고정형) → 검색어: 서울시립용산일시청소년쉼터 서울 용산구
검색 성공: 서울시립용산일시청소년쉼터(고정형) -> 서울 용산구 만리재로 156-1 (위도: 37.55282106313092, 경도: 126.9643606970898)
검색 중: 서울시립강북일시청소년쉼터(고정형, 강북드림) → 검색어: 서울시립강북일시청소년쉼터 서울 강북구
검색 결과 없음: 서울시립강북일시청소년쉼터(고정형, 강북드림)
  재시도: 센터명만으로 검색 -> 서울시립강북일시청소년쉼터
  재검색 결과 없음: 서울시립강북일시청소년쉼터(고정형, 

In [13]:
data2.to_csv('output/청소년쉼터_목록.csv', index=False, encoding='utf-8-sig')
data2=pd.read_csv('output/청소년쉼터_목록.csv', encoding='utf-8-sig')
data2.head()

Unnamed: 0,센터명,시도명,시군구,전화번호,도로명주소,위도,경도
0,"서울시립일시청소년쉼터(이동형, 서북)",서울 종로구,종로구,02-722-1318,서울 용산구 만리재로 156-1,37.552821,126.964361
1,"서울시립일시청소년쉼터(이동형, 서남)",서울 종로구,종로구,02-722-1318,서울 용산구 만리재로 156-1,37.552821,126.964361
2,"서울시립일시청소년쉼터(이동형, 동북)",서울 강동구,강동구,02-6239-2014,서울 용산구 만리재로 156-1,37.552821,126.964361
3,"서울시립일시청소년쉼터(이동형, 동남)",서울 강동구,강동구,02-6239-2002,서울 용산구 만리재로 156-1,37.552821,126.964361
4,서울시립용산일시청소년쉼터(고정형),서울 용산구,용산구,02-718-1318,서울 용산구 만리재로 156-1,37.552821,126.964361


In [14]:
# 도로명주소가 Null 값인 센터 정보 확인
null_address = data2[data2['도로명주소'].isnull()]
null_address.isnull().sum()
#null_address['센터명'].unique()


센터명       0
시도명       0
시군구       0
전화번호      0
도로명주소    27
위도       27
경도       27
dtype: int64

In [15]:
# 청소년쉼터 정보 데이터 추가
data2.loc[data2['센터명']=='서울시립망우여자단기청소년쉼터','도로명주소']='서울시 중랑구 송림길 156'
data2.loc[data2['센터명']=='서울시립망우여자단기청소년쉼터','위도']=37.5976
data2.loc[data2['센터명']=='서울시립망우여자단기청소년쉼터','경도']=127.09422

data2.loc[data2['센터명']=='서울시립신림남자중장기청소년쉼터','도로명주소']='서울시 관악구 난곡로24가길 54 301호'
data2.loc[data2['센터명']=='서울시립신림남자중장기청소년쉼터','위도']=37.4777
data2.loc[data2['센터명']=='서울시립신림남자중장기청소년쉼터','경도']=126.9118

data2.loc[data2['센터명']=='서울시립금천여자중장기청소년쉼터','도로명주소']='서울시 금천구 독산로73길 10-16'
data2.loc[data2['센터명']=='서울시립금천여자중장기청소년쉼터','위도']=37.4682
data2.loc[data2['센터명']=='서울시립금천여자중장기청소년쉼터','경도']=126.9036

data2.loc[data2['센터명']=='강서여자중장기청소년쉼터(어울림)','도로명주소']='서울특별시 강서구 화곡6동'
data2.loc[data2['센터명']=='강서여자중장기청소년쉼터(어울림)','위도']=37.5509
data2.loc[data2['센터명']=='강서여자중장기청소년쉼터(어울림)','경도']=126.8497

data2.loc[data2['센터명']=='대구광역시남자중장기청소년쉼터','도로명주소']='대구시 중구 남산로8길 14 3층'
data2.loc[data2['센터명']=='대구광역시남자중장기청소년쉼터','위도']=35.8592
data2.loc[data2['센터명']=='대구광역시남자중장기청소년쉼터','경도']=128.5867

data2.loc[data2['센터명']=='대구광역시여자중장기청소년쉼터','도로명주소']='대구시 달서구 당산로 106(성당동) 4층'
data2.loc[data2['센터명']=='대구광역시여자중장기청소년쉼터','위도']=35.8411
data2.loc[data2['센터명']=='대구광역시여자중장기청소년쉼터','경도']=128.5432

data2.loc[data2['센터명']=='인천시여자단기청소년쉼터(하늘목장)','도로명주소']='인천광역시 부평구 수변로 45-2 201호'
data2.loc[data2['센터명']=='인천시여자단기청소년쉼터(하늘목장)','위도']=37.4951
data2.loc[data2['센터명']=='인천시여자단기청소년쉼터(하늘목장)','경도']=126.7307

data2.loc[data2['센터명']=='인천시여자단기청소년쉼터(하모니)','도로명주소']='인천 남동구 인주대로 801 대영빌딩 5층'
data2.loc[data2['센터명']=='인천시여자단기청소년쉼터(하모니)','위도']=37.4481
data2.loc[data2['센터명']=='인천시여자단기청소년쉼터(하모니)','경도']=126.7031

data2.loc[data2['센터명']=='광주광역시남자중장기청소년쉼터','도로명주소']='광주광역시 서구 풍금로24번길 5-1'
data2.loc[data2['센터명']=='광주광역시남자중장기청소년쉼터','위도']=35.1350
data2.loc[data2['센터명']=='광주광역시남자중장기청소년쉼터','경도']=126.8513

data2.loc[data2['센터명']=='광주광역시여자중장기청소년쉼터(맥지쉼터)','도로명주소']='광주광역시 동구 지원로 34'
data2.loc[data2['센터명']=='광주광역시여자중장기청소년쉼터(맥지쉼터)','위도']=35.1469
data2.loc[data2['센터명']=='광주광역시여자중장기청소년쉼터(맥지쉼터)','경도']=126.9273

data2.loc[data2['센터명']=='대전시남자중장기청소년쉼터','도로명주소']='대전 서구 도솔로 43 304호 401호'
data2.loc[data2['센터명']=='대전시남자중장기청소년쉼터','위도']=36.3369
data2.loc[data2['센터명']=='대전시남자중장기청소년쉼터','경도']=127.3824

data2.loc[data2['센터명']=='시흥시남자단기청소년쉼터(꿈다락)','도로명주소']='경기도 시흥시 시흥대로 1073번길 4-2'
data2.loc[data2['센터명']=='시흥시남자단기청소년쉼터(꿈다락)','위도']=37.4441
data2.loc[data2['센터명']=='시흥시남자단기청소년쉼터(꿈다락)','경도']=126.7856

data2.loc[data2['센터명']=='부천여자단기청소년쉼터(모퉁이)','도로명주소']='경기도 부천시 부일로 763번길 16-23'
data2.loc[data2['센터명']=='부천여자단기청소년쉼터(모퉁이)','위도']=37.4895
data2.loc[data2['센터명']=='부천여자단기청소년쉼터(모퉁이)','경도']=126.8000

data2.loc[data2['센터명']=='하남시남자중장기청소년쉼터','도로명주소']='경기도 하남시 대청로 33 현대베스코아 1001호 1002호'
data2.loc[data2['센터명']=='하남시남자중장기청소년쉼터','위도']=37.5519
data2.loc[data2['센터명']=='하남시남자중장기청소년쉼터','경도']=127.1885

data2.loc[data2['센터명']=='성남시여자중장기청소년쉼터','도로명주소']='경기 성남시 중원구 박석로41번길 25'
data2.loc[data2['센터명']=='성남시여자중장기청소년쉼터','위도']=37.4382
data2.loc[data2['센터명']=='성남시여자중장기청소년쉼터','경도']=127.1714

data2.loc[data2['센터명']=='파주시여자단기청소년쉼터','도로명주소']='경기 파주시 와석순환로 347'
data2.loc[data2['센터명']=='파주시여자단기청소년쉼터','위도']=37.725062441119
data2.loc[data2['센터명']=='파주시여자단기청소년쉼터','경도']=126.74419855517

data2.loc[data2['센터명']=='강원특별자치도남자단기청소년쉼터','도로명주소']='강원 춘천시 후석로 379번길 27 4층'
data2.loc[data2['센터명']=='강원특별자치도남자단기청소년쉼터','위도']=37.8765
data2.loc[data2['센터명']=='강원특별자치도남자단기청소년쉼터','경도']=127.7341

data2.loc[data2['센터명']=='강원특별자치도여자중장기청소년쉼터','도로명주소']='강원 춘천시 동면 춘천로 527-40 2층'
data2.loc[data2['센터명']=='강원특별자치도여자중장기청소년쉼터','위도']=37.8957
data2.loc[data2['센터명']=='강원특별자치도여자중장기청소년쉼터','경도']=127.80751

data2.loc[data2['센터명']=='청주시남자단기청소년쉼터','도로명주소']='충북 청주시 흥덕구 무심서로 665'
data2.loc[data2['센터명']=='청주시남자단기청소년쉼터','위도']=36.6296
data2.loc[data2['센터명']=='청주시남자단기청소년쉼터','경도']=127.4255

data2.loc[data2['센터명']=='서울시립강북일시청소년쉼터(고정형, 강북드림)','도로명주소']='서울특별시 강북구 한천로 140길 5-26 강북청소년드림센터'
data2.loc[data2['센터명']=='서울시립강북일시청소년쉼터(고정형, 강북드림)','위도']=37.6377
data2.loc[data2['센터명']=='서울시립강북일시청소년쉼터(고정형, 강북드림)','경도']=127.0233

data2.loc[data2['센터명']=='홍성남자단기청소년쉼터','도로명주소']='충남 홍성군 홍성읍 의사로36번길 49 홍성군다기능복지센터 3층'
data2.loc[data2['센터명']=='홍성남자단기청소년쉼터','위도']=36.6009
data2.loc[data2['센터명']=='홍성남자단기청소년쉼터','경도']=126.6623

data2.loc[data2['센터명']=='홍성여자단기청소년쉼터','도로명주소']='충남 홍성군 홍성읍 의사로36번길 49 홍성군다기능복지센터 3층'
data2.loc[data2['센터명']=='홍성여자단기청소년쉼터','위도']=36.6009
data2.loc[data2['센터명']=='홍성여자단기청소년쉼터','경도']=126.6623

data2.loc[data2['센터명']=='군산여자중장기청소년쉼터(꽃동산)','도로명주소']='전라북도 군산시 검다메안길 6-6 (조촌동) 2층'
data2.loc[data2['센터명']=='군산여자중장기청소년쉼터(꽃동산)','위도']=35.9671665
data2.loc[data2['센터명']=='군산여자중장기청소년쉼터(꽃동산)','경도']=126.7396119

data2.loc[data2['센터명']=='경상북도남자단기청소년쉼터','도로명주소']='경상북도 구미시 형곡로34길 31'
data2.loc[data2['센터명']=='경상북도남자단기청소년쉼터','위도']=36.1222
data2.loc[data2['센터명']=='경상북도남자단기청소년쉼터','경도']=128.3444

data2.loc[data2['센터명']=='경주시여자단기청소년쉼터','도로명주소']='경상북도 경주시 봉황로 168(성건동)'
data2.loc[data2['센터명']=='경주시여자단기청소년쉼터','위도']=35.8545
data2.loc[data2['센터명']=='경주시여자단기청소년쉼터','경도']=129.2102

data2.loc[data2['센터명']=='창원시남자단기청소년쉼터(하라)','도로명주소']='경상남도 창원시 의창구 하남천서길37번길 6-4 (도계동) 1층'
data2.loc[data2['센터명']=='창원시남자단기청소년쉼터(하라)','위도']=35.2624
data2.loc[data2['센터명']=='창원시남자단기청소년쉼터(하라)','경도']=128.6396

data2.loc[data2['센터명']=='김해시여자단기청소년쉼터','도로명주소']='경남 김해 분성로 277(봉황동) 김해YMCA 5층)'
data2.loc[data2['센터명']=='김해시여자단기청소년쉼터','위도']=35.23306436
data2.loc[data2['센터명']=='김해시여자단기청소년쉼터','경도']=128.8762265

null_address = data2[data2['도로명주소'].isnull()]
null_address.isnull().sum()


센터명      0
시도명      0
시군구      0
전화번호     0
도로명주소    0
위도       0
경도       0
dtype: int64

In [16]:
data2.head(30)

Unnamed: 0,센터명,시도명,시군구,전화번호,도로명주소,위도,경도
0,"서울시립일시청소년쉼터(이동형, 서북)",서울 종로구,종로구,02-722-1318,서울 용산구 만리재로 156-1,37.552821,126.964361
1,"서울시립일시청소년쉼터(이동형, 서남)",서울 종로구,종로구,02-722-1318,서울 용산구 만리재로 156-1,37.552821,126.964361
2,"서울시립일시청소년쉼터(이동형, 동북)",서울 강동구,강동구,02-6239-2014,서울 용산구 만리재로 156-1,37.552821,126.964361
3,"서울시립일시청소년쉼터(이동형, 동남)",서울 강동구,강동구,02-6239-2002,서울 용산구 만리재로 156-1,37.552821,126.964361
4,서울시립용산일시청소년쉼터(고정형),서울 용산구,용산구,02-718-1318,서울 용산구 만리재로 156-1,37.552821,126.964361
5,"서울시립강북일시청소년쉼터(고정형, 강북드림)",서울 강북구,강북구,02-6435-7979,서울특별시 강북구 한천로 140길 5-26 강북청소년드림센터,37.6377,127.0233
6,"서울시립양천일시청소년쉼터(고정형, 드림)",서울 양천구,양천구,02-2051-1371,서울 양천구 남부순환로54길 37,37.531081,126.82701
7,은평구립일시청소년쉼터(고정형),서울 은평구,은평구,02-382-1388,서울 은평구 통일로89길 6-20,37.625462,126.919467
8,강서남자단기청소년쉼터,서울 강서구,강서구,02-2697-7377,서울 강서구 초록마을로10길 5,37.542048,126.84923
9,서울시립신림남자단기청소년쉼터,서울 관악구,관악구,02-876-7942,서울 관악구 신림로 376,37.487972,126.928914


In [31]:
data3 = pd.read_csv('보건복지부 국립정신건강센터_정신건강 관련기관 정보_20220301.csv', encoding='cp949')
data3.isnull().sum()

기관명        0
기관구분       0
주소         0
홈페이지    2070
dtype: int64

In [18]:
import pandas as pd
import requests
import time
import os

# API 키 설정 (api_key_path 변수가 정의되어 있다고 가정)
try:
    with open(api_key_path, 'r') as f:
        KAKAO_API_KEY = f.read().strip()  # 공백과 줄바꿈 제거
    print(f"API 키를 성공적으로 불러왔습니다.")
except FileNotFoundError:
    print(f"파일을 찾을 수 없습니다: {api_key_path}")
    print(f"현재 작업 디렉토리: {os.getcwd()}")
    KAKAO_API_KEY = ""  # 빈 API 키 설정

# 헤더 설정
headers = {"Authorization": f"KakaoAK {KAKAO_API_KEY}"}

# 데이터 불러오기
try:
    data3 = pd.read_csv('보건복지부 국립정신건강센터_정신건강 관련기관 정보_20220301.csv', encoding='cp949')
    data3 = data3.rename(columns={'기관명': '센터명', '주소': '소재지'})
    data3 = data3.drop(columns=['기관구분'])
    
    # 위도와 경도를 저장할 새 열 추가
    data3['위도'] = None
    data3['경도'] = None
    
    # 각 센터에 대해 카카오 지도 API로 주소 검색
    for idx, row in data3.iterrows():
        try:
            # 소재지 주소로 먼저 검색
            query = row['소재지']
            print(f"검색 중(소재지): {row['센터명']} → 주소: {query}")
            
            # 카카오 로컬 API 호출 (주소 검색)
            url = "https://dapi.kakao.com/v2/local/search/address.json"
            params = {"query": query}
            response = requests.get(url, headers=headers, params=params)
            
            success = False
            # 소재지로 검색 시도
            if response.status_code == 200:
                result = response.json()
                if result['documents']:
                    # 첫 번째 검색 결과의 좌표 저장
                    data3.at[idx, '위도'] = result['documents'][0]['y']  # 위도 (y 좌표)
                    data3.at[idx, '경도'] = result['documents'][0]['x']  # 경도 (x 좌표)
                    success = True
                    print(f"검색 성공(소재지): {row['센터명']} (위도: {data3.at[idx, '위도']}, 경도: {data3.at[idx, '경도']})")
            
            # 소재지로 검색 실패한 경우, 센터명으로 재검색
            if not success:
                print(f"소재지 검색 실패, 센터명으로 재검색: {row['센터명']}")
                
                # 키워드 검색 API 사용
                url = "https://dapi.kakao.com/v2/local/search/keyword.json"
                params = {"query": row['센터명']}
                response = requests.get(url, headers=headers, params=params)
                
                if response.status_code == 200:
                    result = response.json()
                    if result['documents']:
                        # 첫 번째 검색 결과의 좌표와 도로명 주소 저장
                        data3.at[idx, '위도'] = result['documents'][0]['y']  # 위도 (y 좌표)
                        data3.at[idx, '경도'] = result['documents'][0]['x']  # 경도 (x 좌표)
                        # 소재지를 검색된 주소로 업데이트
                        data3.at[idx, '소재지'] = result['documents'][0]['road_address_name']
                        print(f"센터명 검색 성공: {row['센터명']} (위도: {data3.at[idx, '위도']}, 경도: {data3.at[idx, '경도']})")
                        print(f"소재지 업데이트: {data3.at[idx, '소재지']}")
                    else:
                        print(f"센터명 검색 결과 없음: {row['센터명']}")
                else:
                    print(f"센터명 API 호출 실패: {response.status_code} - {row['센터명']}")
            
            # API 호출 제한을 피하기 위한 대기 (초당 최대 요청 수 제한 때문)
            time.sleep(0.5)
            
        except Exception as e:
            print(f"오류 발생: {row['센터명']} - {str(e)}")

    # 결과 확인 (위도/경도가 추출된 데이터 수)
    location_count = data3['위도'].notna().sum()
    total_count = len(data3)
    print(f"\n총 {total_count}개 중 {location_count}개 위치정보 추출 완료 ({location_count/total_count*100:.1f}%)")
    
    # 결과를 CSV 파일로 저장
    data3.to_csv('정신건강센터_위치정보.csv', index=False, encoding='utf-8-sig')
    print("정신건강센터_위치정보.csv 파일 저장 완료")
    
except Exception as e:
    print(f"데이터 로드 중 오류 발생: {str(e)}")

API 키를 성공적으로 불러왔습니다.
검색 중(소재지): (복지)예사랑병원 → 주소: 부산광역시 서구 옥천로130번길 38 (아미동2가)
검색 성공(소재지): (복지)예사랑병원 (위도: 35.0973354790723, 경도: 129.01324126798)
검색 중(소재지): (의)고담의료재단마더스병원 → 주소: 울산광역시 남구 화합로 107 (달동)
검색 성공(소재지): (의)고담의료재단마더스병원 (위도: 35.5343934088755, 경도: 129.340521376408)
검색 중(소재지): (의)나사렛의료재단 나사렛국제병원 → 주소: 인천광역시 연수구 먼우금로 98- (동춘동)
검색 성공(소재지): (의)나사렛의료재단 나사렛국제병원 (위도: 37.4079490183211, 경도: 126.670483797199)
검색 중(소재지): (의)아나의료재단강릉아나병원 → 주소: 강원도 강릉시 용지로 129 129
소재지 검색 실패, 센터명으로 재검색: (의)아나의료재단강릉아나병원
센터명 검색 성공: (의)아나의료재단강릉아나병원 (위도: 37.7605769743724, 경도: 128.90314398882683)
소재지 업데이트: 강원특별자치도 강릉시 용지로 129
검색 중(소재지): (재)예수의꽃동네유지재단 인곡자애병원 → 주소: 충청북도 음성군 맹동면 꽃동네길 37-0 ()
검색 성공(소재지): (재)예수의꽃동네유지재단 인곡자애병원 (위도: 36.9421499109208, 경도: 127.577558020358)
검색 중(소재지): (재)천주의성요한병원 → 주소: 광주광역시 북구 태봉로 32, 유동 115-1
검색 성공(소재지): (재)천주의성요한병원 (위도: 35.1603325685691, 경도: 126.903602534309)
검색 중(소재지): (학)일송학원 한림대학교성심병원 → 주소: 관평로170번길 22
검색 성공(소재지): (학)일송학원 한림대학교성심병원 (위도: 37.3916511965629, 경도: 126.961972175812)
검색 중(소재지): 

In [27]:
import pandas as pd
import requests
import time
import re
import os

# API 키 설정 (기존 코드 유지)
try:
    with open(api_key_path, 'r') as f:
        KAKAO_API_KEY = f.read().strip()
    print(f"API 키를 성공적으로 불러왔습니다.")
except FileNotFoundError:
    print(f"파일을 찾을 수 없습니다: {api_key_path}")
    print(f"현재 작업 디렉토리: {os.getcwd()}")
    KAKAO_API_KEY = ""

headers = {"Authorization": f"KakaoAK {KAKAO_API_KEY}"}

# 한국어 주소 정제 함수 개선
def clean_korean_address(address):
    if not isinstance(address, str):
        return ""
    
    # 원본 주소 저장
    original = address
    
    # 괄호와 내용 제거
    address = re.sub(r'\([^)]*\)', '', address)
    
    # 층, 호 표시 제거
    address = re.sub(r'\d+[층호]', '', address)
    
    # 특수문자 제거 (하이픈 유지)
    address = re.sub(r'[^\w\s\-가-힣]', ' ', address)
    
    # 여러 공백 통합
    address = re.sub(r'\s+', ' ', address)
    address = address.strip()
    
    # 주소가 너무 짧아지면 원본 반환
    if len(address) < 5:
        return original
    
    return address

# 주소 단순화 함수 (시/군/구 수준까지만)
def simplify_address(address):
    parts = address.split()
    # 시/도 + 시/군/구 부분만 추출 (최대 3개 단어)
    return ' '.join(parts[:min(3, len(parts))])

try:
    # 데이터 불러오기
    data = pd.read_csv('정신건강센터_위치정보.csv', encoding='utf-8-sig')
    
    # 위도가 null인 데이터만 처리
    null_rows = data[data['위도'].isnull()]
    print(f"위치정보가 없는 센터 수: {len(null_rows)}")
    
    # 결과 추적
    success_count = 0
    manual_input = {}  # 수동 입력이 필요한 센터 추적
    
    for idx in null_rows.index:
        center_name = data.loc[idx, '센터명']
        address = data.loc[idx, '소재지']
        
        print(f"\n===== 처리 중: {center_name} =====")
        print(f"원본 주소: {address}")
        
        success = False
        
        # 1. 원본 주소로 검색
        try:
            url = "https://dapi.kakao.com/v2/local/search/address.json"
            params = {"query": address}
            response = requests.get(url, headers=headers, params=params)
            
            if response.status_code == 200:
                result = response.json()
                if result['documents']:
                    data.at[idx, '위도'] = result['documents'][0]['y']
                    data.at[idx, '경도'] = result['documents'][0]['x']
                    success = True
                    success_count += 1
                    print(f"✓ 원본 주소로 검색 성공!")
                    continue
        except Exception as e:
            print(f"원본 주소 검색 중 오류: {str(e)}")
        
        # 2. 정제된 주소로 검색
        try:
            cleaned = clean_korean_address(address)
            print(f"정제된 주소: {cleaned}")
            
            url = "https://dapi.kakao.com/v2/local/search/address.json"
            params = {"query": cleaned}
            response = requests.get(url, headers=headers, params=params)
            
            if response.status_code == 200:
                result = response.json()
                if result['documents']:
                    data.at[idx, '위도'] = result['documents'][0]['y']
                    data.at[idx, '경도'] = result['documents'][0]['x']
                    success = True
                    success_count += 1
                    print(f"✓ 정제된 주소로 검색 성공!")
                    continue
        except Exception as e:
            print(f"정제된 주소 검색 중 오류: {str(e)}")
        
        # 3. 단순화된 주소로 검색
        try:
            simplified = simplify_address(cleaned)
            print(f"단순화된 주소: {simplified}")
            
            if simplified != cleaned:
                url = "https://dapi.kakao.com/v2/local/search/address.json"
                params = {"query": simplified}
                response = requests.get(url, headers=headers, params=params)
                
                if response.status_code == 200:
                    result = response.json()
                    if result['documents']:
                        data.at[idx, '위도'] = result['documents'][0]['y']
                        data.at[idx, '경도'] = result['documents'][0]['x']
                        success = True
                        success_count += 1
                        print(f"✓ 단순화된 주소로 검색 성공!")
                        continue
        except Exception as e:
            print(f"단순화된 주소 검색 중 오류: {str(e)}")
        
        # 4. 센터명으로 검색
        try:
            print(f"센터명으로 검색: {center_name}")
            
            url = "https://dapi.kakao.com/v2/local/search/keyword.json"
            params = {"query": center_name}
            response = requests.get(url, headers=headers, params=params)
            
            if response.status_code == 200:
                result = response.json()
                if result['documents']:
                    data.at[idx, '위도'] = result['documents'][0]['y']
                    data.at[idx, '경도'] = result['documents'][0]['x']
                    success = True
                    success_count += 1
                    print(f"✓ 센터명으로 검색 성공!")
                    continue
        except Exception as e:
            print(f"센터명 검색 중 오류: {str(e)}")
        
        # 5. 지역명 + 센터 유형으로 검색
        try:
            # 주소에서 지역명 추출 (첫 1-2개 부분)
            region_parts = simplified.split()[:2]
            region = ' '.join(region_parts)
            
            # 센터 유형 추출 (병원, 의원 등)
            center_type = ""
            if "병원" in center_name:
                center_type = "병원"
            elif "의원" in center_name:
                center_type = "의원"
            elif "센터" in center_name:
                center_type = "센터"
            
            if region and center_type:
                query = f"{region} {center_type}"
                print(f"지역+유형 조합 검색: {query}")
                
                url = "https://dapi.kakao.com/v2/local/search/keyword.json"
                params = {"query": query}
                response = requests.get(url, headers=headers, params=params)
                
                if response.status_code == 200:
                    result = response.json()
                    if result['documents']:
                        data.at[idx, '위도'] = result['documents'][0]['y']
                        data.at[idx, '경도'] = result['documents'][0]['x']
                        success = True
                        success_count += 1
                        print(f"✓ 지역+유형 조합으로 검색 성공!")
                        continue
        except Exception as e:
            print(f"지역+유형 검색 중 오류: {str(e)}")
        
        # 모든 방법 실패시 수동 입력을 위해 정보 저장
        if not success:
            print("✗ 모든 검색 방법 실패")
            manual_input[center_name] = address
        
        # API 호출 제한 방지
        time.sleep(0.5)
    
    # 결과 저장
    data.to_csv('정신건강센터_위치정보_업데이트.csv', index=False, encoding='utf-8-sig')
    
    # 결과 요약
    print("\n===== 처리 결과 =====")
    print(f"위치정보가 없던 센터: {len(null_rows)}개")
    print(f"성공적으로 검색된 센터: {success_count}개")
    print(f"검색 실패한 센터: {len(null_rows) - success_count}개")
    
    # 전체 데이터 기준 요약
    location_count = data['위도'].notna().sum()
    total_count = len(data)
    print(f"전체 {total_count}개 중 {location_count}개 위치정보 보유 ({location_count/total_count*100:.1f}%)")
    
    # 수동 입력이 필요한 센터 목록
    if len(manual_input) > 0:
        print("\n===== 수동 입력이 필요한 센터 =====")
        for name, addr in manual_input.items():
            print(f"- {name}: {addr}")
        
        # 수동 입력을 위한 코드 생성
        print("\n수동 입력을 위한 코드:")
        print("manual_coordinates = {")
        for name in manual_input.keys():
            print(f'    "{name}": {{"위도": "", "경도": ""}},')
        print("}")
    
except Exception as e:
    print(f"오류 발생: {str(e)}")

API 키를 성공적으로 불러왔습니다.
위치정보가 없는 센터 수: 22

===== 처리 중: 공군교육사 기지병원 =====
원본 주소: 경상남도 진주시 금산면 송백로 46 46
정제된 주소: 경상남도 진주시 금산면 송백로 46 46
단순화된 주소: 경상남도 진주시 금산면


  data.at[idx, '위도'] = result['documents'][0]['y']
  data.at[idx, '경도'] = result['documents'][0]['x']


✓ 단순화된 주소로 검색 성공!

===== 처리 중: 국군부산병원 =====
원본 주소: 부산광역시 해운대구 세실로 186 (좌동)
정제된 주소: 부산광역시 해운대구 세실로 186
단순화된 주소: 부산광역시 해운대구 세실로
✓ 단순화된 주소로 검색 성공!

===== 처리 중: 국군부산병원 =====
원본 주소: 부산광역시 해운대구 세실로 186번길
정제된 주소: 부산광역시 해운대구 세실로 186번길
단순화된 주소: 부산광역시 해운대구 세실로
✓ 단순화된 주소로 검색 성공!

===== 처리 중: 김동인정신건강의학과의원 =====
원본 주소: 전라북도 전주시 완산구 안행3길 10 1~3층 (삼천동1가)
정제된 주소: 전라북도 전주시 완산구 안행3길 10 1
단순화된 주소: 전라북도 전주시 완산구
✓ 단순화된 주소로 검색 성공!

===== 처리 중: 대한민국재향소방동우회 희망나눔병원 =====
원본 주소: 인천광역시 미추홀구 한나루로 420 3~4층 (학익동)
정제된 주소: 인천광역시 미추홀구 한나루로 420 3
단순화된 주소: 인천광역시 미추홀구 한나루로
✓ 단순화된 주소로 검색 성공!

===== 처리 중: 박진생정신건강의학과의원 =====
원본 주소: 서울특별시 강남구 테헤란로 313 216,217호 (역삼동, 성지하이츠1)
정제된 주소: 서울특별시 강남구 테헤란로 313 216
단순화된 주소: 서울특별시 강남구 테헤란로
✓ 단순화된 주소로 검색 성공!

===== 처리 중: 보듬자리 =====
원본 주소: 부산광역시 금정구 금샘로 52
정제된 주소: 부산광역시 금정구 금샘로 52
단순화된 주소: 부산광역시 금정구 금샘로
✓ 단순화된 주소로 검색 성공!

===== 처리 중: 빛고을보건복지센터 =====
원본 주소: 광주광역시 서구 상무대로 916번길 4-3
정제된 주소: 광주광역시 서구 상무대로 916번길 4-3
단순화된 주소: 광주광역시 서구 상무대로
✓ 단순화된 주소로 검색 성공!

===== 처리 중: 서광윤신경정신과의원 =====
원본 주소: 

In [33]:
data3=pd.read_csv('정신건강센터_위치정보_업데이트.csv', encoding='utf-8-sig')
data3.isnull().sum()

센터명        0
소재지        9
홈페이지    2070
위도         0
경도         0
dtype: int64

In [39]:
data3 = pd.read_csv('보건복지부 국립정신건강센터_정신건강 관련기관 정보_20220301.csv', encoding='cp949')
data3.isnull().sum()

기관명        0
기관구분       0
주소         0
홈페이지    2070
dtype: int64

In [41]:
data3.loc[data3['기관명']=='공군항공우주의료원']

Unnamed: 0,기관명,기관구분,주소,홈페이지
208,공군항공우주의료원,국립,충청북도 청주시 상당구 남일면 쌍수관기길 6,
209,공군항공우주의료원,병원,충청북도 청주시 상당구 남일면 단재로 635-0 (),


In [53]:
data4=pd.read_csv('정신건강센터_위치정보_업데이트.csv', encoding='utf-8-sig')
data4=data4.dropna(subset=['소재지'])
data4=data4.drop(columns=['Unnamed: 0','Unnamed: 0.1'])
data4.to_csv('정신건강센터_위치정보_업데이트.csv')
data4.isnull().sum()


센터명        0
소재지        0
홈페이지    2061
위도         0
경도         0
dtype: int64

In [57]:
data1=pd.read_csv('output/전국중독관리센터_목록.csv')
print(data1.isnull().sum())
data1.head()


시도명      0
센터명      0
소재지      0
전화번호     1
홈페이지    27
위도       0
경도       0
dtype: int64


Unnamed: 0,시도명,센터명,소재지,전화번호,홈페이지,위도,경도
0,강원,강릉중독관리통합지원센터,강릉시 경강로 2279 강맥빌딩 A동 2층,033-653-9668,,37.766694,128.910995
1,강원,원주시중독관리통합지원센터,원주시 원일로 139 원주건강문화센터 지하 1층,033-748-5119,http://alja.yonsei.ac.kr,37.35155,127.946803
2,강원,춘천중독관리통합지원센터,춘천시 삭주로 84 수인빌딩 3층,033-255-3482,www.alcoholfree.or.kr,37.883397,127.740265
3,경남,경남광역중독관리통합지원센터,경남 창원시 의창구 동읍 동읍로 457번길 48 (경남사회복지센터),055-239-1400,https://www.gnmhc.or.kr/sub02/sub03_01.php,35.309594,128.65115
4,경남,김해중독관리통합지원센터,"경남 김해시 주촌면 주선로 29-1, 건강생활지원센터 1층",055-314-0317,http://www.ghacc.co.kr,35.234777,128.845757


In [61]:
data2=pd.read_csv('output/청소년쉼터_목록.csv')
print(data2.isnull().sum())
data2.head()

센터명       0
시도명       0
시군구       0
전화번호      0
도로명주소    27
위도       27
경도       27
dtype: int64


Unnamed: 0,센터명,시도명,시군구,전화번호,도로명주소,위도,경도
0,"서울시립일시청소년쉼터(이동형, 서북)",서울 종로구,종로구,02-722-1318,서울 용산구 만리재로 156-1,37.552821,126.964361
1,"서울시립일시청소년쉼터(이동형, 서남)",서울 종로구,종로구,02-722-1318,서울 용산구 만리재로 156-1,37.552821,126.964361
2,"서울시립일시청소년쉼터(이동형, 동북)",서울 강동구,강동구,02-6239-2014,서울 용산구 만리재로 156-1,37.552821,126.964361
3,"서울시립일시청소년쉼터(이동형, 동남)",서울 강동구,강동구,02-6239-2002,서울 용산구 만리재로 156-1,37.552821,126.964361
4,서울시립용산일시청소년쉼터(고정형),서울 용산구,용산구,02-718-1318,서울 용산구 만리재로 156-1,37.552821,126.964361


In [65]:
# 카카오맵 API 키 읽기
with open('map_key.txt', 'r') as file:
    kakao_api_key = file.read().strip()

def process_shelters(df):
    """
    센터명에 '이동형'이 포함된 경우 처리하는 함수
    """
    result_df = df.copy()
    
    # 비고 컬럼 추가
    result_df['비고'] = ''
    
    for idx, row in result_df.iterrows():
        if '이동형' in row['센터명']:
            # 시도명에서 정보 추출 (시/도 이름만 사용)
            city_name = row['시도명'].split()[0]  # '서울 종로구' -> '서울'
            
            # 카카오맵 API를 사용하여 시/도 단위의 위도, 경도 정보 가져오기
            headers = {'Authorization': f'KakaoAK {kakao_api_key}'}
            url = f'https://dapi.kakao.com/v2/local/search/address.json'
            params = {'query': city_name}
            
            try:
                response = requests.get(url, headers=headers, params=params)
                if response.status_code == 200:
                    data = response.json()
                    if data.get('documents'):
                        # 첫 번째 결과의 위도, 경도 사용
                        result_df.at[idx, '위도'] = float(data['documents'][0]['y'])
                        result_df.at[idx, '경도'] = float(data['documents'][0]['x'])
                        
                        # 도로명 주소를 구 단위까지만 표시
                        address_parts = row['도로명주소'].split()
                        if len(address_parts) >= 2:  # 최소 '서울 용산구'와 같은 형식이어야 함
                            result_df.at[idx, '도로명주소'] = ' '.join(address_parts[:2])
                
                # 비고에 이동형 쉼터 정보 추가
                result_df.at[idx, '비고'] = '이동형 쉼터입니다. 관련 정보를 검색하여 찾아주세요.'
            
            except Exception as e:
                print(f"API 호출 오류: {e}")
    
    return result_df

# 데이터 처리 및 결과 출력
processed_data = process_shelters(data2)
print(processed_data)

# 결과를 CSV 파일로 저장 (선택 사항)
processed_data.to_csv('processed_shelters.csv', index=False, encoding='utf-8-sig')

                      센터명      시도명   시군구          전화번호  \
0    서울시립일시청소년쉼터(이동형, 서북)   서울 종로구   종로구   02-722-1318   
1    서울시립일시청소년쉼터(이동형, 서남)   서울 종로구   종로구   02-722-1318   
2    서울시립일시청소년쉼터(이동형, 동북)   서울 강동구   강동구  02-6239-2014   
3    서울시립일시청소년쉼터(이동형, 동남)   서울 강동구   강동구  02-6239-2002   
4      서울시립용산일시청소년쉼터(고정형)   서울 용산구   용산구   02-718-1318   
..                    ...      ...   ...           ...   
132   제주특별자치도일시청소년쉼터(고정형)   제주 제주시   제주시  064-722-1388   
133         서귀포시남자단기청소년쉼터  제주 서귀포시  서귀포시  064-739-9805   
134          제주시여자단기청소년쉼터   제주 제주시   제주시  064-751-1388   
135         제주시남자중장기청소년쉼터   제주 제주시   제주시  064-759-1388   
136        서귀포시여자중장기청소년쉼터  제주 서귀포시  서귀포시  064-733-1376   

                        도로명주소         위도          경도  \
0                      서울 용산구  37.566826  126.978652   
1                      서울 용산구  37.566826  126.978652   
2                      서울 용산구  37.566826  126.978652   
3                      서울 용산구  37.566826  126.978652   
4           서울 용산구 만리재로

In [None]:
# 청소년쉼터 정보 데이터 추가
data.loc[data['센터명']=='서울시립망우여자단기청소년쉼터','도로명주소']='서울시 중랑구 송림길 156'
data.loc[data['센터명']=='서울시립망우여자단기청소년쉼터','위도']=37.5976
data.loc[data['센터명']=='서울시립망우여자단기청소년쉼터','경도']=127.09422

data.loc[data['센터명']=='서울시립신림남자중장기청소년쉼터','도로명주소']='서울시 관악구 난곡로24가길 54 301호'
data.loc[data['센터명']=='서울시립신림남자중장기청소년쉼터','위도']=37.4777
data.loc[data['센터명']=='서울시립신림남자중장기청소년쉼터','경도']=126.9118

data.loc[data['센터명']=='서울시립금천여자중장기청소년쉼터','도로명주소']='서울시 금천구 독산로73길 10-16'
data.loc[data['센터명']=='서울시립금천여자중장기청소년쉼터','위도']=37.4682
data.loc[data['센터명']=='서울시립금천여자중장기청소년쉼터','경도']=126.9036

data.loc[data['센터명']=='강서여자중장기청소년쉼터(어울림)','도로명주소']='서울특별시 강서구 화곡6동'
data.loc[data['센터명']=='강서여자중장기청소년쉼터(어울림)','위도']=37.5509
data.loc[data['센터명']=='강서여자중장기청소년쉼터(어울림)','경도']=126.8497

data.loc[data['센터명']=='대구광역시남자중장기청소년쉼터','도로명주소']='대구시 중구 남산로8길 14 3층'
data.loc[data['센터명']=='대구광역시남자중장기청소년쉼터','위도']=35.8592
data.loc[data['센터명']=='대구광역시남자중장기청소년쉼터','경도']=128.5867

data.loc[data['센터명']=='대구광역시여자중장기청소년쉼터','도로명주소']='대구시 달서구 당산로 106(성당동) 4층'
data.loc[data['센터명']=='대구광역시여자중장기청소년쉼터','위도']=35.8411
data.loc[data['센터명']=='대구광역시여자중장기청소년쉼터','경도']=128.5432

data.loc[data['센터명']=='인천시여자단기청소년쉼터(하늘목장)','도로명주소']='인천광역시 부평구 수변로 45-2 201호'
data.loc[data['센터명']=='인천시여자단기청소년쉼터(하늘목장)','위도']=37.4951
data.loc[data['센터명']=='인천시여자단기청소년쉼터(하늘목장)','경도']=126.7307

data.loc[data['센터명']=='인천시여자단기청소년쉼터(하모니)','도로명주소']='인천 남동구 인주대로 801 대영빌딩 5층'
data.loc[data['센터명']=='인천시여자단기청소년쉼터(하모니)','위도']=37.4481
data.loc[data['센터명']=='인천시여자단기청소년쉼터(하모니)','경도']=126.7031

data.loc[data['센터명']=='광주광역시남자중장기청소년쉼터','도로명주소']='광주광역시 서구 풍금로24번길 5-1'
data.loc[data['센터명']=='광주광역시남자중장기청소년쉼터','위도']=35.1350
data.loc[data['센터명']=='광주광역시남자중장기청소년쉼터','경도']=126.8513

data.loc[data['센터명']=='광주광역시여자중장기청소년쉼터(맥지쉼터)','도로명주소']='광주광역시 동구 지원로 34'
data.loc[data['센터명']=='광주광역시여자중장기청소년쉼터(맥지쉼터)','위도']=35.1469
data.loc[data['센터명']=='광주광역시여자중장기청소년쉼터(맥지쉼터)','경도']=126.9273

data.loc[data['센터명']=='대전시남자중장기청소년쉼터','도로명주소']='대전 서구 도솔로 43 304호 401호'
data.loc[data['센터명']=='대전시남자중장기청소년쉼터','위도']=36.3369
data.loc[data['센터명']=='대전시남자중장기청소년쉼터','경도']=127.3824

data.loc[data['센터명']=='시흥시남자단기청소년쉼터(꿈다락)','도로명주소']='경기도 시흥시 시흥대로 1073번길 4-2'
data.loc[data['센터명']=='시흥시남자단기청소년쉼터(꿈다락)','위도']=37.4441
data.loc[data['센터명']=='시흥시남자단기청소년쉼터(꿈다락)','경도']=126.7856

data.loc[data['센터명']=='부천여자단기청소년쉼터(모퉁이)','도로명주소']='경기도 부천시 부일로 763번길 16-23'
data.loc[data['센터명']=='부천여자단기청소년쉼터(모퉁이)','위도']=37.4895
data.loc[data['센터명']=='부천여자단기청소년쉼터(모퉁이)','경도']=126.8000

data.loc[data['센터명']=='하남시남자중장기청소년쉼터','도로명주소']='경기도 하남시 대청로 33 현대베스코아 1001호 1002호'
data.loc[data['센터명']=='하남시남자중장기청소년쉼터','위도']=37.5519
data.loc[data['센터명']=='하남시남자중장기청소년쉼터','경도']=127.1885

data.loc[data['센터명']=='성남시여자중장기청소년쉼터','도로명주소']='경기 성남시 중원구 박석로41번길 25'
data.loc[data['센터명']=='성남시여자중장기청소년쉼터','위도']=37.4382
data.loc[data['센터명']=='성남시여자중장기청소년쉼터','경도']=127.1714

data.loc[data['센터명']=='파주시여자단기청소년쉼터','도로명주소']='경기 파주시 와석순환로 347'
data.loc[data['센터명']=='파주시여자단기청소년쉼터','위도']=37.725062441119
data.loc[data['센터명']=='파주시여자단기청소년쉼터','경도']=126.74419855517

data.loc[data['센터명']=='강원특별자치도남자단기청소년쉼터','도로명주소']='강원 춘천시 후석로 379번길 27 4층'
data.loc[data['센터명']=='강원특별자치도남자단기청소년쉼터','위도']=37.8765
data.loc[data['센터명']=='강원특별자치도남자단기청소년쉼터','경도']=127.7341

data.loc[data['센터명']=='강원특별자치도여자중장기청소년쉼터','도로명주소']='강원 춘천시 동면 춘천로 527-40 2층'
data.loc[data['센터명']=='강원특별자치도여자중장기청소년쉼터','위도']=37.8957
data.loc[data['센터명']=='강원특별자치도여자중장기청소년쉼터','경도']=127.80751

data.loc[data['센터명']=='청주시남자단기청소년쉼터','도로명주소']='충북 청주시 흥덕구 무심서로 665'
data.loc[data['센터명']=='청주시남자단기청소년쉼터','위도']=36.6296
data.loc[data['센터명']=='청주시남자단기청소년쉼터','경도']=127.4255

data.loc[data['센터명']=='서울시립강북일시청소년쉼터(고정형, 강북드림)','도로명주소']='서울특별시 강북구 한천로 140길 5-26 강북청소년드림센터'
data.loc[data['센터명']=='서울시립강북일시청소년쉼터(고정형, 강북드림)','위도']=37.6377
data.loc[data['센터명']=='서울시립강북일시청소년쉼터(고정형, 강북드림)','경도']=127.0233

data.loc[data['센터명']=='홍성남자단기청소년쉼터','도로명주소']='충남 홍성군 홍성읍 의사로36번길 49 홍성군다기능복지센터 3층'
data.loc[data['센터명']=='홍성남자단기청소년쉼터','위도']=36.6009
data.loc[data['센터명']=='홍성남자단기청소년쉼터','경도']=126.6623

data.loc[data['센터명']=='홍성여자단기청소년쉼터','도로명주소']='충남 홍성군 홍성읍 의사로36번길 49 홍성군다기능복지센터 3층'
data.loc[data['센터명']=='홍성여자단기청소년쉼터','위도']=36.6009
data.loc[data['센터명']=='홍성여자단기청소년쉼터','경도']=126.6623

data.loc[data['센터명']=='군산여자중장기청소년쉼터(꽃동산)','도로명주소']='전라북도 군산시 검다메안길 6-6 (조촌동) 2층'
data.loc[data['센터명']=='군산여자중장기청소년쉼터(꽃동산)','위도']=35.9671665
data.loc[data['센터명']=='군산여자중장기청소년쉼터(꽃동산)','경도']=126.7396119

data.loc[data['센터명']=='경상북도남자단기청소년쉼터','도로명주소']='경상북도 구미시 형곡로34길 31'
data.loc[data['센터명']=='경상북도남자단기청소년쉼터','위도']=36.1222
data.loc[data['센터명']=='경상북도남자단기청소년쉼터','경도']=128.3444

data.loc[data['센터명']=='경주시여자단기청소년쉼터','도로명주소']='경상북도 경주시 봉황로 168(성건동)'
data.loc[data['센터명']=='경주시여자단기청소년쉼터','위도']=35.8545
data.loc[data['센터명']=='경주시여자단기청소년쉼터','경도']=129.2102

data.loc[data['센터명']=='창원시남자단기청소년쉼터(하라)','도로명주소']='경상남도 창원시 의창구 하남천서길37번길 6-4 (도계동) 1층'
data.loc[data['센터명']=='창원시남자단기청소년쉼터(하라)','위도']=35.2624
data.loc[data['센터명']=='창원시남자단기청소년쉼터(하라)','경도']=128.6396

data.loc[data['센터명']=='김해시여자단기청소년쉼터','도로명주소']='경남 김해 분성로 277(봉황동) 김해YMCA 5층)'
data.loc[data['센터명']=='김해시여자단기청소년쉼터','위도']=35.23306436
data.loc[data['센터명']=='김해시여자단기청소년쉼터','경도']=128.8762265



센터명        0
시도명        0
전화번호       0
소재지        0
위도         0
경도         0
비고         0
도로명주소    110
dtype: int64

In [115]:
processed_data['시도명']=processed_data['시도명'].str[:2]
processed_data=processed_data.drop('시군구',axis=1)

KeyError: "['시군구'] not found in axis"

In [116]:
processed_data.rename(columns={'도로명주소':'소재지'}, inplace=True)
processed_data.to_csv('청소년쉼터_최종본.csv', index=False, encoding='utf-8-sig')
processed_data.head()

Unnamed: 0,센터명,시도명,전화번호,소재지,위도,경도,비고,소재지.1
0,"서울시립일시청소년쉼터(이동형, 서북)",서울,02-722-1318,서울 용산구,37.566826,126.978652,이동형 쉼터입니다. 관련 정보를 검색하여 찾아주세요.,
1,"서울시립일시청소년쉼터(이동형, 서남)",서울,02-722-1318,서울 용산구,37.566826,126.978652,이동형 쉼터입니다. 관련 정보를 검색하여 찾아주세요.,
2,"서울시립일시청소년쉼터(이동형, 동북)",서울,02-6239-2014,서울 용산구,37.566826,126.978652,이동형 쉼터입니다. 관련 정보를 검색하여 찾아주세요.,
3,"서울시립일시청소년쉼터(이동형, 동남)",서울,02-6239-2002,서울 용산구,37.566826,126.978652,이동형 쉼터입니다. 관련 정보를 검색하여 찾아주세요.,
4,서울시립용산일시청소년쉼터(고정형),서울,02-718-1318,서울 용산구 만리재로 156-1,37.552821,126.964361,,


In [113]:
null_address = processed_data[processed_data['위도'].isnull()]
null_address

Unnamed: 0,센터명,시도명,전화번호,소재지,위도,경도,비고
5,"서울시립강북일시청소년쉼터(고정형, 강북드림)",서울,02-6435-7979,,,,
12,서울시립망우여자단기청소년쉼터,서울,02-493-1388,,,,
13,서울시립신림남자중장기청소년쉼터,서울,02-3281-7942,,,,
14,서울시립금천여자중장기청소년쉼터,서울,02-6959-1011,,,,
16,강서여자중장기청소년쉼터(어울림),서울,02-302-9006,,,,
26,대구광역시남자중장기청소년쉼터,대구,053-426-2275,,,,
27,대구광역시여자중장기청소년쉼터,대구,053-426-2276,,,,
33,인천시여자단기청소년쉼터(하늘목장),인천,032-528-2216,,,,
34,인천시여자단기청소년쉼터(하모니),인천,032-468-1318,,,,
39,광주광역시남자중장기청소년쉼터,광주,062-714-1388,,,,


In [59]:
data3=pd.read_csv('output/정신건강센터_위치정보_업데이트.csv')
print(data3.isnull().sum())
data3.head()

Unnamed: 0       0
센터명              0
소재지              0
홈페이지          2061
위도               0
경도               0
dtype: int64


Unnamed: 0.1,Unnamed: 0,센터명,소재지,홈페이지,위도,경도
0,0,(복지)예사랑병원,부산광역시 서구 옥천로130번길 38 (아미동2가),,35.097335,129.013241
1,1,(의)고담의료재단마더스병원,울산광역시 남구 화합로 107 (달동),http://motherth.co.kr/,35.534393,129.340521
2,2,(의)나사렛의료재단 나사렛국제병원,인천광역시 연수구 먼우금로 98- (동춘동),https://www.nasaret.co.kr/,37.407949,126.670484
3,3,(의)아나의료재단강릉아나병원,강원특별자치도 강릉시 용지로 129,www.anahospital.kr,37.760577,128.903144
4,4,(재)예수의꽃동네유지재단 인곡자애병원,충청북도 음성군 맹동면 꽃동네길 37-0 (),,36.94215,127.577558


In [None]:
data3=pd.read_csv('output/정신건강센터_위치정보_업데이트.csv')
print(data3.isnull().sum())
data3.head()

In [97]:
import pandas as pd
import requests
import re
import time

# Load the data
data4 = pd.read_csv('여성가족부_청소년상담복지센터 현황_20241029.csv', encoding='cp949')
data4 = data4.drop(columns=['시도명', '시군구명', '전화번호_2', '전화번호_3(팩스)'])
data4 = data4.rename(columns={'주소': '소재지', '전화번호_1': '전화번호'})

# Read the Kakao API key from file
with open('map_key.txt', 'r') as f:
    kakao_api_key = f.read().strip()

# Function to clean addresses
def clean_address(address):
    # Remove postal code in parentheses
    address = re.sub(r'\([0-9]{5,6}\)\s*', '', address)
    # Remove floor information at the end
    address = re.sub(r'\s+\d+[동층호]$|\s+\d+층.*$|\s+B\d+$', '', address)
    return address.strip()

# Function to get coordinates from Kakao API
def get_coordinates(address, api_key):
    url = "https://dapi.kakao.com/v2/local/search/address.json"
    headers = {"Authorization": f"KakaoAK {api_key}"}
    params = {"query": address}
    
    response = requests.get(url, headers=headers, params=params)
    
    if response.status_code == 200:
        result = response.json()
        if result['documents']:
            return {
                'latitude': float(result['documents'][0]['y']),
                'longitude': float(result['documents'][0]['x'])
            }
    
    return {'latitude': None, 'longitude': None}

# Add new columns to the dataframe
data4['소재지'] = data4['소재지'].apply(clean_address)
data4['위도'] = None
data4['경도'] = None

# Get coordinates for each address
for idx, row in data4.iterrows():
    try:
        coords = get_coordinates(row['소재지'], kakao_api_key)
        data4.at[idx, '위도'] = coords['latitude']
        data4.at[idx, '경도'] = coords['longitude']
        # Add a small delay to avoid hitting API rate limits
        time.sleep(0.5)
    except Exception as e:
        print(f"Error with address {row['cleaned_address']}: {str(e)}")

# Save the updated dataframe to a new CSV file
data4.to_csv('청소년상담복지센터_위경도_추가.csv', encoding='utf-8-sig', index=False)

print("Processing complete. Results saved to '청소년상담복지센터_위경도_추가.csv'")

Processing complete. Results saved to '청소년상담복지센터_위경도_추가.csv'


In [100]:
null_address = data4[data4['위도'].isnull()]
null_address

Unnamed: 0,지역,센터명,소재지,전화번호,홈페이지,위도,경도


In [101]:
data4.loc[data4['센터명']=='동래구청소년상담복지센터','소재지']='부산광역시 동래구 중앙대로 1523 SK허브스카이 A3동 05호, 06호'
data4.loc[data4['센터명']=='동래구청소년상담복지센터','위도']=35.221286652299
data4.loc[data4['센터명']=='동래구청소년상담복지센터','경도']=129.08607825265

data4.loc[data4['센터명']=='광명시청소년상담복지센터','소재지']='경기 광명시 디지털로 34'
data4.loc[data4['센터명']=='광명시청소년상담복지센터','위도']= 37.4783
data4.loc[data4['센터명']=='광명시청소년상담복지센터','경도']=126.8665

data4.loc[data4['센터명']=='충청남도청소년상담복지센터','소재지']='충남 천안시 서북구 서부대로 766 진암빌딩 4층'
data4.loc[data4['센터명']=='충청남도청소년상담복지센터','위도']=36.8260
data4.loc[data4['센터명']=='충청남도청소년상담복지센터','경도']=127.1370

data4.loc[data4['센터명']=='천안시청소년상담복지센터','소재지']='충청남도 천안시 동남구 은행길 15 도시창조두드림센터 4층'
data4.loc[data4['센터명']=='천안시청소년상담복지센터','위도']=36.8106
data4.loc[data4['센터명']=='천안시청소년상담복지센터','경도']=127.1471

data4.loc[data4['센터명']=='화순군청소년상담복지센터','소재지']='전남 화순군 화순읍 쌍충로 118-4 3층'
data4.loc[data4['센터명']=='화순군청소년상담복지센터','위도']=35.0654
data4.loc[data4['센터명']=='화순군청소년상담복지센터','경도']=127.0032

data4.loc[data4['센터명']=='예천군청소년상담복지센터','소재지']='경북 예천군 봉호로 4040 신도시 복합커뮤니티센터 3층'
data4.loc[data4['센터명']=='예천군청소년상담복지센터','위도']=36.5786
data4.loc[data4['센터명']=='예천군청소년상담복지센터','경도']=128.4532

data4.to_csv('청소년상담복지센터_위경도_추가.csv', encoding='utf-8-sig', index=False)
data4.isnull().sum()


지역      0
센터명     0
소재지     0
전화번호    0
홈페이지    0
위도      0
경도      0
dtype: int64

In [190]:
data1=pd.read_csv('output/전국중독관리센터_목록.csv')
data2=pd.read_csv('청소년상담복지센터_위경도_추가.csv')
data3=pd.read_csv('output/정신건강센터_위치정보_업데이트.csv')
data4=pd.read_csv('청소년쉼터_최종본.csv')

In [191]:
data1.head()

Unnamed: 0,시도명,센터명,소재지,전화번호,홈페이지,위도,경도
0,강원,강릉중독관리통합지원센터,강릉시 경강로 2279 강맥빌딩 A동 2층,033-653-9668,,37.766694,128.910995
1,강원,원주시중독관리통합지원센터,원주시 원일로 139 원주건강문화센터 지하 1층,033-748-5119,http://alja.yonsei.ac.kr,37.35155,127.946803
2,강원,춘천중독관리통합지원센터,춘천시 삭주로 84 수인빌딩 3층,033-255-3482,www.alcoholfree.or.kr,37.883397,127.740265
3,경남,경남광역중독관리통합지원센터,경남 창원시 의창구 동읍 동읍로 457번길 48 (경남사회복지센터),055-239-1400,https://www.gnmhc.or.kr/sub02/sub03_01.php,35.309594,128.65115
4,경남,김해중독관리통합지원센터,"경남 김해시 주촌면 주선로 29-1, 건강생활지원센터 1층",055-314-0317,http://www.ghacc.co.kr,35.234777,128.845757


In [192]:
data2.head()

Unnamed: 0,지역,센터명,소재지,전화번호,홈페이지,위도,경도
0,서울,서울시청소년상담복지센터,서울특별시 중구 을지로 11길 23,02-2285-1318,www.teen1318.or.kr,37.56747,126.990557
1,서울,종로구청소년상담복지센터,서울특별시 종로구 명륜길 90,02-762-1318,www.jongno1318.or.kr,37.590644,126.993382
2,서울,용산구청소년상담복지센터,서울특별시 용산구 백범로 329(원효로 1가) 꿈나무종합타운,02-3273-5820,www.dodoit.or.kr,37.538904,126.965012
3,서울,성동구청소년상담복지센터,서울특별시 성동구 행당로6길 24-15,02-2299-1388,http://sdyc.or.kr,37.554226,127.027099
4,서울,광진구청소년상담복지센터,서울특별시 광진구 아차산로 24길 17 자양공공힐링센터,02-2205-2300,www.light1318.or.kr,37.540263,127.065109


In [193]:
def extract_city_province(address):
    # List of city/province names to search for
    regions = ['서울', '부산', '대구', '인천', '광주', '대전', '울산', '세종',
               '경기', '강원', '충북', '충남', '전북', '전남', '경북', '경남', '제주']
    
    # Check if any region is in the address
    for region in regions:
        if region in address:
            return region
    
    # If no match found, try more specific parsing
    # Pattern typically seen in Korean addresses: "[Province] [City/County]"
    # Example patterns to check
    if '경상북도' in address or '경북' in address:
        return '경북'
    elif '경상남도' in address or '경남' in address:
        return '경남'
    elif '전라북도' in address or '전북' in address:
        return '전북'
    elif '전라남도' in address or '전남' in address:
        return '전남'
    elif '충청북도' in address or '충북' in address:
        return '충북'
    elif '충청남도' in address or '충남' in address:
        return '충남'
    elif '강원특별자치도' in address or '강원도' in address:
        return '강원'
    elif '경기도' in address:
        return '경기'
    elif '제주특별자치도' in address or '제주도' in address:
        return '제주'
    
    # If still no match, return unknown
    return '확인필요'

# Apply the function to create a new column
data3['시도'] = data3['소재지'].apply(extract_city_province)

# Check the distribution of city/province
city_counts = data3['시도'].value_counts()
print(city_counts)


시도
서울      650
경기      500
부산      205
경북      146
경남      143
대구      140
대전      126
전북      126
인천      124
충남      114
전남      105
강원      103
광주       95
충북       92
울산       46
제주       41
세종       18
확인필요      3
Name: count, dtype: int64


In [194]:
data3.head()
data3.isnull().sum()

Unnamed: 0       0
센터명              0
소재지              0
홈페이지          2061
위도               0
경도               0
시도               0
dtype: int64

In [195]:
null_address = data3.loc[data3['시도'] == '확인필요']
null_address

Unnamed: 0.1,Unnamed: 0,센터명,소재지,홈페이지,위도,경도,시도
6,6,(학)일송학원 한림대학교성심병원,관평로170번길 22,https://hallym.hallym.or.kr/,37.391651,126.961972,확인필요
54,54,강릉시정신건강복지센터,"강릉시 남구길 23번길24 3층,4층",www.gnmind.com,37.763635,128.903224,확인필요
1542,1542,양양군정신건강복지센터,양양군 양양읍 양양로 9-5(양양군보건소2층),http://www.diddid0197.com/,38.077861,128.627479,확인필요


In [196]:
data3.loc[data3['센터명']=='(학)일송학원 한림대학교성심병원','소재지']='경기도 안양시 동안구 관평로170번길 22'
data3.loc[data3['센터명']=='(학)일송학원 한림대학교성심병원','시도']='경기'
data3.loc[data3['센터명']=='강릉시정신건강복지센터','시도']='강원'
data3.loc[data3['센터명']=='양양군정신건강복지센터','시도']='강원'

data3=data3.drop(columns=['Unnamed: 0'])
data3.rename(columns={'시도':'시도명'}, inplace=True)

In [197]:
data3.to_csv('output/정신건강센터_최종본.csv', encoding='utf-8-sig')

In [198]:
data4.head()

Unnamed: 0,센터명,시도명,전화번호,소재지,위도,경도,비고,소재지.1
0,"서울시립일시청소년쉼터(이동형, 서북)",서울,02-722-1318,서울 용산구,37.566826,126.978652,이동형 쉼터입니다. 관련 정보를 검색하여 찾아주세요.,
1,"서울시립일시청소년쉼터(이동형, 서남)",서울,02-722-1318,서울 용산구,37.566826,126.978652,이동형 쉼터입니다. 관련 정보를 검색하여 찾아주세요.,
2,"서울시립일시청소년쉼터(이동형, 동북)",서울,02-6239-2014,서울 용산구,37.566826,126.978652,이동형 쉼터입니다. 관련 정보를 검색하여 찾아주세요.,
3,"서울시립일시청소년쉼터(이동형, 동남)",서울,02-6239-2002,서울 용산구,37.566826,126.978652,이동형 쉼터입니다. 관련 정보를 검색하여 찾아주세요.,
4,서울시립용산일시청소년쉼터(고정형),서울,02-718-1318,서울 용산구 만리재로 156-1,37.552821,126.964361,,


In [199]:
print(data1.isnull().sum())
print(data2.isnull().sum())

시도명      0
센터명      0
소재지      0
전화번호     1
홈페이지    27
위도       0
경도       0
dtype: int64
지역      0
센터명     0
소재지     0
전화번호    0
홈페이지    0
위도      0
경도      0
dtype: int64


In [200]:
print(data3.isnull().sum())
print(data4.isnull().sum())

센터명        0
소재지        0
홈페이지    2061
위도         0
경도         0
시도명        0
dtype: int64
센터명        0
시도명        0
전화번호       0
소재지       27
위도         0
경도         0
비고       123
소재지.1    110
dtype: int64


In [201]:
data1.head()
data1['유형']='중독관리센터'
data2['유형']='청소년상담복지센터'
data3['유형']='정신건강센터'
data4['유형']='청소년쉼터'

In [202]:
data2=data2.rename(columns={'지역':'시도명'})
data2.head()


Unnamed: 0,시도명,센터명,소재지,전화번호,홈페이지,위도,경도,유형
0,서울,서울시청소년상담복지센터,서울특별시 중구 을지로 11길 23,02-2285-1318,www.teen1318.or.kr,37.56747,126.990557,청소년상담복지센터
1,서울,종로구청소년상담복지센터,서울특별시 종로구 명륜길 90,02-762-1318,www.jongno1318.or.kr,37.590644,126.993382,청소년상담복지센터
2,서울,용산구청소년상담복지센터,서울특별시 용산구 백범로 329(원효로 1가) 꿈나무종합타운,02-3273-5820,www.dodoit.or.kr,37.538904,126.965012,청소년상담복지센터
3,서울,성동구청소년상담복지센터,서울특별시 성동구 행당로6길 24-15,02-2299-1388,http://sdyc.or.kr,37.554226,127.027099,청소년상담복지센터
4,서울,광진구청소년상담복지센터,서울특별시 광진구 아차산로 24길 17 자양공공힐링센터,02-2205-2300,www.light1318.or.kr,37.540263,127.065109,청소년상담복지센터


In [203]:
data3=pd.read_csv('output/정신건강센터_최종본.csv')
data3.drop(columns=['Unnamed: 0'], inplace=True)
data3.head()

Unnamed: 0,센터명,소재지,홈페이지,위도,경도,시도명
0,(복지)예사랑병원,부산광역시 서구 옥천로130번길 38 (아미동2가),,35.097335,129.013241,부산
1,(의)고담의료재단마더스병원,울산광역시 남구 화합로 107 (달동),http://motherth.co.kr/,35.534393,129.340521,울산
2,(의)나사렛의료재단 나사렛국제병원,인천광역시 연수구 먼우금로 98- (동춘동),https://www.nasaret.co.kr/,37.407949,126.670484,인천
3,(의)아나의료재단강릉아나병원,강원특별자치도 강릉시 용지로 129,www.anahospital.kr,37.760577,128.903144,강원
4,(재)예수의꽃동네유지재단 인곡자애병원,충청북도 음성군 맹동면 꽃동네길 37-0 (),,36.94215,127.577558,충북


In [204]:
data3['유형']='정신건강센터'

In [205]:
data4.head()
data4=data4.drop(columns=['소재지.1'])
data4['유형']='청소년쉼터'
data4.head()

Unnamed: 0,센터명,시도명,전화번호,소재지,위도,경도,비고,유형
0,"서울시립일시청소년쉼터(이동형, 서북)",서울,02-722-1318,서울 용산구,37.566826,126.978652,이동형 쉼터입니다. 관련 정보를 검색하여 찾아주세요.,청소년쉼터
1,"서울시립일시청소년쉼터(이동형, 서남)",서울,02-722-1318,서울 용산구,37.566826,126.978652,이동형 쉼터입니다. 관련 정보를 검색하여 찾아주세요.,청소년쉼터
2,"서울시립일시청소년쉼터(이동형, 동북)",서울,02-6239-2014,서울 용산구,37.566826,126.978652,이동형 쉼터입니다. 관련 정보를 검색하여 찾아주세요.,청소년쉼터
3,"서울시립일시청소년쉼터(이동형, 동남)",서울,02-6239-2002,서울 용산구,37.566826,126.978652,이동형 쉼터입니다. 관련 정보를 검색하여 찾아주세요.,청소년쉼터
4,서울시립용산일시청소년쉼터(고정형),서울,02-718-1318,서울 용산구 만리재로 156-1,37.552821,126.964361,,청소년쉼터


In [206]:
# 데이터프레임 리스트 만들기
dfs = [data1,data2,data3,data4]
# 행 기준으로 합치기 (아래로 쌓기)
data = pd.concat(dfs, axis=0, ignore_index=True)
data.head(10)
data.shape

(3223, 9)

In [207]:
data.head(10)


Unnamed: 0,시도명,센터명,소재지,전화번호,홈페이지,위도,경도,유형,비고
0,강원,강릉중독관리통합지원센터,강릉시 경강로 2279 강맥빌딩 A동 2층,033-653-9668,,37.766694,128.910995,중독관리센터,
1,강원,원주시중독관리통합지원센터,원주시 원일로 139 원주건강문화센터 지하 1층,033-748-5119,http://alja.yonsei.ac.kr,37.35155,127.946803,중독관리센터,
2,강원,춘천중독관리통합지원센터,춘천시 삭주로 84 수인빌딩 3층,033-255-3482,www.alcoholfree.or.kr,37.883397,127.740265,중독관리센터,
3,경남,경남광역중독관리통합지원센터,경남 창원시 의창구 동읍 동읍로 457번길 48 (경남사회복지센터),055-239-1400,https://www.gnmhc.or.kr/sub02/sub03_01.php,35.309594,128.65115,중독관리센터,
4,경남,김해중독관리통합지원센터,"경남 김해시 주촌면 주선로 29-1, 건강생활지원센터 1층",055-314-0317,http://www.ghacc.co.kr,35.234777,128.845757,중독관리센터,
5,경남,마산중독관리통합지원센터,"경남 창원시 마산합포구 합포로 2, 3층",055-247-6994,http://www.masanacc.or.kr,35.202656,128.572614,중독관리센터,
6,경남,양산시중독관리통합지원센터,경남 양산시 중앙로 7-32 양산시 보건복지센터 5층,055-367-9072,http://www.yscamc.org,35.332157,129.037995,중독관리센터,
7,경남,진주중독관리통합지원센터,"경남 진주시 진주대로 816번길 20, 2층",055-758-7801,http://www.jinjuacc.org,35.174151,128.095878,중독관리센터,
8,경남,창원중독관리통합지원센터,"경남 창원시 성산구 중앙대로 162번길 8, 4층",055-225-7851,http://www.cwacc.or.kr,35.227811,128.685588,중독관리센터,
9,경북,구미중독관리통합지원센터,경북 구미시 검성로 115-1,054-474-9791,http://gmaddiction.or.kr,36.118274,128.429909,중독관리센터,


In [208]:
# 청소년쉼터 정보 데이터 추가
data.loc[data['센터명']=='서울시립망우여자단기청소년쉼터','소재지']='서울시 중랑구 송림길 156'
data.loc[data['센터명']=='서울시립망우여자단기청소년쉼터','위도']=37.5976
data.loc[data['센터명']=='서울시립망우여자단기청소년쉼터','경도']=127.09422

data.loc[data['센터명']=='서울시립신림남자중장기청소년쉼터','소재지']='서울시 관악구 난곡로24가길 54 301호'
data.loc[data['센터명']=='서울시립신림남자중장기청소년쉼터','위도']=37.4777
data.loc[data['센터명']=='서울시립신림남자중장기청소년쉼터','경도']=126.9118

data.loc[data['센터명']=='서울시립금천여자중장기청소년쉼터','소재지']='서울시 금천구 독산로73길 10-16'
data.loc[data['센터명']=='서울시립금천여자중장기청소년쉼터','위도']=37.4682
data.loc[data['센터명']=='서울시립금천여자중장기청소년쉼터','경도']=126.9036

data.loc[data['센터명']=='강서여자중장기청소년쉼터(어울림)','소재지']='서울특별시 강서구 화곡6동'
data.loc[data['센터명']=='강서여자중장기청소년쉼터(어울림)','위도']=37.5509
data.loc[data['센터명']=='강서여자중장기청소년쉼터(어울림)','경도']=126.8497

data.loc[data['센터명']=='대구광역시남자중장기청소년쉼터','소재지']='대구시 중구 남산로8길 14 3층'
data.loc[data['센터명']=='대구광역시남자중장기청소년쉼터','위도']=35.8592
data.loc[data['센터명']=='대구광역시남자중장기청소년쉼터','경도']=128.5867

data.loc[data['센터명']=='대구광역시여자중장기청소년쉼터','소재지']='대구시 달서구 당산로 106(성당동) 4층'
data.loc[data['센터명']=='대구광역시여자중장기청소년쉼터','위도']=35.8411
data.loc[data['센터명']=='대구광역시여자중장기청소년쉼터','경도']=128.5432

data.loc[data['센터명']=='인천시여자단기청소년쉼터(하늘목장)','소재지']='인천광역시 부평구 수변로 45-2 201호'
data.loc[data['센터명']=='인천시여자단기청소년쉼터(하늘목장)','위도']=37.4951
data.loc[data['센터명']=='인천시여자단기청소년쉼터(하늘목장)','경도']=126.7307

data.loc[data['센터명']=='인천시여자단기청소년쉼터(하모니)','소재지']='인천 남동구 인주대로 801 대영빌딩 5층'
data.loc[data['센터명']=='인천시여자단기청소년쉼터(하모니)','위도']=37.4481
data.loc[data['센터명']=='인천시여자단기청소년쉼터(하모니)','경도']=126.7031

data.loc[data['센터명']=='광주광역시남자중장기청소년쉼터','소재지']='광주광역시 서구 풍금로24번길 5-1'
data.loc[data['센터명']=='광주광역시남자중장기청소년쉼터','위도']=35.1350
data.loc[data['센터명']=='광주광역시남자중장기청소년쉼터','경도']=126.8513

data.loc[data['센터명']=='광주광역시여자중장기청소년쉼터(맥지쉼터)','소재지']='광주광역시 동구 지원로 34'
data.loc[data['센터명']=='광주광역시여자중장기청소년쉼터(맥지쉼터)','위도']=35.1469
data.loc[data['센터명']=='광주광역시여자중장기청소년쉼터(맥지쉼터)','경도']=126.9273

data.loc[data['센터명']=='대전시남자중장기청소년쉼터','소재지']='대전 서구 도솔로 43 304호 401호'
data.loc[data['센터명']=='대전시남자중장기청소년쉼터','위도']=36.3369
data.loc[data['센터명']=='대전시남자중장기청소년쉼터','경도']=127.3824

data.loc[data['센터명']=='시흥시남자단기청소년쉼터(꿈다락)','소재지']='경기도 시흥시 시흥대로 1073번길 4-2'
data.loc[data['센터명']=='시흥시남자단기청소년쉼터(꿈다락)','위도']=37.4441
data.loc[data['센터명']=='시흥시남자단기청소년쉼터(꿈다락)','경도']=126.7856

data.loc[data['센터명']=='부천여자단기청소년쉼터(모퉁이)','소재지']='경기도 부천시 부일로 763번길 16-23'
data.loc[data['센터명']=='부천여자단기청소년쉼터(모퉁이)','위도']=37.4895
data.loc[data['센터명']=='부천여자단기청소년쉼터(모퉁이)','경도']=126.8000

data.loc[data['센터명']=='하남시남자중장기청소년쉼터','소재지']='경기도 하남시 대청로 33 현대베스코아 1001호 1002호'
data.loc[data['센터명']=='하남시남자중장기청소년쉼터','위도']=37.5519
data.loc[data['센터명']=='하남시남자중장기청소년쉼터','경도']=127.1885

data.loc[data['센터명']=='성남시여자중장기청소년쉼터','소재지']='경기 성남시 중원구 박석로41번길 25'
data.loc[data['센터명']=='성남시여자중장기청소년쉼터','위도']=37.4382
data.loc[data['센터명']=='성남시여자중장기청소년쉼터','경도']=127.1714

data.loc[data['센터명']=='파주시여자단기청소년쉼터','소재지']='경기 파주시 와석순환로 347'
data.loc[data['센터명']=='파주시여자단기청소년쉼터','위도']=37.725062441119
data.loc[data['센터명']=='파주시여자단기청소년쉼터','경도']=126.74419855517

data.loc[data['센터명']=='강원특별자치도남자단기청소년쉼터','소재지']='강원 춘천시 후석로 379번길 27 4층'
data.loc[data['센터명']=='강원특별자치도남자단기청소년쉼터','위도']=37.8765
data.loc[data['센터명']=='강원특별자치도남자단기청소년쉼터','경도']=127.7341

data.loc[data['센터명']=='강원특별자치도여자중장기청소년쉼터','소재지']='강원 춘천시 동면 춘천로 527-40 2층'
data.loc[data['센터명']=='강원특별자치도여자중장기청소년쉼터','위도']=37.8957
data.loc[data['센터명']=='강원특별자치도여자중장기청소년쉼터','경도']=127.80751

data.loc[data['센터명']=='청주시남자단기청소년쉼터','소재지']='충북 청주시 흥덕구 무심서로 665'
data.loc[data['센터명']=='청주시남자단기청소년쉼터','위도']=36.6296
data.loc[data['센터명']=='청주시남자단기청소년쉼터','경도']=127.4255

data.loc[data['센터명']=='서울시립강북일시청소년쉼터(고정형, 강북드림)','소재지']='서울특별시 강북구 한천로 140길 5-26 강북청소년드림센터'
data.loc[data['센터명']=='서울시립강북일시청소년쉼터(고정형, 강북드림)','위도']=37.6377
data.loc[data['센터명']=='서울시립강북일시청소년쉼터(고정형, 강북드림)','경도']=127.0233

data.loc[data['센터명']=='홍성남자단기청소년쉼터','소재지']='충남 홍성군 홍성읍 의사로36번길 49 홍성군다기능복지센터 3층'
data.loc[data['센터명']=='홍성남자단기청소년쉼터','위도']=36.6009
data.loc[data['센터명']=='홍성남자단기청소년쉼터','경도']=126.6623

data.loc[data['센터명']=='홍성여자단기청소년쉼터','소재지']='충남 홍성군 홍성읍 의사로36번길 49 홍성군다기능복지센터 3층'
data.loc[data['센터명']=='홍성여자단기청소년쉼터','위도']=36.6009
data.loc[data['센터명']=='홍성여자단기청소년쉼터','경도']=126.6623

data.loc[data['센터명']=='군산여자중장기청소년쉼터(꽃동산)','소재지']='전라북도 군산시 검다메안길 6-6 (조촌동) 2층'
data.loc[data['센터명']=='군산여자중장기청소년쉼터(꽃동산)','위도']=35.9671665
data.loc[data['센터명']=='군산여자중장기청소년쉼터(꽃동산)','경도']=126.7396119

data.loc[data['센터명']=='경상북도남자단기청소년쉼터','소재지']='경상북도 구미시 형곡로34길 31'
data.loc[data['센터명']=='경상북도남자단기청소년쉼터','위도']=36.1222
data.loc[data['센터명']=='경상북도남자단기청소년쉼터','경도']=128.3444

data.loc[data['센터명']=='경주시여자단기청소년쉼터','소재지']='경상북도 경주시 봉황로 168(성건동)'
data.loc[data['센터명']=='경주시여자단기청소년쉼터','위도']=35.8545
data.loc[data['센터명']=='경주시여자단기청소년쉼터','경도']=129.2102

data.loc[data['센터명']=='창원시남자단기청소년쉼터(하라)','소재지']='경상남도 창원시 의창구 하남천서길37번길 6-4 (도계동) 1층'
data.loc[data['센터명']=='창원시남자단기청소년쉼터(하라)','위도']=35.2624
data.loc[data['센터명']=='창원시남자단기청소년쉼터(하라)','경도']=128.6396

data.loc[data['센터명']=='김해시여자단기청소년쉼터','소재지']='경남 김해 분성로 277(봉황동) 김해YMCA 5층)'
data.loc[data['센터명']=='김해시여자단기청소년쉼터','위도']=35.23306436
data.loc[data['센터명']=='김해시여자단기청소년쉼터','경도']=128.8762265

null_address = data[data['소재지'].isnull()]
null_address.isnull().sum()

시도명     0
센터명     0
소재지     0
전화번호    0
홈페이지    0
위도      0
경도      0
유형      0
비고      0
dtype: int64

In [209]:
data.isnull().sum()

시도명        0
센터명        0
소재지        0
전화번호    2778
홈페이지    2225
위도         0
경도         0
유형         0
비고      3209
dtype: int64

In [210]:
data.head()

Unnamed: 0,시도명,센터명,소재지,전화번호,홈페이지,위도,경도,유형,비고
0,강원,강릉중독관리통합지원센터,강릉시 경강로 2279 강맥빌딩 A동 2층,033-653-9668,,37.766694,128.910995,중독관리센터,
1,강원,원주시중독관리통합지원센터,원주시 원일로 139 원주건강문화센터 지하 1층,033-748-5119,http://alja.yonsei.ac.kr,37.35155,127.946803,중독관리센터,
2,강원,춘천중독관리통합지원센터,춘천시 삭주로 84 수인빌딩 3층,033-255-3482,www.alcoholfree.or.kr,37.883397,127.740265,중독관리센터,
3,경남,경남광역중독관리통합지원센터,경남 창원시 의창구 동읍 동읍로 457번길 48 (경남사회복지센터),055-239-1400,https://www.gnmhc.or.kr/sub02/sub03_01.php,35.309594,128.65115,중독관리센터,
4,경남,김해중독관리통합지원센터,"경남 김해시 주촌면 주선로 29-1, 건강생활지원센터 1층",055-314-0317,http://www.ghacc.co.kr,35.234777,128.845757,중독관리센터,


In [211]:
data.loc[data['시도명']=='광주광역시','시도명']='광주'
data.loc[data['시도명']=='대구광역시','시도명']='대구'
data.loc[data['시도명']=='대전광역시','시도명']='대전'
data.loc[data['시도명']=='부산광역시','시도명']='부산'
data.loc[data['시도명']=='인천광역시','시도명']='인척'

In [212]:
data['시도명'].unique()

array(['강원', '경남', '경북', '광주', '대구', '부산', '서울', '울산', '인척', '전남', '전북',
       '제주', '경기도', '충남', '충북', '인천', '대전', '세종', '경기'], dtype=object)

In [213]:
import pandas as pd
import requests
import numpy as np
import time
import re

# API 키 파일에서 읽기
def read_api_keys(file_path):
    keys = {}
    try:
        with open(file_path, 'r', encoding='utf-8') as file:
            for line in file:
                if ":" in line:
                    key, value = line.strip().split(":", 1)
                    keys[key.strip()] = value.strip()
    except Exception as e:
        print(f"API 키 파일 읽기 오류: {e}")
    return keys

# API 키 파일 읽기
api_keys = read_api_keys('naver_api_key.txt')

# API 키 확인
try:
    with open(api_key_path, 'r') as f:
        KAKAO_API_KEY = f.read().strip()
    print(f"API 키를 성공적으로 불러왔습니다.")
except FileNotFoundError:
    print(f"파일을 찾을 수 없습니다: {api_key_path}")
    print(f"현재 작업 디렉토리: {os.getcwd()}")
    KAKAO_API_KEY = ""

headers = {"Authorization": f"KakaoAK {KAKAO_API_KEY}"}
naver_client_id = api_keys.get('client_id', '')
naver_client_secret = api_keys.get('client_secret', '')

if not naver_client_id or not naver_client_secret:
    print("네이버 API 키가 올바르게 로드되지 않았습니다.")
    print("naver_api_key.txt 파일에 다음 형식으로 저장되어 있는지 확인하세요:")
    print("client_id: 발급받은_클라이언트_아이디")
    print("client_secret: 발급받은_클라이언트_시크릿")
    exit(1)  # 오류 코드와 함께 종료

print(f"네이버 API 키 로드 완료: client_id={naver_client_id[:5]}...")

# API 헤더 설정
kakao_headers = {"Authorization": f"KakaoAK {kakao_api_key}"}
naver_headers = {
    "X-Naver-Client-Id": naver_client_id,
    "X-Naver-Client-Secret": naver_client_secret
}

df = pd.DataFrame(data)

# URL에서 도메인 추출하는 함수
def extract_domain(url):
    if pd.isna(url):
        return None
    
    # URL 형식 확인 및 수정
    if not url.startswith(('http://', 'https://')):
        url = 'http://' + url
    
    # 도메인 추출
    try:
        domain = re.findall(r'https?://([^/]+)', url)[0]
        return domain
    except:
        return url

# 홈페이지 정보 검색 함수
def search_homepage(center_name, location):
    homepage_candidates = []
    
    # 1. 카카오 로컬 API로 검색 (카카오 API 키가 유효하다면)
    if kakao_api_key and kakao_api_key != "YOUR_KAKAO_REST_API_KEY":
        try:
            kakao_url = "https://dapi.kakao.com/v2/local/search/keyword.json"
            query = f"{center_name} {location}"
            params = {"query": query}
            
            response = requests.get(kakao_url, headers=kakao_headers, params=params)
            
            if response.status_code == 200:
                places = response.json().get("documents", [])
                
                if places:
                    place = places[0]
                    # 카카오 장소 URL 저장
                    place_url = place.get('place_url')
                    if place_url:
                        homepage_candidates.append(('kakao_place', place_url))
                    
                    # 응답에서 다른 가능한 홈페이지 필드 확인
                    for field in ['homepage', 'web_url', 'website']:
                        if field in place and place[field]:
                            homepage_candidates.append(('kakao_web', place[field]))
                            break
        except Exception as e:
            print(f"카카오 API 오류: {e}")
    
    # 2. 네이버 검색 API로 검색
    try:
        naver_url = "https://openapi.naver.com/v1/search/webkr.json"
        query = f"{center_name} {location.split()[0]} 공식 홈페이지"
        params = {
            "query": query,
            "display": 3,  # 결과 개수
            "start": 1,
            "sort": "sim"  # 유사도순
        }
        
        response = requests.get(naver_url, headers=naver_headers, params=params)
        
        if response.status_code == 200:
            search_results = response.json().get("items", [])
            
            if search_results:
                # 첫 번째 결과의 링크 저장
                naver_url = search_results[0].get('link')
                if naver_url:
                    homepage_candidates.append(('naver_web', naver_url))
        else:
            print(f"네이버 API 오류: {response.status_code}, {response.text}")
    except Exception as e:
        print(f"네이버 API 오류: {e}")
    
    # 3. 가장 적합한 홈페이지 URL 선택
    if homepage_candidates:
        # 우선순위: 네이버 검색 결과 > 카카오 웹 URL > 카카오 장소 URL
        for source, url in [('naver_web', None), ('kakao_web', None), ('kakao_place', None)]:
            for candidate_source, candidate_url in homepage_candidates:
                if candidate_source == source:
                    return candidate_url
        
        # 어떤 것도 일치하지 않으면 첫 번째 후보 반환
        return homepage_candidates[0][1]
    
    return None

# 홈페이지가 NaN인 행에 대해서만 처리
for idx, row in df.iterrows():
    # 홈페이지가 NaN인 경우에만 업데이트 진행
    if pd.isna(row['홈페이지']):
        # 센터명과 소재지를 추출
        center_name = row['센터명']
        location = row['소재지']
        
        print(f"\n처리 중: {center_name}")
        
        # 홈페이지 검색
        homepage = search_homepage(center_name, location)
        
        # 홈페이지 정보가 있으면 업데이트
        if homepage:
            df.at[idx, '홈페이지'] = homepage
            print(f"홈페이지 업데이트: {homepage}")
        else:
            print(f"홈페이지 정보를 찾을 수 없습니다.")
        
        # API 호출 제한 방지를 위한 딜레이
        time.sleep(1)

# 결과 확인
print("\n업데이트된 데이터:")
pd.set_option('display.max_columns', None)
print(df)

# 결과를 CSV 파일로 저장
df.to_csv('updated_centers.csv', index=False, encoding='utf-8-sig')
print("\n데이터가 'updated_centers.csv'로 저장되었습니다.")

API 키를 성공적으로 불러왔습니다.
네이버 API 키 로드 완료: client_id=qdtPm...

처리 중: 강릉중독관리통합지원센터
홈페이지 업데이트: https://gnamc.or.kr/

처리 중: 안동중독관리통합지원센터
홈페이지 업데이트: https://www.kyongbuk.co.kr/news/articleView.html?idxno=4028077

처리 중: 동구중독관리 통합지원센터
홈페이지 업데이트: http://www.yohanacc.or.kr/

처리 중: 서구중독관리 통합지원센터
홈페이지 업데이트: http://www.dsracc.or.kr/

처리 중: 남구중독관리 통합지원센터
홈페이지 업데이트: http://www.yohanacc.or.kr/

처리 중: 북구중독관리 통합지원센터
홈페이지 정보를 찾을 수 없습니다.

처리 중: 광산구중독관리 통합지원센터
홈페이지 업데이트: http://www.yohanacc.or.kr/

처리 중: 광역정신건강복지센터
홈페이지 업데이트: https://www.mohw.go.kr/menu.es?mid=a10706040200

처리 중: 중구정신건강복지센터
홈페이지 업데이트: https://www.junggumind.or.kr/

처리 중: 동구정신건강복지센터
홈페이지 업데이트: https://dmhc.co.kr/

처리 중: 서구정신건강복지센터
홈페이지 업데이트: http://www.ismhc.co.kr/

처리 중: 남구정신건강복지센터
홈페이지 업데이트: https://monami.or.kr/

처리 중: 북구정신건강복지센터
홈페이지 업데이트: http://www.eosmhc.or.kr/

처리 중: 수성구정신건강복지센터
홈페이지 업데이트: http://www.belami.or.kr/sub.php?menukey=12

처리 중: 달서구정신건강복지센터
홈페이지 업데이트: https://www.dsmhc.or.kr/

처리 중: 달성군정신건강복지센터
홈페이지 업데이트: https://www.mind119.

In [214]:
data=pd.read_csv('updated_centers.csv')
data.head()

Unnamed: 0,시도명,센터명,소재지,전화번호,홈페이지,위도,경도,유형,비고
0,강원,강릉중독관리통합지원센터,강릉시 경강로 2279 강맥빌딩 A동 2층,033-653-9668,https://gnamc.or.kr/,37.766694,128.910995,중독관리센터,
1,강원,원주시중독관리통합지원센터,원주시 원일로 139 원주건강문화센터 지하 1층,033-748-5119,http://alja.yonsei.ac.kr,37.35155,127.946803,중독관리센터,
2,강원,춘천중독관리통합지원센터,춘천시 삭주로 84 수인빌딩 3층,033-255-3482,www.alcoholfree.or.kr,37.883397,127.740265,중독관리센터,
3,경남,경남광역중독관리통합지원센터,경남 창원시 의창구 동읍 동읍로 457번길 48 (경남사회복지센터),055-239-1400,https://www.gnmhc.or.kr/sub02/sub03_01.php,35.309594,128.65115,중독관리센터,
4,경남,김해중독관리통합지원센터,"경남 김해시 주촌면 주선로 29-1, 건강생활지원센터 1층",055-314-0317,http://www.ghacc.co.kr,35.234777,128.845757,중독관리센터,


In [215]:
data.isnull().sum()

시도명        0
센터명        0
소재지        0
전화번호    2778
홈페이지       1
위도         0
경도         0
유형         0
비고      3209
dtype: int64

In [220]:
null_homepage = data.loc[data['홈페이지'].isnull()]
data.loc[data['센터명']=='북구중독관리 통합지원센터','홈페이지']='https://www.yohanacc.or.kr/wp_main/'
null_homepage = data.loc[data['홈페이지'].isnull()]
null_homepage

Unnamed: 0,시도명,센터명,소재지,전화번호,홈페이지,위도,경도,유형,비고
