In [2]:
# norm : 크기 , 노말라이징 -> 단위벡터 구하기
# norm : 규격, 기준 
import math
import numpy as np
from scipy import linalg
import pandas as pd
import folium

def haversine(lat1, lon1, lat2, lon2):
    """
    위도와 경도를 이용하여 두 지점 간의 거리를 계산합니다.
    
    매개변수:
    lat1, lon1: 첫 번째 지점의 위도와 경도
    lat2, lon2: 두 번째 지점의 위도와 경도
    
    반환값:
    두 지점 간의 거리 (킬로미터 단위)
    """
    R = 6371.0  # 지구의 반지름 (킬로미터 단위)
    
    # 위도와 경도를 라디안 단위로 변환
    lat1_rad = math.radians(lat1)
    lon1_rad = math.radians(lon1)        
    lat2_rad = math.radians(lat2)    
    lon2_rad = math.radians(lon2)
    
    # 위도와 경도의 차이 계산
    # delta_lat = lat2_rad - lat1_rad
    # delta_lon = lon2_rad - lon1_rad
    
    # 하버사인 공식 적용
    # a = math.sin(delta_lat / 2)**2 + math.cos(lat1_rad) * math.cos(lat2_rad) * math.sin(delta_lon / 2)**2
    # c = 2 * math.atan2(math.sqrt(a), math.sqrt(1 - a))
    
    # 거리 계산
    # distance = R * c
    # return distance  

# 예제 사용
# lat1, lon1 = 37.7749, -122.4194  # 샌프란시스코, 미국
# lat2, lon2 = 34.0522, -118.2437  # 로스앤젤레스, 미국

# distance = haversine(lat1, lon1, lat2, lon2)
# print(f"Distance: {distance:.2f} km")

In [3]:
cols = ['연번', '위도', '경도']
df1 = pd.read_csv('C:/shjung/pythonExam/240807_linalg_pandas2/cloth.csv', encoding='cp949', usecols=cols)

In [4]:
# df1.info()
df1

Unnamed: 0,연번,위도,경도
0,1,37.506749,127.046375
1,2,37.506841,127.044369
2,3,37.506241,127.045348
3,4,37.507094,127.045051
4,5,37.507862,127.044635
...,...,...,...
662,663,37.463176,127.105597
663,664,37.463647,127.105501
664,665,37.474468,127.098659
665,666,37.474736,127.097952


In [5]:
df1.columns

Index(['연번', '위도', '경도'], dtype='object')

In [6]:
# df1.drop('지번주소', axis = 1, inplace=True)

In [7]:
# 1. 쓰레기 수거 패턴
# 2. 수거 경로 최적화
# 3. 쓰레기 종류별 분석
# 4. 사용자 행동 분석

# 요약
#     쓰레기 수거 패턴 분석: 시계열 분석, 예측 모델링.
#     수거 경로 최적화: TSP 알고리즘, GIS 분석.
#     쓰레기 종류별 분석: 분류 알고리즘, 비율 분석.
#     사용자 행동 분석: 설문조사 분석, 클러스터링.

#     이러한 분석 업무를 통해 쓰레기 수거 효율성을 높이고 비용을 절감할 수 있습니다.

# 서울시 강남역의 위도와 경도는 다음과 같습니다:

# 위도 (Latitude): 37.4979
# 경도 (Longitude): 127.0276

# lat1, lon1 = 37.7749, -122.4194  
# lat2, lon2 = 34.0522, -118.2437   
# distance = haversine(lat1, lon1, lat2, lon2)
# print(f"Distance: {distance:.2f} km") 

In [8]:
# df1.columns

In [9]:
# type(df1)

In [10]:
# df1['delta1'] = {}
# df1['delta2'] = {}

In [11]:
# df1

In [12]:
# 서울시 강남역의 위도와 경도는 다음과 같습니다:
# 위도 (Latitude): 37.4979
# 경도 (Longitude): 127.0276

# lat1, lon1 = 37.4979, 127.0276  # 서울 강남역
# lat2, lon2 = df1['위도'][0],  df1['경도'][0]
# distance = haversine(lat1, lon1, lat2, lon2)
# print(f"거리: {distance:.6f} km")  
# print(df1['위도'][0] , df1['경도'][0])

In [13]:
# df1['거리'] = haversine(lat1, lon1, lat2, lon2)

In [14]:
# ser1= pd.Series(df1['위도'])
# ser1
# ser2= pd.Series(df1['경도'])
# ser2

In [15]:
# df1['delta1'] = lat1- ser1
# df1['delta2'] = lon1- ser2
# np.std(df1['delta1'])
# np.std(df1['delta2'])
# abs(df1['delta1']) >= np.std(df1['delta1'])
# abs(df1['delta2']) >= np.std(df1['delta2'])
# df1[(abs(df1['delta1']) >= np.average(df1['delta1'])) | ((df1['delta2']) >= np.average(df1['delta2']))]

In [16]:
df1

Unnamed: 0,연번,위도,경도
0,1,37.506749,127.046375
1,2,37.506841,127.044369
2,3,37.506241,127.045348
3,4,37.507094,127.045051
4,5,37.507862,127.044635
...,...,...,...
662,663,37.463176,127.105597
663,664,37.463647,127.105501
664,665,37.474468,127.098659
665,666,37.474736,127.097952


In [17]:
# df1.iloc[1]['경도']
df1['위도'].count()

667

In [20]:
m = folium.Map(
    location=[37.4979, 127.0276],
    zoom_start=16
)
tooltip = 'Click'
# 강남역:  37.4979, 127.0276
folium.Marker (
    [37.4979, 127.0276],
    popup='<strong>강남역</strong>',
    tooltip = tooltip,
    icon=folium.Icon(color='red', icon='info-sign')
).add_to(m)

#for i in range(df1['위도'].count()):
for i in range(2):
    folium.Marker(
        [df1.iloc[i]['위도'], df1.iloc[i]['경도']],
        tooltip = round(df1.iloc[i]['연번']),
        icon=folium.Icon(color='blue', icon='star')
    ).add_to(m)
m