In [34]:
import pandas as pd
import plotly.express as px

# CSV 파일 읽기
bus_data = pd.read_csv('C:\\Users\\USER\\Desktop\\2025신월동\\data-20250122T010720Z-001\\data\\sinwol_bus.csv')

# 승차일시와 하차일시를 datetime 형식으로 변환
bus_data['승차일시'] = pd.to_datetime(bus_data['승차일시'], format='%Y%m%d%H%M%S')
bus_data['하차일시'] = pd.to_datetime(bus_data['하차일시'], format='%Y%m%d%H%M%S')

# 요일 정보 추출 (0=월요일, 6=일요일)
bus_data['승차요일'] = bus_data['승차일시'].dt.day_name()  # 요일명 추출
bus_data['하차요일'] = bus_data['하차일시'].dt.day_name()  # 요일명 추출

# 요일 순서를 설정
ordered_days = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']
bus_data['승차요일'] = pd.Categorical(bus_data['승차요일'], categories=ordered_days, ordered=True)
bus_data['하차요일'] = pd.Categorical(bus_data['하차요일'], categories=ordered_days, ordered=True)

# 요일별 승차와 하차 인원수 집계 (observed=False 추가)
boarding_counts = bus_data.groupby('승차요일', observed=False)['승객수'].sum().reset_index(name='승차인원수')
alighting_counts = bus_data.groupby('하차요일', observed=False)['승객수'].sum().reset_index(name='하차인원수')

# 요일별 승하차 인원 통합
combined_counts = pd.merge(boarding_counts, alighting_counts, left_on='승차요일', right_on='하차요일', how='outer')

# 시각화 (grouped bar로 승차와 하차 인원 나란히 비교)
fig = px.bar(combined_counts, 
             x='승차요일', 
             y=['승차인원수', '하차인원수'], 
             title='요일별 승하차 인원',
             labels={'value': '인원수', 'variable': '승하차'},
             barmode='group',  # grouped bar 형식
             color_discrete_sequence=['blue', 'red'])  # 승차는 파랑, 하차는 빨강
fig.show()

In [36]:
import pandas as pd
import plotly.express as px

# CSV 파일 읽기
bus_data = pd.read_csv('C:\\Users\\USER\\Desktop\\2025신월동\\data-20250122T010720Z-001\\data\\sinwol_bus.csv')

# 승차일시와 하차일시를 datetime 형식으로 변환
bus_data['승차일시'] = pd.to_datetime(bus_data['승차일시'], format='%Y%m%d%H%M%S')
bus_data['하차일시'] = pd.to_datetime(bus_data['하차일시'], format='%Y%m%d%H%M%S')

# 시간대 추가 (00시도 00:00으로 출력되도록 포맷 설정)
bus_data['승차시간대'] = bus_data['승차일시'].dt.floor('H').dt.strftime('%H:%M')  # 시간 단위로 내림 후 포맷
bus_data['하차시간대'] = bus_data['하차일시'].dt.floor('H').dt.strftime('%H:%M')  # 시간 단위로 내림 후 포맷

# 승차와 하차 인원수 집계
boarding_counts = bus_data.groupby('승차시간대')['승객수'].sum().reset_index(name='승차인원수')
alighting_counts = bus_data.groupby('하차시간대')['승객수'].sum().reset_index(name='하차인원수')

# 시간대별 승하차 인원 통합
combined_counts = pd.merge(boarding_counts, alighting_counts, left_on='승차시간대', right_on='하차시간대', how='outer')

# 시각화
fig = px.bar(combined_counts, 
             x='승차시간대', 
             y=['승차인원수', '하차인원수'], 
             title='시간대별 승하차 인원',
             labels={'value': '인원수', 'variable': '승하차'},
             barmode='stack',  # 스택형 막대그래프
             color_discrete_sequence=['blue', 'red'])  # 승차는 파랑, 하차는 빨강

# x축 레이블 변경
fig.update_layout(xaxis_title='시간대')  # x축 이름을 '시간대'로 변경

fig.show()

In [38]:
import pandas as pd
import plotly.express as px

# CSV 파일 읽기
bus_data = pd.read_csv('C:\\Users\\USER\\Desktop\\2025신월동\\data-20250122T010720Z-001\\data\\sinwol_bus.csv')

# 승차일시를 datetime 형식으로 변환
bus_data['승차일시'] = pd.to_datetime(bus_data['승차일시'], format='%Y%m%d%H%M%S')

# 요일 및 시간대 추가
bus_data['승차요일'] = bus_data['승차일시'].dt.day_name()
bus_data['승차시간대'] = bus_data['승차일시'].dt.floor('H').dt.strftime('%H:%M')  # 시간 단위로 내림 후 포맷

# 승차 인원수 집계
boarding_counts = bus_data.groupby(['승차요일', '승차시간대'])['승객수'].sum().reset_index(name='승차인원수')

# 요일 순서 설정 (월화수목금토일)
days_order = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']
boarding_counts['승차요일'] = pd.Categorical(boarding_counts['승차요일'], categories=days_order, ordered=True)

# 요일 순서가 적용된 데이터프레임 정렬
boarding_counts = boarding_counts.sort_values(['승차요일', '승차시간대'])

# 시각화
fig = px.line(boarding_counts, 
              x='승차시간대', 
              y='승차인원수', 
              color='승차요일', 
              title='요일 및 시간대별 승차 인원',
              labels={'승차시간대': '시간대', '승차인원수': '인원수'},
              markers=True)  # 마커 추가

# 그래프 출력
fig.update_layout(legend=dict(traceorder="normal"))  # 범례 순서 월화수목금토일 적용
fig.show()








In [40]:
import pandas as pd
import plotly.express as px

# CSV 파일 읽기
bus_data = pd.read_csv('C:\\Users\\USER\\Desktop\\2025신월동\\data-20250122T010720Z-001\\data\\sinwol_bus.csv')

# 하차일시를 datetime 형식으로 변환
bus_data['하차일시'] = pd.to_datetime(bus_data['하차일시'], format='%Y%m%d%H%M%S')

# 요일 및 시간대 추가
bus_data['하차요일'] = bus_data['하차일시'].dt.day_name()
bus_data['하차시간대'] = bus_data['하차일시'].dt.floor('H').dt.strftime('%H:%M')  # 시간 단위로 내림 후 포맷

# 하차 인원수 집계
alighting_counts = bus_data.groupby(['하차요일', '하차시간대'])['승객수'].sum().reset_index(name='하차인원수')

# 요일 순서 설정 (월화수목금토일)
days_order = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']
alighting_counts['하차요일'] = pd.Categorical(alighting_counts['하차요일'], categories=days_order, ordered=True)

# 시각화
fig = px.line(
    alighting_counts.sort_values(by=['하차요일', '하차시간대']),  # 요일 및 시간대 순서 정렬
    x='하차시간대',
    y='하차인원수',
    color='하차요일',
    title='요일 및 시간대별 하차 인원',
    labels={'하차시간대': '시간대', '하차인원수': '인원수'},
    markers=True  # 마커 추가
)

# 범례 순서 설정
fig.for_each_trace(lambda t: t.update(name=t.name.split(' ')[0]))  # 요일 이름에서 공백 제거

fig.show()








In [42]:
import pandas as pd
import plotly.express as px

# 데이터 로드
file1_path = r'C:\\Users\\USER\\Desktop\\2025신월동\\data-20250122T010720Z-001\\data\\code\\bus.csv'
file2_path = r'C:\\Users\\USER\\Desktop\\2025신월동\\data-20250122T010720Z-001\\data\\sinwol_bus.csv'

# CSV 파일 읽기
routes_df = pd.read_csv(file1_path)  # 노선 정보
passenger_df = pd.read_csv(file2_path)  # 승객 수

# 승차정류장ID에 대한 노선ID와 버스노선명을 가져옵니다.
boarding_df = passenger_df.merge(routes_df[['정류장ID', '노선ID', '버스노선명']], 
                                   left_on='승차정류장ID', 
                                   right_on='정류장ID', 
                                   how='left')

# 하차정류장ID에 대한 노선ID와 버스노선명을 가져옵니다.
alighting_df = passenger_df.merge(routes_df[['정류장ID', '노선ID', '버스노선명']], 
                                    left_on='하차정류장ID', 
                                    right_on='정류장ID', 
                                    how='left', 
                                    suffixes=('_승차', '_하차'))

# 승차일과 하차일을 datetime 형식으로 변환
boarding_df['승차일'] = pd.to_datetime(boarding_df['승차일시']).dt.date
alighting_df['하차일'] = pd.to_datetime(alighting_df['하차일시']).dt.date

# 승차 인원 집계
daily_boarding = boarding_df.groupby(['노선ID', '버스노선명', '승차일']).agg(
    일일_승차인원=('승객수', 'sum')
).reset_index()

# 하차 인원 집계
daily_alighting = alighting_df.groupby(['노선ID', '버스노선명', '하차일']).agg(
    일일_하차인원=('승객수', 'sum')
).reset_index()

# 승차와 하차 데이터를 병합
merged_passengers = pd.merge(daily_boarding, daily_alighting, 
                              left_on=['노선ID', '버스노선명', '승차일'], 
                              right_on=['노선ID', '버스노선명', '하차일'], 
                              how='outer')

# 노선별 일평균 승하차 인원 계산
average_passengers = merged_passengers.groupby(['노선ID', '버스노선명']).agg(
    일평균_승차인원=('일일_승차인원', 'mean'),
    일평균_하차인원=('일일_하차인원', 'mean')
).reset_index()

# Plotly scatter plot 생성
fig = px.scatter(
    average_passengers,
    x='일평균_승차인원',
    y='일평균_하차인원',
    color='버스노선명',
    title='노선별 일평균 승하차 인원',
    labels={'일평균_승차인원': '일평균 승차 인원', '일평균_하차인원': '일평균 하차 인원'},
    hover_name='버스노선명'
)

fig.show()

In [1]:
import pandas as pd
import plotly.express as px

# 버스 데이터 읽기
bus_data = pd.read_csv('C:\\Users\\USER\\Desktop\\2025신월동\\data-20250122T010720Z-001\\data\\sinwol_bus.csv')

# 정류장 데이터 읽기 (정류장 ID와 이름이 포함된 파일)
bus_stops_data = pd.read_csv('C:\\Users\\USER\\Desktop\\2025신월동\\data-20250122T010720Z-001\\data\\sinwol_busstops.csv')

# 승차일시를 datetime 형식으로 변환
bus_data['승차일시'] = pd.to_datetime(bus_data['승차일시'], format='%Y%m%d%H%M%S')

# 정류장별 승차 인원수 집계
boarding_counts = bus_data.groupby('승차정류장ID')['승객수'].sum().reset_index(name='승차인원수')

# 정류장 ID와 이름 매핑
# 정류장 ID를 인덱스로 설정하여 매핑
bus_stops_mapping = bus_stops_data.set_index('정류장ID')['버스정류장명'].to_dict()

# 정류장 ID에 이름 추가
boarding_counts['버스정류장명'] = boarding_counts['승차정류장ID'].map(bus_stops_mapping)

# 정류장명에 대해 총 승차 인원수 집계
total_boarding_counts = boarding_counts.groupby('버스정류장명')['승차인원수'].sum().reset_index()

# 승차 인원수에 따라 내림차순 정렬 (정류장명 기준)
total_boarding_counts = total_boarding_counts.sort_values(by='승차인원수', ascending=False)

# 시각화
fig = px.bar(total_boarding_counts, 
             x='버스정류장명', 
             y='승차인원수', 
             title='정류장별 승차 인원',
             labels={'버스정류장명': '정류장', '승차인원수': '승차 인원'},
             color='승차인원수',  # 색상으로 승차 인원수 표현
             text='승차인원수')  # 막대 위에 인원수 표시

# y축 범위 조정 (20,000까지 표시)
fig.update_yaxes(range=[0, 25000])  # y축 범위를 0에서 20,000으로 설정

fig.show()

In [44]:
import pandas as pd
import plotly.express as px

# 버스 데이터 읽기
bus_data = pd.read_csv('C:\\Users\\USER\\Desktop\\2025신월동\\data-20250122T010720Z-001\\data\\sinwol_bus.csv')

# 정류장 데이터 읽기 (정류장 ID와 이름이 포함된 파일)
bus_stops_data = pd.read_csv('C:\\Users\\USER\\Desktop\\2025신월동\\data-20250122T010720Z-001\\data\\sinwol_busstops.csv')

# 하차일시를 datetime 형식으로 변환
bus_data['하차일시'] = pd.to_datetime(bus_data['하차일시'], format='%Y%m%d%H%M%S')

# 정류장별 하차 인원수 집계
alighting_counts = bus_data.groupby('하차정류장ID')['승객수'].sum().reset_index(name='하차인원수')

# 정류장 ID와 이름 매핑
# 정류장 ID를 인덱스로 설정하여 매핑
bus_stops_mapping = bus_stops_data.set_index('정류장ID')['버스정류장명'].to_dict()

# 정류장 ID에 이름 추가
alighting_counts['버스정류장명'] = alighting_counts['하차정류장ID'].map(bus_stops_mapping)

# 정류장명에 대해 총 하차 인원수 집계
total_alighting_counts = alighting_counts.groupby('버스정류장명')['하차인원수'].sum().reset_index()

# 하차 인원수에 따라 내림차순 정렬 (정류장명 기준)
total_alighting_counts = total_alighting_counts.sort_values(by='하차인원수', ascending=False)

# 시각화
fig = px.bar(total_alighting_counts, 
             x='버스정류장명', 
             y='하차인원수', 
             title='정류장별 하차 인원',
             labels={'버스정류장명': '정류장', '하차인원수': '하차 인원'},
             color='하차인원수',  # 색상으로 하차 인원수 표현
             text='하차인원수')  # 막대 위에 인원수 표시

# y축 범위 조정 (20,000까지 표시)
fig.update_yaxes(range=[0, 15000])  # y축 범위를 0에서 20,000으로 설정

fig.show()
