### 로그 파일을 활용한 IP 접속 분석

In [None]:
# 필요한 모듈 불러오기

import re
import csv
import os
from collections import Counter


In [11]:
# 사용자 입력 받기 (파일 경로)
log_path = input("분석할 로그 파일 경로를 입력하세요: ")

# 파일 존재 여부 확인
if not os.path.exists(log_path):
    print(f"파일 '{log_path}' 이 존재하지 않습니다.")
else:
    print("파일 확인 완료. 분석 시작!")

파일 확인 완료. 분석 시작!


In [None]:
# 로그 파일 열기 및 IP 주소 추출
ip_pattern = re.compile(r"\b(?:\d{1,3}\.){3}\d{1,3}\b")

ip_list = []  # 추출된 IP 주소들을 저장할 리스트

if log_path:
    with open(log_path, "r", encoding="utf-8") as file:
        for line in file:
            # 각 줄에서 IP 주소 패턴과 일치하는 모든 부분 찾기
            found_ips = ip_pattern.findall(line)
            for ip in found_ips:
                # IP 각 부분이 0~255 사이인지 확인하여 유효성 검사
                parts = ip.split('.')
                if all(0 <= int(part) <= 255 for part in parts):
                    ip_list.append(ip)


In [13]:
# IP별 접속 횟수 계산 및 상위 3개 IP 출력
if ip_list:
    # IP별 빈도 계산 (Counter 사용)
    ip_counts = Counter(ip_list)

    # 가장 많이 접속한 3개의 IP를 구함
    top3 = ip_counts.most_common(3)

    print("\n상위 3개 접속 IP 및 접속 횟수:")
    for ip, count in top3:
        print(f"{ip} - {count}회 접속")
else:
    print("로그에서 유효한 IP 주소를 찾지 못했습니다.")


상위 3개 접속 IP 및 접속 횟수:
203.0.113.5 - 17회 접속
192.168.0.3 - 14회 접속
192.168.0.2 - 14회 접속


In [14]:
if ip_list:
    try:
        # CSV 파일을 UTF-8-sig 인코딩으로 열어 한글 깨짐 방지
        with open("ip_analysis.csv", "w", encoding="utf-8-sig", newline='') as csvfile:
            writer = csv.writer(csvfile)
            # 헤더 작성
            writer.writerow(["IP Address", "Access Count"])
            # 모든 IP 주소와 접속 횟수를 많이 접속한 순서대로 작성
            for ip, count in ip_counts.most_common():
                writer.writerow([ip, count])
        print("\n분석 결과가 'ip_analysis.csv' 파일로 저장되었습니다.")
        
    except Exception as e:
        print("CSV 파일 저장 중 오류가 발생했습니다:", e)


분석 결과가 'ip_analysis.csv' 파일로 저장되었습니다.
