### [ ACCESSOR 접근자 ]
- pandas에서 str 데이터, datetime 데이터에 간편한 처리 위해 제공
- Series에 제공되는 기능
- 종류
    * str 데이터 : Series.str 접근자
    * datetime 데이터 : Series.dt 접근자

In [1]:
## 모듈 로딩
import pandas as pd

In [2]:
## DF 인스턴스 생성
dataDF = pd.DataFrame({ '이름' : ['홍 길동', '마 징가', '베 트맨'],
                       '댓글' : ['Good Luck', 'Happy New Year', 'Good Day']})

dataDF

Unnamed: 0,이름,댓글
0,홍 길동,Good Luck
1,마 징가,Happy New Year
2,베 트맨,Good Day


In [5]:
## 댓글 컬럼의 내용을 모두 소문자로 변환
# dataDF['댓글'].lower()  <= Series에 문자열 관련 메서드 X
# dataDF['댓글'][0].lower()  <= 원소 1개 선택 시 문자열. 문자열 관련 메서드 사용 O


for idx in range(dataDF['댓글'].shape[0]):
    dataDF['댓글'][idx] = dataDF['댓글'][idx].lower()
print(dataDF)

for idx in dataDF.index:
    dataDF['댓글'][idx] = dataDF['댓글'][idx].upper()
print(dataDF)

     이름              댓글
0  홍 길동       good luck
1  마 징가  happy new year
2  베 트맨        good day
     이름              댓글
0  홍 길동       GOOD LUCK
1  마 징가  HAPPY NEW YEAR
2  베 트맨        GOOD DAY


You are setting values through chained assignment. Currently this works in certain cases, but when using Copy-on-Write (which will become the default behaviour in pandas 3.0) this will never work to update the original DataFrame or Series, because the intermediate object on which we are setting values will behave as a copy.
A typical example is when you are setting values in a column of a DataFrame, like:

df["col"][row_indexer] = value

Use `df.loc[row_indexer, "col"] = values` instead, to perform the assignment in a single step and ensure this keeps updating the original `df`.

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy

  dataDF['댓글'][idx] = dataDF['댓글'][idx].lower()
You are setting values through chained assignment. Currently this works in certain cases, but when using Copy-on-Write (which will become the default behaviour in pandas 3.0) this will never work to update the original DataFr

In [15]:
## Series 인스턴스 생성
dataSR = pd.Series( [ " Hello, World! ",
                        "Pandas_is_FUN",
                        "email: user01@example.com",
                        None
])

## 1) 공백 제거 & 소문자화
print( dataSR.str.strip().str.lower() )

0                hello, world!
1                pandas_is_fun
2    email: user01@example.com
3                         None
dtype: object


In [16]:
## 2) 포함 여부(불리언) / 위치 찾기
## contains() : 문자열안에 해당 문자열 존재 여부
##              case 매개변수 : 대소문 일치여부
##              na   매개변수 : 결측치에 대한 처리 설정
print(dataSR.str.contains("world", case=False, na=False)) ## [True/False]

## find() : 문자열안에서 제일 먼저 발견되는 인덱스 반환
print(dataSR.str.find("FUN"))           ## 없으면 -1, NaN 처리

0     True
1    False
2    False
3    False
dtype: bool
0    -1.0
1    10.0
2    -1.0
3     NaN
dtype: float64


In [17]:
## 3) 부분 문자열 추출(슬라이스) / 길이
print(dataSR.str.slice(0,5)) # 앞 5글자

print(dataSR.str.len())      # 글자 수 (한글도 문자 1개로 셈)

0     Hell
1    Panda
2    email
3     None
dtype: object
0    15.0
1    13.0
2    25.0
3     NaN
dtype: float64


In [18]:
## 4) 구분자 분리 및 확장
## 구분자 분리 -> List  담아서 반환
print(dataSR.str.split("_"))

ret = dataSR.str.split("_")
print( type(ret[0]) )

## 구분자 분리 -> 여러 열로 확장 : Series => DataFrame
print(dataSR.str.split("_", expand=True))

ret = dataSR.str.split("_", expand=True)
print( type(ret[0]) )

0              [ Hello, World! ]
1              [Pandas, is, FUN]
2    [email: user01@example.com]
3                           None
dtype: object
<class 'list'>
                           0     1     2
0             Hello, World!   None  None
1                     Pandas    is   FUN
2  email: user01@example.com  None  None
3                       None  None  None
<class 'pandas.core.series.Series'>


[3] Series.dt 접근자 : 날짜/시간 관련 메서드들 <hr>

In [22]:
## Series 인스턴스 생성
dateSR = pd.Series([
    "2025-10-01 08:30",
    "2025/10/02 21:15",
    "Oct 03, 2025 06:00",
    None
])


display(dateSR)

0      2025-10-01 08:30
1      2025/10/02 21:15
2    Oct 03, 2025 06:00
3                  None
dtype: object

In [23]:
## 문자열 -> datetime 타입 변환
## pd.to_datetime() 함수
tsSR = pd.to_datetime(dateSR, errors="coerce")  # 파싱 실패는 NaT로
print(tsSR)

0   2025-10-01 08:30:00
1                   NaT
2                   NaT
3                   NaT
dtype: datetime64[ns]


In [24]:
## 문자열 -> datetime 타입 변환
## pd.to_datetime() 함수
## - format : strftime()로 지정하거나 각각 다르면 mixed
## - errors : 변환 실패 시 처리 방법 [기] raise ==> coerce : NaT
tsSR = pd.to_datetime(dateSR, format='mixed', errors="coerce")  # 파싱 실패는 NaT로
print(tsSR)

0   2025-10-01 08:30:00
1   2025-10-02 21:15:00
2   2025-10-03 06:00:00
3                   NaT
dtype: datetime64[ns]


In [None]:
## 1) 구성요소 뽑기
print(tsSR.dt.year)             ## 연도
print(tsSR.dt.month)            ## 월(숫자)
print(tsSR.dt.day)              ## 일
print(tsSR.dt.weekday)          ## 0(월) ~ 6(일)
print(tsSR.dt.day_name())       ## 요일 이름
print(tsSR.dt.hour)             ## 시


In [26]:
# 2) 형식 문자열로 출력
print(tsSR.dt.strftime("%Y/%m/%d %H:%M"))  # 포맷팅

0    2025/10/01 08:30
1    2025/10/02 21:15
2    2025/10/03 06:00
3                 NaN
dtype: object


In [None]:
## 3) 시계열 성질(월초/월말 등) 불리언
print(tsSR.dt.is_month_start)
print(tsSR.dt.is_month_end)