df.select_dtypes(include=object, exclude=object)
- include에 포함되는 타입의 칼럼은 포함
- exclude에 포함되는 타입의 칼럼은 제외한 데이터프레임 출력
- object에 number, object, datetime, timedelta, category 사용 가능
- object에 여러개의 값을 넣고 싶은 경우 리스트 형태로 입력
df.dtypes
df.column.astype()
df.iloc[행 인덱스, 열 인덱스]
df.loc[행 인덱스 값, 열 인덱스 값]
df.loc[조건문]
- iloc: 인덱스 위치 활용
- loc: 칼럼명 활용
df.column.str.contains('str')
df.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)
- subset: 중복을 판단할 칼럼 지정(ex. subset = ['col1', 'col2'])
- keep: 중복 제거 시 남길 행으로 'first'는 첫 행을 'last'는 마지막 행 남김
- inplace: 원본 반영 여부
- ignore_index: 원 데이터의 index를 무시할지 여부로 True로 지정하면 인덱스가 재지정됨