파이썬 함수 — To be professional

df.select_dtypes(include=object, exclude=object)

include에 포함되는 타입의 칼럼은 포함
exclude에 포함되는 타입의 칼럼은 제외한 데이터프레임 출력
object에 number, object, datetime, timedelta, category 사용 가능
object에 여러개의 값을 넣고 싶은 경우 리스트 형태로 입력

df.dtypes

dtypes: 데이터프레임 칼럼 타입 확인

df.column.astype()

astype: 데이터프레임 칼럼 타입 변경

df.iloc[행 인덱스, 열 인덱스]
df.loc[행 인덱스 값, 열 인덱스 값]
df.loc[조건문]

iloc: 인덱스 위치 활용
loc: 칼럼명 활용

df.column.str.contains('str')

contains: 특정 문자열 포함여부

df.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)

subset: 중복을 판단할 칼럼 지정(ex. subset = ['col1', 'col2'])
keep: 중복 제거 시 남길 행으로 'first'는 첫 행을 'last'는 마지막 행 남김
inplace: 원본 반영 여부
ignore_index: 원 데이터의 index를 무시할지 여부로 True로 지정하면 인덱스가 재지정됨

'Data Science' 카테고리의 다른 글

Machine Learning Model (0)	2022.11.19
Xgboost Error (0)	2022.11.19
데이터 용어 (0)	2022.11.09
데이터 스케일링 (0)	2022.11.09
SQL 함수 (0)	2022.11.09

티스토리툴바