파이썬 함수 help dir
·
Data Science
파이썬의 내장함수를 활용하여 여러 함수를 사용할 수 있다. dir(): 객체가 가지고 있는 변수와 함수 나열 help(): 해당 변수나 함수에 대한 설명 내장함수를 활용하여 함수를 사용하려면 추가적으로 아래와 같은 내용을 알아두면 좋다. 클래스(class): 객체지향 프로그래밍의 기본단위 인스턴스(instance): 클래스로부터 생성하는 변수 메서드(method): 클래스 내부에 정의된 함수 class new_class: def __init__(self): instance = new_class() instance.method() 위를 이용하여 분위수 회귀분석 함수를 찾아보자. import statsmodels.api as sm dir(sm) 위와 같이 statsmodels.api 라이브러리에 있는 함수를..
주피터 노트북 병합
·
Data Science
여러 주피터 노트북을 하나로 병합하는 파이썬 코드import osimport jsonfrom datetime import datetimedef get_files(folder: str) -> list[str]: """ 주피터 노트북 파일 이름순으로 정렬 Args: folder (str): 주피터 노트북 파일 폴더 경로 Returns: list[str]: 정렬된 주피터 노트북 파일 이름 리스트 """ notebooks = [ file.name for file in os.scandir(folder) if file.is_file() and file.name.endswith('.ipynb') ] notebooks.sort..
Machine Learning Model
·
Data Science
알고리즘 개념 장점 단점 k-최근접 이웃 (K-Nearest Neighbor) - 주변의 가장 가까운 K개의 샘플을 통해 값을 예측 - 구현 쉬움 - 알고리즘 이해하기 쉬움 - 하이퍼파라미터 적음 - 계산 속도 느림 - 메모리 많이 씀 - 노이즈 데이터에 예민 서포트 벡터 머신 (Support Vector Machine) - 데이터들과 거리가 가장 먼 초평면을 선택하여 분리 - 정확도 높음 - 예측 속도 빠름 - 고차원 데이터 효과적 - 모형 구축 시간 오래 걸림 - 해석하기 어려움 - 커널 트릭 오사용 시 과대적합되기 쉬움 의사결정트리 (Decision Tree) - 특정 분류 규칙에 따라 데이터 분리 - 결과 해석 용이 - 학습 및 예측 속도 빠름 - 전처리, 통계가정 필요없음 - 과대적합 가능성 -..