전체 글
주피터 노트북 병합
여러 주피터 노트북을 하나로 병합하는 파이썬 코드 import datetime import json import os ## ipynb_file_folder : 주피터 파일 모여있는 폴더 경로 ipynb_file_folder = '/content/drive/MyDrive/Colab Notebooks/ADP' ## get_files: 파일 불러오는 함수 ## 이름순 정렬되므로 파일명 0001_abc.ipynb ~등으로 할당 def get_files(): notebooks_to_merge = [file.name for file in os.scandir(ipynb_file_folder) if file.name.endswith('.ipynb') and file.is_file()] notebooks_to_merge..
Machine Learning Model
알고리즘 개념 장점 단점 k-최근접 이웃 (K-Nearest Neighbor) - 주변의 가장 가까운 K개의 샘플을 통해 값을 예측 - 구현 쉬움 - 알고리즘 이해하기 쉬움 - 하이퍼파라미터 적음 - 계산 속도 느림 - 메모리 많이 씀 - 노이즈 데이터에 예민 서포트 벡터 머신 (Support Vector Machine) - 데이터들과 거리가 가장 먼 초평면을 선택하여 분리 - 정확도 높음 - 예측 속도 빠름 - 고차원 데이터 효과적 - 모형 구축 시간 오래 걸림 - 해석하기 어려움 - 커널 트릭 오사용 시 과대적합되기 쉬움 의사결정트리 (Decision Tree) - 특정 분류 규칙에 따라 데이터 분리 - 결과 해석 용이 - 학습 및 예측 속도 빠름 - 전처리, 통계가정 필요없음 - 과대적합 가능성 -..
Xgboost Error
WARNING: /workspace/src/objective/regression_obj.cu:152: reg:linear is now deprecated in favor of reg:squarederror. Xgboost의 사이킷런 호환 Regressor인 XGBRegrssor의 Default 생성자로 reg:linear 가 입력됨 Xgboost 0.9 버전부터 reg:linear가 Deprecated 되고 reg:squarederror로 변경된다는 warning 메시지 Xgboost 정상 동작에는 문제가 없음 from xgboost import XGBRegressor xgb_reg = XGBRegressor(objective='reg:squarederror') [출처] 회귀 트리 관련 코드 warnin..