ADP
ADP 필기 시험 후기
2022년 8월 28일에 시행한 제 26회 데이터 분석 전문가 ADP 필기 시험 후기입니다. ADsP와 달리 시중에 기출문제가 많지 않아 교재가 필수적이라고 생각하여, ADP 필기 올패키지 데이터 분석 전문가를 사용하여 공부했습니다. ADP는 ADsP에서 2과목 데이터 처리기술 이해와 5과목 데이터 시각화만 추가된 시험으로 ADsP와 크게 다르지 않습니다. 따라서 ADP까지 고려하고 계신 분이라면 ADsP 응시 후 빠른 시일 내에 ADP 필기시험에 응시하시는 걸 추천드립니다. 간단히 시험에 대해 소개드리자면 객관식 80점, 서술형 20점으로 100점 만점에 70점 이상이어야 합격입니다. 객관식은 1과목, 2과목, 3과목, 5과목은 각각 10문제, 4과목은 40문제로 문제당 1점이며 과목별로 40% 이상 ..
ADP 기출 1회 오답
시각화 데이터 시각화 예시: 마인드맵 정보 시각화 예시: 트리맵 정보 디자인 예시: 나폴레옹 행군의 다이어그램, 나이팅게일의 다이어그램 인포그래픽: 지하철 노선도 정보 디자인 프로세스 데이터 수집 모든 것을 읽기 내러티브 찾기 문제 정의 계층 구조 만들기: 프로젝트 정리 및 인포그래픽의 개별 자료 정리 와이어프레임 그리기: 중요한 정보에 대한 시각표현 방법 만들어냄 포맷 선택하기: 프로세스를 설명하기 위한 다이어그램, 흐름도 등 필요 시각 접근 방법 결정하기: 직관적이고 효과적인 인포그래픽 결정 정제와 테스트 세상에 선보이기 빅데이터 시각화 프로세스 벤 프라이: 획득 - 분해 - 선별 - 마이닝 - 표현 - 정제 - 상호작용 빅데이터 프로세스 정보 구조화: 데이터 분석과 동시에 필요한 그래프 그려내기 정..
ADP 4과목
4장. 통계분석 1절. 통계분석의 이해 표본추출 단순랜덤 추출법 계통추출법 집락추출법 층화추출법 측정 명목척도: 어느 집단에 속하는지 분류 (예: 성별) 순서척도: 서열관계 (예: 만족도) 구간척도: 구간 사이의 간격이 의미가 있는 자료 (예: 온도) 비율척도: 절대적 기준인 0이 존재하고 연산 가능 (예: 무게) 확률분포 t-분포: 두 집단의 평균이 동일한지 검정 카이제곱 분포: 두 집단 간 동질성 검정 F-분포: 두 집단 간 분산의 동일성 검정 가설검정 유의수준(alpha): 귀무가설이 옳은데도 이를 기각하는 확률의 크기 제1종 오류: 귀무가설이 옳은데도 이를 기각하게 되는 오류 제2종 오류: 귀무가설이 옳지 않은데도 이를 채택하게 되는 오류 비모수 검정 정의: 모집단 분포에 대한 가정을 하지 않는 ..
ADP 3과목
1장. 데이터 분석 기획의 이해 1절. 분석기획 방향성 도출 분석대상과 방법 Optimization: 분석대상 known, 분석방법 known Insight: 분석대상 Unknown, 분석방법 known Solution: 분석대상 Known, 분석방법 Unknown Discovery: 분석대상 Unknown, 분석방법 Unknown 2절. 분석 방법론 KDD(Knowledge Discovery in Database) 분석 방법론 정의: 데이터로부터 통계적 패턴이나 지식을 찾기 위해 활용할 수 있도록 정리한 데이터 마이닝 프로세스 단계: 데이터셋 선택 - 데이터 전처리 - 데이터 변환 - 데이터 마이닝 - 데이터 마이닝 결과 평가 CRISP-DM 분석 방법론(Cross Industry Standard Pr..
ADP 모의고사 1회 오답
데이터 베이스 특징: 통합, 저장, 공용, 운영 DIKW 예시 Data: A마트 라면 700원, B마트 라면 650원 Information: B마트의 라면 가격이 더 저렴하다 Knowledge: B마트에서 라면을 사는 것이 더 유리 Wisdom: B마트의 다른 상품도 A마트보다 저렴할 것’이라고 예측 데이터 사이언티스트 소프트 역량: 창의적 사고, 호기심, 스토리텔링, 커뮤니케이션 빅데이터 시대 위기요인 사생활 침해: 개인정보 포함 책임 원칙 훼손: 잠재적 위협 데이터 오용: 잘못된 데이터 사물인터넷: 모든 사물에서 데이터를 추출할 수 있어야함 ETL 특징: MPP(Massive Parallel Processing) 지원 작업단계 Interface: 데이터 원천으로부터 데이터 획득 Staging: 획득한..
ADP 5과목
2절. 시각화 디자인 시각화 분류 데이터 시각화: 그래픽의 의미를 이용해 명확하고 효과적으로 커뮤니케이션 정보 시각화: 대규모 비수량 정보를 시각적으로 표현 정보 디자인: 사람이 사용할 수 있는 효과적인 정보와 복잡하고 구조적이지 않은 기술 데이터를 시각적으로 표현 인포그래픽: 중요한 정보를 한 장의 그래픽으로 표현 3절. 시각화 구현 D3.js 특징 자바스크립스 기반의 데이터 시각화 라이브러리 SVG 객체, canvas 객체 등을 기반으로 동작 CSS를 통해 객체의 레이아웃과 속성을 변경해 디자인적 요소 조작 브라우저를 사용하여 동일한 코드에 대해 일관적인 결과를 얻을 수 있음 시각화 구현절차 데이터 획득 - 데이터 파싱 - 데이터 필터링 - 데이터 표현 - 상호작용 추가 코드 translate(a, ..
ADP 2과목
1장 1절. ETL ETL(Extraction Transformation Load) 단계: Staging - Profiling - Cleansing - Integration - De-Normalizing ODS(Operational Date Store) 정의: 실시간 또는 실시간 근접 데이터 웨어하우스 정의: ODS를 통해 정제 및 통합된 데이터가 분석과 보고서 생성을 위해 적재되는 데이터 저장소 특징: 주제 중심성, 비휘발성, 통합성, 시계열성 테이블 모델링 기법 스타 스키마 정의: 조인 스키마라고도 하며 데이터 웨어하우스 중 가장 단순함 장점: 이해하기 쉬움 단점: 데이터 중복 스노우 플레이크 스키마 정의: 스타 스키마 차원 테이블을 제 3정규형으로 정규화 장점: 중복 제거 단점: 조인 테이블 개수 ..