KDATA ADsP
ADsP, 3과목을 같은 방식으로 외우지 마세요
ADsP는 1·2과목에서 용어를 먼저 만들고, 3과목 통계·R·머신러닝을 자주 회전시키는 쪽이 덜 막힙니다. 긴 요약 대신 짧은 개념과 바로 푸는 문제로 나눠 보세요.
데이터분석준전문가(ADsP) 시험 사실
- 시행기관
- KDATA 데이터자격검정
- 시험 방식
- 필기시험
- 과목 구성
- 데이터 이해 · 데이터분석 기획 · 데이터분석
- 문항 / 시간
- 총 50문항 · 90분
- 합격 기준
- 총점 60점 이상 · 과목별 40% 미만 과락
- 시험 범위
- 데이터 이해 10문항 · 데이터분석 기획 10문항 · 데이터분석 30문항
- 응시 자격
- 제한 없음
1·2과목에서 데이터 분석의 말문을 먼저 열고, 3과목 데이터 분석은 R 기초, 통계, 가설검정, 머신러닝을 짧게 여러 번 회전시키는 쪽이 안정적입니다.
시험 일정과 응시료는 회차별로 바뀔 수 있어 KDATA 공식 안내에서 확인하세요. 공식 일정·응시료 확인
1과목 데이터 이해
데이터의 이해
- DIKW 피라미드 개요 — DIKW 피라미드는 데이터가 의사결정에 쓰이기까지의 가공 단계를 4 층으로 정리한 모델이야. 아래로 갈수록 양은 많고 가치는 낮으며, 위로 갈수록 양은 줄지만 의사결정에 직접 쓰여. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- DIKW ① 데이터 (Data) — 데이터(Data) 는 측정·관찰·기록의 결과 그 자체야. 어떤 의미나 해석도 붙지 않은 원시 값이야. 마트에 가서 가격표를 본 그 순간, 체중계 위에 올라가서 숫자가 표시된 그 순간 — 그게 데이터야. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- DIKW ② 정보 (Information) — 정보(Information) 는 여러 데이터를 비교·집계·맥락 안에 놓아 "그래서 어떤 뜻이지?" 가 드러난 단계야. 데이터가 점이라면 정보는 점들을 잇는 선. 한 번 비교가 일어나는 순간 데이터는 정보로 승격해. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리…
- DIKW ③ 지식 (Knowledge) — 지식(Knowledge) 은 여러 정보를 묶어 "이런 상황엔 이렇게 한다" 라는 규칙·패턴으로 굳힌 단계야. 정보가 "이번에 어떻더라" 의 일회성 관찰이라면 지식은 "다음에도 그럴 것" 의 반복 가능한 룰. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- DIKW 피라미드 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- DIKW ④ 지혜 (Wisdom) — 지혜(Wisdom) 는 검증된 지식을 새로운 영역으로 확장하는 창의적 추론이야. 직접 비교한 적 없는 영역까지 같은 룰이 통할 거라 미루어 짐작하는 통찰. DIKW 의 가장 위, 양은 가장 적지만 가치는 가장 높아. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정…
- 데이터 분류 (개요) — "고객 리뷰 텍스트는 어떤 데이터인가?" 같은 시험 문제는 한 마디로는 답이 안 돼. 같은 데이터를 세 가지 다른 관점으로 묻거든요. (1) 어떻게 정리돼 있나(형태) (2) 숫자인가 말인가(표현 방식) (3) 무엇을 의미하나(분석 목적) — 이 세 축에 각각 답해야 완전한 분류가…
- 형태 ② 반정형 — 반정형(Semi-structured) 은 미리 정해진 행·열 구조는 없지만 데이터 자체에 메타데이터 (키·태그·항목 이름) 가 함께 들어있는 형태야. 키워드는 메타데이터. "규칙은 있는데 모양은 자유롭다" — 같은 키 이름을 쓰지만 메시지마다 길이·내용이 달라요. ADsP 데이터의…
- 형태 ③ 비정형 — 비정형(Unstructured) 은 미리 정해진 행·열 구조나 키-값 형식이 전혀 없는 데이터야. 사람은 의미를 바로 알아채지만 컴퓨터 입장에선 그냥 바이트(0과 1) 의 긴 묶음이야. 분석에 쓰려면 텍스트 추출·이미지 인식 같은 가공 단계가 먼저 필요해. ADsP 데이터의 이해 …
- 분석 목적 ② 범주형 — 범주형(Categorical) 은 값이 카테고리·라벨인 데이터야. 키워드는 라벨. 평균이나 합계가 의미 없어 — A·B·O·AB 의 평균은 정의되지 않으니까요. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 형태 ① 정형 — 정형(Structured) 은 미리 정한 행·열 구조에 딱 맞춰 저장된 데이터야. 키워드는 구조화. 이름·학번·전공이라는 열이 정해져 있고, 모든 학생이 같은 형식으로 한 행씩 들어가요. 컴퓨터가 가장 다루기 쉬운 형태 — SQL 한 줄로 검색·집계가 돼. ADsP 데이터의 이해 …
- 분석 목적 ① 수치형 — 수치형(Numerical) 은 값 자체가 크기·차이·비율의 의미를 가지는 데이터야. 키워드는 연산 가능. 산술 연산(평균·합계·차이) 이 자연스럽게 통하면 수치형이야. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 표현 방식 ② 정성적 — 정성적(Qualitative) 은 말·감정·서술처럼 숫자가 아닌 자연어 형태로 표현된 데이터야. 분석할 땐 텍스트 마이닝·감성 분석·코딩(범주화) 같은 별도 처리가 필요해. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 표현 방식 ① 정량적 — 정량적(Quantitative) 은 숫자로 측정 가능한 데이터야. 키워드는 측정값. 평균·합계·표준편차 같은 통계 연산이 자연스럽게 적용돼. "더하기·평균이 의미가 있나?" 라고 자문해서 의미가 있으면 정량적. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니…
- 데이터 분류 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 암묵지 · 형식지 — 자전거 타는 법은 책으로 옮기기 어렵지만 누구나 탈 수 있어. 몸이 배운 노하우 — 이게 암묵지. 매뉴얼·논문처럼 글로 정리된 게 형식지. 두 종류 지식의 구분이 ADsP 시험의 출발점이야. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- SECI ③ 연결화 (Combination) — 연결화(Combination) — 이미 형식지(=글) 로 존재하는 여러 자료를 결합·재구성·요약해 새로운 형식지를 만드는 단계야. 글 → 글 의 변환이라는 점이 핵심이야. 사람 머리 속의 새 노하우를 끌어내는 게 아니라, 흩어진 글들을 묶어 새 그림을 그리는 작업. ADsP 데이터…
- SECI ② 표출화 (Externalization) — 표출화(Externalization) — 사람 안(암묵지) 에 머물던 지식을 처음으로 외부의 형태(글·도식·매뉴얼) 로 꺼내는 단계야. 영어 단어 그대로 "externalize = 밖으로 끄집어 낸다". 조직이 한 사람의 노하우에 의존하지 않고 자산화 하는 결정적 단계여서, SEC…
- SECI ④ 내면화 (Internalization) — 내면화(Internalization) — 글·매뉴얼·교본 같은 형식지를 읽고 실제로 반복 적용해 자기 몸·머리에 체화하는 단계야. 글 → 사람 안. 표출화(사람 → 글) 의 반대 방향이야. SECI 사이클이 한 바퀴 돌아 다시 새로운 암묵지가 만들어지는 마무리 단계. ADsP 데이…
- 암묵지 · 형식지 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- SECI ① 공동화 (Socialization) — 공동화(Socialization) — 머리 속이나 몸에 있는 노하우(암묵지) 가 다른 사람의 머리·몸으로 그대로 옮겨가는 단계야. 중요한 건 "글로 적힌 게 없다" 는 점이야. 같이 보고 따라하고, 시행착오를 옆에서 지켜보며 익혀. ADsP 데이터의 이해 개념을 QuestDP 레슨…
- SECI 4단계 — SECI 모델 — 암묵지와 형식지가 4단계 로 순환하며 조직의 지식이 자란다는 이론. 4단계 영문 첫 글자가 S·E·C·I 라서 SECI. 한국어로는 공표연내 로 외워. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- SECI 종합 — SECI 4단계 종합 정리. 시험에선 사례를 하나 던져주고 어느 단계인지 묻는 매핑 문제가 가장 흔해. 핵심은 "지식의 출발점과 도착점이 암묵인지 형식인지" 를 빠르게 가르는 것. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- DB 4특징 — 데이터베이스(DB) 는 동시에 여러 사용자의 요구에 대응하여 데이터를 체계적으로 저장·관리할 수 있도록 설계된 데이터의 집합 이야. 4가지 본질 특징이 ADsP 시험 단골 — 공통저변 으로 외우면 끝. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- DB ④ 변화 — 변화하는 데이터(Operational/Changing Data) — 데이터에 새 행이 추가되고, 기존 값이 수정되며, 일부가 삭제되어도 DB 전체는 항상 정확하고 일관된 최신 상태를 유지해. 운영 중인 시스템에서 끊임없이 변화하는 게 본질. ADsP 데이터의 이해 개념을 Quest…
- DM (Data Mart) — Data Mart(DM) 는 특정 부서·주제에 특화된 작은 규모 의 데이터 저장소로, DW 의 부분집합이야. 큰 회사 전체의 통합 분석은 DW, 마케팅·재무·인사 같은 한 부서의 빠른 분석은 DM 이 담당. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- DM 유형 — DM 은 데이터를 어디에서 가져오느냐에 따라 종속형(Dependent) 과 독립형(Independent) 으로 나뉘어. 시험에 단골로 매핑 문제로 등장. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- DM 목적 — DM 의 핵심 목적은 부서·주제 단위로 빠르게 분석 할 수 있게 하는 거야. DW 의 거대한 창고에서 자기 부서 데이터를 찾는 것보다, 부서가 자기 데이터만 작게 가져 빠르게 결정하는 데 강점. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- DW (Data Warehouse) — Data Warehouse(DW) 는 다양한 운영 시스템의 데이터를 주제 지향적·시계열적으로 통합한, 의사결정 지원용 데이터의 집합이야. 운영 시스템(ERP·CRM·회계 등) 의 원시 데이터를 ETL 로 가공해 한 곳에 모아 BI·OLAP 분석에 쓰여. ADsP 데이터의 이해 개념…
- DW 주요특징 — DW 의 주요특징 4가지 — 주제 지향성·데이터 통합·시계열성·비휘발성. 이 4가지가 운영 DB(OLTP) 와 가장 크게 갈리는 지점이고, 시험에 단골로 매핑 문제로 등장해. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- DW 목적 — DW 의 핵심 목적은 흩어진 데이터를 한 곳에 모아 쉽게 분석·결정 할 수 있게 하는 거야. 부서마다, 시스템마다 따로 흩어진 데이터를 한 곳에서 정돈해서 같은 화면에서 전체 그림을 보게 만들어. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- DB ② 통합 — 통합된 데이터(Integrated Data) — 같은 정보가 여러 곳에 흩어져 중복 저장 되지 않고 한 곳에 단일하게 보관돼. 중복이 없으면 갱신할 때도 한 번만 고치면 모든 부서가 자동으로 최신값을 봐. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- Data Lake — Data Lake 는 정형뿐 아니라 반정형·비정형까지 형태 변환 없이 원시 상태로 적재하는 대규모 저장소야. 사진·영상·로그·SNS 글 같은 비정형도 다 받아. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- Data Lake 특징 — Data Lake 의 주요특징 — Schema-on-Read · 모든 형태 원시 · 대규모 분산 저장 · Data Swamp 위험. DW 와 정반대 지점이 시험 단골. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- Data Lake 목적 — Data Lake 의 핵심 목적은 모든 형태 데이터를 원시로 일단 보존 해 미래의 다양한 분석 가능성을 열어두는 거야. DW 처럼 분석 형태를 미리 정해 가공하는 게 아니라, 일단 받고 분석은 나중에. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- OLAP — OLAP(Online Analytical Processing) 은 다차원 데이터를 빠르게 집계·조회할 수 있도록 설계된 분석 시스템이야. DW 와 짝꿍 — DW 가 데이터 창고라면 OLAP 은 그 창고를 다양한 각도로 보는 도구. ADsP 데이터의 이해 개념을 QuestDP 레슨에…
- OLAP 특징 — OLAP 의 주요특징 — 비정규화 다차원 구조 · 복잡한 집계 쿼리 · BI 분석가·경영진 사용 · 긴 응답 시간 OK. 모두 OLTP 와 정반대 지점. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- OLAP 목적 — OLAP 의 핵심 목적은 다차원 데이터를 빠르게 집계·조회 해 의사결정을 지원하는 거야. 시계열 비교, 부서·지역·상품 같은 주제별 시각화에 강점. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- OLTP — OLTP(Online Transaction Processing) 은 실시간으로 들어오는 거래를 즉시 처리하는 운영 시스템이야. ms 단위 빠른 응답이 핵심. ERP·CRM·은행 거래·쇼핑몰 주문 같은 운영계 시스템이 모두 OLTP. ADsP 데이터의 이해 개념을 QuestDP 레슨…
- OLTP 특징 — OLTP 의 주요특징 — 정규화 정형 · 짧은 트랜잭션 · 일반 사용자·운영 직원 · ms 응답. OLAP 와 정반대 지점. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- OLTP 목적 — OLTP 의 핵심 목적은 실시간 거래를 즉시 처리 하면서 데이터 일관성 을 유지하는 거야. ms 단위 응답 + ACID 무결성 보장이 본질. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- DB 4특징 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- DB ① 공용 — 공용 데이터(Shared Data) — 여러 사용자가 다른 목적 으로 같은 데이터를 동시에 공유하며 사용한다는 특징이야. 부서/사용자마다 같은 데이터를 따로 보관하지 않고 한 곳에 두고 다 같이 보는 게 핵심. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니…
- DB ③ 저장 — 저장된 데이터(Stored Data) — 메모리 위의 임시 데이터가 아니라 저장매체 (하드디스크·SSD·서버) 에 영속적으로 보관돼. 전원이 꺼져도 사라지지 않고, 필요할 때마다 다시 꺼내 볼 수 있는 게 핵심. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합…
- 기업 데이터베이스 개요 — 회사가 커지면 부서마다 데이터가 따로 쌓이고, 같은 고객 정보가 영업·마케팅·CS 에 중복 저장돼. 이를 통합·표준화하기 위한 7가지 기업 데이터베이스 시스템이 시험 단골 — 인프라(DBMS) 위에 운영계(ERP·CRM·SCM) 가 올라가고, 그 위에서 지식·분석계(KMS·BI·B…
- ⑦ BA — BA(Business Analytics) 는 BI 의 발전형으로, 통계·예측 모델·머신러닝까지 포함한 고급 분석 시스템이야. BI 가 "과거/현재 무슨 일이 일어났나" 라면, BA 는 "왜 일어났고, 앞으로 어떻게 될 것인지, 어떻게 대응할 것인지" 까지 답해. ADsP 데이터의 …
- ⑥ BI — BI(Business Intelligence) 는 데이터를 다차원 분석·리포트·대시보드로 시각화해 경영 의사결정을 지원해. 대표: Tableau · Power BI · Looker. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- ③ CRM — CRM(Customer Relationship Management) 은 고객 정보·구매 이력·접점 데이터를 통합 관리해 개인화된 마케팅·서비스를 지원. 대표: Salesforce · HubSpot. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- ① DBMS — DBMS(DataBase Management System) 는 데이터베이스의 생성·조회·수정·삭제·백업을 담당하는 소프트웨어. 다른 모든 기업 시스템(ERP·CRM·SCM·KMS·BI·BA) 의 기반. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- ② ERP — ERP(Enterprise Resource Planning) 는 생산·판매·재무·인사 등 전사적 자원을 하나의 시스템으로 통합해 부서 간 데이터 일관성을 확보해. 대표: SAP · Oracle ERP. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- ⑤ KMS — KMS(Knowledge Management System) 는 조직의 지식·노하우·문서·매뉴얼을 체계적으로 축적·공유하는 시스템이야. SECI 모델 (암묵지 ↔ 형식지 4단계 변환) 을 시스템 형태로 구현한 것이 KMS — 직원 개인의 노하우를 조직 자산으로. ADsP 데이터의 이…
- 기업 데이터베이스 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- ④ SCM — SCM(Supply Chain Management) 은 원자재 조달부터 생산·유통·반품까지 공급사슬 전체를 통합 관리해 재고·납기·비용을 최적화해. 협력사 정보 공유가 핵심. ADsP 데이터의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- Part 1 데이터의 이해 총 복습 — 데이터의 이해 Part 1은 데이터가 의미로 올라가는 과정에서 시작해, 조직이 데이터를 저장하고 분석하며 업무 시스템으로 활용하는 흐름까지 이어져. DIKW, 데이터 분류, 암묵지·형식지, DB 특징, DW·DM·Data Lake, OLTP·OLAP, 기업 정보 시스템을 하나의 지…
데이터의 가치와 미래
- 빅데이터 출현 배경 — 빅데이터 시대는 어느 한 사건이 아니라 5가지 기술 요인 이 동시에 발달하면서 가능해졌어. 데이터를 싸게 저장 하고, 빠르게 처리 하고, 멀리 전송 하고, 어디서나 빌려쓰며, 모든 기기가 만들어내는 환경이 만들어졌어. ADsP 데이터의 가치와 미래 개념을 QuestDP 레슨에서 단…
- 빅데이터 단위 암기 — KB → MB → GB → TB → PB(페타) → EB(엑사) → ZB(제타) → YB(요타). 단계마다 1024배. PB 이상을 빅데이터 영역으로 봐. 앞 글자 P·E·Z·Y → "패지" 로 외우면 끝. ADsP 데이터의 가치와 미래 개념을 QuestDP 레슨에서 단계별로 정리…
- 빅데이터 3V — 3V + Value(가치) + Veracity(진실성) = 5V. + Validity(유효성) + Volatility(휘발성) = 7V. ADsP 데이터의 가치와 미래 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 빅데이터 단위 암기 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 데이터의 가치와 미래 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 3V ② Variety — Variety(다양성) — 한 시스템 안에 정형(엑셀·DB 테이블) · 반정형(JSON·XML·로그) · 비정형(영상·이미지·음성·자유 텍스트) 이 함께 들어오는 상황이야. 단순히 양이 많은 게 아니라 형태가 제각각이라는 점이 핵심. 같은 양이라도 형태가 한 가지면 Variety …
- 3V ③ Velocity — Velocity(속도) — 데이터가 들어오고 처리되어야 하는 속도가 빠른 상황이야. 옛날 데이터 분석은 "저녁에 그날 매출을 한 번에 정리" 하는 배치(batch) 처리로 충분했지만, 빅데이터 시대엔 "지금 막 발생한 사건을 즉시 판단" 해야 하는 케이스가 많아졌어. 이걸 스트리밍…
- 3V ① Volume — Volume(양) — 가장 직관적인 V 이야. 단위 시간·공간에 쌓인 데이터의 절대 규모가 너무 커서 평소 도구(엑셀·MySQL 단일 인스턴스) 로는 다룰 수 없는 상태. PB(페타바이트, 1024 TB) 이상이 되면 한 대 컴퓨터의 디스크·메모리·CPU 한계를 넘어가 분산처리가 …
- 빅데이터가 만들어내는 변화 개요 — 빅데이터 시대 이전엔 데이터가 비싸고 분석 도구도 비쌌어. 그래서 작은 표본을 정성스럽게 모으고, 데이터를 미리 정제하고, "왜 그런가" 의 인과를 밝히는 방식이 표준이었어. 지금은 저장·연산 비용이 폭락해 4가지 축에서 분석의 디폴트가 뒤집혔어. ADsP 데이터의 가치와 미래 개…
- 변화 ④ 인과관계 → 상관관계 — 인과관계 = "A 가 B 의 원인이다" — A 를 바꾸면 B 가 바뀐다는 직접적 영향 관계. 상관관계 = "A 와 B 가 함께 변한다" — 둘이 동시 변하지만 무엇이 원인인지는 모름. 전통 과학은 인과관계를 증명해야 결론을 내렸지만, 빅데이터 시대엔 상관관계만으로도 마케팅·운영 결…
- 변화 ② 사전처리 → 사후처리 — 사전처리 는 데이터 저장 전에 미리 정제·변환·정규화를 끝내는 방식 (DW 의 ETL · Schema-on-Write). 사후처리 는 일단 원시(raw) 그대로 받아 두고 분석 시점에 비로소 가공하는 방식 (Data Lake 의 Schema-on-Read). 빅데이터 시대엔 다양한…
- 변화 ③ 질 → 양 — 질 이란 데이터가 얼마나 깔끔한지 — 결측·오타·이상치가 없는지를 말해. 전통 통계에선 작은 표본에서도 정확한 결론을 내야 했기에 데이터 정제에 큰 비중을 뒀어. 빅데이터에선 양 이 워낙 많아 일부 잡음이 평균에 묻혀버리는 효과가 생겨, 정제보다 양 확보가 우선이 됐어. ADsP …
- 빅데이터가 만들어내는 변화 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 데이터의 가치와 미래 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 변화 ① 표본조사 → 전수조사 — 표본조사 는 모집단(예: 전체 가입자) 의 일부만 추려 분석하는 것. 전수조사 는 한 명도 빠짐없이 다 분석하는 것. 전통적 통계학은 비용 때문에 표본조사를 강제했지만, 빅데이터 시대엔 가입자 1억 명 거래 로그도 다 다룰 수 있게 됐어. ADsP 데이터의 가치와 미래 개념을 Qu…
- 데이터 3법 개요 — 개인정보보호법 · 정보통신망법 · 신용정보법 → 앞 글자 "개정신". 2020년 개정으로 가명정보 개념이 추가돼 통계·연구·공익 목적으로 동의 없이 활용 가능. ADsP 데이터의 가치와 미래 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 데이터 3법 ③ 신용정보법 — 신용정보법은 금융거래·신용평가에 사용되는 신용정보의 수집·이용·제공·집중관리(신용정보집중기관) 등을 규제. 마이데이터(본인신용정보관리업) 의 근거 법. ADsP 데이터의 가치와 미래 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 데이터 3법 ② 정보통신망법 — 정보통신망법은 정보통신서비스 제공자(웹사이트·앱·SNS 등) 의 개인정보 보호 의무·이용자 보호 조치를 규정. 일반 개인정보보호법 위에 통신서비스 특화 규정이 추가된 형태. ADsP 데이터의 가치와 미래 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 데이터 3법 ① 개인정보보호법 — 개인정보보호법은 모든 개인정보 처리에 대한 일반법. 정보주체의 동의·열람·정정·삭제 권리, 처리자의 안전조치 의무 등을 규정. 통신·금융 같은 특정 영역은 추가로 정보통신망법·신용정보법 적용. ADsP 데이터의 가치와 미래 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 데이터 3법 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 데이터의 가치와 미래 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 빅데이터 비유 개요 — 빅데이터가 가진 여러 성격을 이해하기 위해 4가지 대표 비유가 사용돼. 각 비유는 빅데이터의 다른 면 (원동력 / 가공 / 관찰 / 토대) 을 강조해. 시험에선 "이 비유가 강조하는 것은?" 이나 "이 사례에 맞는 비유는?" 으로 자주 등장. ADsP 데이터의 가치와 미래 개념을 …
- 비유 ① 산업혁명 석탄·철 — 산업혁명 석탄·철 비유는 빅데이터를 사회를 근본적으로 바꾸는 원동력 으로 봐. 18세기 산업혁명이 석탄·철 같은 새로운 자원으로 인해 가능했듯이, 21세기 사회·경제 변혁의 핵심 자원이 빅데이터라는 시각. ADsP 데이터의 가치와 미래 개념을 QuestDP 레슨에서 단계별로 정리합…
- 빅데이터 위기·대응 — 빅데이터는 강력한 만큼 3가지 위기 도 동반해. (1) 사생활 침해 — 데이터 수집·결합으로 개인 식별 위험. (2) 책임원칙 훼손 — 데이터 기반 자동 결정의 책임 모호. (3) 데이터 오용·과신 — 통계적 결론을 절대시 (Garbage In, Garbage Out). 각 위기마…
- 비유 ③ 렌즈 — 렌즈 비유는 빅데이터를 세상을 새롭게 관찰·발견하게 해주는 도구 로 봐. 현미경이 미생물을, 망원경이 천체를 발견하게 해줬듯이, 빅데이터는 인간의 직관으로는 안 보이던 패턴·트렌드·연관성을 드러나게 해. ADsP 데이터의 가치와 미래 개념을 QuestDP 레슨에서 단계별로 정리합니…
- 비유 ② 원유 — 원유 비유는 빅데이터를 정제해야 가치가 생기는 자원 으로 봐. 원시 데이터(raw) 그대로는 쓸모가 없고, 분석·가공·정제 과정을 거쳐야 비로소 의사결정·서비스에 활용 가능. 데이터 사이언티스트의 역할이 정제소처럼 중요하다는 의미. ADsP 데이터의 가치와 미래 개념을 QuestD…
- 비유 ④ 플랫폼 — 플랫폼 비유는 빅데이터를 다른 서비스가 그 위에서 자라는 토대 로 봐. 빅데이터 자체보다는 그것을 활용해 만들어지는 AI·추천 시스템·자율주행 등의 응용 서비스가 만들어지는 기반. 생태계의 토대가 되는 자원이라는 시각. ADsP 데이터의 가치와 미래 개념을 QuestDP 레슨에서 …
- 빅데이터 비유 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 데이터의 가치와 미래 개념을 QuestDP 레슨에서 단계별로 정리합니다.
가치 창조를 위한 데이터 사이언스
- 핵심 3축 — 데이터 사이언스는 "데이터에서 가치를 뽑는 종합 예술". 통계학이 엄밀한 수식 위에서 움직인다면, 데이터 사이언스는 여기에 컴퓨터공학(속도)과 비즈니스(목적) 가 합쳐진 훨씬 넓은 판이야. 한 사람이 셋을 다 갖추기는 어렵고 보통 팀으로 협업해. ADsP 가치 창조를 위한 데이터 …
- Hard Skill vs Soft Skill — Hard 는 "배워서 익히는 기술" — 머신러닝, SQL, 프로그래밍. Soft 는 "태도·관점·커뮤니케이션" — 통찰, 스토리텔링, 협력. 시험은 어떤 역량이 어느 쪽인지 매칭을 물어. ADsP 가치 창조를 위한 데이터 사이언스 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- DS 6역량 개요 — 앞서 본 3축(Analytics·IT·Business) 을 더 잘게 쪼개 6가지 구체적 역량으로 표현한 것이 "Digital CA메라". 시험에선 6개 알파벳에 무엇이 매핑되는지·매핑 안 되는 단어가 무엇인지를 자주 물어 — Management 가 단골 함정. ADsP 가치 창조를…
- 6역량 ② Analytics — Analytics 는 도메인 이해 + 분석 기법 선택 능력. 어떤 비즈니스 문제에 어떤 모델·기법이 맞는지 판단하는 역량. 의사가 진료 전 환자 증상 듣고 검사·치료법 선택하는 것과 비슷. ADsP 가치 창조를 위한 데이터 사이언스 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 6역량 ⑥ Art (디자인·창의) — Art 는 데이터에서 통찰·창의적 관점·미적 디자인 을 끌어내는 비기술적 역량. 시각화 미감, 새 가치 발견의 직관. 인테리어 디자이너가 같은 공간을 다르게 꾸미듯, 같은 데이터에서 새 관점을 발견. ADsP 가치 창조를 위한 데이터 사이언스 개념을 QuestDP 레슨에서 단계별로…
- 6역량 ① Communication — Communication 은 분석 결과를 비즈니스 청중에 맞게 풀어내는 역량 — 시각화·스토리텔링·발표. 아무리 정확한 분석이라도 의사결정자에게 전달되지 않으면 가치가 없어. ADsP 가치 창조를 위한 데이터 사이언스 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 6역량 ④ Engineering — Engineering 은 데이터 파이프라인 · DB · 분산 처리 · 코드 구현 능력. 모델을 실제 서비스로 옮기는 데 필수. 식당 주방처럼 좋은 도구·시스템이 있어야 요리(분석 결과) 가 손님(사용자) 에게 전달돼. ADsP 가치 창조를 위한 데이터 사이언스 개념을 QuestDP…
- 6역량 ③ Math (수학·통계) — Math 는 통계·확률·선형대수·미적분 등 분석의 수학적 기반. 모델 가정·수식 유도·검정의 토대. 자동차 엔진의 기름처럼 안 보이지만 모든 분석 활동이 그 위에서 돌아가. ADsP 가치 창조를 위한 데이터 사이언스 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 6역량 ⑤ Research — Research 는 기존 모델·기법으로 풀리지 않는 문제에 대해 새 가설·접근 을 탐구하는 R&D 역량. 새 메뉴 개발하는 셰프처럼, 기존 레시피로 안 되는 새 시도를 실험·검증. ADsP 가치 창조를 위한 데이터 사이언스 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- DS 6역량 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 가치 창조를 위한 데이터 사이언스 개념을 QuestDP 레슨에서 단계별로 정리합니다.
2과목 데이터 분석 기획
데이터 분석 기획의 이해
- 분석 4유형 (개요) — "What 을 안다 / 모른다" × "How 를 안다 / 모른다" 의 2×2. 각 칸이 다른 분석 전략을 요구해. ADsP 데이터 분석 기획의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 4유형 ④ Discovery — Discovery(전방위 탐험) 는 What 도 How 도 모두 비어있는 가장 모험적인 영역이야. 가설·문제 정의부터 시작해서 어떤 데이터가 의미 있는지, 어떤 기법으로 접근할지까지 전부 만들어가는 R&D 적 분석. ADsP 데이터 분석 기획의 이해 개념을 QuestDP 레슨에서 …
- 4유형 ③ Insight — Insight(대상 발견) 는 How(분석 도구·기법) 는 갖춰져 있지만 What(어디에 적용할까) 이 비어 있는 단계야. "우리 회사가 잘하는 회귀·군집·EDA 를 어디에 써먹지?" 라는 질문에서 시작해 데이터에서 가치 있는 분석 대상을 발굴하는 일. ADsP 데이터 분석 기획의…
- 4유형 ① Optimization — Optimization(최적화) 는 What(풀 문제) 도 분명하고 How(푸는 방법) 도 갖춰진 가장 안정된 상태야. 새로운 모델을 만드는 게 아니라 이미 잘 작동하는 모델·프로세스의 효율을 한 단계 더 끌어올리는 일 — 파라미터 튜닝, 자원 배분 재조정, 운영 최적화. ADsP…
- 분석 4유형 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 데이터 분석 기획의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 4유형 ② Solution — Solution(방법 탐색) 은 What 은 분명("어떤 결과를 얻고 싶은지" 명확) 한데 How 가 비어있는 단계야. 여러 분석 기법·모델을 후보로 두고 "이 문제엔 어느 기법이 가장 잘 맞을까?" 를 비교 실험하는 일. ADsP 데이터 분석 기획의 이해 개념을 QuestDP 레…
- 분석 프로세스 개요 — "문제를 안다 × 방법을 안다" — 2×2 칸이 분석을 결정해. ADsP 데이터 분석 기획의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- CRISP-DM 6단계 — CRISP-DM(Cross-Industry Standard Process for Data Mining) 은 산업 표준. 6단계: 업무 이해 → 데이터 이해 → 데이터 준비 → 모델링 → 평가 → 전개. 비즈니스 의도에서 출발하고 배포까지. ADsP 데이터 분석 기획의 이해 개념을 …
- KDD 5단계 — KDD(Knowledge Discovery in Databases) 는 1996년 Fayyad 가 정립한 5단계 프로세스. 데이터 선택 → 전처리 → 변환 → 마이닝 → 해석·평가. ADsP 데이터 분석 기획의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 분석 프로세스 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 데이터 분석 기획의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 하향식 접근 개요 — 하향식(Top-down) 접근은 풀어야 할 문제가 명확할 때 쓰는 정석. 4단계 순서가 시험에 그대로 나와 — "탐정해타". ADsP 데이터 분석 기획의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 하향식 ② 문제 정의 — 문제 정의(Definition) 는 탐색에서 모은 후보 중 한 개를 골라 "데이터로 풀 수 있는 형태" 로 다시 쓰는 단계야. "요즘 매출이 좀 부진해" 같은 구어체 비즈니스 문제는 분석가가 그대로 풀 수 없어. 측정 가능한 지표·시점·범위로 좁혀줘야 해. ADsP 데이터 분석 기…
- 하향식 ① 문제 탐색 — 문제 탐색(Exploration) 은 풀어야 할 문제 후보를 빠짐없이 모으는 단계야. 처음부터 한두 개로 좁히지 않고 일단 넓게 펼쳐놓는 게 핵심 — 회사 안과 밖, 두 관점을 교차하면 사각지대를 줄일 수 있어. ADsP 데이터 분석 기획의 이해 개념을 QuestDP 레슨에서 단계…
- 하향식 ④ 타당성 검토 — 타당성 검토(Feasibility) 는 실제 프로젝트 착수 직전, "정말 진행 가능한가?" 를 3축으로 점검하는 마지막 관문이야. 한 축이라도 막히면 앞 단계로 돌아가 후보를 다시 고려해야 해. ADsP 데이터 분석 기획의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 하향식 접근 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 데이터 분석 기획의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 하향식 ③ 해결방안 탐색 — 해결방안 탐색(Solution) 은 정의된 분석 문제에 대해 풀이 방법 후보를 나열하고 비교하는 단계야. 어떤 알고리즘으로? 어떤 데이터를? 어떤 시스템 위에서? — 도구·기법·데이터 소스의 후보를 줄세우고 일차 비교를 해. 실제로 운영에 올리기 전 단계. ADsP 데이터 분석 기…
- 분석 방법론 5종 개요 — "문제를 안다 × 방법을 안다" — 2×2 칸이 분석을 결정해. ADsP 데이터 분석 기획의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 방법론 ④ Agile — Agile(애자일) 은 2~4주 짧은 반복 주기(스프린트) 를 돌며 매 스프린트마다 동작하는 결과물을 만들고 변경을 적극 수용하는 방법론이야. "요구사항이 자주 바뀐다" 를 약점이 아닌 자연스러운 사실로 받아들이는 게 철학적 차이 — Waterfall 이 변경을 비용으로 본다면 A…
- 방법론 ② Prototype — Prototype(시제품) 방법론은 요구사항이 처음부터 분명하지 않을 때 일단 동작하는 시제품을 빠르게 만들어 사용자에게 보여주고 피드백을 받아 개선하는 반복 사이클이야. "말로 설명해도 사용자가 정확히 뭘 원하는지 모를 때" 가장 강력 — 사용자도 만든 걸 봐야 진짜 원하는 걸 …
- 방법론 ⑤ RAD — RAD(Rapid Application Development) 는 60~90일 같은 명확한 단기 데드라인 안에 결과물을 내야 하는 프로젝트에 쓰는 방법론이야. 미리 만들어둔 모듈·컴포넌트·라이브러리를 빠르게 조립해 단기간에 동작하는 시스템을 완성. Agile 과 비슷해 보이지만 R…
- 분석 방법론 5종 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 데이터 분석 기획의 이해 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 방법론 ③ Spiral — Spiral(나선형) 은 반복 사이클 + 각 사이클마다 위험 분석을 결합한 방법론이야. 한 사이클당 4단계(계획·위험분석·개발·평가) 를 돌고, 다음 사이클로 갈지 멈출지를 위험 평가 결과로 결정해. 신기술·대형·고위험 프로젝트에 적합 — 한 번의 실패가 너무 비싸기 때문에 매 단…
- 방법론 ① Waterfall — Waterfall(폭포수) 은 단계가 순차적으로 진행되어 한 번 다음 단계로 가면 이전으로 되돌리기 어려운 방법론이야. 폭포처럼 위에서 아래로 한 방향으로만 흐른다는 뜻에서 이름이 붙었어. 요구사항이 처음부터 명확하고 변경이 거의 없는 프로젝트에서만 효율적이야. ADsP 데이터 분…
분석 마스터플랜
- 과제 우선순위 (개요) — 과제 우선순위는 "지금 급한가" × "얼마나 어려운가" 의 2×2 매트릭스로 분류. 각 칸이 다른 행동을 권해. ADsP 분석 마스터플랜 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 우선순위 ③ Future × Easy — Future × Easy = 시급하진 않지만 부담도 적은 영역. 분석 팀이 한가할 때 처리하면 작은 가치라도 확보할 수 있는 보너스 후보들이야. 다만 이 영역에 자원을 너무 많이 쓰면 1·2순위 핵심 과제를 놓치기 쉬워요. ADsP 분석 마스터플랜 개념을 QuestDP 레슨에서 단…
- 우선순위 ④ Future × Difficult — Future × Difficult = 후순위. 지금 시작하기엔 비용 부담이 크고 즉각 효용도 낮은 영역이야. 보통 R&D·신기술 검토·실험적 프로젝트가 여기 분류돼. 회사 자원이 충분하고 미래 대비를 명확히 할 때만 착수. ADsP 분석 마스터플랜 개념을 QuestDP 레슨에서 단…
- 우선순위 ① Now × Easy — Now × Easy = 1순위. 시급성도 높고 난이도도 낮아 망설일 이유가 없는 과제야. 보통 데이터·인프라가 이미 갖춰져 있어 며칠~몇 주 안에 결과를 낼 수 있어. 분석 조직이 처음 들어왔을 때 "조직의 신뢰" 를 빠르게 쌓는 카드로도 사용돼. ADsP 분석 마스터플랜 개념을 …
- 우선순위 ② Now × Difficult — Now × Difficult = 시급성은 높은데 난이도도 높은 영역. 지금 안 하면 다른 분석들이 모두 막히지만, 한 번에 끝낼 수 없는 큰 투자가 필요한 과제들이 여기 와. 단계적 로드맵·예산 분할·점진적 인도(MVP → 확장) 가 정석. ADsP 분석 마스터플랜 개념을 Ques…
- 과제 우선순위 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 분석 마스터플랜 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 분석 거버넌스 개요 — 시스템(Infra) · 조직(Organization) · 프로세스(Process) · 인력(Resource) · 데이터(Data). "마케팅" 은 포함되지 않음 — 함정. ADsP 분석 마스터플랜 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 거버넌스 ⑤ 데이터 (Data) — 데이터(Data) 축은 데이터 자체의 표준화·품질 관리·메타데이터·라이프사이클. 더 깊이 들어가면 별도 "데이터 거버넌스 (원·조·프)" 로 펼쳐짐. ADsP 분석 마스터플랜 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 거버넌스 ② 조직 (Organization) — 조직(Organization) 축은 분석 활동의 R&R · 보고 라인 · CoE / 분산 / 기능 같은 조직 형태를 정해. ADsP 분석 마스터플랜 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 거버넌스 ③ 프로세스 (Process) — 프로세스(Process) 축은 과제 발굴 → 수행 → 평가의 표준화된 작업 흐름·승인 절차·산출물 양식. ADsP 분석 마스터플랜 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 거버넌스 ④ 인력 (Resource) — 인력(Resource) 축은 분석 인력의 채용·교육·역량 평가·경력 경로. ADsP 분석 마스터플랜 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 분석 거버넌스 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 분석 마스터플랜 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 거버넌스 ① 시스템 (Infra) — 시스템(Infra) 축은 분석을 돌릴 수 있는 기술 기반 — 분석 플랫폼·데이터베이스·BI 도구·컴퓨팅 인프라. ADsP 분석 마스터플랜 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 분석 성숙도 개요 — 도입(Introduction) → 활용(Adoption) → 확산(Diffusion) → 최적화(Optimization). 준비도(Readiness) 와 혼동 금지 — 준비도는 별개 축. ADsP 분석 마스터플랜 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 성숙도 ② 활용 — 활용(Adoption) 은 한두 부서가 분석을 정기 업무로 통합한 단계야. 도입과 다른 점은 (1) 개인이 아니라 부서 차원의 활동이 되었다는 것 (2) 정기적으로(주간·월간) 결과를 만들어 의사결정에 쓴다는 것. 다만 전사 차원의 통일된 도구·플랫폼은 아직 없어 부서마다 도구가 …
- 성숙도 ③ 확산 — 확산(Diffusion) 은 전사 차원에서 분석을 표준화하는 단계야. 부서마다 흩어져 있던 데이터·도구를 통합 플랫폼 위로 모으고, 거버넌스 정책(누가 어떤 데이터를 볼 수 있는지·품질 기준은 어떻게 되는지) 을 공식화해. 분석이 "있으면 좋은" 게 아니라 "모든 부서가 공유하는 …
- 성숙도 ① 도입 — 도입(Introduction) 은 회사의 분석이 일부 개인의 자발적 시도 수준에 머무는 단계야. 회사가 공식적으로 "분석을 하자" 라고 말한 적은 없고, 호기심 많은 한두 명이 엑셀·구글 시트로 자기 업무를 분석해 보는 정도. 표준·예산·플랫폼 모두 부재해. ADsP 분석 마스터플…
- 성숙도 ④ 최적화 — 최적화(Optimization) 는 분석이 조직 의사결정의 디폴트가 된 단계야. 회의에서 데이터 근거 없이 의견을 내면 통과되지 않을 정도로 분석이 일상에 내재화돼. 한 발 더 나아가 "분석 자체의 ROI 와 효율" 을 다시 분석해 최적화하는 메타 단계까지 진행돼. ADsP 분석 …
- 분석 성숙도 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 분석 마스터플랜 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 데이터 거버넌스 개요 — "분석 거버넌스 5축 (시조프인데)" 와 "데이터 거버넌스 3요소 (원조프)" 는 별개. 시험에서 두 축을 섞어 오답 선지로 주는 게 흔해. ADsP 분석 마스터플랜 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 데이터 거버넌스 ② 조직 — 조직(Organization) 은 데이터 거버넌스의 원칙을 실제로 굴릴 사람·역할 구조야. 아무리 좋은 정책도 책임자가 없으면 종이일 뿐 — 누가 어떤 데이터에 대해 결정권을 가지고, 누가 일상 운영을 담당할지를 명확히 해. ADsP 분석 마스터플랜 개념을 QuestDP 레슨에서 …
- 데이터 거버넌스 ① 원칙 — 원칙(Principle) 은 회사가 데이터를 다룰 때 따라야 할 기본 규범·정책이야. "헌법" 에 비유하면 가장 정확해. 보안 정책, 접근 권한 정책, 데이터 품질 정책, 활용 정책 — 모든 일상 결정이 이 원칙에서 출발해. ADsP 분석 마스터플랜 개념을 QuestDP 레슨에서 …
- 데이터 거버넌스 ③ 프로세스 — 프로세스(Process) 는 원칙을 일상 운영에 녹이는 실행 절차야. "매일·매주 어떤 일을 어떤 순서로 하는가" 가 프로세스. 원칙(헌법) 이 있고 조직(책임자) 이 정해졌어도 이 일상 절차가 없으면 결국 운영이 안 돼. ADsP 분석 마스터플랜 개념을 QuestDP 레슨에서 단…
- 데이터 거버넌스 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 분석 마스터플랜 개념을 QuestDP 레슨에서 단계별로 정리합니다.
분석 과제 발굴
- 타당성 3요소 개요 — 기본 3요소는 경제·기술·운영. "사회적 타당성" 같은 추가 항목은 오답 함정. ADsP 분석 과제 발굴 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 타당성 ① 경제적 (Economic) — 경제적(Economic) 타당성 — 비용·편익 분석(ROI). 프로젝트가 투자 대비 충분한 수익을 낼 수 있는지. ADsP 분석 과제 발굴 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 타당성 ③ 운영적 (Operational) — 운영적(Operational) 타당성 — 분석 결과를 실제 운영할 조직·인력·프로세스 수용 가능성. "기술은 되지만 사람이 못 받는" 케이스 점검. ADsP 분석 과제 발굴 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 타당성 3요소 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 분석 과제 발굴 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 타당성 ② 기술적 (Technical) — 기술적(Technical) 타당성 — 필요한 데이터가 있는지, 알고리즘·인프라·시스템이 가능한지. ADsP 분석 과제 발굴 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 상향식 접근 — 대량의 로그·거래 데이터를 들여다보고 패턴·이상 징후에서 분석 주제를 "발견" 하는 방식. 비지도 학습·EDA 가 주 무기야. 문제를 미리 정의하지 않고 데이터가 말하게 하는 것. ADsP 분석 과제 발굴 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 디자인 씽킹 (혼합) — 하향식으로 가설을 세우고, 상향식으로 데이터를 점검하고, 다시 가설을 수정하는 반복 운동. 이 혼합 접근을 디자인 씽킹이라 불러. 현대 기업들이 가장 선호하는 방식. ADsP 분석 과제 발굴 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 분석 과제 정의서 — 분석 과제 정의서는 분석 프로젝트를 시작하기 전 합의해서 작성하는 문서야. 진행 중 "범위가 갑자기 바뀐다", "자원이 부족하다" 같은 분쟁을 사전에 방지하는 헌장 역할을 해. ADsP 분석 과제 발굴 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 분석 준비도 개요 — 분석 준비도(Analytics Readiness) 는 조직이 분석을 시작·확장할 만한 토대가 갖춰졌는지 6 영역으로 점검해. 분석 거버넌스 5축(시조프인데) 와 헷갈리지 마 — 거버넌스는 굴리는 틀, 준비도는 시작 전 점검표. ADsP 분석 과제 발굴 개념을 QuestDP 레슨에서…
- 준비도 ① 분석 업무 (Business Task) — 분석 업무 영역은 조직이 분석할 만한 비즈니스 과제를 얼마나 발굴·정의할 수 있느냐를 봐. "어떤 분석이 필요한지" 조차 못 짚으면 다음 단계 진행 X. ADsP 분석 과제 발굴 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 준비도 ⑤ 분석 문화 (Culture) — 분석 문화 영역은 조직이 데이터 기반 의사결정을 일상으로 받아들이는 문화 수준을 봐. 분석이 의사결정의 디폴트인가, 아니면 "감으로 결정" 후 사후 정당화용인가. ADsP 분석 과제 발굴 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 준비도 ④ 분석 데이터 (Data) — 분석 데이터 영역은 분석에 사용할 수 있는 데이터의 확보 가능성·품질·표준화 수준을 봐. ADsP 분석 과제 발굴 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 준비도 ⑥ IT 인프라 (Infrastructure) — IT 인프라 영역은 분석을 돌릴 컴퓨팅 환경·플랫폼·도구 보유 수준이야. 분석 거버넌스 5축의 "시스템" 과 동일한 개념. ADsP 분석 과제 발굴 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 준비도 ③ 분석 기법 (Method) — 분석 기법 영역은 통계·머신러닝·딥러닝 등 분석 알고리즘과 기법을 어디까지 활용할 수 있는가를 봐. ADsP 분석 과제 발굴 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 준비도 ② 분석 인력·조직 (People & Org) — 분석 인력·조직 영역은 조직 내 분석 인력 보유 수준 + 분석 전담 조직 (CDO·CoE 등) 의 명확성을 봐. ADsP 분석 과제 발굴 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 분석 준비도 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 분석 과제 발굴 개념을 QuestDP 레슨에서 단계별로 정리합니다.
3과목 데이터 분석
R 기초와 데이터 마트
- 요약변수 vs 파생변수 — 실무에선 모델 만드는 시간보다 데이터 정리 시간이 더 길어. 그 정리 결과물이 "데이터 마트" — 분석 목적에 맞게 다듬어 둔 작은 창고야. ADsP R 기초와 데이터 마트 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- EDA 개요 — EDA(Exploratory Data Analysis) 는 튜키(Tukey) 가 정립한 단계. 모델링 전에 데이터의 형태·이상·관계를 파악해. ADsP R 기초와 데이터 마트 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- EDA ③ 재표현 — 재표현(Re-expression) 은 변수의 척도(눈금) 를 다른 함수로 바꿔 분석에 더 적합한 형태로 만드는 원칙이야. 한쪽으로 길게 늘어진 분포를 종 모양으로 펴주거나, 분산이 들쑥날쑥한 데이터를 균일하게 만들어 회귀·t검정의 가정을 충족시키기 위해 자주 사용. ADsP R 기…
- EDA ② 잔차해석 — 잔차해석(Residual) 은 모델 적합 후 잔차(실제 − 예측) 를 들여다보며 모델이 놓친 게 없는지 점검하는 원칙이야. 좋은 모델일수록 잔차가 평균 0 주변에 무작위로 흩어져 있어. 만약 잔차에 어떤 모양·추세가 보이면 그건 모델이 잡아내지 못한 정보가 남아 있다는 신호. AD…
- EDA ① 저항성 — 저항성(Resistance) 은 "소수의 이상치 때문에 결과가 크게 흔들리지 않는 통계를 쓰자" 는 원칙이야. 평균·표준편차·분산은 한 점이 크게 튀면 통째로 끌려가. 반면 중앙값·IQR·중위절대편차(MAD) 같은 통계는 이상치가 끼어들어도 거의 그대로야. ADsP R 기초와 데이…
- EDA ④ 현시성 — 현시성(Revelation) 은 적절한 시각화로 데이터에 숨은 구조·관계·이상을 드러내는 원칙이야. EDA 4원칙 중 가장 자주 마주하는 활동 — 표나 평균값으론 안 보이는 패턴이 그림 한 장에서 단번에 드러나는 경우가 많거든요. ADsP R 기초와 데이터 마트 개념을 QuestD…
- EDA 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP R 기초와 데이터 마트 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 결측값 처리 개요 — 결측값은 데이터 표 안의 "빈칸" 이야. 그냥 비어 있다고 바로 지우면 안 되고, 왜 비었는지와 얼마나 중요한 값인지 먼저 판단해야 해. 그래서 결측 처리는 지우기, 단순히 채우기, 여러 번 추정하기, 모델로 예측하기의 4가지 흐름으로 나뉘어. ADsP R 기초와 데이터 마트 개념…
- 결측 처리 ① 완전 제거 — 완전 제거(Listwise Deletion) 는 결측이 있는 레코드를 모두 제외. Pairwise 는 분석마다 가용 변수만 사용. 단순하지만 표본이 작아지고 MNAR 일 때 편향 발생. ADsP R 기초와 데이터 마트 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 결측 처리 ④ 모델 기반 — 모델 기반 대치는 회귀·KNN·랜덤포레스트 등으로 다른 변수에서 결측을 예측해 채움. 변수 간 관계를 활용해 단순 대치보다 정교. ADsP R 기초와 데이터 마트 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 결측 처리 ③ 다중 대치 (MI) — 다중 대치(Multiple Imputation, MI) 는 결측 값에 대해 여러 번(M회) 다른 값을 대치해 M개의 완전 데이터셋을 만들고, 분석 후 결과를 통합. 대치의 불확실성까지 반영. ADsP R 기초와 데이터 마트 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 결측값 처리 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP R 기초와 데이터 마트 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 결측 처리 ② 단순 대치 — 단순 대치(Simple Imputation) 는 평균·중앙값·최빈값 같은 단일 통계로 결측을 채움. 빠르지만 변동성을 줄여 통계적 추론을 왜곡할 수 있음. ADsP R 기초와 데이터 마트 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 이상값 탐지 개요 — 오타·기기 오류는 제거. 사기 거래·고가치 고객처럼 진짜 극단값이면 남겨서 분석 대상으로 삼아. ADsP R 기초와 데이터 마트 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 이상값 ④ DBScan — DBScan(Density-Based Spatial Clustering of Applications with Noise) 은 본래 군집 알고리즘이지만, "어느 군집에도 속하지 않는 점(noise)" 을 자동으로 분리해주기 때문에 이상값 탐지로도 자주 사용돼. 평균·분산이 아닌 거리…
- 이상값 ① ESD — ESD(Extreme Studentized Deviate) 는 "평균 ± 3·표준편차" 라는 정규분포 기반의 경계로 이상값을 판정하는 방법이야. 정규분포에선 99.7% 의 데이터가 평균 ±3σ 안에 들어오므로, 이 밖으로 나가면 0.3% 미만의 극단적인 값으로 봐. 종 모양 분포에…
- 이상값 ② IQR — IQR(Interquartile Range, 사분위수 범위) 은 Q3(상위 25% 경계) 에서 Q1(하위 25% 경계) 을 뺀 폭이야. 이 폭의 1.5배만큼을 양쪽에 더해 "Q1 − 1.5·IQR 미만" 또는 "Q3 + 1.5·IQR 초과" 를 이상값으로 판정해. 박스플롯의 수염 …
- 이상값 탐지 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP R 기초와 데이터 마트 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 이상값 ③ Z-Score — Z-Score 는 각 데이터 값을 "(값 − 평균) / 표준편차" 로 변환해 평균에서 몇 σ 떨어졌는지를 숫자로 표현하는 방법이야. 변환된 |z| 가 임계값(보통 2 또는 3) 을 넘으면 이상값으로 판정. 임계값을 데이터 특성에 맞게 조절할 수 있다는 게 ESD 보다 유연한 점이야…
- R 자료구조 개요 — R 자료구조는 데이터를 담는 그릇이야. 같은 종류를 한 줄로 담는지, 서로 다른 종류를 섞는지, 표처럼 행과 열이 있는지에 따라 쓰는 그릇이 달라져. 처음에는 "타입이 같은가?" 와 "1차원인가 2차원인가?" 두 질문만 기억하면 돼. ADsP R 기초와 데이터 마트 개념을 Ques…
- R ④ data.frame — data.frame 은 분석에서 가장 자주 다루는 자료구조. 행=관측치, 열=변수. 열마다 타입(숫자·문자·factor) 이 달라도 되며, dplyr 로 filter/select/mutate. ADsP R 기초와 데이터 마트 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- R ② list — list 는 서로 다른 타입·길이의 요소를 한 객체에 담는 컨테이너. list(name="A", age=30, scores=c(90,85)) 처럼 이름 붙여 접근. ADsP R 기초와 데이터 마트 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- R ③ matrix — matrix 는 같은 타입의 2차원 배열. matrix(1:6, nrow=2, ncol=3) · 행렬 곱(%*%)·전치(t())·역행렬(solve()) 등 선형대수 연산 지원. ADsP R 기초와 데이터 마트 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- R 자료구조 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP R 기초와 데이터 마트 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- R ① vector — vector 는 R 의 기본 단위. 같은 타입의 1차원 묶음. c(1, 2, 3) · c("a", "b") · 1:10 모두 vector. 다른 타입을 섞으면 가장 일반적인 타입으로 자동 변환(coercion). ADsP R 기초와 데이터 마트 개념을 QuestDP 레슨에서 단계별…
통계 분석
- 측정 척도 개요 — 척도가 낮을수록 정보량이 적고, 높을수록 가능한 연산이 자유로워. 명목 < 순서(서열) < 등간 < 비율 위계. ADsP 통계 분석 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 척도 ③ 등간 — 등간(Interval) 척도는 값의 차이(빼기) 가 일정한 의미를 갖는 척도야. "10°C 차이" 가 어디서나 같은 의미야. 하지만 비율(나누기) 은 무의미한데, 그 이유는 "절대 0 (값이 진짜 없는 상태)" 이 정의되지 않았기 때문이야. 0이 그저 "임의로 정한 기준점" 일 뿐…
- 척도 ① 명목 — 명목(Nominal) 척도는 카테고리를 구분하는 이름표일 뿐, 그 사이에 어떤 순서·크기·간격도 의미가 없는 척도야. "같다 / 다르다" 의 비교만 통하고, "크다·작다", "차이가 얼마", "두 배" 같은 비교는 모두 무의미해. 척도의 4단계 중 가장 정보량이 적은 단계. ADs…
- 척도 ② 서열(순서) — 순서(Ordinal, 서열) 척도는 값들 사이에 순위는 있지만 그 간격이 일정한지는 모르는 척도야. "A > B > C" 라고 줄세우는 건 의미 있지만, "A와 B의 차이가 B와 C의 차이와 같다" 라고 단정할 수는 없어. 차이를 산수(빼기) 로 다루는 건 무의미. ADsP 통계 …
- 척도 ④ 비율 — 비율(Ratio) 척도는 절대 0 이 존재해 모든 산술 연산이 의미를 가지는 척도야. "두 배 / 절반" 같은 비율 표현이 명백히 통해. 4단계 척도 중 가장 정보량이 많고 자유롭게 분석할 수 있어. ADsP 통계 분석 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 측정 척도 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 통계 분석 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 확률분포 개요 — 확률분포는 "어떤 값이 얼마나 자주 나올지"를 그려놓은 지도야. 먼저 결과가 0개, 1개, 2개처럼 셀 수 있는지, 아니면 키·시간·무게처럼 끊기지 않는 값인지부터 나누면 훨씬 쉬워져. ADsP 통계 분석 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 확률분포 ② 연속 (Continuous) — 연속 확률분포는 결과가 실수 구간. 정규(기본·CLT) · t(소표본 평균) · 카이제곱(분산·적합도·독립성) · F(분산비·ANOVA) · 지수(사건 사이 대기시간). ADsP 통계 분석 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 확률분포 ① 이산 (Discrete) — 이산 확률분포는 결과가 셀 수 있는 값. 베르누이(1회 성공/실패) · 이항(n회 중 k) · 기하(첫 성공까지) · 다항(여러 범주) · 포아송(단위시간 드문 사건). ADsP 통계 분석 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 확률분포 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 통계 분석 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 좋은 추정량 개요 — Unbiased(불편성) · Efficient(효율성) · Consistent(일치성) · Sufficient(충분성). "정규성" 은 포함되지 않아 — 함정. ADsP 통계 분석 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 추정량 ③ 일치성 — 일치성(Consistent) 은 표본 크기 n 이 커질수록 추정량이 모수에 확률적으로 수렴하는 성질이야. "표본을 무한히 늘리면 결국 정답이 된다" 의 보장. 큰 표본을 가질 수만 있다면 신뢰할 수 있다는 의미라 통계 추론의 핵심 기반. ADsP 통계 분석 개념을 QuestDP 레…
- 추정량 ② 효율성 — 효율성(Efficient) 은 같은 모수를 추정하는 여러 불편추정량 중 분산(또는 MSE) 이 가장 작은 것을 의미해. 평균적으로는 둘 다 정답이라도 한 번의 추정에서 덜 흔들리는 게 더 좋은 추정량 — 매번 더 신뢰할 수 있으니까요. ADsP 통계 분석 개념을 QuestDP 레슨…
- 좋은 추정량 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 통계 분석 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 추정량 ④ 충분성 — 충분성(Sufficient) 은 추정량이 표본의 모수 관련 정보를 모두 흡수했음을 의미해. "추정량 값만 알면 충분하다 — 원 표본을 다시 들여다봐도 모수에 대한 더 많은 정보가 안 나온다" 는 보장. 정보 손실 없이 데이터를 압축한 통계량이라는 뜻. ADsP 통계 분석 개념을 Q…
- 추정량 ① 불편성 — 불편성(Unbiased) 은 "추정값을 무한 번 반복했을 때 평균이 정확히 진짜 모수가 되는" 성질이야. 한 번의 추정은 빗나갈 수 있어도 체계적인 편향(bias) 이 없다는 뜻이야. 식으로는 E추정량 = 모수. ADsP 통계 분석 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 중심극한정리 (CLT) — 모집단 분포와 무관하게 n 이 커지면 표본 "평균" 의 분포가 정규분포에 가까워진다 — 이것이 CLT. 통계적 추론이 성립하는 토대야. ADsP 통계 분석 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 주성분 분석 (PCA) — 변수가 100개인 고객 데이터 — 그대로 분석하면 모델이 무거워지고 해석도 어려워. "덜 중요한 방향은 버리고 중요한 방향 몇 개로 요약" 하는 것이 PCA. 수십 개 변수를 2~3개 주성분으로 압축해 시각화·모델 속도를 동시에 잡아. ADsP 통계 분석 개념을 QuestDP 레슨…
- 다차원척도화 (MDS) — 개체들 사이 "얼마나 비슷한가"(유사도) 또는 "얼마나 다른가"(거리) 를 입력받아, 그 관계를 최대한 보존하는 저차원(주로 2D) 좌표에 개체들을 배치하는 기법이야. 도시 간 거리표만으로 세계 지도를 복원해보는 것과 같은 발상. ADsP 통계 분석 개념을 QuestDP 레슨에서 …
통계적 가설 검정
- 가설검정 5용어 개요 — 예를 들어 "새 공부법이 점수를 올린다"는 주장이 있다고 해봅시다. 가설검정은 일단 "차이가 없다"를 기본값으로 두고, 데이터가 그 기본값을 뒤집을 만큼 강한지 확인해. ADsP 통계적 가설 검정 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 가설검정 ③ 유의수준 (α) — 유의수준(α) 은 "참인 H₀ 를 잘못 기각할 위험" 의 허용 한도. 일반적으로 0.05. p-value < α 면 H₀ 기각. ADsP 통계적 가설 검정 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 가설검정 ⑤ 1종/2종 오류 — 1종 오류(α) = H₀ 가 참인데 기각 (거짓 양성). 2종 오류(β) = H₀ 가 거짓인데 채택 (놓침). 검정력(Power) = 1 − β. ADsP 통계적 가설 검정 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 가설검정 ① 귀무가설 (H₀) — 귀무가설(H₀, Null Hypothesis) 은 "차이 없음 · 효과 없음" 을 가정. 검정의 출발점 — 데이터가 H₀ 를 뒤집을 만큼 강한지를 봐. ADsP 통계적 가설 검정 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 가설검정 ② 대립가설 (H₁) — 대립가설(H₁, Alternative Hypothesis) 은 "차이 있음 · 효과 있음" 을 주장. 연구자가 증명하고자 하는 가설로, H₀ 가 기각될 때 채택돼. ADsP 통계적 가설 검정 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 가설검정 ④ p-value — p-value 는 "H₀ 가 참이라고 가정할 때, 현재 데이터 또는 그보다 극단적인 결과가 나올 확률". α 보다 작으면 H₀ 기각. ADsP 통계적 가설 검정 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 가설검정 5용어 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 통계적 가설 검정 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- t검정 3종 개요 — "같은 대상의 전/후" 는 대응표본. "서로 다른 두 집단" 은 독립표본. 시험 단골. ADsP 통계적 가설 검정 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- t검정 ③ 독립표본 — 독립표본(Two-sample) t검정은 서로 다른 두 집단의 평균을 비교해. 두 그룹의 구성원이 겹치지 않아 짝지을 수 없는 게 대응표본과의 차이. 등분산성이 가정되면 pooled variance, 등분산이 깨졌으면 Welch 의 t를 사용해. ADsP 통계적 가설 검정 개념을 Q…
- t검정 ① 일표본 — 일표본(One-sample) t검정은 한 집단의 평균이 알려진 기준값과 같은지를 검증하는 검정이야. H₀: μ = μ₀. 비교 상대가 또 다른 집단이 아니라 "특정 숫자" 라는 게 다른 t검정과의 결정적 차이. ADsP 통계적 가설 검정 개념을 QuestDP 레슨에서 단계별로 정리…
- t검정 ② 대응표본 — 대응표본(Paired) t검정은 같은 대상에서 두 시점 또는 두 조건을 측정해 차이의 평균이 0인지 검정해. 핵심은 "측정 대상이 같다" 는 것 — 같은 사람·같은 차량·같은 환자가 두 번 측정되어 자연스러운 짝(pair) 을 이뤄. 분석 시엔 차이값(d = 사후 − 사전) 의 평…
- t검정 3종 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 통계적 가설 검정 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 회귀 4가정 개요 — 회귀선은 데이터 위에 그은 "설명선"이야. 그런데 데이터 모양이 직선과 너무 다르거나, 오차가 한쪽으로 몰리거나, 시간 순서대로 서로 영향을 주면 회귀선의 p-value와 해석을 믿기 어려워져. 그래서 4가정을 먼저 확인해. ADsP 통계적 가설 검정 개념을 QuestDP 레슨에서…
- 회귀 가정 ② 분산 (등분산성) — 등분산성(Homoscedasticity) 은 X 의 어느 영역에서나 잔차의 흩어짐(분산) 이 비슷하게 일정하다는 가정이야. 깨지면(이분산) 회귀계수의 표준오차 추정이 잘못되어 t·F 검정의 p-value 를 신뢰할 수 없게 돼. ADsP 통계적 가설 검정 개념을 QuestDP 레슨…
- 회귀 가정 ④ 독립성 — 독립성(Independence) 은 잔차들이 서로 상관이 없어야 한다는 가정이야. 한 관측의 잔차가 다른 관측의 잔차에 영향을 주면 안 됨. 시계열·반복측정·군집 데이터에서 자주 깨지며 깨지면 회귀계수 표준오차가 과소/과대 추정되어 검정 신뢰가 떨어져. ADsP 통계적 가설 검정 …
- 회귀 가정 ① 선형성 — 선형성(Linearity) 은 "X 가 1단위 증가할 때 Y 도 일정하게 증가/감소한다" 는 직선 관계 가정이야. 회귀의 가장 기본 전제 — 만약 X-Y 가 곡선이거나 어느 구간 후 정체된다면 직선으로 그은 회귀선이 시스템을 잘못 묘사하게 돼. ADsP 통계적 가설 검정 개념을 Q…
- 회귀 가정 ③ 정규성 — 정규성(Normality) 은 잔차가 평균 0인 정규분포를 따라야 한다는 가정이야. 회귀계수의 신뢰구간·t·F 검정의 p-value 가 정규성 가정 위에서 계산되기 때문에 이 가정이 깨지면 통계적 추론이 흔들려. ADsP 통계적 가설 검정 개념을 QuestDP 레슨에서 단계별로 정…
- 회귀 4가정 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 통계적 가설 검정 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 다중공선성 · 변수 선택 — 설명변수끼리 상관이 너무 크면 계수 해석이 불안정해져. VIF(Variance Inflation Factor) 가 10 이상이면 다중공선성을 의심해. ADsP 통계적 가설 검정 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 시계열 4성분 개요 — Trend(추세) · Seasonality(계절) · Cycle(순환) · Irregular(불규칙). "지연(Lag)" 은 ARIMA 파라미터지 분해 성분 아님 — 함정. ADsP 통계적 가설 검정 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 시계열 ③ 순환 — 순환(Cycle) 은 계절성보다 길고 등락이 있지만 주기가 일정하지 않은 변동이야. 다음 등락이 언제 올지 정확히 예측하기 어려운 게 계절성과의 결정적 차이. 보통 수년 단위로 펼쳐지는 큰 사이클이야. ADsP 통계적 가설 검정 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 시계열 ④ 불규칙 — 불규칙(Irregular) 성분은 추세·계절성·순환을 모두 분해해 빼낸 뒤 남는 무작위 변동이야. 일회성 외부 충격, 자연재해, 측정 오차, 알 수 없는 우연 — 시계열 모델이 미리 예측할 수 없는 부분이 모두 여기로 모여. ADsP 통계적 가설 검정 개념을 QuestDP 레슨에서…
- 시계열 4성분 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 통계적 가설 검정 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 시계열 ② 계절성 — 계절성(Seasonality) 은 시·일·주·월·년 단위처럼 고정된 주기로 정확하게 반복되는 패턴이야. "매년 8월에 늘 같은 모양" 처럼 주기가 일정하다는 게 핵심 — 다음 주기에 어느 정도 비슷한 패턴이 다시 올지 예측이 가능해. ADsP 통계적 가설 검정 개념을 QuestDP…
- 시계열 ① 추세 — 추세(Trend) 는 시계열의 장기적이고 일관된 방향성이야. "수년~수십 년" 단위에서 시계열을 멀찍이 보면 드러나는 큰 흐름 — 우상향, 우하향, 평탄화. 단기 출렁임이나 1년 주기 반복을 모두 걷어낸 뒤 남는 큰 그림이야. ADsP 통계적 가설 검정 개념을 QuestDP 레슨에…
정형 데이터 마이닝
- 과적합 / 데이터 분할 — 데이터 마이닝은 "큰 데이터에서 규칙·패턴을 발굴" 하는 작업. 정답 레이블이 있으면 지도(분류·회귀), 없으면 비지도(군집·연관). ADsP 정형 데이터 마이닝 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 서포트 벡터 머신 (SVM) — 두 집단 사이에 선을 긋는다면, 가장 여유롭게 긋는 게 안전하겠지. SVM 은 그 "여유(margin)" 가 최대가 되는 경계(초평면) 를 찾아. 경계에 가장 가까운 소수 점이 "서포트 벡터" — 이들이 경계를 결정해. ADsP 정형 데이터 마이닝 개념을 QuestDP 레슨에서 단…
- 인공신경망 · 딥러닝 — 뇌의 뉴런이 신호를 받아 임계를 넘으면 다음 뉴런에 전달 — 이걸 수식으로 흉내 낸 것이 인공신경망(ANN). 그 층(layer) 을 여러 개 깊게 쌓은 것이 딥러닝(Deep Learning) 이야. ADsP 정형 데이터 마이닝 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 마무리 — ADsP 전 과정을 끝까지 완주했어. 데이터의 본질부터 분석 기획·통계·모델링까지 — 데이터 분석 준전문가에게 필요한 핵심을 모두 다뤘어. ADsP 정형 데이터 마이닝 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 앙상블 개요 — Voting(다수결) · Bagging(병렬) · Boosting(순차) · Stacking(메타). 4종 분류 기준. ADsP 정형 데이터 마이닝 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 앙상블 ② Bagging — Bagging(Bootstrap Aggregating) 은 같은 알고리즘 N 개를 병렬로 학습하되, 각각에게 부트스트랩(복원 허용 무작위 추출) 으로 약간씩 다른 데이터셋을 줘. 결과적으로 N 개 모델의 예측을 평균(다수결) 해서 분산을 줄이고 과적합을 완화해. ADsP 정형 데이…
- 앙상블 ③ Boosting — Boosting 은 약한 학습기(stump 같은 단순 모델) 를 순차로 학습시키며, 매 단계마다 이전 모델이 틀린 샘플에 더 큰 가중치를 두어 점진적으로 오차를 줄여나가는 앙상블이야. 편향(bias) 을 줄이는 게 강점이라 단일 약한 모델로는 못 풀던 문제도 잘 풀어. ADsP 정…
- 앙상블 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 정형 데이터 마이닝 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 앙상블 ④ Stacking — Stacking 은 여러 베이스 모델(랜덤포레스트·XGBoost·로지스틱 등) 의 예측 결과를 모아 새로운 학습 데이터셋으로 만든 뒤, 그 위에 메타(블렌더) 모델 하나를 더 학습시키는 앙상블이야. "예측의 예측" 이라는 한 층을 더 쌓는 것 — 다양한 모델의 강점을 한 번 더 결…
- 앙상블 ① Voting — Voting 은 서로 다른 종류의 분류기·회귀기를 학습시킨 뒤 각자의 예측을 다수결(hard voting) 또는 확률 평균(soft voting) 으로 합치는 가장 단순한 앙상블이야. 친구 여러 명에게 같은 문제를 보여주고 의견을 모은다고 생각하면 직관적이야. ADsP 정형 데이터…
- 연관분석 개요 — Support(지지도) · Confidence(신뢰도) · Lift(향상도). 향상도 > 1 양의 연관, = 1 독립, < 1 음의 연관. ADsP 정형 데이터 마이닝 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 연관분석 ② 신뢰도 — 신뢰도(Confidence) = P(B|A) = "A·B 가 함께 등장한 거래 수 ÷ A 가 등장한 거래 수". A 라는 행동이 일어났을 때 B 가 따라올 조건부 확률이야. "맥주를 산 사람들 중 60%가 기저귀도 샀다" 같이 추천·번들링·진열 결정에 직접 쓰여. ADsP 정형 데…
- 연관분석 ③ 향상도 — 향상도(Lift) = 신뢰도 ÷ 전체에서 B 의 등장 비율 = P(B|A) ÷ P(B). 이는 "A 를 봤을 때 B 가 등장할 확률" 이 "A 와 무관하게 B 가 등장할 확률" 의 몇 배인지를 측정해. 연관성의 진짜 강도를 측정하는 핵심 지표 — Confidence 의 함정을 보정…
- 연관분석 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 정형 데이터 마이닝 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 연관분석 ① 지지도 — 지지도(Support) = "A·B 가 함께 등장한 거래 수 ÷ 전체 거래 수" 이야. 발견한 규칙이 얼마나 자주 일어나는지를 측정해. 지지도가 너무 낮으면 어쩌다 한두 번 일어나는 우연일 가능성이 커서, 마이닝 시작 전에 최소 지지도(min support) 기준을 정해 그 이상만…
- 군집 개요 — 군집은 정답 라벨이 없는 데이터를 비슷한 것끼리 묶는 방법이야. "이 학생이 A반인지 B반인지"를 미리 알려주지 않고, 데이터의 거리·밀도·확률 구조를 보고 자연스러운 그룹을 찾아. ADsP 정형 데이터 마이닝 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 군집 ③ DBSCAN — DBSCAN(Density-Based) 은 밀도가 충분한 영역을 클러스터로, 외곽은 noise(이상값) 로 분류. K 사전 지정 불필요 + 비구형 클러스터 + 이상치 강건. 학급에서 친구가 모여 앉은 자리는 군집, 외딴 학생은 noise 로 자동 분류되는 구조와 동일해. ADsP …
- 군집 ④ EM · SOM — EM(Expectation-Maximization) 은 가우시안 혼합 모델로 각 점이 클러스터에 속할 확률을 학습해 — "이 학생은 A 그룹 70%, B 그룹 30%" 처럼 부드러운 할당. SOM(Self-Organizing Map) 은 신경망 기반 2D 격자 투영으로 고차원 데이…
- 군집 ① 계층적 (Hierarchical) — 계층적 군집은 데이터를 점점 합치거나(합병형, agglomerative) 큰 덩어리에서 쪼개며(분할형, divisive) 트리(덴드로그램) 를 형성. K 를 미리 정할 필요 없어. 학교 조직도처럼 "친한 친구 → 같은 반 → 같은 학년 → 학교" 로 점점 묶이는 구조와 동일해. A…
- 군집 ② K-means — K-means 는 K 개의 중심점을 두고 각 점을 가장 가까운 중심에 할당 → 중심 갱신 → 반복. K 를 미리 정해야 하고, 구형 클러스터에 강함. "친구 그룹 3개 만들어줘" 처럼 K 가 비즈니스 요구로 정해질 때 직관적이야. ADsP 정형 데이터 마이닝 개념을 QuestDP …
- 군집 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 정형 데이터 마이닝 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 평가지표 ① 오분류표 개요 — 오분류표(Confusion Matrix) — 행=실제, 열=예측의 2×2 표. TP(맞게 양성), FP(거짓 양성), FN(놓친 양성), TN(맞게 음성). 정확도·정밀도·재현율·F1·ROC 모두 이 4 칸에서 계산. ADsP 정형 데이터 마이닝 개념을 QuestDP 레슨에서 단계…
- 평가지표 ② 정확도 (Accuracy) — 정확도(Accuracy) = (TP + TN) ÷ 전체. 시험에서 100문제 중 95개 맞히면 95% 라고 하는 것과 똑같아. 가장 직관적이고 입에 붙는 지표지만, 클래스 불균형(양성과 음성 비율이 크게 차이남) 상황에서는 무력해진다는 결정적 약점이 있어. ADsP 정형 데이터 마…
- 평가지표 ⑤ F1 · ROC · Lift — F1 = 2·(P·R) / (P+R) — 정밀도·재현율의 조화평균. 균형 필요할 때. ADsP 정형 데이터 마이닝 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 평가지표 ③ 정밀도 (Precision) — 정밀도(Precision) = TP ÷ (TP + FP). 풀어쓰면 "모델이 양성이라고 외친 횟수 중 진짜 양성이었던 비율". 거짓 양성(FP, 양성이 아닌데 양성이라 외침) 의 비용이 클 때 중요한 지표야. ADsP 정형 데이터 마이닝 개념을 QuestDP 레슨에서 단계별로 정리…
- 평가지표 ④ 재현율 (Recall) — 재현율(Recall, 민감도 Sensitivity) = TP ÷ (TP + FN). 풀어쓰면 "진짜 양성이 100명이었다면 그 중 모델이 몇 명을 잡아냈는가". 놓침(FN, 양성을 음성으로 오판) 의 비용이 클 때 중요한 지표야. ADsP 정형 데이터 마이닝 개념을 QuestDP …
- 평가지표 ① 오분류표 복습 — 바로 직전 스텝들에서 배운 개념·암기법·함정을 한 번 더 떠올리며 다음 그룹으로 넘어가요. 잘 안 떠오르는 항목이 있으면 이전 스텝으로 돌아가 확인해. ADsP 정형 데이터 마이닝 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 로지스틱 회귀 — "이 환자가 당뇨냐 아니냐" 처럼 분류 가 필요한데, 일반 선형회귀는 예측값이 음수나 2 가 나올 수 있어 부적합해. 로지스틱 회귀는 출력을 0~1 사이 확률로 바꿔주는 똑똑한 회귀야. ADsP 정형 데이터 마이닝 개념을 QuestDP 레슨에서 단계별로 정리합니다.
- 의사결정나무 — 뿌리 노드에서 "나이 > 30?" 같은 질문으로 데이터를 둘(또는 여러 개) 로 나누고, 가지마다 또 질문을 던져. 잎(leaf) 에 도달하면 그게 최종 예측. 규칙이 그대로 보여서 해석이 뛰어난 것이 최대 장점. ADsP 정형 데이터 마이닝 개념을 QuestDP 레슨에서 단계별로…
- K-최근접이웃 (K-NN) — "비슷한 애들이 뭐였는지 보고 따라 한다." 새 데이터가 들어오면 가장 가까운 K개 이웃의 다수결로 범주를 정해. 학습 단계는 데이터를 "저장만" 할 뿐이라서 게으른 학습기(lazy learner) 로 불려. ADsP 정형 데이터 마이닝 개념을 QuestDP 레슨에서 단계별로 정리…
- 나이브베이즈 분류기 (NBC) — "베이즈 정리 + 순진한 가정 하나." 각 특징이 서로 조건부 독립 이라고 가정하면, 복잡한 결합확률이 "각 특징 확률의 곱" 으로 확 단순해져. 스팸 필터·텍스트 분류의 고전. ADsP 정형 데이터 마이닝 개념을 QuestDP 레슨에서 단계별로 정리합니다.
QuestDP에서 보는 방식
긴 요약문을 한 번에 외우는 대신, 토픽을 작게 나누고 개념을 본 직후 바로 문제로 확인합니다. 공개 SEO 페이지는 시험범위와 개념 이해를 돕기 위한 본문 중심으로 두고, 실제 풀이 흐름은 게임 화면에서 이어가도록 분리합니다.
QuestDP의 개념 설명·문제·해설은 자체 제작 학습 콘텐츠입니다. 무단 복제·배포·재판매·상업적 이용이 확인되면 서비스 이용 제한 및 관련 법령에 따른 법적 조치를 진행할 수 있습니다.