본문 바로가기
728x90

ADP5

[데이터분석 전문가/준전문가] 과목 4 - 1장 - R 기초와 데이터 마트 4 제 4 절 시계열 예측 1. 정상성 • 시계열자료: 시간의 흐름에 따라서 관측된 데이터 (Time-series Data) - 시계열 분석을 하기 위해선, 정상성*(stationary)를 만족해야함 * 정상성: 시점에 상관없이 시계열의 특성이 일정함을 의미하며 아래의 특징을 만족해야 한다. 아래의 특징을 하나라도 만족하지 않는 경우에는 비정상 시계열이라 부르며, 대부분 시계열 자료는 비정상 시계열이라 부른다. (a) 평균이 일정 (b) 분산이 시점에 의존하지 않음 (c) 공분산은 단지 시차에만 의존하고 시점 자체에는 의존하지 않는다. • 주어진 시계열 자료가 정상성을 만족하는지 판단하는 과정 (1) 그림을 통해 자료의 이상점(outlier)과 개입(intervention)을 살핌 - 이상점: 해당 이상점을.. 2020. 11. 20.
[데이터분석 전문가/준전문가] 과목 4 - 1장 - R 기초와 데이터 마트 1 제 1절 R 기초 1. 분석환경의 이해 가. R의 특징 • 그래픽 처리 • 데이터 처리 및 계산 능력 • 패키지 라. R 언어와 문법 1) R의 데이터 구조: 벡터, 행렬, 데이터 프레임 (a) 벡터 • 벡터 데이터 구조는 하나의 스칼라값, 혹은 하나 이상의 스칼라 원소들을 갖는 단순한 형태의 집합 • 벡터 데이터에 들어갈 수 있는 데이터 타입: 숫자, 문자, 논리 연산자 - 벡터 데이터에 숫자만 있는 경우: 숫자형 벡터 - 벡터 데이터에 문자만 있는 경우: 문자형 벡터 - 벡터 데이터에 논리 연산자만 있는 경우: 논리 연산자 벡터 - 문자형벡터와 숫자형 벡터가 결합이 될 경우, 합쳐진 벡터는 문자형 벡터가 된다. • R에서 다루는 구조 중에서 가장 단순한 형태이며, c*를 이용하여 선언가능 • 기본적으.. 2020. 11. 20.
[데이터분석 전문가/준전문가] 과목 3 - 2 장 - 분석 마스터 플랜 개인적으로 한국데이터산업진흥원에서 출판한 데이터 분석 전문가 가이드를 읽으면서 정리한 내용입니다 제 1 절 마스터 플랜 수립 1. 분석 마스터 플랜 수립 프레임워크 - 분석 과제를 대상으로 전략적 중요도, 비지니스 성과 및 ROI, 분석 과제의 실행 용이성 등 다양한 기준을 고려해 적용할 우선 순위를 설정 - 분석을 업무에 내제화할 것인지, 별도의 분석화면으로 적용할 것인지, 분석 데이터를 내부 데이터로 한정할 것인지, 외부데이터까지 포함할 것인지, 분석 기술은 어느 기술 요소까지 적용할 것인지 등 분석 적용 범위 및 방식에 대해서도 종합적으로 고려하여 데이터 분석을 실행하기 위한 로드맵을 수립 - 기업 및 공공기관에서는 시스템의 중장기 로드맵을 정의하기 위해 정보전략계획인 ISP를 수행 : 정보기술 또.. 2020. 11. 18.
[데이터분석 전문가/준전문가] 과목 3 - 1 장 - 데이터 분석 기획의 이해 개인적으로 한국데이터산업진흥원에서 출판한 데이터 분석 전문가 가이드를 읽으면서 정리한 내용입니다 제 1절 분석 기획 방향성 도출 분석 기획이란? • 실제 분석을 수행하기 앞서 분석을 수행할 과제의 정의 및 의도했던 결과를 도출할 수 있도록 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업 • 어떠한 목표(what)를 달성하기 위하여 (why) 어떠한 데이터를 가지고 어떤 방식으로 (How) 수행할 지에 대한 일련의 계획을 수립하는 작업 1. 분석 기획의 특징 • 빅데이터 분석의 주의점: 데이터를 다루는 특성 때문에, IT 기술 및 분석 기법에 치우치는 경향 • 분석을 할 때 필요한 3가지 영역에 대한 고른 시각과 역량 (1) 수학/통계학적 지식, (Math $ Statistics) (2) 해킹.. 2020. 11. 18.
[데이터분석 전문가/준전문가] 과목 1 - 1장 - 데이터의 이해 개인적으로 한국데이터산업진흥원에서 출판한 데이터 분석 전문가 가이드를 읽으면서 정리한 내용입니다. 제 1 절 데이터와 정보 1. 데이터의 정의 1) 1946년 영국 문헌에서 데이터라는 용어가 처음 등장한 것으로 알려짐 2) 데이터의 어원: 라틴어인 dare(주다)의 과거분사형으로서 처음 사용된 것으로 알려짐 3) 데이터의 정의 • 옥스포드 대사전: 데이터는 추론과 추정의 근거를 이루는 사실 - 데이터를 단순한 객체로써 가치뿐만 아니라 다른 객체와의 상호관계 속에서 가치를 갖는 것으로 설명 - 존재적 특성(객관적 사실) + 당위적 특성(추론/예측/전망/추정을 위한 근거) 4) 데이터의 분류: 정성 데이터 (Qualitative data) + 정량 데이터 (Quantitative data) 정량데이터 정성데.. 2020. 11. 16.
728x90