728x90 ADsP7 [데이터분석 전문가/준전문가] 과목 4 - 1장 - R 기초와 데이터 마트 4 제 4 절 시계열 예측 1. 정상성 • 시계열자료: 시간의 흐름에 따라서 관측된 데이터 (Time-series Data) - 시계열 분석을 하기 위해선, 정상성*(stationary)를 만족해야함 * 정상성: 시점에 상관없이 시계열의 특성이 일정함을 의미하며 아래의 특징을 만족해야 한다. 아래의 특징을 하나라도 만족하지 않는 경우에는 비정상 시계열이라 부르며, 대부분 시계열 자료는 비정상 시계열이라 부른다. (a) 평균이 일정 (b) 분산이 시점에 의존하지 않음 (c) 공분산은 단지 시차에만 의존하고 시점 자체에는 의존하지 않는다. • 주어진 시계열 자료가 정상성을 만족하는지 판단하는 과정 (1) 그림을 통해 자료의 이상점(outlier)과 개입(intervention)을 살핌 - 이상점: 해당 이상점을.. 2020. 11. 20. [데이터분석 전문가/준전문가] 과목 4 - 1장 - R 기초와 데이터 마트 1 제 1절 R 기초 1. 분석환경의 이해 가. R의 특징 • 그래픽 처리 • 데이터 처리 및 계산 능력 • 패키지 라. R 언어와 문법 1) R의 데이터 구조: 벡터, 행렬, 데이터 프레임 (a) 벡터 • 벡터 데이터 구조는 하나의 스칼라값, 혹은 하나 이상의 스칼라 원소들을 갖는 단순한 형태의 집합 • 벡터 데이터에 들어갈 수 있는 데이터 타입: 숫자, 문자, 논리 연산자 - 벡터 데이터에 숫자만 있는 경우: 숫자형 벡터 - 벡터 데이터에 문자만 있는 경우: 문자형 벡터 - 벡터 데이터에 논리 연산자만 있는 경우: 논리 연산자 벡터 - 문자형벡터와 숫자형 벡터가 결합이 될 경우, 합쳐진 벡터는 문자형 벡터가 된다. • R에서 다루는 구조 중에서 가장 단순한 형태이며, c*를 이용하여 선언가능 • 기본적으.. 2020. 11. 20. [데이터분석 전문가/준전문가] 과목 3 - 2 장 - 분석 마스터 플랜 개인적으로 한국데이터산업진흥원에서 출판한 데이터 분석 전문가 가이드를 읽으면서 정리한 내용입니다 제 1 절 마스터 플랜 수립 1. 분석 마스터 플랜 수립 프레임워크 - 분석 과제를 대상으로 전략적 중요도, 비지니스 성과 및 ROI, 분석 과제의 실행 용이성 등 다양한 기준을 고려해 적용할 우선 순위를 설정 - 분석을 업무에 내제화할 것인지, 별도의 분석화면으로 적용할 것인지, 분석 데이터를 내부 데이터로 한정할 것인지, 외부데이터까지 포함할 것인지, 분석 기술은 어느 기술 요소까지 적용할 것인지 등 분석 적용 범위 및 방식에 대해서도 종합적으로 고려하여 데이터 분석을 실행하기 위한 로드맵을 수립 - 기업 및 공공기관에서는 시스템의 중장기 로드맵을 정의하기 위해 정보전략계획인 ISP를 수행 : 정보기술 또.. 2020. 11. 18. [데이터분석 전문가/준전문가] 과목 3 - 1 장 - 데이터 분석 기획의 이해 개인적으로 한국데이터산업진흥원에서 출판한 데이터 분석 전문가 가이드를 읽으면서 정리한 내용입니다 제 1절 분석 기획 방향성 도출 분석 기획이란? • 실제 분석을 수행하기 앞서 분석을 수행할 과제의 정의 및 의도했던 결과를 도출할 수 있도록 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업 • 어떠한 목표(what)를 달성하기 위하여 (why) 어떠한 데이터를 가지고 어떤 방식으로 (How) 수행할 지에 대한 일련의 계획을 수립하는 작업 1. 분석 기획의 특징 • 빅데이터 분석의 주의점: 데이터를 다루는 특성 때문에, IT 기술 및 분석 기법에 치우치는 경향 • 분석을 할 때 필요한 3가지 영역에 대한 고른 시각과 역량 (1) 수학/통계학적 지식, (Math $ Statistics) (2) 해킹.. 2020. 11. 18. [데이터분석 전문가/준전문가] 과목 1 - 3 장 - 가치 창조를 위한 데이터 사이언스와 전략 인사이트 개인적으로 한국데이터산업진흥원에서 출판한 데이터 분석 전문가 가이드를 읽으면서 정리한 내용입니다. 제 1 절 빅데이터 분석과 전략 인사이트 1. 빅데이터 열풍과 회의론 • 빅데이터 열풍이 일종의 거품현상으로 우려되는 빅데이터 회의론 시각 존재 • 빅데이터 성공사례로 설명하고 있는 많은 사례는 기존의 분석 프로그램을 포장해놓은 것이 대다수 • 빅데이터 회의론이 발생하는 이유? → 데이터에서 가치, 즉 통찰을 끌어내 성과를 창출하는 것이 관건이지만, 이를 달성하기 어려움 2. 왜 싸이월드는 페이스북이 되지 못했나? ※ 문제점: 싸이월드 내의 데이터 분석 기반 경영 문화의 부재 •데이터 분석에 기초해 전략적 통찰력을 얻고 효과적인 의사결정을 내리고 구체적인 성과를 만들어내는 체계의 부재 •페이스북, 링크드인의.. 2020. 11. 17. [데이터분석 전문가/준전문가] 과목 1 - 2 장 - 데이터의 가치와 미래 개인적으로 한국데이터산업진흥원에서 출판한 데이터 분석 전문가 가이드를 읽으면서 정리한 내용입니다. 제 1 절 빅데이터의 이해 1. 정의 1) Big + Data (큰 데이터) 2) 매우 큰 데이터 양과 증가된 복잡성으로 인해 기존의 데이터 처리 애플리케이션이나 관리 툴로는 다루기 어려운 데이터 세트의 집합 3) 정의 정의한 곳 정의 McKinsey, 2011 • 빅데이터는 일반적인 데이터베이스 소프트웨어로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터 • 일반적인 빅데이터의 정의 • 활용하는 데이터의 규모에 중점을 둔 정의 IDC, 2011 • 빅데이터는 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 데이터의 초고속 수집/발굴/분석을 지원하도록 고안된 차세대 기술 및 아.. 2020. 11. 17. [데이터분석 전문가/준전문가] 과목 1 - 1장 - 데이터의 이해 개인적으로 한국데이터산업진흥원에서 출판한 데이터 분석 전문가 가이드를 읽으면서 정리한 내용입니다. 제 1 절 데이터와 정보 1. 데이터의 정의 1) 1946년 영국 문헌에서 데이터라는 용어가 처음 등장한 것으로 알려짐 2) 데이터의 어원: 라틴어인 dare(주다)의 과거분사형으로서 처음 사용된 것으로 알려짐 3) 데이터의 정의 • 옥스포드 대사전: 데이터는 추론과 추정의 근거를 이루는 사실 - 데이터를 단순한 객체로써 가치뿐만 아니라 다른 객체와의 상호관계 속에서 가치를 갖는 것으로 설명 - 존재적 특성(객관적 사실) + 당위적 특성(추론/예측/전망/추정을 위한 근거) 4) 데이터의 분류: 정성 데이터 (Qualitative data) + 정량 데이터 (Quantitative data) 정량데이터 정성데.. 2020. 11. 16. 이전 1 다음 728x90