* 데이터 처리 영역 : 기초 데이터를 정의, 수집 및 저장, 분석용 물리적 환경 제공
① 데이터 소스 : 내부,외부 데이터, 미디어 정보
② 데이터 수집 : 입력, 로그수집기, 크롤링, 센싱
③ 데이터 저장 : 정형, 비정형데이터, 저장 장치
④ 데이터 처리: 배치 처리, 실시간 처리, 분산 처리
* 데이터 분석 영역: 데이터를 가공하여 분석을 수행하고 표현
① 도메인 이슈 도출 : 현황 파악 및 개선과제 정의, 빅데이터 요건 정의서 작성
② 분석 목표 수립 : 분석목표 수립, 분석목표 정의서 작성
③ 프로젝트 계획 수립 : 분석몰표정의서, 프로젝트 소요비용 배분계획을 바탕으로 작업 분할 구조도(WBS) 작성
④ 보유 데이터 자산 확인 : 현재 데이터의 법률적 이슈나 제약상항 검토
* 데이터 표현 : 빅데이터 분석 시각화
* 데이터 확보를 위한 사전 검토사항
① 필요데이터의 정의
② 보유 데이터의 현황 파악
③ 분석 데이터의 유형
④ 편향되지 않고 충분한 data 규모
⑤ 내부 데이터 사용
⑥ 외부데이터 수집
* 분석 변수 생성 프로세스
① 객관적사실 기반의 문제접근 ② 데이터 상관관계 분석 ③프로토 타입으로 변수 접근
* 데이터 전처리 기법
데이터의 ① 정제 ② 통합 ③ 축소 ④ 변환
* 빅데이터 품질 관리 및 검증
①정확성 ②완전성 ③적시성 ④일관성
* 일반적인 분석 절차 : 문제인식~데이터 확보 ~ 도출 및 제시
문제인식 → 연구조사 → 모형화 → 데이터 수집 → 데이터분석 → 분석결과제시
* 데이터 분석 절차 : 수집 → 저장 → 처리 → 분석 → 시각화 → 이용 → 폐기
* 분석 작업 계획 수립
프로젝트의 ①소요 비용 배분 ② 작업 분할구조 수립 ③ 업무 분장 계획 및 배분
* 분석 작업 계획 수립을 위한 작업분할구조(Work Breakdown Structure)작성
데이터의 ① 분석과제 정의 ② 준비 및 탐색 ③ 모델링 및 검증 ④ 산출물 정리
* 분석 목표 정의서 구성요소 : ①원천데이터 조사 ②분석 방안 및 적용 가능성 판단 ③ 성과평가 기준
* 분석 프로젝트 : 가치 증명하기 위한 수단,
- 특징 : 프로젝트 특성이해해서 관리방안 수립 필요, 개선과변경이 있을수 있음, 협업
* 분석 프로젝트의 속성
① 데이터 크기 ② 데이터 복잡도 ③ 속도 ④ 분석 모형의 복잡도 ⑤ 정확도와 정밀도(page100참고)
* 분석 프로젝트의 영역별 관리항목
①범위관리 ②일정관리 ③ 원가관리 ④품질관리 ⑤통합관리
⑥조달관리 ⑦인적자원 관리 ⑧위험관리 ⑨의사소통 관리 ⑩이해관계자 관리
'자격증 > 빅데이터 분석기사' 카테고리의 다른 글
[필기] (이기적) 분석 변수 처리 (0) | 2021.01.24 |
---|---|
[필기] (이기적) 데이터 수집 및 전환 (0) | 2021.01.24 |
[필기] (이기적) 빅데이터 분석 방안 (1) | 2021.01.15 |
[필기] (이기적) 빅데이터 분석 방안 수립 (0) | 2021.01.15 |
[필기] (이기적)빅데이터 제도 (0) | 2021.01.15 |