자료 수집 중
제 전공분야가 아니고, 저도 공부하는 입장이라 하기 내용은 선별해서 참고하시길 바랍니다.
나름 관련 링크를 여러 개 찾아봤는데, 개념 정립에 도움이 되었으면 합니다.
가. 데이터 마이닝과 통계의 차이점
통계 분석
- 모집단을 대표할 수 있는 표본 집단에서 정보를 수집하고 가설과 검정 등, 추론 과정을 거쳐
분석하는 기술
- 대표적 통계적 방법:
기술 통계(記述統計,descriptive statistics), 추론 통계(statistical inference)
기술 통계
기술통계(記述統計,descriptive statistics)는 측정이나 실험에서 수집한 자료의 정리, 표현, 요약, 해석 등을 통해 자료의 특성을 규명하는 통계적 방법
추론 통계
추론 통계(statistical inference)는 기술통계로 어떤 모집단에서 구한 표본정보를 가지고 그 모집단의 특성 및 가능성 등을 추론해 내는 통계적 방법
데이터 마이닝 개념
데이터마이닝(data mining), 또는 자료채굴(資料採掘)은, 대규모로 저장된 데이터안에서 체계적이고 자동적으로 통계적 규칙이나 짜임을 분석하여, 가치 있는 정보를 빼내는 과정이다.
다른 말로는, KDD(데이터베이스속의 앎발견, knowledge-discovery in databases)라고도 일컫는다.
데이터마이닝은, 통계학에서 패턴인식에 이르는 다양한 계량기법을 사용한다.
데이터 마이닝 기법은 통계학쪽에서 발전한 탐색적 자료분석, 가설 검정, 다변량 분석, 시계열 분석, 일반선형모형 등의 방법론과 데이터베이스 쪽에서 발전한 OLAP (온라인 분석 처리:On-Line Analytic Processing), 인공지능 진영에서 발전한 SOM, 신경망, 전문가 시스템 등의 기술적인 방법론이 쓰인다.
데이터 마이닝과 통계의 차이점 (개념 비교)
- 데이터 마이닝은 대용량 데이터에서 의미 있는 패턴을 파악하거나 예측하여 의사결정에 활용하기 위해
다양한 수리 알고리즘을 이용해 데이터로부터 의미 있는 정보를 찾아내는 방법
- 통계분석은 가설이나 가정에 따른 분석이나 검증을 통하여 특정 집단을 대상으로 조사, 실험하여 결과를 도출하는 방법
데이터 마이닝 6가지 기능
[두음] 분추예연군기
분류(Classification), 추정(Estimation), 예측(Prediction),
연관분석(Association Analysis), 군집(Clustering), 기술(Description)
데이터 마이닝 분류
- 처리하는 데이터 유형에 따라 정형 데이터 마이닝, 비정형 데이터 마이닝으로 분류 가능
정형 데이터 마이닝
→ RDBMS, DW 등 구조화된 정형 데이터를 기반으로 데이터들의 정련 과정을 통해 의미 있는 정보를 발굴하는 데이터 마이닝 기법
비정형 데이터 마이닝 유형
→ 텍스트, 이미지, 음성과 영상 , 로그 파일 등 비정형 데이터들의 정련 과정을 통해 의미 있는 정보를 발굴하는 데이터 마이닝 기법
대표적인 비정형 데이터 마이닝 기법
[두음] 텍오웹소
텍스트 마이닝, 오피니언 마이닝, 웹 마이닝, 소셜 마이닝
참고 자료
https://ko.wikipedia.org/wiki/데이터_마이닝
https://saintbinary.tistory.com/2
비정형 데이터 마이닝의 이해 : 네이버 블로그 (naver.com)
https://warm-uk.tistory.com/35
https://m.blog.naver.com/song_gina/221824807187
'정보관리기술사 > ★ 129회 기출문제 풀이 ★' 카테고리의 다른 글
(129 관리 3-5) EDA(Event Driven Architecture) (0) | 2023.03.15 |
---|---|
(129 관리 3-4) 데이터 품질관리 (0) | 2023.03.14 |
(129 관리 3-2) 작업분류체계(WBS, Work Breakdown Structure) (0) | 2023.03.09 |
(129 관리 3-1) ISP 및 ISMP 수립 공통가이드 6판 (0) | 2023.03.09 |
(129 관리 2-6) 리팩토링, 디자인 패턴 (0) | 2023.03.07 |
댓글