데이터마이닝 기법과 응용 예제

테러와의 전쟁의 맥락에서, 데이터 마이닝의 두 가지 특히 그럴듯한 방법은 “패턴 마이닝”과 “주제 기반 데이터 마이닝”입니다. 예를 들어 고객 인구 통계 프로필의 경우 연령 데이터가 누락되었습니다. 데이터가 불완전하며 채워야 합니다. 경우에 따라 데이터 이상값이 있을 수 있습니다. 예를 들어 나이는 값이 300입니다. 데이터가 일치하지 않을 수 있습니다. 예를 들어 고객의 이름은 테이블에서 다릅니다. 우리는 종종 이러한 데이터 마이닝 기술을 두 개 이상 결합하여 비즈니스 요구 사항을 충족하는 적절한 프로세스를 형성합니다. 집계: 요약 또는 집계 작업이 데이터에 적용됩니다. 즉, 주간 판매 데이터가 집계되어 월별 및 연간 합계를 계산합니다. 특성 생성: 이러한 특성은 생성되고 데이터 마이닝에 도움이 되는 지정된 특성 집합을 포함합니다. A 의사 결정 트리는 모델이 사용자가 이해하기 쉽기 때문에 가장 일반적으로 사용되는 데이터 마이닝 기술 중 하나입니다. 의사 결정 트리 기술에서 의사 결정 트리의 루트는 여러 답변이 있는 간단한 질문 또는 조건입니다.

그런 다음 각 답변은 데이터를 결정하는 데 도움이 되는 일련의 질문이나 조건으로 이어져 데이터를 기반으로 최종 결정을 내릴 수 있습니다. 예를 들어, 우리는 테니스를 재생할지 여부를 결정하기 위해 다음 의사 결정 트리를 사용 : 데이터 마이닝은 다음과 같은 유형의 데이터에 수행 할 수 있습니다 그래서 당신은 이러한 기술을 적용 할 수 있도록 최신의 최고의 기계 학습 기술이 필요합니까? 반드시. 실제로 비교적 겸손한 데이터베이스 시스템과 거의 모든 회사에서 사용할 수 있는 간단한 도구를 사용하여 일부 최첨단 데이터 마이닝을 수행할 수 있습니다. 그리고 작업에 적합한 도구가 없다면 언제든지 직접 만들 수 있습니다. 클러스터링 분석은 서로 같은 데이터를 식별하는 데이터 마이닝 기술입니다. 이 프로세스는 데이터 간의 차이점과 유사성을 이해하는 데 도움이 됩니다. 7. 예측.

예측은 미래에 볼 수 있는 데이터 유형을 투영하는 데 사용되기 때문에 가장 중요한 데이터 마이닝 기술 중 하나입니다. 많은 경우에, 단지 인식하고 역사적 동향을 이해하는 것은 미래에 무슨 일이 일어날지의 다소 정확한 예측을 차트로 충분하다. 예를 들어 소비자의 신용 기록 및 과거 구매를 검토하여 향후 신용 위험이 될지 여부를 예측할 수 있습니다.

Uncategorized