KUBIG 2022-1 활동 블로그

고정 헤더 영역

글 제목

메뉴 레이어

KUBIG 2022-1 활동 블로그

메뉴 리스트

  • 홈
  • 태그
  • 분류 전체보기 (109)
    • 소개 (4)
    • 방학 세션 (13)
      • 방학 스터디 (5)
      • KUBIG 미니 프로젝트 (8)
    • 심화 스터디 (90)
      • Practical Statistics for Da.. (44)
      • 시각화 (11)
      • 강화학습 (11)
      • 금융데이터 (5)
      • 분류 예측 (16)
      • 이미지 (3)
    • 장기 프로젝트 (0)
      • Instagram Youtube 썸네일 기반 게시.. (0)
      • 고대 신문 프로젝트 (0)
      • 도로 위 사물 판단(Object Detection.. (0)
      • 분류 예측 1팀 (0)
      • 분류 예측 2팀 (0)
      • 분류 예측 3팀 (0)
      • 식당 및 카페 추천 시스템 (0)
      • 음악 추천 시스템 (0)
      • 텍스트 (0)
    • 알쓸쿠잡 (1)

검색 레이어

KUBIG 2022-1 활동 블로그

검색 영역

컨텐츠 검색

군집화

  • [Practical Statistics for data science] B팀: K-Means & Hierarchical Clustering

    2022.07.28 by 혁수

[Practical Statistics for data science] B팀: K-Means & Hierarchical Clustering

K-Means Clustering Clustering(군집화)이란 데이터를 서로 다른 그룹으로 분류하는 기술을 말한다. 각 그룹에는 서로 비슷한 데이터들이 속하며, 클러스터링의 목적은 데이터로부터 유의미한 그룹들을 구하는 것이다. K-Means는 최초로 개발된 클러스터링 기법으로서 알고리즘이 상당히 간단하고 데이터가 커져도 손쉽게 사용할 수 있다는 장점이 있다. K-Means는 데이터를 K개의 클러스터로 나눈 뒤, 할당된 클러스터의 평균(클러스터 안에 속한 레코드들의 평균 벡터)과 포함된 데이터들의 거리 제곱합이 최소가 되도록 한다. 데이터들의 거리 제곱합을 클러스터 내 제곱합 혹은 클러스터 내 SS라고도 한다. 또한, 클러스터들끼리는 최대한 멀리 떨어지도록 한다. 예시를 하나 들어보면서 K-Means에..

심화 스터디/Practical Statistics for Data Scientists 2022. 7. 28. 14:04

추가 정보

인기글

페이징

이전
1
다음
TISTORY
KUBIG 2022-1 활동 블로그 © Magazine Lab
페이스북 트위터 인스타그램 유투브 메일

티스토리툴바