Phân tích cụm

(đổi hướng từ Phân nhóm dữ liệu)

Phân tích cụm (hay phân nhóm, gom cụm, tiếng Anh: Cluster analysis) là một tác vụ gom nhóm một tập các đối tượng theo cách các đối tượng cùng nhóm (gọi là cụm, cluster) sẽ có tính giống nhau (theo các đặc tính nào đó) hơn so với các đối tượng ngoài nhóm hoặc thuộc các nhóm khác.[1][2] Phân tích cụm là một tác vụ chính của khai phá dữ liệu, và là một kỹ thuật phổ biến trong thống kê phân tích dữ liệu, được dùng trong nhiều lĩnh vực, bao gồm nhận dạng mẫu, phân tích ảnh, truy hồi thông tin, tin sinh học, nén dữ liệu, đồ họa máy tínhhọc máy.

Kết quả một phân tích cụm chỉ ra các hình vuông theo màu sắc được chia thành 3 cụm (nhóm).

Phân tích cụm có nguồn gốc ở lĩnh vực nhân chủng học do Driver và Kroeber đề xuất năm 1932[3] và giới thiệu trong tâm lý học bởi Joseph Zubin năm 1938[4]Robert Tryon năm 1939[5] cũng như được dùng khá nổi tiếng bởi Raymond Cattell bắt đầu từ năm 1943[6] để phân loại lý thuyết tính trạng trong lĩnh vực tâm lý học nhân cách.

Xem thêmSửa đổi

Các dạng phân tích cụm chuyên biệtSửa đổi

Các kỹ thuật được dùng trong phân tích cụmSửa đổi

Tiền xử lý và tham chiếu dữ liệuSửa đổi

KhácSửa đổi

Tham khảoSửa đổi

  1. ^ What is the Cluster Analysis?, DeepAI.
  2. ^ cluster analysis, Merriam Webster.
  3. ^ Driver and Kroeber (1932). “Quantitative Expression of Cultural Relationships”. University of California Publications in American Archaeology and Ethnology. Quantitative Expression of Cultural Relationships: 211–256 – qua http://dpg.lib.berkeley.edu. 
  4. ^ Zubin, Joseph (1938). “A technique for measuring like-mindedness.”. The Journal of Abnormal and Social Psychology (bằng tiếng Anh) 33 (4): 508–516. ISSN 0096-851X. doi:10.1037/h0055441. 
  5. ^ Tryon, Robert C. (1939). Cluster Analysis: Correlation Profile and Orthometric (factor) Analysis for the Isolation of Unities in Mind and Personality. Edwards Brothers. 
  6. ^ Cattell, R. B. (1943). “The description of personality: Basic traits resolved into clusters”. Journal of Abnormal and Social Psychology 38 (4): 476–506. doi:10.1037/h0054116.