Phân tích cụm (hay phân nhóm, gom cụm, tiếng Anh: cluster analysis) là một tác vụ gom nhóm một tập các đối tượng theo cách các đối tượng cùng nhóm (gọi là cụm, cluster) sẽ có tính giống nhau (theo các đặc tính nào đó) hơn so với các đối tượng ngoài nhóm hoặc thuộc các nhóm khác.[1][2] Phân tích cụm là một tác vụ chính của khai phá dữ liệu, và là một kỹ thuật phổ biến trong thống kê phân tích dữ liệu, được dùng trong nhiều lĩnh vực, bao gồm nhận dạng mẫu, phân tích ảnh, truy hồi thông tin, tin sinh học, nén dữ liệu, đồ họa máy tínhhọc máy.

Kết quả một phân tích cụm chỉ ra các hình vuông theo màu sắc được chia thành 3 cụm (nhóm).

Phân tích cụm có nguồn gốc ở lĩnh vực nhân chủng học do Driver và Kroeber đề xuất năm 1932[3] và giới thiệu trong tâm lý học bởi Joseph Zubin năm 1938[4]Robert Tryon năm 1939[5] cũng như được dùng khá nổi tiếng bởi Raymond Cattell bắt đầu từ năm 1943[6] để phân loại lý thuyết tính trạng trong lĩnh vực tâm lý học nhân cách.

Xem thêm sửa

Các dạng phân tích cụm chuyên biệt sửa

Các kỹ thuật được dùng trong phân tích cụm sửa

Tiền xử lý và tham chiếu dữ liệu sửa

Khác sửa

Tham khảo sửa

  1. ^ What is the Cluster Analysis?, DeepAI.
  2. ^ cluster analysis, Merriam Webster.
  3. ^ Driver and Kroeber (1932). “Quantitative Expression of Cultural Relationships”. University of California Publications in American Archaeology and Ethnology. Quantitative Expression of Cultural Relationships: 211–256. Bản gốc lưu trữ ngày 6 tháng 12 năm 2020. Truy cập ngày 19 tháng 11 năm 2020 – qua http://dpg.lib.berkeley.edu.
  4. ^ Zubin, Joseph (1938). “A technique for measuring like-mindedness”. The Journal of Abnormal and Social Psychology (bằng tiếng Anh). 33 (4): 508–516. doi:10.1037/h0055441. ISSN 0096-851X.
  5. ^ Tryon, Robert C. (1939). Cluster Analysis: Correlation Profile and Orthometric (factor) Analysis for the Isolation of Unities in Mind and Personality. Edwards Brothers.
  6. ^ Cattell, R. B. (1943). “The description of personality: Basic traits resolved into clusters”. Journal of Abnormal and Social Psychology. 38 (4): 476–506. doi:10.1037/h0054116.