Phân phối chuẩn nhiều chiều

Phân phối chuẩn nhiều chiều
Hàm mật độ xác suất
Hàm phân phối tích lũy
Tham số vị trí (véc tơ giá trị thực)
ma trận hiệp phương sai (ma trận xác định dương giá trị thực kích thước )
Giá
Hàm mật độ xác suất
Hàm phân phối tích lũy
Giá trị kỳ vọng
Trung vị
Yếu vị
Phương sai (ma trận hiệp phương sai)
Độ xiên 0
Độ nhọn 0
Entropy
Hàm sinh mô men
Hàm đặc trưng


Trong lý thuyết xác suấtthống kê, phân phối chuẩn nhiều chiều, đôi khi được gọi là phân phối Gauss nhiều chiều, là tổng quát hóa của phân phối chuẩn một chiều (còn gọi là phân phối Gauss) cho không gian nhiều chiều hơn. Phân phối này còn có quan hệ gần gũi với phân phối chuẩn ma trận.

Trường hợp tổng quát sửa

Một véc tơ ngẫu nhiên   tuân theo một phân phối chuẩn nhiều chiều nếu nó thỏa mãn các điều kiện tương đương nhau sau đây:

  • mọi tổ hợp tuyến tính   đều tuân theo phân phối chuẩn
  • tồn tại một véc tơ ngẫu nhiên  , trong đó các thành phần của nó là các biến ngẫu nhiên độc lập tuân theo phân phối chuẩn chuẩn hóa, một véc tơ   và một ma trận   kích thước   sao cho  .
  • tồn tại một véc tơ   và một ma trận   đối xứng, nửa xác định dương sao cho hàm đặc trưng của X
 

Nếu  ma trận không suy biến, thì phân phối này có thể được mô tả bởi hàm mật độ xác suất sau:

 

trong đó  định thức của  . Lưu ý rằng phương trình trên suy biến về phương trình của phân phối chuẩn một chiều nếu   là một giá trị vô hướng (nghĩa là một ma trận 1x1).

Véc tơ μ trong các điều kiện trên là giá trị kỳ vọng của X và ma trận   là ma trận hiệp phương sai của thành phần Xi.

Cần lưu ý rằng ma trận hiệp phương sai có thể suy biến (và khi đó không được mô tả bởi các công thức sử dụng   ở trên).

Trường hợp này thường xảy ra trong thống kê; ví dụ, trong phân phối của véc tơ trong các bài toán hồi quy tuyến tính thông thường. Cũng lưu ý rằng các Xi nói chung là không độc lập; chúng có thể được xem là kết quả của việc áp dụng biến đổi tuyến tính A cho tập hợp Z gồm các biến ngẫu nhiên Gauss độc lập.

Việc phân phối của một véc tơ ngẫu nhiên X là một phân phối chuẩn nhiều chiều được ký hiệu bởi công thức sau:

 

hoặc viết tường minh rằng X biến trong không gian N-chiều,

 

Hàm phân phối tích lũy sửa

Hàm phân phối tích lũy (cdf)   được định nghĩa là xác suất mà mỗi giá trị trong một véc tơ ngẫu nhiên   đều nhỏ hơn hay bằng giá trị tương ứng trong véc tơ  . Tuy không có dạng đóng cho  , có một số thuật toán ước tính giá trị của nó. Ví dụ, xem MVNDST tại [1] (dùng FORTRAN) hay [2] Lưu trữ 2008-05-13 tại Wayback Machine (dùng MATLAB).

Một phản ví dụ sửa

Điều kiện rằng hai biến ngẫu nhiên XY đều có phân phối chuẩn không kéo theo việc cặp (XY) có một phân phối chuẩn có điều kiện phụ thuộc (joint normal distribution). Một ví dụ đơn giản là: Y = X nếu |X| > 1 và Y = −X nếu |X| < 1. Điều này cũng đúng cho số biến ngẫu nhiên nhiều hơn 2.

Độc lập và phân phối chuẩn sửa

Nếu XY có phân phối chuẩn và độc lập thống kê, thì chúng có một phân phối chuẩn có điều kiện phụ thuộc, nghĩa là cặp (XY) phải có phân phối chuẩn 2 chiều. Tuy nhiên, một cặp biến ngẫu nhiên có phân phối chuẩn có điều kiện phụ thuộc không nhất thiết độc lập lẫn nhau.

Trường hợp 2 chiều sửa

Trong trường hợp 2 chiều không suy biến, hàm mật độ xác suất (với kì vọng (0,0)) là

 

trong đó  tương quan giữa   . Khi đó,

 .

Biến đổi afin sửa

Nếu   là một biến đổi afin của   trong đó   là một véc tơ   gồm các hằng số và   là ma trận  , thì   có phân phối chuẩn nhiều chiều với giá trị kỳ vọng   và phương sai   nghĩa là,  . Đặc biệt, tập con bất kỳ của   đều có một phân phối biên duyên là phân phối chuẩn nhiều chiều. Để minh họa, ta xét ví dụ sau: để tách tập con  , sử dụng

 

ma trận này trích lấy các phần tử mong muốn.

Một hệ quả khác là phân phối của  , trong đó   là một véc tơ có cùng số chiều với   và dấu chấm ký hiệu phép nhân véc tơ, là phân phối chuẩn một chiều với  . Kết quả đó thu được bằng cách sử dụng

 

và chỉ xét thành phần đầu tiên của tích (hàng đầu của   là véc tơ  ). Để ý tính chất xác định dương của   hàm ý rằng phương sai của tích vô hướng phải là số dương.

Tham khảo sửa

Đọc thêm sửa

  • Rencher, A.C. (1995). Methods of Multivariate Analysis. New York: Wiley.
  • Tong, Y. L. (1990). The multivariate normal distribution. Springer Series in Statistics. New York: Springer-Verlag. doi:10.1007/978-1-4613-9655-0. ISBN 978-1-4613-9657-4.