Định lý giới hạn trung tâm

Trong toán họcxác suất thống kê, định lý giới hạn trung tâm (Tiếng Anh gọi là Central Limit Theorem) là một kết quả về sự hội tụ yếu của một dãy các biến ngẫu nhiên. Với định lý này, ta có kết quả là tổng (hoặc trung bình mẫu) của các biến ngẫu nhiên độc lập và có phân phối đồng nhất (bất kể phân phối nào) sẽ hội tụ về phân phối chuẩn khi kích cỡ mẫu trở nên rất lớn.

Tổng các kết quả đầu ra khi gieo một con xúc sắc sẽ có xu hướng tuân theo phân phối chuẩn khi số lần gieo xúc sắc tăng lên

Trong trường hợp đơn giản nhất, được dùng dưới đây trong phần chứng minh của định lý, các biến ngẫu nhiên là độc lập, có cùng kỳ vọngphương sai. Một cách tổng quát, tổng của các biến ngẫu nhiên sẽ tăng vô định khi số biến ngẫu nhiên tăng. Do đó để có một kết quả hữu hạn, ta hạn chế sự tăng của tổng bằng cách lấy tổng trừ đi giá trị trung bình và rút gọn bằng cách chia cho căn bậc hai của phương sai (chuẩn hoá). Với một số các điều kiện nữa thì phân phối xác suất của biến ngẫu nhiên giản lược sẽ hội tụ về một phân phối chuẩn.

Sự hội tụ được đảm bảo trong trường hợp đơn giản này. Tuy nhiên cũng tồn tại sự hội tụ trong trường hợp các biến ngẫu nhiên không cùng phân phối, nhưng vẫn phải đảm bảo điều kiện không có biến ngẫu nhiên nào có phân phối trội hơn hoặc gây ảnh hưởng đến phân phối của các biến ngẫu nhiên khác. Điều này được đảm bảo bởi điều kiện Lindebergđiều kiện Lyapunov. Một số phiên bản khác của định lý cũng cho phép sự phụ thuộc yếu giữa các biến ngẫu nhiên.

Ngoài ra còn có một số nghiên cứu khác của GnedenkoKolmogorov cho rằng tổng của các biến ngẫu nhiên với phân phối có đuôi giảm theo phân số 1/|x|α+1, 0 < α < 2 (do đó có phương sai vô hạn), sẽ hội tụ về phân phối Levy đối xứng và ổn định khi số biến nhẫu nhiên tăng.

Phần trình bày ở đây chỉ đề cập đến định lý giới hạn trung tâm cho trường hợp các phân phối có phương sai hữu hạn.

Định lý giới hạn trung tâm

sửa

Cho X1, X2... là tập hợp các biến ngẫu nhiên được định nghĩa trên cùng một không gian xác suất, có cùng phân phối Dđộc lập lẫn nhau. Giả sử giá trị kỳ vọng  độ lệch chuẩn   của phân phối D là tồn tại và hữu hạn ( ).

Xét tổng Sn = X1 + ... + Xn. Ta có Sn có kỳ vọng là nμ và độ lệch chuẩn σ n½. Khi đó, phân phối của Sn hội tụ về phân phối chuẩn N(nμ,σ2n) khi n tiến về vô cùng.

Để làm rõ hơn sự hội tụ này, ta đặt:

 

để có được kỳ vọng và độ lệch chuẩn của   lần lượt là 0 và 1.

Nếu phân phối của Zn hội tụ về phân phối chuẩn N(0,1) khi n tiến về vô cùng (tức là hội tụ theo phân phối), thì cũng có nghĩa là: nếu Φ là hàm phân phối tích lũy của N(0,1), thì với mọi số thực z:

 

Hay một cách tương đương:

 

trong đó

 

Chứng minh định lý giới hạn trung tâm

sửa

Mặc dù đây là định lý quan trọng trong thống kê và xác suất ứng dụng nhưng phần chứng minh của nó khá đơn giản bằng cách sử dụng các hàm đặc trưng, nó gần giống với phần chứng minh của luật số lớn.

Ta có với mọi i,   có kỳ vọng 0 và độ lệch chuẩn 1, với hàm đặc trưng được khai triển giới hạn dưới dạng:

 

Ta có:

 

Từ các tính chất cơ bản của hàm đặc trưng, ta suy ra hàm đặc trưng của Zn

  khi  

Giới hạn này là hàm đặc trưng của phân phối chuẩn N(0,1). Từ đó định lý giới hạn trung tâm được chứng minh nhờ vào định lý về tính liên tục của Levy, trong đó có nói rằng, sự hội tụ của các hàm đặc trưng cho phép suy ra sự hội tụ theo phân phối.

Nếu mômen bậc 3 E[(X - μ)3] tồn tại và hữu hạn, thì ta có hội tụ đều (uniform), và vận tốc hội tụ có bậc ít nhất là 1/n½ (xem định lý Berry-Esseen).

Trong các ứng dụng thực tế, định lý này cho phép thay thế tổng vô cùng lớn nhưng hữu hạn các biến ngẫu nhiên bằng một biến ngẫu nhiên có phân phối chuẩn, như vầy sẽ dễ dàng thao tác, tính toán hơn.

Các suy rộng từ định lý

sửa

Hàm phân phối xác suất

sửa

Hàm phân phối xác suất của tổng nhiều biến ngẫu nhiên độc lập được xác định bởi hàm xoắn (convolution) từ các hàm phân phối xác suất của các biến ngẫu nhiên đó. Từ định lý giới hạn trung tâm, ta có thể suy ra, hàm xoắn này hội tụ về một hàm phân phối xác suất chuẩn khi số biến ngẫu nhiên tăng vô hạn.

Tích các biến ngẫu nhiên

sửa

Định lý giới hạn trung tâm phát biểu cho tổng các biến ngẫu nhiên độc lập, câu hỏi là chuyện gì xảy ra với tích của các biến ngẫu nhiên độc lập?

Ta biết rằng, lôgarit (log) của tích các số hạng thì bằng tổng lôgarit các số hạng. Định lý giới hạn trung tâm cho biết tổng lôgarit, và do đó lôgarit của tích, hội tụ về biến ngẫu nhiên phân phối chuẩn. Từ đó suy ra tích các biến ngẫu nhiên hội tụ về một biến ngẫu nhiên có phân phối chuẩn-lôgarit (log-normal).

Các định lý giới hạn trung tâm mở rộng

sửa

Điều kiện Lyapunov

sửa

Xét Xn là một dãy các biến ngẫu nhiên được định nghĩa trên cùng một không gian xác suất, không nhất thiết có cùng phân phối. Giả sử Xi có kỳ vọng hữu hạn μi và độ lệch chuẩn hữu hạn σi. Ta định nghĩa:

 

Giả sử các mômen bậc 3

 

là hữu hạn với mọi i

 

Các điều kiện trên được gọi la điều kiện Lyapunov.

Ta xét tổng mới Sn=X1+...+Xn. Kỳ vọng của Snmn = ∑i=1..nμi và độ lệch chuẩn là sn. Nếu ta chuẩn hóa Sn bằng cách đặt

 

thì phân phối xác suất của Zn hội tụ về phân phối chuẩn N(0,1).

Điều kiện Lindeberg

sửa

Với các giả thiết ban đầu như trong điều kiện Lyapunov.

Với mọi ε > 0

 

trong đó E(U: V > c) là kỳ vọng có điều kiện: kỳ vọng của U với điều kiện V > c. Khi đó phân phối xác suất của Zn hội tụ về phân phối chuẩn N(0,1).

Trường hợp các biến ngẫu nhiên không độc lập

sửa

Có một số định lý nghiên cứu trường hợp tổng của các biến ngẫu nhiên không độc lập, ví dụ định lý giới han trung tâm m-phụ thuộc (m-dependent central limit theorem), định lý giới hạn trung tâm martingal (martingale central limit theorem) và định lý giới hạn trung tâm cho quá trình hỗn hợp (central limit theorem for mixing processes).[1]

sửa

Tham khảo

sửa
  1. ^ Van Huu, Nguyen; Hoang, Vuong Quan; Ngoc, Tran Minh (2005). “Central Limit Theorem for Functional of Jump Markov Processes”. Vietnam Journal of Mathematics. 33 (4): 443–461.