Nhiều bài toán suy luận thống kê yêu cầu chúng ta tìm số bậc tự do . Số bậc tự do chọn một phân phối xác suất duy nhất trong số vô hạn. Bước này thường bị bỏ qua nhưng lại là chi tiết quan trọng cả trong việc tính toán khoảng tin cậy và cách thức hoạt động của các kiểm tra giả thuyết .
Không có công thức chung duy nhất cho số bậc tự do. Tuy nhiên, có những công thức cụ thể cho từng loại thủ tục trong thống kê suy luận. Nói cách khác, môi trường mà chúng ta đang làm việc sẽ quyết định số bậc tự do. Dưới đây là danh sách một phần của một số thủ tục suy luận phổ biến hơn, cùng với số bậc tự do được sử dụng trong mỗi tình huống.
phân phối chuẩn
Các thủ tục liên quan đến phân phối chuẩn chuẩn được liệt kê cho đầy đủ và để làm sáng tỏ một số quan niệm sai lầm. Các thủ tục này không yêu cầu chúng ta tìm số bậc tự do. Lý do cho điều này là chỉ có một phân phối chuẩn chuẩn. Các loại quy trình này bao gồm những quy trình liên quan đến trung bình tổng thể khi độ lệch chuẩn của tổng thể đã được biết và cả các quy trình liên quan đến tỷ lệ dân số.
Quy trình lấy mẫu một chữ T
Đôi khi thực hành thống kê yêu cầu chúng tôi sử dụng phân phối t của Học sinh. Đối với những thủ tục này, chẳng hạn như những thủ tục xử lý một tổng thể có nghĩa là có độ lệch chuẩn tổng thể chưa biết, số bậc tự do nhỏ hơn cỡ mẫu một bậc. Do đó, nếu cỡ mẫu là n , thì có n – 1 bậc tự do.
Thủ tục T với dữ liệu được ghép nối
Nhiều khi việc coi dữ liệu là các cặp là hợp lý . Việc khớp thường được thực hiện do kết nối giữa giá trị thứ nhất và thứ hai của cặp của chúng tôi. Nhiều lần chúng tôi sẽ khớp trước và sau khi đo. Mẫu dữ liệu được ghép nối của chúng tôi không độc lập; tuy nhiên, sự khác biệt giữa mỗi cặp là độc lập. Do đó, nếu mẫu có tổng cộng n cặp điểm dữ liệu (với tổng số 2 giá trị n ), thì có n – 1 bậc tự do.
Thủ tục T cho hai quần thể độc lập
Đối với các loại vấn đề này, chúng tôi vẫn đang sử dụng phân phối t . Nhân dịp này có một mẫu của mỗi thị trấn của chúng tôi. Mặc dù tốt hơn là hai mẫu này có cùng kích thước, nhưng điều này không cần thiết cho các quy trình thống kê của chúng tôi. Vì vậy, chúng tôi có thể có hai mẫu có kích thước n 1 và n 2 . Có hai cách để xác định số bậc tự do. Phương pháp chính xác nhất là sử dụng công thức Welch, một công thức tính toán phức tạp liên quan đến cỡ mẫu và độ lệch chuẩn của mẫu.Một cách tiếp cận khác, được gọi là xấp xỉ bảo thủ, có thể được sử dụng để ước lượng nhanh bậc tự do. Đây đơn giản là số nhỏ hơn trong hai số n 1 – 1 và n 2 – 1.
Chi-Square cho Độc lập
Một cách sử dụng kiểm định chi-square là để xem liệu hai biến phân loại, mỗi biến có một vài cấp độ, có thể hiện tính độc lập hay không. Thông tin về các biến này được ghi vào một bảng nhập kép có r hàng và c cột. Số bậc tự do là tích ( r – 1)( c – 1).
Mức độ phù hợp Chi bình phương
Mức độ phù hợp Chi bình phương bắt đầu với một biến phân loại duy nhất có tổng cộng n cấp độ. Chúng tôi kiểm tra giả thuyết rằng biến này phù hợp với một mô hình mặc định. Số bậc tự do nhỏ hơn một bậc so với số bậc. Nói cách khác, có n – 1 bậc tự do.
ANOVA một chiều
Phân tích phương sai một chiều ( ANOVA ) cho phép chúng tôi so sánh giữa nhiều nhóm, loại bỏ nhu cầu kiểm tra giả thuyết theo cặp nhiều lần. Vì bài kiểm tra yêu cầu chúng tôi đo lường cả sự thay đổi giữa một số nhóm và sự thay đổi trong mỗi nhóm, nên cuối cùng chúng tôi có hai bậc tự do. Thống kê F , được sử dụng cho ANOVA một chiều, là một phân số. Tử số và mẫu số có bậc tự do. Gọi c là số nhóm và n là tổng số giá trị dữ liệu. Số bậc tự do của tử số nhỏ hơn số nhóm một, hoặc c– 1. Số bậc tự do của mẫu số là tổng số giá trị dữ liệu, trừ đi số nhóm hoặc n – c .
Rõ ràng là chúng ta phải rất cẩn thận để biết chúng ta đang làm việc với thủ tục suy luận nào. Kiến thức này sẽ cho chúng ta biết số bậc tự do chính xác để sử dụng.