Cách tính biên độ sai số

0
23


Các cuộc thăm dò ý kiến ​​chính trịcác ứng dụng thống kê khác thường thể hiện kết quả của chúng với một sai số nhỏ. Không có gì lạ khi thấy một cuộc thăm dò ý kiến ​​chỉ ra rằng có sự ủng hộ đối với một vấn đề hoặc ứng cử viên trong số một tỷ lệ phần trăm người trả lời nhất định, cộng và trừ một tỷ lệ phần trăm nhất định. Thuật ngữ cộng và trừ này là biên độ sai số. Nhưng biên độ sai số được tính như thế nào? Đối với một mẫu ngẫu nhiên đơn giản từ một tổng thể đủ lớn, biên độ hoặc sai số thực sự chỉ là sự trình bày lại kích thước mẫu và mức độ tin cậy được sử dụng.

Công thức tính biên sai số

Trong phần tiếp theo, chúng ta sẽ sử dụng công thức tính sai số. Chúng tôi sẽ lập kế hoạch cho trường hợp xấu nhất, khi chúng tôi không biết mức độ ủng hộ thực sự cho các chủ đề thăm dò ý kiến ​​của chúng tôi là bao nhiêu. Nếu chúng tôi có bất kỳ ý tưởng nào về con số này, có thể thông qua dữ liệu khảo sát trước đó, chúng tôi sẽ có sai số nhỏ hơn.

Công thức chúng ta sẽ sử dụng là: E = z α/2 /(2√ n)

mức độ tự tin

Phần thông tin đầu tiên chúng ta cần để tính toán sai số là xác định mức độ tin cậy mà chúng ta muốn. Con số này có thể là bất kỳ tỷ lệ phần trăm nào thấp hơn 100%, nhưng mức độ tin cậy phổ biến nhất là 90%, 95% và 99%. Trong ba mức này, mức 95% được sử dụng thường xuyên nhất.

Nếu chúng ta trừ đi mức độ tin cậy từ một, chúng ta sẽ nhận được giá trị của alpha, được viết là α, cần thiết cho công thức.

giá trị quan trọng

Bước tiếp theo trong việc tính toán lề hoặc sai số là tìm giá trị tới hạn thích hợp. Điều này được biểu thị bằng số hạng z α/2 trong công thức trên. Vì chúng tôi đã giả định một mẫu ngẫu nhiên đơn giản từ một dân số lớn, nên chúng tôi có thể sử dụng phân phối chuẩn chuẩn của điểm số z .

Giả sử chúng ta đang làm việc với mức tin cậy là 95%. Chúng tôi muốn tìm điểm số zz* mà diện tích giữa -z* và z* là 0,95. Từ bảng, chúng ta thấy rằng giá trị tới hạn này là 1,96.

Chúng tôi cũng có thể đã tìm thấy giá trị quan trọng như sau. Nếu chúng ta nghĩ về α/2, vì α = 1 – 0,95 = 0,05, chúng ta thấy rằng α/2 = 0,025. Bây giờ chúng tôi tìm kiếm trong bảng để tìm z -score với diện tích 0,025 ở bên phải của nó. Chúng ta sẽ có cùng giá trị tới hạn là 1,96.

Các mức tin cậy khác sẽ cho ta các giá trị tới hạn khác nhau. Mức độ tin cậy càng cao thì giá trị tới hạn càng cao. Giá trị tới hạn cho mức độ tin cậy 90%, với giá trị α tương ứng là 0,10, là 1,64. Giá trị tới hạn đối với mức độ tin cậy 99%, với giá trị α tương ứng là 0,01, là 2,54.

Cỡ mẫu

Con số duy nhất khác mà chúng ta cần sử dụng công thức để tính biên sai sốcỡ mẫu , được biểu thị bằng n trong công thức. Sau đó, chúng tôi lấy căn bậc hai của số này.

Do vị trí của con số này trong công thức trên, kích thước mẫu chúng tôi sử dụng càng lớn thì sai số càng nhỏ. Do đó, các mẫu lớn được ưu tiên hơn các mẫu nhỏ hơn. Tuy nhiên, do việc lấy mẫu thống kê đòi hỏi phải có nguồn lực về thời gian và tiền bạc nên có những hạn chế về mức độ chúng tôi có thể tăng cỡ mẫu. Sự hiện diện của căn bậc hai trong công thức có nghĩa là việc tăng gấp bốn lần cỡ mẫu sẽ chỉ giảm một nửa sai số.

Vài ví dụ

Để hiểu ý nghĩa của công thức, chúng ta hãy xem xét một vài ví dụ.

  1. Biên độ sai số đối với một mẫu ngẫu nhiên đơn giản gồm 900 người có trình độ là bao nhiêu ?
  2. Sử dụng bảng, chúng ta có giá trị tới hạn là 1,96, do đó biên độ sai số là 1,96/(2 √ 900 = 0,03267, hay khoảng 3,3%.
  3. Sai số cho một mẫu ngẫu nhiên đơn giản gồm 1600 người với độ tin cậy 95% là bao nhiêu?
  4. Với cùng mức độ tin cậy như ví dụ đầu tiên, việc tăng kích thước mẫu lên 1.600 sẽ cho chúng ta sai số là 0,0245, tương đương khoảng 2,5%.