Báo cáo học liệu
Mua học liệu
Mua học liệu:
-
Số dư ví của bạn: 0 coin - 0 Xu
-
Nếu mua học liệu này bạn sẽ bị trừ: 0 coin\Xu
Để nhận Coin\Xu, bạn có thể:
Các số đặc trưng đo mức độ phân tán cho mẫu số liệu không ghép nhóm SVIP
Nội dung này do giáo viên tự biên soạn.
I. KHOẢNG BIẾN THIÊN. KHOẢNG TỨ PHÂN VỊ
1. Định nghĩa
Trong một mẫu số liệu, khoảng biến thiên là hiệu số giữa giá trị lớn nhất và giá trị nhỏ nhất của mẫu số liệu đó.
Ta có thể tính khoảng biến thiên \(R\) của mẫu số liệu theo công thức sau: \(R=x_{max}-x_{min}\), trong đó \(x_{max}\) là giá trị lớn nhất, \(x_{min}\) là giá trị nhỏ nhất của mẫu số liệu đó.
Giả sử \(Q_1,Q_2,Q_3\) là tứ phân vị của mẫu số liệu. Ta gọi \(\Delta_Q=Q_3-Q_1\) là khoảng tứ phân vị của mẫu số liệu đó.
Chú ý: Khoảng tứ phân vị của mẫu số liệu còn được gọi là khoảng trải giữa của mẫu số liệu.
Ví dụ 1. Cho mẫu số liệu:
\(5\) | \(6\) | \(4\) | \(7\) | \(6\) | \(8\) | \(5\) | \(6\) |
Tìm khoảng biến thiên của mẫu số liệu này.
Giải
Giá trị cao nhất và thấp nhất của mẫu số liệu lần lượt là \(8\) và \(4\), do đó khoảng biến thiên là \(R=8-4=4.\)
Ví dụ 2. Cho mẫu số liệu điểm kiểm tra môn Toán của một tổ:
\(9\) | \(8\) | \(8\) | \(7\) | \(6\) | \(9\) | \(7\) | \(10\) | \(8\) |
Tìm khoảng tứ phân vị cho mẫu số liệu này.
Giải
Sắp xếp mẫu số liệu theo thứ tự không giảm
\(6\) | \(7\) | \(7\) | \(8\) | \(8\) | \(8\) | \(9\) | \(9\) | \(10\) |
Mẫu số liệu có \(9\) giá trị nên trung vị là số chính giữa, \(Q_2=8\).
\(Q_1=\dfrac{7+7}{2}=7;Q_3=\dfrac{9+9}{2}=9;\)
Vậy khoảng tứ phân vị của mẫu số liệu trên là \(\Delta_Q=Q_3-Q_1=9-7=2.\)
2. Ý nghĩa
a. Khoảng biến thiên của mẫu số liệu phản ánh sự "dao động", "sự dàn trải" của các số liệu trong mẫu đó.
b. Khoảng tứ phân vị là đại lượng cho biết mức độ phân tán của nửa giữa mẫu số liệu và có thể giúp xác định các giá trị bất thường của mẫu số liệu đó. Khoảng tứ phân vị thường được dùng thay cho khoảng biến thiên vì nó loại trừ hầu hết giá trị bất thường của mẫu số liệu.
II. PHƯƠNG SAI
1. Định nghĩa
Cho mẫu số liệu thống kê có \(n\) giá trị \(x_1,x_2,...,x_n\) và số trung bình cộng là \(\overline{x}\).
Ta gọi số \(s^2=\dfrac{\left(x_1-\overline{x}\right)^2+\left(x_2-\overline{x}\right)^2+...+\left(x_n-\overline{x}\right)^2}{n}\) là phương sai của mẫu số liệu trên.
Nhận xét: Mỗi hiệu giữa số liệu và số trung bình cộng gọi là độ lệch của số liệu đó đối với số trung bình cộng.
- Khi mẫu số liệu được cho dưới dạng bảng tần số
Giá trị | \(x_1\) | \(x_2\) | \(...\) | \(x_k\) |
Tần số | \(n_1\) | \(n_2\) | \(...\) | \(n_k\) |
Phương sai của mẫu số liệu thống kê trong bảng phân bố tần số là:
\(s^2=\dfrac{n_1\left(x_1-\overline{x}\right)^2+n_2\left(x_2-\overline{x}\right)^2+...+n_k\left(x_k-\overline{x}\right)^2}{n}\) trong đó \(n=n_1+n_2+...+n_k\); \(\overline{x}\) là số trung bình cộng của các số liệu đã cho.
- Khi mẫu số liệu cho bởi bảng phân bố tần số tương đối
Giá trị | \(x_1\) | \(x_2\) | \(...\) | \(x_k\) |
Tần số tương đối | \(f_1\) | \(f_2\) | \(...\) | \(f_k\) |
Phương sai của mẫu số liệu thống kê trong bảng phân bố tần số là:
\(s^2=f_1\left(x_1-\overline{x}\right)^2+f_2\left(x_2-\overline{x}\right)^2+...+f_k\left(x_k-\overline{x}\right)^2\) trong đó \(\overline{x}\) là số trung bình cộng của các số liệu đã cho.
2. Ý nghĩa
Phương sai là số đặc trưng đo mức độ phân tán của mẫu số liệu.
III. ĐỘ LỆCH CHUẨN
1. Định nghĩa
Căn bậc hai của phương sai gọi là độ lệch chuẩn của mẫu số liệu thống kê.
2. Ý nghĩa
Độ lệch chuẩn là số đặc trưng đo mức độ phân tán của mẫu số liệu thống kê có cùng đơn vị đo. Mẫu số liệu nào có độ lệch chuẩn nhỏ hơn thì mức độ phân tán (so với số trung bình cộng) của các số liệu trong mẫu đó sẽ thấp hơn.
Ví dụ 3. Mẫu số liệu sau đây cho biết cân nặng của \(5\) bạn lớp \(10\) (đơn vị kg):
\(45\) | \(48\) | \(46\) | \(50\) | \(48\) |
Tìm phương sai và độ lệch chuẩn cho mẫu số liệu này.
Giải
Số trung bình của mẫu số liệu là
\(\overline{X}=\dfrac{45+48+46+50+48}{5}=47,4\)
Phương sai của mẫu số liệu là
\(s^2=\dfrac{\left(45-47,4\right)^2+\left(48-47,4\right)^2+\left(46-47,4\right)^2+\left(50-47,4\right)^2+\left(48-47,4\right)^2}{5}=3,04\)
Độ lệch chuẩn \(s=\sqrt{s^2}\approx1,74.\)
IV. TÍNH HỢP LÍ CỦA SỐ LIỆU THỐNG KÊ
Ta có thể sử dụng các số đặc trưng đo mức độ phân tán cho mẫu số liệu không ghép nhóm để chỉ ra được những số liệu bất thường của mẫu số liệu. Ta thường sử dụng khoảng tứ phân vị để xác định số liệu bất thường của mẫu số liệu như sau:
Giả sử \(Q_1,Q_2,Q_3\) là tứ phân vị của mẫu số liệu và \(\Delta_Q=Q_3-Q_1\) là khoảng tứ phân vị của mẫu số liệu. Một giá trị \(x\) trong mẫu là một giá trị bất thường nếu \(x>Q_3+1,5\Delta_Q\) hoặc \(x< Q_1-1,5\Delta_Q.\)
Ví dụ 4. Một mẫu số liệu có tứ phân vị thứ nhất là \(48\) và tứ phân vị thứ ba là \(76\). Hãy kiểm tra xem trong hai giá trị \(5\) và \(100\) giá trị nào được xem là giá trị bất thường của mẫu số liệu.
Giải
Ta có \(Q_1=48;Q_3=76\Rightarrow\Delta_Q=Q_3-Q_1=76-48=28\)
Khi đó \(Q_1-1,5.\Delta_Q=6;Q_3+1,5.\Delta_Q=118\)
nên \(5\) (nhỏ hơn \(6\)) là một giá trị bất thường của mẫu số liệu.
Bạn có thể đánh giá bài học này ở đây