Ôn tập chương 5 Thống kê

Tóm tắt lý thuyết

1.1. Mẫu số liệu

+ Dấu hiệu là một vấn đề mà người điều tả quan tâm

+ Đơn vị điều tra là mỗi đối tượng điều tả

+ Mẫu là một tập hợp con hữu hạn các đơn vị điều tra

+ Kích thước mẫu là số phần tử của mẫu

+ Mẫu số liệu là giá trị của dấu hiệu thu được trên mẫu

+ Trình bày một mẫu số liệu có 2 cách chính

1.2. Các số đặc trưng của mẫu số liệu

Số trung bình cộng (ký hiệu \(\overline x \)):

\(\bar x = \frac{1}{n}({n_1}{x_1} + {n_2}{x_2} + … + {n_k}{x_k}) = {f_1}{x_1} + {f_2}{x_2} + … + {f_k}{x_k}\)

hoặc \(\bar x = \frac{1}{n}({n_1}{c_1} + {n_2}{c_2} + … + {n_k}{c_k}) = {f_1}{c_1} + {f_2}{c_2} + … + {f_k}{c_k}\)

Số trung vị (ký hiệu Me):

Cho mẫu số liệu có kích thước n được sắp xếp theo thứ tự không giảm (hoặc không tăng)

+ Nếu n lẻ thì Me là số đứng chính giữa dãy ( số hạng thứ \(\frac{{n + 1}}{2}\)).

+ Nếu n chẵn thì Me là  trung bình cộng của 2 số đứng giữa dãy (số hạng thứ \(\frac{n}{2}\) và số hạng thứ \(\frac{n}{2} + 1\)).

Mốt (ký hiệu MO): Giá trị có tần số lớn nhất

Phương sai (ký hiệu s2):

\(\begin{array}{l}
{s^2} = \frac{1}{n}\left[ {{n_1}{{\left( {{x_1} – \overline x } \right)}^2} + {n_2}{{\left( {{x_2} – \overline x } \right)}^2} + … + {n_k}{{\left( {{x_k} – \overline x } \right)}^2}} \right]\\
= {f_1}{\left( {{x_1} – \overline x } \right)^2} + {f_2}{\left( {{x_2} – \overline x } \right)^2} + … + {f_k}{\left( {{x_k} – \overline x } \right)^2}
\end{array}\)

hoặc

\(\begin{array}{l}
{s^2} = \frac{1}{n}\left[ {{n_1}{{\left( {{c_1} – \overline x } \right)}^2} + {n_2}{{\left( {{c_2} – \overline x } \right)}^2} + … + {n_k}{{\left( {{c_k} – \overline x } \right)}^2}} \right]\\
= {f_1}{\left( {{c_1} – \overline x } \right)^2} + {f_2}{\left( {{c_2} – \overline x } \right)^2} + … + {f_k}{\left( {{c_k} – \overline x } \right)^2}
\end{array}\)

Độ lệch chuẩn (ký hiệu s): \(s = \sqrt {{s^2}} \)

Bài tập minh họa


Ví dụ 1: Điều tra về số giờ tự học của 1 học sinh lớp 10 ở nhà trong 1 tuần, người ta chọn ra ngẫu nhiên 50 học sinh lớp 10 và đề nghị các em cho biết số giờ tự học ở nhà trong 1 tuần. Kết quả được nêu dưới dạng bảng phân bố tần số ghép lớp sau ( đơn vị là giờ):

Lớp

Tần số

[0;9]

5

[10;19]

9

[20;29]

15

[30;39]

10

[40;49]

9

[50;59]

2

N = 50

 

a) Dấu hiệu là gì ? Đơn vị điều tra là gì?

b) Bổ xung cột tần suất để được bảng phân bố tần số – tần suất.

c) Vẽ biểu đồ tần số hình cột và biểu đồ tần suất hình quạt.

d) Tính số trung bình?

Hướng dẫn:

a) Dấu hiệu: Số giờ học trong 1 tuần

Đơn vị điều tả: Một học sinh lớp 10

b) Bổ sung cột tần suất, ta có bảng phân bố tần số – tần suất ghép lớp

Công thức tính tần suất: \({f_i} = \frac{{{n_i}}}{n}\)

Lớp

Tần số

Tần suất %

[0;9]

5

10

[10;19]

9

18

[20;29]

15

30

[30;39]

10

20

[40;49]

9

18

[50;59]

2

4

N = 50

 

c)

d) Số trung bình

Lớp

Giá trị đại diện

Tần số

[0;9]

4,5

5

[10;19]

14,5

9

[20;29]

24,5

15

[30;39]

34,5

10

[40;49]

44,5

9

[50;59]

54,5

2

N=50

 

\(\overline x  = \frac{1}{{50}}\left( {5.4,5 + 9.14,5 + 15.24,5 + 10.34,5 + 9.44,5 + 2.54,5} \right) = 27,5\) (giờ)

Ví dụ 2: Để khảo sát kết quả thi môn Toán trong kỳ thi Tuyển sinh Đại học năm trước ở trường A, người ta chọn một mẫu gồm 100 học sinh tham gia kỳ thi tuyển sinh đó. Kết quả được bảng phân bố tần số sau:

Điểm

0

1

2

3

4

5

6

7

8

9

10

Tần số

1

1

3

5

8

13

19

24

13

11

2

N=100

 

a) Tìm mốt?

b) Tìm số trung bình (chính xác đến hàng phần trăm)?

c) Tìm số trung vị?

d) Tìm phương sai và độ lệch chuẩn (chính xác đến hàng phần nghìn)?

Hướng dẫn:

a) Mốt MO=7

b) Số trung bình

\(\overline x  = \frac{1}{{100}}\left( {1.0 + 1.1 + 3.2 + 5.3 + … + 2.10} \right) = 6,24\) (điểm)

c) Số liệu đứng thứ 50 là 6, số liệu đứng thứ 51 là 7. Vậy số trung vị bằng:

\({M_e} = \frac{{6 + 7}}{2} = 6,5\)

d) Phương sai và độ lệch chuẩn

\({s^2} = \frac{1}{{100}}\sum\limits_{i = 1}^{100} {{n_i}{{\left( {{x_i} – \overline x } \right)}^2}}  \approx 4,002\);

\(s = \sqrt {{s^2}}  = \sqrt {4,002}  \approx 2,001\)