1.Thu thập, tổ chức, phân tích dữ liệu
Những thông tin thu thập được như số, chữ, hình ảnh, được gọi là dữ liệu. Dữ liệu dưới dạng số được gọi là số liệu
Sau khi thu thập, tổ chức, phân loại, biểu diễn dữ liệu bằng bảng hoặc biểu đồ, ta cần phân tích và xử lí các dữ liệu đó để tìm ra các thông tin hữu ích và rút ra kết luận.
- Phân loại dữ liệu là ta đi sắp xếp các thông tin theo những tiêu chí nhất định.
Ví dụ
Hình dưới đây là các bình ga của một cửa hàng đang bán.
a) Cửa hàng đang bán tất cả bao nhiêu bình ga?
b) Cửa hàng bán mấu loại bình ga?
Hãy cho biết số lượng bình ga mỗi loại.
Giải:
a) Cửa hàng bán tất cả 8 bình ga
b) Quan sát hình ta thấy các bình ga có hai màu vàng và hồng.
Có hai kích thước: lớn và nhỏ
Nếu lấy tiêu chí là kích thước thì có hai loại ga là:
- Bình cỡ nhỏ: 6 bình
- Bình vỡ lớn: 2 bình
Nếu lấy tiêu chí là màu sắc để phân loại thì có 2 loại bình là:
- Màu hồng: 6 bình
- Màu vàng: 2 bình.
Tính hợp lí của dữ liệu
- Để đánh giá tính hợp lí của dữ liệu, ta cần đưa ra các tiêu chí đánh giá, chẳng hạn như dữ liệu phải:
+ Đúng định dạng: Họ và tên phải là chữ, số tuổi phải là số, email thì phải có kí hiệu @,…
+ Nằm trong phạm vi dự kiến: Số người thì phải là số tự nhiên, cân nặng của người Việt Nam thì phải dưới 200kg, số tuổi của người nguyên dương,…
Ví dụ:
a) Danh sách đội học sinh dự thi văn nghệ của lớp 6A được ghi lại trong bảng sau:
STT |
Họ và tên |
1 |
Hoàng Thu Trang |
2 |
Đỗ Ngọc Hà |
3 |
Phạm Văn Vũ |
4 |
0384888586 |
5 |
Trần Nhật Minh |
6 |
Nguyễn Minh Trí |
Dữ liệu không hợp lí ở đây là 0384888586 trong cột Họ và tên vì đây không phải là tên người.
b) Điều tra điểm Toán của 20 bạn trong kì khảo sát đầu năm của lớp 6B:
5 |
2 |
8 |
9 |
4 |
6 |
7 |
5,5 |
6 |
-1 |
5 |
10 |
6 |
7 |
-3 |
8 |
9 |
6 |
3 |
8 |
Dữ liệu không hợp lí là -1 và -3 vì số điểm kiểm tra không thể là số âm được.
Ta có thể nhận biết được tính hợp lí của dữ liệu thống kê theo những tiêu chí đơn giản
Dựa vào thống kê, ta có thể nhận biết được tính hợp lí của kết luận đã nêu ra
2. Biểu diễn dữ liệu
Sau khi thu thập, tổ chức dữ liệu, ta cần biểu diễn dữ liệu đó ở dạng thích hợp. Nhờ việc biểu diễn dữ liệu, ta có thể phân tích và xử lí các dữ liệu đó
Ta có thể biểu diễn dữ liệu bằng bảng số liệu; biểu đồ tranh; biểu đồ cột
Bảng dữ liệu ban đầu là bảng mà ta tạo ra để ghi lại các thông tin đã thu thập được khi điều tra một vấn đề nào đó.
Chú ý: Để thu thập các dữ liệu được nhanh chóng, trong bảng dữ liệu ban đầu ta thường viết tắt các giá trị, nhưng để tránh sai ót, các giá trị khác nhau phải được viết tắt khác nhau.
Ví dụ:
a) Điều tra điểm Toán của 20 bạn trong kì khảo sát đầu năm của lớp 6B:
Trước hết, ta kẻ bảng gồm 10 cột 2 hàng và ghi lại điểm của mỗi bạn vào bảng
5 |
2 |
8 |
9 |
4 |
6 |
7 |
5,5 |
6 |
7,5 |
5 |
10 |
6 |
7 |
8,5 |
8 |
9 |
6 |
3 |
8 |
b) Xếp loại học lực của học sinh tổ 1 lớp 6A được ghi lại trong bảng dữ liệu sau:
Kh |
G |
Kh |
Kh |
TB |
G |
Kh |
TB |
TB |
Kh |
Kh |
Y |
G |
Kh |
Kh |
(G: Giỏi; Kh: Khá; TB: Trung bình; Y: Yếu)
Các ví dụ trên đều là các ví dụ về bảng dữ liệu ban đầu.
Bảng số liệu
- Bảng thống kê là một cách trình bày dữ liệu chi tiết hơn bảng dữ liệu ban đầu.
- Trong bảng thống kê có:
+ Đối tượng thống kê: Ta cần tìm số liệu của đối tượng nào thì đó là đối tượng thống kê. Các đối tượng này được biểu diễn ở dòng đầu tiên của bảng.
+ Tiêu chí thống kê: Thông tin, đặc điểm của mỗi đối tượng.
+ Ứng với mỗi đối tượng thống kê có một số liệu thống kê theo tiêu chí, lần lượt được biểu diễn ở dòng thứ hai.
Ví dụ
Bảng sau cho biết số anh chị em ruột trong gia đình của 30 học sinh lớp 6A.
Số anh chị em ruột |
0 |
1 |
2 |
3 |
Số học sinh |
9 |
6 |
7 |
8 |
Ta cần tìm thông tin số anh chị em ruột nên đối tượng thống kê là 0, 1, 2, 3
Tiêu chí thống kê là số học sinh ứng với số anh chị em ruột.
Chẳng hạn:
Với đối tượng là “Số anh chị em ruột bằng 0” thì có 9 học sinh.
Số học sinh có 1 anh chị em ruột là 6.
Số học sinh có 2 anh chị em ruột là 7.
Số học sinh có 3 anh chị em ruột là 8.
Dựa vào thống kê, ta có thể bác bỏ kết luận đã nêu ra