Máy tính thống kê (trung bình, trung vị, độ lệch chuẩn, tứ phân vị)
Dán danh sách số (phân cách bằng dấu phẩy, khoảng trắng hoặc dòng mới). Máy tính trả về thống kê mô tả bao gồm xu hướng trung tâm, phân tán và tứ phân vị trong một giao diện.
- Số lượng (n)
- 9
- Tổng
- 222
- Trung bình (giá trị trung bình)
- 24,6667
- Trung vị
- 25
- Mode
- 25
- Khoảng biến thiên
- 28
- Giá trị nhỏ nhất
- 12
- Giá trị lớn nhất
- 40
- Q1 (phân vị thứ 25)
- 16,5
- Q3 (phân vị thứ 75)
- 32,5
- Độ lệch chuẩn
- 9,1924
- Phương sai
- 84,5
Cách hoạt động
Mỗi thống kê đo gì
Trung bình: tổng chia cho số lượng. Nhạy cảm với ngoại lệ — một giá trị khổng lồ có thể kéo trung bình xa giá trị điển hình. Tốt nhất khi dữ liệu đối xứng gần bằng.
Trung vị: giá trị ở giữa khi sắp xếp. Bền vững với ngoại lệ — vài giá trị cực đoan không di chuyển nó. Tốt hơn trung bình với dữ liệu lệch như thu nhập hoặc giá nhà.
Mode: giá trị xuất hiện nhiều nhất. Hữu ích nhất với dữ liệu rời rạc (câu trả lời khảo sát, tung xúc xắc). Với dữ liệu liên tục, mode thường vô nghĩa và chúng tôi báo cáo 'không có' nếu không có giá trị nào lặp lại.
Độ lệch chuẩn: khoảng cách điển hình từ trung bình. Cùng đơn vị với dữ liệu. Khoảng hai phần ba giá trị thường nằm trong ±1 độ lệch chuẩn của trung bình (với phân phối chuẩn).
Mẫu so với tổng thể
Nếu các số của bạn là toàn bộ tổng thể (mọi nhân viên trong công ty, mọi ngày trong tháng), dùng độ lệch chuẩn tổng thể: chia cho n. Chúng tôi tắt điều này khi bạn bỏ chọn 'Độ lệch chuẩn mẫu'.
Nếu các số là mẫu được lấy từ tổng thể lớn hơn (khảo sát 100 từ 10.000 khách hàng), dùng độ lệch chuẩn mẫu: chia cho n−1 (hiệu chỉnh Bessel). Đây là mặc định và là điều hầu hết các khóa học thống kê và phần mềm mặc định.
Sự khác biệt giảm khi n tăng. Với n=100 hai cái khác nhau 0,5%; với n=10 khác nhau 5%. Với mẫu rất nhỏ, lựa chọn quan trọng.
Tứ phân vị và IQR
Q1 (tứ phân vị thứ nhất, phân vị thứ 25) là trung vị của nửa dưới. Q3 (tứ phân vị thứ ba, phân vị thứ 75) là trung vị của nửa trên. Khoảng tứ phân vị (IQR = Q3 − Q1) mô tả 50% giữa của dữ liệu và bền vững với ngoại lệ.
Biểu đồ hộp dùng những con số này: hộp trải dài từ Q1 đến Q3, với trung vị là đường ở giữa. Râu kéo dài đến giá trị cực đoan nhất trong phạm vi 1,5 × IQR; bất cứ điều gì ngoài đó được vẽ là ngoại lệ.
Câu hỏi thường gặp
›Tôi có thể dán bao nhiêu số?
Tới khoảng 100.000 một cách hợp lý. Ngoài đó trình duyệt có thể chậm lại. Với tập dữ liệu khổng lồ, dùng công cụ lập trình.
›Nếu tôi có số thập phân thì sao?
Dùng dấu chấm (.) làm dấu phân cách thập phân bất kể địa phương: 3.14, không phải 3,14.
›Tại sao mode là 'không có'?
Vì không có giá trị nào lặp lại. Mode chỉ có ý nghĩa khi ít nhất một giá trị xuất hiện hai lần trở lên.
›Tôi nên dùng mẫu hay tổng thể cho dữ liệu lớp học?
Nếu bạn coi lớp là mẫu của trường, dùng mẫu (n−1). Nếu lớp CÓ LÀ tổng thể, dùng tổng thể (n).
›Sự khác biệt giữa độ lệch chuẩn và phương sai là gì?
Phương sai là khoảng cách bình phương trung bình từ trung bình; độ lệch chuẩn là căn bậc hai của nó. Độ lệch chuẩn có cùng đơn vị với dữ liệu của bạn, đó là lý do chúng tôi báo cáo cả hai nhưng độ lệch chuẩn thường hữu ích hơn.
›Tại sao Q1 của tôi khác với máy tính?
Tồn tại các phương pháp khác nhau (Phương pháp 1, 2, R-mặc định, Excel-mặc định). Chúng tôi dùng phương pháp trung vị-của-nửa-dưới. Hầu hết các khóa học nhập môn dùng cách này; hàm QUARTILE() trong bảng tính có thể khác một chút.
›Tôi có thể dùng số âm không?
Có. Số âm được hỗ trợ đầy đủ.
›Dữ liệu có rời khỏi trình duyệt không?
Không. Tất cả tính toán chạy cục bộ; không có gì được gửi đến server nào.
Công cụ liên quan
Cập nhật lần cuối: