Đếm từ (kèm thời gian đọc và nói)
Dán văn bản bất kỳ để xem số từ, số ký tự (có và không tính dấu cách), số câu, số đoạn, và ước tính thời gian đọc thầm và đọc to.
- Từ
- 0
- Ký tự
- 0
- Không tính dấu cách
- 0
- Câu
- 0
- Đoạn
- 0
- Thời gian đọc
- 0phút
- Thời gian nói
- 0phút
Cách hoạt động
Cách tính từng chỉ số
Ký tự là độ dài thô của văn bản, bao gồm dấu cách, xuống dòng và emoji. 'Không tính dấu cách' loại bỏ khoảng trắng trước khi đếm. Từ được tách bằng khoảng trắng cho các ngôn ngữ chữ Latin (như tiếng Việt); với tiếng Nhật, Trung, Hàn và Thái, mỗi ký tự biểu ý được đếm là một từ, vì các ngôn ngữ này không dùng dấu cách giữa các từ như tiếng Việt hay tiếng Anh.
Câu được phát hiện qua dấu kết thúc (. ! ? trong chữ Latin; 。!? trong CJK). Đoạn là khối được phân tách bằng dòng trống. Các quy tắc này thực dụng — văn bản có dấu câu khác lạ có thể lệch một câu, nhưng với văn xuôi bình thường thì đếm đáng tin cậy.
Thời gian đọc được ước tính thế nào
Thời gian đọc dùng 200 từ/phút, trung vị cho người lớn đọc văn xuôi. Thời gian nói dùng 130 từ/phút, tốc độ của diễn giả có kinh nghiệm. Cả hai làm tròn lên phút gần nhất, nên câu 50 từ hiện '1 phút'.
Các con số này là xấp xỉ. Văn bản kỹ thuật nặng đọc chậm hơn (gần 150 wpm), tiểu thuyết nhẹ đọc nhanh hơn (gần 250 wpm), và nhịp thuyết trình thay đổi nhiều theo phong cách và khán giả. Dùng con số để kiểm tra trực giác, không phải đồng hồ bấm giây.
Cách dùng phổ biến
Blogger và người viết dùng số từ để đạt độ dài mục tiêu (hầu hết bài longform nhắm 1500-2500 từ cho SEO). Sinh viên dùng cho bài luận. Marketer dùng ký tự-có-dấu-cách cho giới hạn bài X (Twitter) và độ dài thẻ meta description. Diễn giả dùng số thời gian nói để hiệu chỉnh kịch bản cho lightning talk 5 phút hay keynote 20 phút.
Người dịch và biên tập theo dõi cả bốn số đếm khi tính tiền theo từ hoặc ký tự — chọn 'có dấu cách' hay 'không' ảnh hưởng giá 10-20%.
Câu hỏi thường gặp
›Vì sao số từ CJK của tôi cao hơn dự kiến?
Chúng tôi đếm mỗi ký tự biểu ý (Hán tự Trung, kanji/kana Nhật, hangul Hàn) là một từ. Từ chữ Latin ở phần khác trong cùng văn bản vẫn được đếm theo khoảng trắng.
›Emoji có được đếm là ký tự không?
Có. Một số emoji về kỹ thuật là nhiều code unit Unicode; bộ đếm theo độ dài chuỗi JavaScript, đếm mỗi code unit UTF-16.
›Thời gian đọc có chính xác không?
Con số 200 wpm khớp tốc độ đọc thầm trung vị của người lớn với văn xuôi. Văn bản kỹ thuật cao đọc chậm hơn, tiểu thuyết dễ đọc nhanh hơn — coi như ước tính ±30%.
›Vì sao số câu trông lệch?
Phát hiện dựa trên dấu kết thúc. Danh sách, tiêu đề không có dấu câu, hoặc văn phong khác lạ có thể làm sai. Số từ vẫn đáng tin cậy.
›Văn bản có rời khỏi trình duyệt không?
Không. Mọi thứ chạy cục bộ; chúng tôi không có endpoint server nhận đầu vào.
›Giới hạn độ dài văn bản là bao nhiêu?
Không có giới hạn cưỡng chế. Trình duyệt hiện đại xử lý văn bản nhiều megabyte không vấn đề, dù textarea có thể chậm khi vượt khoảng 100.000 ký tự.
›Có đếm được tweet hay bài X không?
Có — dùng 'ký tự' (có dấu cách) vì X tính khoảng trắng. Giới hạn 280 ký tự cũng tính URL thành 23 ký tự.
›Có hỗ trợ Markdown không?
Nó đếm văn bản thô bao gồm cú pháp Markdown. Nếu muốn đếm từ 'đã render', hãy dán chỉ phần output đã render.
Công cụ liên quan
Cập nhật lần cuối: