Xin chào,

Em là Thảo hiện đang tìm hiểu về ngôn ngữ tiếng Việt để thực hiện một đề tài về tách từ tiếng Việt tự động. Em có tham khảo qua bài viết (link bên dưới).
http://www.scribd.com/doc/58879057/5...g-Vi%E1%BB%87t

Trong trang 40 của tài liệu trên có nói Table 1: liệt kê Tần suất xuất hiện độ dài từ tiếng Việt. Cho em hỏi bằng cách nào thống kê được tần suất đó, và tần suất đó khách như thế nào với tần suất sử dụng của từ.

Trong đề tài của em cần có một bảng thống kê tần suất sử dụng của các từ đơn, nhưng em không biết cách nào để thống kê được.

Mong ban quản trị và các anh chị trên diễn đàn hướng dẫn giúp em.

Chân thành cảm ơn mọi người.

Thanh Thảo
Email: ttthao03@gmail.com