Hướng dẫn sử dụng● Văn bản tiếng Việt được tổ chức trong Vietlex Corpus đã qua bước tiền sử lí, cụ thể như sau:
- Bỏ dấu vào "a" nhất loạt cho các âm tiết có khuôn vần /-oa/ (oà, oả, oã, oá, oạ).
- Bỏ dấu vào "e" nhất loạt cho các âm tiết có khuôn vần /-oe/ (oè, oẻ, oẽ, oé, oẹ). - Bỏ dấu vào "y" nhất loạt cho các âm tiết có khuôn vần /-uy/ (uỳ, uỷ, uỹ, uý, uỵ). Lý do: để thống nhất trong cách bỏ dấu, không gây nhầm lẫn xem "hoả" và "hỏa" là hai từ khác nhau (trường hợp này khác với trường hợp viết khuôn vần /-i/ bằng "i" và "y"). ● Để bảo lưu tính nguyên bản trong việc dùng chữ viết, chúng tôi giữ nguyên hai cách viết "i" và "y" trong văn bản, chẳng hạn: quy-qui, quý-quí, lí-lý, mĩ-mỹ, ti-ty, v.v. Như vậy, khi tra cứu các từ có khuôn vần /-i/, chúng ta có thể phải tra hai lần (một lần cho "i" và một lần cho "y"). ● Chúng tôi giữ nguyên cách viết dùng dấu gạch ngang cho các từ Hán-Việt xuất hiện chủ yếu trong các văn bản trước đây, như: thuộc-địa, văn-hoá, sinh-hoạt, kinh-tế, xã-hội, v.v.
- Khi nhập "thuộc địa" chương trình sẽ trả về kết quả cho cả "thuộc địa" và "thuộc-địa"
- Khi nhập "thuộc-địa" chương trình chỉ trả về kết quả cho từ "thuộc-địa" ● Vietlex Corpus có các nút lọc loại văn bản sau:
- Chọn {Toàn bộ} chương trình sẽ trả về kết quả tìm kiếm trong cả kho văn bản.
- Chọn {KHXH} chương trình chỉ trả về kết quả tìm trong văn bản "khoa học xã hội". - Chọn các loại văn bản khác có ý nghĩa tương tự như mục trên. - Nhập từ tra (key word) vào ô "Nhập từ" (không phân biệt chữ hoa, chữ thường), nhấn Enter hoặc chọn nút lệnh "Tạo ngữ cảnh". - Số lượng của "key word" sẽ xuất hiện ở tiết mục Tần số. - Mỗi lần chọn các loại văn bản khác nhau thì tần số xuất hiện cũng thay đổi theo. - Click vào bất kì hàng nào chứa "key word" trong danh sách ngữ cảnh, sẽ thấy xuất hiện nội dung chi tiết ở khung bên dưới. - Click nút lệnh "Expand" để mở rộng số câu mà "key word" xuất hiện trong đoạn văn bản. Vietlex rất mong nhận được những góp ý của người dùng. | |