8. Từ loại chỉ ra phạm trù ngữ pháp bao gồm đặc điểm ngữ pháp, quan hệ cú pháp và ý nghĩa khái quát của đơn vị từ vựng. Căn cứ vào từ
loại có thể nhận ra được chức năng của đơn vị từ vựng trong hoạt động ngôn ngữ, chẳng hạn chức năng chủ ngữ đối với danh
từ, vị ngữ đối với động từ, v.v. Do đặc thù của tiếng Việt có thể có những mục từ còn bỏ trống chú thích từ loại.
9. Phong cách chỉ ra cách thức sử dụng hoặc lựa chọn ngôn ngữ trong những yêu cầu chức năng cụ thể nào đó, bao gồm các yếu tố biểu thị
sắc thái tu từ như trang trọng, kiểu cách, văn chương, thông tục, khẩu ngữ
10. Phạm vi sử dụng chỉ ra các giới hạn về cách dùng từ trong những phạm vi, lĩnh vực sử dụng ngôn ngữ, bao gồm các yếu tố như cũ, ít dùng,
phương ngữ, chuyên môn
11. Kết hợp cú pháp chỉ ra các khả năng sử dụng, phạm vi kết hợp cũng như chức năng cú pháp của đơn vị ngôn ngữ, như dùng độc lập, dùng để xưng gọi, dùng trong
câu phủ định, dùng kết hợp với..., kết hợp hạn chế, dùng ở đầu câu, dùng làm thành phần phụ trong câu, v.v.
12. Chuyển chú áp dụng trong 2 trường hợp:
1) Chuyển chú một hình thức chính tả này (a)sang một hình thức chính tả khác (b) được coi là chuẩn hơn hoặc được dùng phổ biến hơn, chẳng hạn
a x. b (b chuẩn hơn a); nếu cả hai hình thức chính tả đều là chuẩn và dùng phổ biến như nhau thì chuyển chú b x. a khi b đứng sau a (theo thứ tự chữ cái). 2) Chuyển chú một đơn vị từ vựng này (a)
sang một đơn vị từ vựng khác (b) đồng nghĩa hoàn toàn, nhưng dùng phổ biến hơn, chẳng hạn a x. b (b dùng phổ
biến hơn a); nếu hai đơn vị từ vựng đồng nghĩa hoàn toàn và được dùng phổ biến như nhau, thì chuyển chú b như a (khi b đứng sau a).
13. Định nghĩa nêu lên ý nghĩa cơ bản của đơn vị từ vựng được khái quát từ những cảnh huống cụ thể trong hoạt động ngôn ngữ. Đây là công
việc chính yếu nhất trong công tác biên soạn từ điển giải thích ngôn ngữ.
14. Ví dụ nhằm bổ sung hoặc minh hoạ cho định nghĩa, góp phần làm rõ hơn về sắc thái, hay khía cạnh nào đó của nghĩa mà định nghĩa
chưa nêu rõ, hoặc cho thấy khả năng cũng như phạm vi sử dụng của đơn vị từ vựng trong hoạt động ngôn ngữ.
15. Dạng láy chỉ ra dạng thức cấu tạo từ đặc thù của tiếng Việt, đó là dạng thức hoà phối ngữ âm từ đơn vị từ vựng đã có. Từ được tạo ra theo dạng láy thường
đồng nghĩa (nhưng không hoàn toàn) với từ gốc, do giữa chúng có sự khác nhau ít nhiều về sắc thái ngữ nghĩa hoặc khả năng tổ hợp.
16. Kiến thức bách khoa giới thiệu thêm kiến thức khoa học (ngoài ý nghĩa từ vựng) cho những từ ngữ thường là các thuật ngữ chỉ khái niệm khoa học
- kĩ thuật, góp phần nâng cao hiểu biết cho người sử dụng, hoặc đôi khi cũng có tác dụng làm rõ thêm định nghĩa. Thông tin
này có thể đưa hoà quyện trong lời định nghĩa chung, nhưng cũng có thể được tách ra và phản ánh riêng cho rất nhiều mục từ,
chỉ bằng một câu ngắn gọn, hoặc cho một số ít mục từ, được coi là quan trọng, nhưng định nghĩa bách khoa rất tỉ mỉ. Ví dụ:
- Từ điển Le Petit Larousse (1993), ở mục EAU (nước), trang 361, cột 2, chỗ có kí hiệu ■ trở đi là định nghĩa bách khoa, tạm dịch là: "Nước sôi ở 100ºC
trong áp suất 1 atm, đông đặc ở 0ºC. Có trong khí quyển ở dạng hơi nước. 1 cm³ nước ở 4ºC nặng khoảng 1g. Nước tự nhiên có lẫn khí, các thứ muối tan trong nó và lẫn các loại bụi, đôi khi lẫn các vi khuẩn gây bệnh.
- Từ điển Le Dictionnaire du Français (1989), phần định nghĩa bách khoa bắt đầu từ chữ "ENCYCL" trở đi, ví dụ:
Trong từ điển, hầu như không có mục từ nào biểu hiện đầy đủ các thông tin (đã được hạn định). Có khi, cùng một thông tin nhưng sự biểu hiện hoặc vị trí xuất hiện của nó trong một mục từ cũng rất khác nhau. Chẳng hạn:
-Ở những mục từ kiểu như: "cải giá đg. Lấy chồng khác sau khi chồng chết hoặc sau khi li dị.", thông tin về đầu mục từ chỉ ra rằng, nó là đại diện duy nhất cho toàn bộ phần định nghĩa. Trong khi, ở những mục từ kiểu như:
balông cv. ba lông. d. (cũ). 1 Bóng tròn. 2 Khí cầu. cả I t. 1 (kết hợp hạn chế). Ở bậc cao nhất, lớn nhất, đứng hàng đầu trong loại, về phạm vi hoặc
mức độ tác động, chức năng, giá trị tinh thần,... 2 (hay p.). (dùng phụ trước đg., t.). Ở mức cao nhất, vừa nhiều vừa dễ dàng hoặc mạnh mẽ (nói về một số hoạt động của con người, nhất là hoạt động tâm lí)... 3 (hay đ.). Toàn thể, hết thảy, không trừ một thành phần nào... II tr. Từ biểu thị ý nhấn mạnh về mức độ cao, phạm vi không hạn chế của sự việc...
thì thông tin về đầu mục từ lại chỉ ra rằng, nó là đại diện chung cho tất cả các nghĩa.
- Cùng một vị trí biểu hiện thông tin về từ loại, ở balông, thông tin này là chung cho cả hai nghĩa, trong khi đó ở cả, thông tin này lại không đồng nhất cho các nghĩa. Dấu hiệu ghi "I" chỉ ra rằng cả ba nghĩa thuộc I đều có chung ý nghĩa về "t.". Tuy nhiên, do vị trí biểu hiện về thông tin từ loại ở nghĩa 1 so với nghĩa 2, 3 có khác nhau, nên sự nhận thức về từng nghĩa cũng có khác nhau. Cụ thể là: ở nghĩa 1 có duy nhất ý nghĩa "t.", nghĩa 2 thêm "hay p.", nghĩa 3 thêm "hay đ.".
Sự không tường minh một một giữa hình thức biểu hiện với ý nghĩa diễn đạt như nêu ở trên là tương đối phổ biến ở những
mục từ đa nghĩa hoặc mục từ đồng âm có quan hệ nguồn gốc - ngữ nghĩa. Có rất nhiều thông tin khác cũng xảy ra trường hợp
tương tự như hai thông tin về đầu mục từ và từ loại.
Do phải biểu hiện các thông tin theo chiều tuyến tính và do nhiều lí do khác thuộc về văn bản từ điển, nên ở những mục từ đa nghĩa hoặc mục từ đồng âm có quan hệ nguồn gốc - ngữ nghĩa, các thông tin thường được tỉnh lược hoặc được làm mờ đi. Việc nhận diện ra chúng đòi hỏi phải có tri thức về cáckí hiệu viết tắt, các chú thích, và các dấu hiệu quy ước về bố trí của từ điển.
Công việc của chúng tôi là diễn đạt cách tổ chức thông tin trong cấu trúc của một mục từ từ điển sang dạng mô hình thu nhận dữ liệu trên máy tính. Điều này sẽ rất khó khăn nếu không xuất phát từ những diễn đạt khác đi so với những quan niệm truyền thống. Chúng tôi cho rằng, mỗi một nghĩa (của mục từ đa nghĩa, hoặc mục từ đồng âm có quan hệ nguồn gốc - ngữ nghĩa) đều có quan hệ trực tiếp với đầu mục từ, thông tin về đầu mục từ cũng như mọi thông tin khác là bình đẳng cho tất cả các nghĩa. Vì thế, mô hình thu nhận dữ liệu mà chúng tôi đưa ra là áp dụng cho từng nghĩa một, với mục đích là biểu hiện tường minh một một giữa hình thức biểu hiện với ý nghĩa diễn đạt cho từng thông tin đã được xác định. Các ví dụ nêu trên khi được thể hiện trong mô hình thu nhận dữ liệu sẽ có hình thức như sau (được rút gọn lại):
balông
cv. ba lông.
d.
(cũ)
1
Bóng tròn.
2
Khí cầu.
cả
I
t.
1
(kết hợp hạn chế).
Ở bậc cao nhất, lớn nhất, đứng hàng đầu...
2
(hay p.)
(dùng phụ trước đg., t.).
Ở mức cao nhất, vừa nhiều vừa dễ dàng...
3
(hay đ.)
Toàn thể, hết thảy, không trừ một thành phần nào...
II
tr.
Từ biểu thị ý nhấn mạnh về mức độ cao...
cải giá
đg.
Lấy chồng khác sau khi chồng chết...
Tuy nhiên, để có thể phục hồi như dạng sách từ điển, chúng tôi có tạo thêm những thành phần chứa kí hiệu trộn thêm vào. Quá trình đưa kí hiệu trộn thêm nằm trong mã nguồn của mẫu biên soạn, người biên soạn không cần tác động đến. Việc tạo những thành phần chứa kí hiệu trộn thêm phụ thuộc vào việc xác định cấu trúc vi mô của mục từ. Công việc này cần phải được tiến hành một cách kĩ lưỡng và khoa học, nhằm tránh tình trạng làm dư thừa, thất lạc, hoặc làm hoán đổi thông tin khi chuyến sang dạng văn bản từ điển. Sau khi đã xác định được mô hình thu nhận dữ liệu, các yêu cầu cũng như ý đồ đặt ra đều do chương trình ở mẫu biên soạn đảm nhiệm.
Cuối cùng, chúng tôi luôn chú ý đến tính khả mở (khả năng mở rộng) và tính khả chuyển (khả năng chuyển đổi) trong việc thiết kế mô hình thu nhận dữ liệu. Tính khả mở biểu hiện ở việc có thể dễ dàng bổ sung các thông tin khi cần thiết, còn tính khả chuyển biểu hiện ở khả năng tương thích khi chuyển sang các dạng mã dữ liệu khác nhau, phục vụ cho nhiều yêu cầu, nhiều đối tượng, v.v.
III. Thiết kế mẫu biên soạn nội dung mục từ
Công việc đòi hỏi nhiều công sức nhất đối với người biên soạn từ điển là việc lấp đầy các thông tin thuộc cấu trúc vi mô của mục từ. Trong số các thông tin của mục từ, có những thông tin chỉ thuần tuý là việc chọn lựa đơn vị biểu diễn trong một khuôn mẫu có sẵn và hạn định (tuy không phải là việc dễ). Đó là loại thông tin có tính “thủ tục”, ví dụ: thông tin về từ loại, chuyên ngành, ngữ dụng, v.v. Xuất phát từ thực tế của công việc biên soạn từ điển, chúng tôi cố gắng khuôn mẫu hoá
đến mức tối đa một số thành phần tương đối rõ ràng, được lặp đi lặp lại rất nhiều lần. Người biên soạn chỉ làm mỗi một việc là chọn hay không chọn đơn vị thông tin đã được định danh trong tập hợp thông tin cùng loại.
Trong ngôn ngữ, thường có hiện tượng đẳng cấu ngữ nghĩa ở một số đơn vị từ vựng, khuôn mẫu định nghĩa các từ này giống nhau về cơ bản, vì vậy chúng tôi có chú ý đến việc đưa ra những mẫu định nghĩa chung, áp dụng cho cả nhóm. Nếu khai thác tốt khía cạnh này, có thể “chỉ” ra cho máy tính làm tự động một số công việc, giúp tiết kiệm thời gian, công sức, cũng như sẽ tránh được sự không nhất quán trong việc định nghĩa các mục từ có cùng cấu trúc ngữ nghĩa, ví dụ tháng, ngày thứ, hoa, cây, quả, v.v