Các thành tố của chữ viết

Tự vị (字位 chứ không phải 字彙) là đơn vị cấu thành nhỏ nhất của một hệ thống chữ viết. Có nhiều quan điểm về định nghĩa của thành tố này ở nhiều lĩnh vực khác nhau, quan điểm nào cũng có hạn chế.

Có quan điểm cho rằng, tự vị là nét giúp khu biệt các chữ với nhau. Ví dụ: <h> trong chữ <shake> là một tự vị vì nó giúp ta khu biệt <shake> và <snake>. Quan điểm khác cho rằng, tự vị là đơn vị hình ảnh tương đương với một âm vị trong lời nói. Theo cách hiểu này thì trong chữ <shake>, cả <sh> mới là một tự vị, vì cả <sh> mới tương ứng với âm vị /ʃ/ trong lời nói. Quan điểm thứ nhất có vẻ thực tế hơn vì bản chất chữ viết là một thực thể hình ảnh, hay nói cách khác nó là thực thể có thể tri nhận bằng thị giác. Quan điểm thứ hai xuất phát từ quan niệm lời nói là hệ thống kí hiệu luôn luôn song hành của ngôn ngữ, điều này phần trên đã phủ nhận, vì có những ngôn ngữ không có tiếng nói mà vẫn có chữ viết.

Theo ý tác giả, vì chữ viết là hệ thống kí hiệu bằng hình ảnh nên tự vị phải là đơn vị hình ảnh nhỏ nhất mà con người có thể tri nhận được. Một tự vị khi đứng một mình phải gợi ra trong đầu người đọc một hình ảnh hoàn chỉnh, kiểu “o tròn như quả trứng gà, ô thì đội mũ ơ thì mang râu”. Nhưng đó không nhất thiết phải là hình ảnh của một sự vật khả kiến ngoài đời, mà cũng có thể là hình ảnh do chính nó tạo ra trong trí óc người học chữ, ví dụ “hình chữ T”, “hình chữ Y”...

Về giá trị của tự vị, đa số quan điểm đều cho rằng mỗi tự vị đều có ít nhất một giá trị. Với quan điểm này, tác giả không phản đối, cũng không đồng ý hoàn toàn. Một tự vị, theo định nghĩa ở trên, nếu đứng riêng một mình thì đúng là sẽ luôn mang một giá trị có thể nhận biết hoặc dự đoán được. Giá trị đó có thể thuộc 1 trong 3 hệ thống lời nói (âm vị, âm tiết), ngôn ngữ (hình vị, từ, khái niệm) hoặc ý nghĩa (hình ảnh).Tuy vậy, trong quá trình hành chức, tự vị có thể không có giá trị hoặc có giá trị tiềm tàng:

- Tự vị không có giá trị trong chữ khi nó có thể bị lược bỏ mà chỉnh hợp chứa nó vẫn giữ nguyên giá trị. Ta có thể gọi nó là tự vị mang giá trị lịch sử vì nguyên nhân thường thấy của hiện tượng này là do nguyên tắc lịch sử trong chính tả (sẽ được giới thiệu ở phần sau). Ví dụ, xét chữ <rhym> trong tiếng Anh như là một chữ ghi lời nói, <h> là một tự vị nhưng nó không thể hiện âm vị /h/hay bất cứ giá trị ngôn ngữ, hình ảnh nào, ta nói tự vị <h> không có giá trị trong chữ này.

- Tự vị có giá trị tiềm tàng trong chữ khi nó không thể bị lược bỏ hoặc thay thế mà không làm thay đổi giá trị của chỉnh hợp chứa nó. Ví dụ chữ <shape> trong tiếng Anh, cả chỉnh hợp <sh> mới có giá trị là âm vị /ʃ/, nhưng ta không thể lược bỏ hay thay thế một trong hai tự vị đó. Ta nói <s> và <h> có giá trị tiềm tàng trong chữ này.

Theo cách hiểu này, chữ <à> trong hệ thống chữ Latin ghi tiếng Pháp gồm có hai tự vị: <a> và <`> (dấu accent grave). Trong đó, giá trị của <a> là âm vị /a/, còn <`> mang giá trị hình vị, cụ thể nó giúp ta xác định kí tự này truyền tải giới từ «à» (chứ không phải động từ «a»-avoir)

Nhiều người coi mỗi kí tự chữ hán là một tự vị. Điều này không phải lúc nào cũng đúng. Chữ hán được chia làm 6 loại tuỳ theo đối tượng mà nó ghi (các đơn vị của 3 thực thể lời nói, ngôn ngữ hình ảnh). Trong số đó thì chỉ có (một số) chữ thuộc loại tượng hình, giả tá, chỉ sự là có thể được coi là một tự vị. Ví dụ <>, <>, <>, <>... mỗi chữ này là một tự vị vì tổng thể nó mới là một hình ảnh hoàn chỉnh, không bao gồm và do đó không thể được chia thành những bộ phận nhỏ hơn. Trong khi những chữ thuộc các loại hội ý, chuyển chú và đặc biệt là hình thanh thì không như vậy. Chúng thường được ghép từ những tự vị là những hình ảnh riêng biệt và luôn có giá trị riêng trong những kí tự đó. Ví dụ chữ <> trong hệ thống chữ hán sẽ gồm 3 tự vị: <>, <> và <>. Tự vị <> theo tự nguyên có giá trị ngữ âm, <> và <> có giá trị hình ảnh, vì mỗi tự vị lần lượt là hình ảnh một đứa trẻ và bàn tay cầm cây thước.

Một ví dụ khác, chữ <> trong hệ thống chữ hán cũng có 3 tự vị: tự vị <>, <> và <>. <> ở đây không ghi trực tiếp ý nghĩa bằng hình ảnh mà nó đại diện cho một trường ngữ nghĩa (champs sémantique) giúp ta xác định kí tự <> truyền tải một từ mang ý nghĩa liên quan tới ngôn ngữ và lời nói. <> và <> mỗi tự vị đều mang giá trị tiềm tàng, và sự kết hợp của chúng thông qua tổ hợp <> cho ta gợi ý về âm tiết /ɲə̰ʔn˨˩/ (“nhận”) trong tiếng Việt. Chung qui, <> có giá trị ý nghĩa, <> và <> mang giá trị lời nói.

Một tự vị khi hành chức còn có thể mang nhiều giá trị cùng lúc, thường là giá trị ngôn ngữ kèm theo giá trị ngữ âm. Dựa trên mối quan hệ giữa các tự vị trong một hệ chữ, có thể chia tự vị ra làm hai loại: tự vị cơ sở (hay độc lập) và tự vị thứ cấp (hay phụ thuộc)

- Tự vị cơ sở là tự vị có ít nhất một giá trị riêng và giá trị đó được thể hiện kể cả khi nó đứng riêng một mình trong văn bản. Ví dụ: trong hệ chữ Latin thì <a> là một tự vị cơ sở, vì kể cả khi đứng một mình nó vẫn có thể đại diện cho âm vị /a/, trong hệ chữ Latin ghi tiếng Anh, <a> còn truyền tải hình vị mạo từ «a», trong tiếng Pháp là động từ «avoir»...

- Tự vị thứ cấp là tự vị thường không có giá trị riêng cố định mà giá trị của nó chỉ thể hiện khi nó được ghép chung với một tự vị cơ sở thành kí tự. (Lưu ý rằng đây không có nghĩa nó là tự vị có giá trị tềm tàng như trình bày ở trên). Ví dụ, trong hệ thống chữ Latin ghi tiếng Pháp, dấu accent grave <`> là một tự vị phụ thuộc vì giá trị ngôn ngữ của nó (giúp phân biệt hình vị «a» với «à») chỉ thể hiện khi nó được ghép chung với <a> thành <à>; giá trị ngữ âm của nó cũng chỉ được thể hiện khi nó ghép chung với tự vị <e> tạo thành <è>, chỉ tại đây nó mới đánh dấu kí tự <è> truyền tải âm vị /ɛ/...

Tự vị đồng trị (同値) là các tự vị có hình dạng khác nhau nhưng có giá trị như nhau. Ví dụ <a> và <A>, <> và <>, <> và <>...

Tự tố (hay kí tự) có thể là tự vị cơ sở hoặc tổ hợp của một tự vị cơ sở và các tự vị thứ cấp. Ví dụ: <a>, <á>, <à>, <â>, <ă>, <ä>... mỗi tổ hợp này là một kí tự. Trong khoa học máy tính, một kí tự là một đơn vị thông tin được mã hoá bằng một điểm mã trong bảng mã (thường là unicode) và chiếm một đơn vị thông tin (bit) nhất định.

Chữ là kí tự hoặc chỉnh hợp kí tự tương ứng với một đơn vị trong ngôn ngữ, thường là từ. Ví dụ: chỉnh hợp <literam> là một chữ; <テキスト> là một chữ; <> là một chữ... Một tự vị-kí tự <A>, <>.. cũng có thể là một chữ khi trong văn cảnh nó đại diện cho chính nó, ví dụ trong câu “chữ cái đầu tiên trong bảng chữ cái latin là chữ A”.