TIÊU CHUẨN VIỆT NAM

TCVN 6909 : 2001

CÔNG NGHỆ THÔNG TIN - BỘ MÃ KÍ TỰ TIẾNG VIỆT 16-BIT

Information Technology - 16-bit Coded Vietnamese Character Set

Lời nói đầu

TCVN 6909 : 2001 phù hợp với ISO/IEC 10646-1 : 2000;

TCVN 6909 : 2001 do Tiểu ban kỹ thuật Tiêu chuẩn TCVN/JTC1/SC2 Công nghệ Thông tin - Các tập ký tự và mã hóa thông tin biên soạn, Tổng cục Tiêu chuẩn Đo lường Chất lượng đề nghị, Bộ Khoa học, Công nghệ và Môi trường ban hành

 

CÔNG NGHỆ THÔNG TIN - BỘ MÃ KÍ TỰ TIẾNG VIỆT 16-BIT

Information Technology - 16-bit Coded Vietnamese Character Set

1. Phạm vi áp dụng

1.1. Tiêu chuẩn này qui định bộ mã 16-bit phục vụ việc biểu diễn, lưu trữ và trao đổi các ký tự tiếng Việt trong công nghệ thông tin.

1.2. Tiêu chuẩn này quy định cấu trúc của bộ mã kí tự tiếng Việt 16-bit thông qua việc mô tả các tập kí tự thành phần và qui ước mã hóa từng kí tự trong bảng mã.

1.3. Tiêu chuẩn này không quy định hình dạng cố định và kích thước của các kí tự tiếng Việt, kỹ thuật hiển thị và xử lí những kí tự này.

2. Tính phù hợp

2.1. Các kí tự tiếng Việt trong tiêu chuẩn này phù hợp với ISO/IEC 10646-1:2000 và UNICODE 3.0 về vị trí trong mặt phẳng đa ngữ cơ bản (BMP); các kí tự khác cần được tham chiếu theo hai tiêu chuẩn trên.

2.2. Việc mã hóa kí tự văn bản tiếng Việt trong một hệ thống công nghệ thông tin được coi là phù hợp với tiêu chuẩn này nếu có sử dụng các tập kí tự qui định trong điều 5 và mã của những kí tự được sử dụng tuân theo đúng điều 6 của tiêu chuẩn này.

3. Tiêu chuẩn trích dẫn

ISO/IEC 10646-1:2000 Công nghệ Thông tin - Bộ kí tự tổng hợp mã hóa bằng nhiều octet (UCS) - Phần 1: Cấu trúc và mặt phẳng đa ngữ cơ bản (BMP)

TCVN 6695-1:2000 Công nghệ Thông tin - Từ vựng - Phần 1: Các thuật ngữ cơ bản

UNICODE phiên bản 3.0

4. Thuật ngữ và định nghĩa

4.1. Kí tự: một thành viên của một tập chứa các phần tử được dùng để biểu diễn, tổ chức hoặc điều khiển dữ liệu. [TCVN 6695-1:2000].

4.2. Chức năng điều khiển: chức năng tác động đến việc ghi lưu, xử lí, truyền phát hoặc diễn đạt dữ liệu và có biểu diễn mã hóa bằng một hoặc một số octet.

4.3. Bit: chữ số 0 hoặc 1 dùng trong hệ đếm nhị phân. [TCVN 6695-1:2000].

4.4. Byte: một xâu bao gồm một số bit được xử lý như một đơn vị và thường biểu diễn cho một kí tự hoặc một bộ phận của kí tự. [TCVN 6695-1: 2000].

4.5. Octet: một byte chứa 8 bit; cụm 8. [TCVN 6695-1:2000].

4.6. Kí tự khả hiện: kí tự có hình dáng đồ họa ở dạng viết tay, dạng in hoặc hiển thị và không có chức năng điều khiển (những hình dáng đồ họa thể hiện trong tiêu chuẩn này là một minh họa ở dạng in).

4.7. Mã kí tự: giá trị số của một xâu các bit sắp xếp có thứ tự trong biểu diễn một kí tự mã hóa (mã kí tự trong tiêu chuẩn này có độ dài 16 bit và giá trị nằm trong khoảng từ 0000 đến FFFF theo cơ số 16).

4.8. Tập kí tự mã hóa: tập hợp những kí tự tuân theo các qui tắc thiết lập cấu trúc và quan hệ giữa từng kí tự trong đó với mã kí tự tương ứng.

4.9. Bộ mã kí tự: một hoặc một số tập kí tự mã hóa được xác định rõ ràng về thành phần cấu trúc và bảng mã của chúng.

4.10. Bảng mã: bảng trình bày các kí tự được sắp xếp trong các ô có tọa độ tương ứng với mã của chúng.

4.11. Kí tự dấu thanh: thành phần của nhóm kí tự dấu thanh điệu, có khả năng tổ hợp với một số kí tự nguyên âm thành những kí tự có thanh điệu khác.

4.12. Kí tự dấu nguyên âm: thành phần của nhóm kí tự dấu nguyên âm, có khả năng tổ hợp với một số kí tự nguyên âm (như A, E, O, U, a, e, o, u) thành những kí tự nguyên âm khác.

5. Các tập kí tự

Các tập kí tự được quy định trong tiêu chuẩn này bao gồm tập kí tự cơ bản và tập kí tự mở rộng.

5.1. Tập kí tự cơ bản

Tập kí tự cơ bản gồm 119 kí tự khả hiện nằm trong sáu nhóm: nhóm chữ cái, nhóm dấu thanh, nhóm dấu nguyên âm, nhóm chữ số, nhóm kí hiệu và nhóm dấu câu.

5.1.1. Nhóm chữ cái

Có 33 chữ cái, thể hiện 12 nguyên âm và 21 phụ âm cơ bản.

Mỗi chữ cái có hai dạng: chữ hoa và chữ thường.

Nhóm chữ cái bao gồm 33 chữ hoa và 33 chữ thường (xem bảng 1 và bảng 2).

Mô tả của những kí tự nói trên xem trong bảng 14.

Bảng 1 - Các kí tự nguyên âm

Chữ hoa

A

Ă

Â

E

Ê

I

O

Ô

Ơ

U

Ư

Y

Chữ thường

a

ă

â

e

ê

i

o

ô

ơ

u

ư

y

Bảng 2 - Các kí tự phụ âm

Chữ hoa

B

C

D

Đ

F

G

H

J

K

L

M

Chữ thường

b

c

d

đ

f

g

h

j

k

l

m

 

Chữ hoa

N

P

Q

R

S

T

V

W

X

Z

 

Chữ thường

n

p

q

r

s

t

v

w

x

z

 

5.1.2. Nhóm dấu thanh

Nhóm dấu thanh gồm có 5 kí tự (xem bảng 3), mô tả của những kí tự này xem trong bảng 14.

Bảng 3 - Các dấu thanh

Tiêu chuẩn Việt Nam TCVN 6909:2001 (ISO/IEC 10646-1 : 2000) về công nghệ thông tin - Bộ mã kí tự tiếng Việt 16-bit do Bộ Khoa học Công nghệ và Môi trường ban hành

5.1.3. Nhóm dấu nguyên âm

Nhóm dấu nguyên âm gồm 3 kí tự (xem bảng 4), mô tả của những kí tự này xem trong bảng 14.

Bảng 4 - Các dấu nguyên âm

Tiêu chuẩn Việt Nam TCVN 6909:2001 (ISO/IEC 10646-1 : 2000) về công nghệ thông tin - Bộ mã kí tự tiếng Việt 16-bit do Bộ Khoa học Công nghệ và Môi trường ban hành

5.1.4. Nhóm chữ số

Nhóm chữ số gồm có 10 kí tự (xem bảng 5), mô tả của những kí tự này xem trong bảng 14.

Bảng 5 - Các chữ số

0

1

2

3

4

5

6

7

8

9

5.1.5. Nhóm kí hiệu

Nhóm kí hiệu gồm có 20 kí tự (xem bảng 6), mô tả của những kí tự này xem trong bảng 14.

Bảng 6 - Các kí hiệu

#

$

%

&

*

+

-

/

=

@

\

^

_

|

̉

~

5.1.6. Nhóm dấu câu

Nhóm các dấu câu gồm có 15 kí tự (xem bảng 7), mô tả của những kí tự này xem trong bảng 14.

Bảng 7 - Các dấu câu

SP

!

(

)

,

.

:

;

?

[

]

{

}

5.2. Tập kí tự mở rộng

Tập kí tự mở rộng gồm có 120 kí tự nguyên âm mang dấu thanh (xem bảng 8).

Tập kí tự này gồm có 60 kí tự chữ hoa và 60 kí tự chữ thường. Mô tả của những kí tự này xem trong bảng 14.

Bảng 8 - Các kí tự nguyên âm mang dấu thanh

Chữ hoa

À

Ã

Á

Chữ thường

à

ã

á

 

Chữ hoa

È

É

Chữ thường

è

é

 

Chữ hoa

Ì

Ĩ

Í

Chữ thường

ế

ì

ĩ

í

 

Chữ hoa

Ò

Õ

Ó

Chữ thường

ò

õ

ó

 

Chữ hoa

Ù

Ũ

Ú

Chữ thường

ù

ũ

ú

 

Chữ hoa

Ý

Chữ thường

ý

6. Bộ mã và mô tả kí tự

6.1. Bộ mã kí tự tiếng Việt 16-bit được quy định trong năm bảng mã từ bảng 9 đến bảng 13.

6.2. Vị trí mỗi ô trong bảng mã được biểu thị bằng tọa độ (x, y) theo cơ số 16, trong đó x chỉ số cột và y chỉ số hàng; xy cũng là giá trị số (mã) của kí tự trong ô.

6.3. Mã và mô tả của các kí tự được qui định trong bảng 14.

Bảng 9 - Bảng mã kí tự trong vùng 0000 - 00FF

Tiêu chuẩn Việt Nam TCVN 6909:2001 (ISO/IEC 10646-1 : 2000) về công nghệ thông tin - Bộ mã kí tự tiếng Việt 16-bit do Bộ Khoa học Công nghệ và Môi trường ban hành

Bảng 10 - Bảng mã kí tự trong vùng 0100 - 01FF

Tiêu chuẩn Việt Nam TCVN 6909:2001 (ISO/IEC 10646-1 : 2000) về công nghệ thông tin - Bộ mã kí tự tiếng Việt 16-bit do Bộ Khoa học Công nghệ và Môi trường ban hành

Bảng 11 - Bảng mã kí tự trong vùng 0300 - 03FF

Tiêu chuẩn Việt Nam TCVN 6909:2001 (ISO/IEC 10646-1 : 2000) về công nghệ thông tin - Bộ mã kí tự tiếng Việt 16-bit do Bộ Khoa học Công nghệ và Môi trường ban hành

Bảng 12 - Bảng mã kí tự trong vùng 1E00 - 1EFF

Tiêu chuẩn Việt Nam TCVN 6909:2001 (ISO/IEC 10646-1 : 2000) về công nghệ thông tin - Bộ mã kí tự tiếng Việt 16-bit do Bộ Khoa học Công nghệ và Môi trường ban hành

Bảng 13 - Bảng mã kí tự trong vùng 2000 - 20FF

Tiêu chuẩn Việt Nam TCVN 6909:2001 (ISO/IEC 10646-1 : 2000) về công nghệ thông tin - Bộ mã kí tự tiếng Việt 16-bit do Bộ Khoa học Công nghệ và Môi trường ban hành

Bảng 14 - Bảng mô tả các kí tự

Kí tự

Mô tả kí tự

0020

SP

Dấu cách (SPACE)

0021

!

Dấu chấm than

0022

Dấu nháy kép

0023

#

Dấu rào

0024

$

Dấu đô la

0025

%

Dấu phần trăm

0026

&

Dấu và

0027

Dấu nháy đơn

0028

(

Dấu mở ngoặc đơn

0029

)

Dấu đóng ngoặc đơn

002A

*

Dấu hoa thị

002B

+

Dấu cộng

002C

,

Dấu phẩy

002D

-

Dấu trừ, dấu gạch ngang

002E

.

Dấu chấm

002F

/

Dấu chia, dấu sổ thuận

0030

0

Số không

0031

1

Số một

0032

2

Số hai

0033

3

Số ba

0034

4

Số bốn

0035

5

Số năm

0036

6

Số sáu

0037

7

Số bảy

0038

8

Số tám

0039

9

Số chín

003A

:

Dấu hai chấm

003B

;

Dấu chấm phẩy

003C

Dấu nhỏ hơn

003D

=

Dấu bằng

003E

Dấu lớn hơn

003F

?

Dấu chấm hỏi

0040

@

Dấu a còng

0041

A

Chữ A hoa

0042

B

Chữ B hoa

0043

C

Chữ C hoa

0044

D

Chữ D hoa

0045

E

Chữ E hoa

0046

F

Chữ F hoa

0047

G

Chữ G hoa

0048

H

Chữ H hoa

0049

I

Chữ I hoa

004A

J

Chữ J hoa

004B

K

Chữ K hoa

004C

L

Chữ L hoa

004D

M

Chữ M hoa

004E

N

Chữ N hoa

004F

O

Chữ O hoa

0050

P

Chữ P hoa

0051

Q

Chữ Q hoa

0052

R

Chữ R hoa

0053

S

Chữ S hoa

0054

T

Chữ T hoa

0055

U

Chữ U hoa

0056

V

Chữ V hoa

0057

W

Chữ W hoa

0058

X

Chữ X hoa

0059

Y

Chữ Y hoa

005A

Z

Chữ Z hoa

005B

[

Dấu mở ngoặc vuông

005C

\

Dấu sổ ngược

005D

]

Dấu đóng ngoặc vuông

005E

^

Dấu mũ

005F

_

Dấu gạch dưới

0060

`

Dấu trầm

0061

a

Chữ a thường

0062

b

Chữ b thường

0063

c

Chữ c thường

0064

d

Chữ d thường

0065

e

Chữ e thường

0066

f

Chữ f thường

0067

g

Chữ g thường

0068

h

Chữ h thường

0069

i

Chữ i thường

006A

j

Chữ j thường

006B

k

Chữ k thường

006C

l

Chữ l thường

006D

m

Chữ m thường

006E

n

Chữ n thường

006F

o

Chữ o thường

0070

p

Chữ p thường

0071

q

Chữ q thường

0072

r

Chữ r thường

0073

s

Chữ s thường

0074

t

Chữ t thường

0075

u

Chữ u thường

0076

v

Chữ v thường

0077

w

Chữ w thường

0078

x

Chữ x thường

0079

y

Chữ y thường

007A

z

Chữ z thường

007B

{

Dấu mở ngoặc nhọn

007C

|

Dấu sổ

007D

}

Dấu đóng ngoặc nhọn

007E

~

Dấu sóng

00A0

NBSP

Dấu cách phi dãn (NO - BREAK SPACE)

00C0

À

Chữ A hoa với dấu huyền

00C1

Á

Chữ A hoa với dấu sắc

00C2

Â

Chữ Â hoa

00C3

Ã

Chữ A hoa với dấu ngã

00C8

È

Chữ E hoa với dấu huyền

00C9

É

Chữ E hoa với dấu sắc

00CA

Ê

Chữ Ê hoa

00CC

Ì

Chữ I hoa với dấu huyền

00CD

Í

Chữ I hoa với dấu sắc

00D2

Ò

Chữ O hoa với dấu huyền

00D3

Ó

Chữ O hoa với dấu sắc

00D4

Ô

Chữ Ô hoa

00D5

Õ

Chữ O hoa với dấu ngã

00D9

Ù

Chữ U hoa với dấu huyền

00DA

Ú

Chữ U hoa với dấu sắc

00DD

Ý

Chữ Y hoa với dấu sắc

00E0

à

Chữ a thường với dấu huyền

00E1

á

Chữ a thường với dấu sắc

00E2

â

Chữ â thường

00E3

ã

Chữ a thường với dấu ngã

00E8

è

Chữ e thường với dấu huyền

00E9

é

Chữ e thường với dấu sắc

00EA

ê

Chữ ê thường

00EC

ì

Chữ i thường với dấu huyền

00ED

í

Chữ i thường với dấu sắc

00F2

ò

Chữ o thường với dấu huyền

00F3

ó

Chữ o thường với dấu sắc

00F4

ô

Chữ ô thường

00F5

õ

Chữ o thường với dấu ngã

00F9

ù

Chữ u thường với dấu huyền

00FA

ú

Chữ u thường với dấu sắc

00FD

ý

Chữ y thường với dấu sắc

0102

Ă

Chữ Ă hoa

0103

ă

Chữ ă thường

0110

Đ

Chữ Đ hoa

0111

đ

Chữ đ thường

0128

Ĩ

Chữ I hoa với dấu ngã

0129

ĩ

Chữ i thường với dấu ngã

0168

Ũ

Chữ U hoa với dấu ngã

0169

ũ

Chữ u thường với dấu ngã

01A0

Ơ

Chữ O hoa

01A1

ơ

Chữ ơ thường

01AF

Ư

Chữ Ư hoa

01B0

ư

Chữ ư thường

0300

Tiêu chuẩn Việt Nam TCVN 6909:2001 (ISO/IEC 10646-1 : 2000) về công nghệ thông tin - Bộ mã kí tự tiếng Việt 16-bit do Bộ Khoa học Công nghệ và Môi trường ban hành

Dấu huyền

0301

Tiêu chuẩn Việt Nam TCVN 6909:2001 (ISO/IEC 10646-1 : 2000) về công nghệ thông tin - Bộ mã kí tự tiếng Việt 16-bit do Bộ Khoa học Công nghệ và Môi trường ban hành

Dấu sắc

0302

Tiêu chuẩn Việt Nam TCVN 6909:2001 (ISO/IEC 10646-1 : 2000) về công nghệ thông tin - Bộ mã kí tự tiếng Việt 16-bit do Bộ Khoa học Công nghệ và Môi trường ban hành

Dấu nón

0303

Tiêu chuẩn Việt Nam TCVN 6909:2001 (ISO/IEC 10646-1 : 2000) về công nghệ thông tin - Bộ mã kí tự tiếng Việt 16-bit do Bộ Khoa học Công nghệ và Môi trường ban hành

Dấu ngã

0306

Tiêu chuẩn Việt Nam TCVN 6909:2001 (ISO/IEC 10646-1 : 2000) về công nghệ thông tin - Bộ mã kí tự tiếng Việt 16-bit do Bộ Khoa học Công nghệ và Môi trường ban hành

Dấu võng

0309

Tiêu chuẩn Việt Nam TCVN 6909:2001 (ISO/IEC 10646-1 : 2000) về công nghệ thông tin - Bộ mã kí tự tiếng Việt 16-bit do Bộ Khoa học Công nghệ và Môi trường ban hành

Dấu hỏi

031B

Tiêu chuẩn Việt Nam TCVN 6909:2001 (ISO/IEC 10646-1 : 2000) về công nghệ thông tin - Bộ mã kí tự tiếng Việt 16-bit do Bộ Khoa học Công nghệ và Môi trường ban hành

Dấu móc

0323

Tiêu chuẩn Việt Nam TCVN 6909:2001 (ISO/IEC 10646-1 : 2000) về công nghệ thông tin - Bộ mã kí tự tiếng Việt 16-bit do Bộ Khoa học Công nghệ và Môi trường ban hành

Dấu nặng

1EA0

Chữ A hoa với dấu nặng

1EA1

Chữ a thường với dấu nặng

1EA2

Chữ A hoa với dấu hỏi

1EA3

Chữ a thường với dấu hỏi

1EA4

Chữ Â hoa với dấu sắc

1EA5

Chữ â thường với dấu sắc

1EA6

Chữ Â hoa với dấu huyền

1EA7

Chữ â thường với dấu huyền

1EA8

Chữ Â hoa với dấu hỏi

1EA9

Chữ â thường với dấu hỏi

1EAA

Chữ Â hoa với dấu ngã

1EAB

Chữ â thường với dấu ngã

1EAC

Chữ Â hoa với dấu nặng

1EAD

Chữ â thường với dấu nặng

1EAE

Chữ Ă hoa với dấu sắc

1EAF

Chữ ă thường với dấu sắc

1EB0

Chữ Ă hoa với dấu huyền

1EB1

Chữ ă thường với dấu huyền

1EB2

Chữ Ă hoa với dấu hỏi

1EB3

Chữ ă thường với dấu hỏi

1EB4

Chữ Ă hoa với dấu ngã

1EB5

Chữ ă thường với dấu ngã

1EB6

Chữ Ă hoa với dấu nặng

1EB7

Chữ ă thường với dấu nặng

1EB8

Chữ E hoa với dấu nặng

1EB9

Chữ e thường với dấu nặng

1EBA

Chữ E hoa với dấu hỏi

1EBB

Chữ e thường với dấu hỏi

1EBC

Chữ E hoa với dấu ngã

1EBD

Chữ e thường với dấu ngã

1EBE

Chữ Ê hoa với dấu sắc

1EBF

ế

Chữ ê thường với dấu sắc

1EC0

Chữ Ê hoa với dấu huyền

1EC1

Chữ ê thường với dấu huyền

1EC2

Chữ Ê hoa với dấu hỏi

1EC3

Chữ ê thường với dấu hỏi

1EC4

Chữ Ê hoa với dấu ngã

1EC5

Chữ ê thường với dấu ngã

1EC6

Chữ Ê hoa với dấu nặng

1EC7

Chữ ê thường với dấu nặng

1EC8

Chữ I hoa với dấu hỏi

1EC9

Chữ i thường với dấu hỏi

1ECA

Chữ I hoa với dấu nặng

1ECB

Chữ i thường với dấu nặng

1ECC

Chữ O hoa với dấu nặng

1ECD

Chữ o thường với dấu nặng

1ECE

Chữ O hoa với dấu hỏi

1ECF

Chữ o thường với dấu hỏi

1ED0

Chữ Ô hoa với dấu sắc

1ED1

Chữ ô thường với dấu sắc

1ED2

Chữ Ô hoa với dấu huyền

1ED3

Chữ ô thường với dấu huyền

1ED4

Chữ Ô hoa với dấu hỏi

1ED5

Chữ ô thường với dấu hỏi

1ED6

Chữ Ô hoa với dấu ngã

1ED7

Chữ ô thường với dấu ngã

1ED8

Chữ Ô hoa với dấu nặng

1ED9

Chữ ô thường với dấu nặng

1EDA

Chữ Ơ hoa với dấu sắc

1EDB

Chữ ơ thường với dấu sắc

1EDC

Chữ Ơ hoa với dấu huyền

1EDD

Chữ ơ thường với dấu huyền

1EDE

Chữ Ơ hoa với dấu hỏi

1EDF

Chữ ơ thường với dấu hỏi

1EE0

Chữ Ơ hoa với dấu ngã

1EE1

Chữ ơ thường với dấu ngã

1EE2

Chữ Ơ hoa với dấu nặng

1EE3

Chữ ơ thường với dấu nặng

1EE4

Chữ U hoa với dấu nặng

1EE5

Chữ u thường với dấu nặng

1EE6

Chữ U hoa với dấu hỏi

1EE7

Chữ u thường với dấu hỏi

1EE8

Chữ Ư hoa với dấu sắc

1EE9

Chữ ư thường với dấu sắc

1EEA

Chữ Ư hoa với dấu huyền

1EEB

Chữ ư thường với dấu huyền

1EEC

Chữ Ư hoa với dấu hỏi

1EED

Chữ ư thường với dấu hỏi

1EEE

Chữ Ư hoa với dấu ngã

1EEF

Chữ ư thường với dấu ngã

1EF0

Chữ Ư hoa với dấu nặng

1EF1

Chữ ư thường với dấu nặng

1EF2

Chữ Y hoa với dấu huyền

1EF3

Chữ y thường với dấu huyền

1EF4

Chữ Y hoa với dấu nặng

1EF5

Chữ y thường với dấu nặng

1EF6

Chữ Y hoa với dấu hỏi

1EF7

Chữ y thường với dấu hỏi

1EF8

Chữ Y hoa với dấu ngã

1EF9

Chữ y thường với dấu ngã

201C

Dấu mở ngoặc kép

201D

Dấu đóng ngoặc kép