Unicode

Unicode語系字碼分佈表

討論區: 
0000-007F C0 Control and Basic Latin, 標準ANSI字元
0080-00FF C1 Control and Latin-1 Supplement, 控制碼與拉丁文
0100-024F Latin Extended, 拉丁文
0250-02AF IPA Extensions, 拉丁文
02B0-02FF Spacing Modifier Letters, 符號
0300-036F Combining Diacritical Marks, 組合記號
0370-03FF Greek and Coptic, 希臘文與科普特文
0400-052F Cyrillic, 西里爾文
0530-058F Armenian, 亞美尼亞文
0590-05FF Hebrew, 希伯來文
0600-06FF Arabic, 阿拉伯文
0700-074F Syriac, 敘利亞文

Unicode 相關事項

討論區: 
UnicodeString 和 AnsiString 都是如上的結構,儘管 UnicodeString 包含是雙位元組資料,AnsiString 包含的是單字節的。

用 Object Pascal 語言來描述 UnicodeString 的結構,應該是這樣:

type
 StrRec = record
   CodePage: Word;
   ElemSize: Word;
   refCount: Integer;
   Len: Integer;
   case Integer of
     1: array[0..0] of AnsiChar;
Subscribe to RSS - Unicode
Free Web Hosting