]> gitweb.factorcode.org Git - factor.git/blob - basis/unicode/UCD/PropertyAliases.txt
unicode: Update to 11.0
[factor.git] / basis / unicode / UCD / PropertyAliases.txt
1 # PropertyAliases-12.1.0.txt
2 # Date: 2019-03-10, 10:53:18 GMT
3 # © 2019 Unicode®, Inc.
4 # Unicode and the Unicode Logo are registered trademarks of Unicode, Inc. in the U.S. and other countries.
5 # For terms of use, see http://www.unicode.org/terms_of_use.html
6 #
7 # Unicode Character Database
8 #   For documentation, see http://www.unicode.org/reports/tr44/
9 #
10 # This file contains aliases for properties used in the UCD.
11 # These names can be used for XML formats of UCD data, for regular-expression
12 # property tests, and other programmatic textual descriptions of Unicode data.
13 #
14 # The names may be translated in appropriate environments, and additional
15 # aliases may be useful.
16 #
17 # FORMAT
18 #
19 # Each line has two or more fields, separated by semicolons.
20 #
21 # First Field: The first field is the short name for the property.
22 # It is typically an abbreviation, but in a number of cases it is simply
23 # a duplicate of the "long name" in the second field.
24 # For Unihan database tags, the short name is actually a longer string than
25 # the tag specified in the second field.
26 #
27 # Second Field: The second field is the long name for the property,
28 # typically the formal name used in documentation about the property.
29 #
30 # The above are the preferred aliases. Other aliases may be listed in additional fields.
31 #
32 # Loose matching should be applied to all property names and property values, with
33 # the exception of String Property values. With loose matching of property names and
34 # values, the case distinctions, whitespace, and '_' are ignored. For Numeric Property
35 # values, numeric equivalencies are applied: thus "01.00" is equivalent to "1".
36 #
37 # NOTE: Property value names are NOT unique across properties. For example:
38 #
39 #   AL means Arabic Letter for the Bidi_Class property, and
40 #   AL means Above_Left for the Combining_Class property, and
41 #   AL means Alphabetic for the Line_Break property.
42 #
43 # In addition, some property names may be the same as some property value names.
44 # For example:
45 #
46 #   sc means the Script property, and
47 #   Sc means the General_Category property value Currency_Symbol (Sc)
48 #
49 # The combination of property value and property name is, however, unique.
50 #
51 # For more information, see UAX #44, Unicode Character Database, and
52 # UTS #18, Unicode Regular Expressions.
53 # ================================================
54
55
56 # ================================================
57 # Numeric Properties
58 # ================================================
59 cjkAccountingNumeric     ; kAccountingNumeric
60 cjkOtherNumeric          ; kOtherNumeric
61 cjkPrimaryNumeric        ; kPrimaryNumeric
62 nv                       ; Numeric_Value
63
64 # ================================================
65 # String Properties
66 # ================================================
67 cf                       ; Case_Folding
68 cjkCompatibilityVariant  ; kCompatibilityVariant
69 dm                       ; Decomposition_Mapping
70 FC_NFKC                  ; FC_NFKC_Closure
71 lc                       ; Lowercase_Mapping
72 NFKC_CF                  ; NFKC_Casefold
73 scf                      ; Simple_Case_Folding         ; sfc
74 slc                      ; Simple_Lowercase_Mapping
75 stc                      ; Simple_Titlecase_Mapping
76 suc                      ; Simple_Uppercase_Mapping
77 tc                       ; Titlecase_Mapping
78 uc                       ; Uppercase_Mapping
79
80 # ================================================
81 # Miscellaneous Properties
82 # ================================================
83 bmg                      ; Bidi_Mirroring_Glyph
84 bpb                      ; Bidi_Paired_Bracket
85 cjkIICore                ; kIICore
86 cjkIRG_GSource           ; kIRG_GSource
87 cjkIRG_HSource           ; kIRG_HSource
88 cjkIRG_JSource           ; kIRG_JSource
89 cjkIRG_KPSource          ; kIRG_KPSource
90 cjkIRG_KSource           ; kIRG_KSource
91 cjkIRG_MSource           ; kIRG_MSource
92 cjkIRG_TSource           ; kIRG_TSource
93 cjkIRG_USource           ; kIRG_USource
94 cjkIRG_VSource           ; kIRG_VSource
95 cjkRSUnicode             ; kRSUnicode                  ; Unicode_Radical_Stroke; URS
96 EqUIdeo                  ; Equivalent_Unified_Ideograph
97 isc                      ; ISO_Comment
98 JSN                      ; Jamo_Short_Name
99 na                       ; Name
100 na1                      ; Unicode_1_Name
101 Name_Alias               ; Name_Alias
102 scx                      ; Script_Extensions
103
104 # ================================================
105 # Catalog Properties
106 # ================================================
107 age                      ; Age
108 blk                      ; Block
109 sc                       ; Script
110
111 # ================================================
112 # Enumerated Properties
113 # ================================================
114 bc                       ; Bidi_Class
115 bpt                      ; Bidi_Paired_Bracket_Type
116 ccc                      ; Canonical_Combining_Class
117 dt                       ; Decomposition_Type
118 ea                       ; East_Asian_Width
119 gc                       ; General_Category
120 GCB                      ; Grapheme_Cluster_Break
121 hst                      ; Hangul_Syllable_Type
122 InPC                     ; Indic_Positional_Category
123 InSC                     ; Indic_Syllabic_Category
124 jg                       ; Joining_Group
125 jt                       ; Joining_Type
126 lb                       ; Line_Break
127 NFC_QC                   ; NFC_Quick_Check
128 NFD_QC                   ; NFD_Quick_Check
129 NFKC_QC                  ; NFKC_Quick_Check
130 NFKD_QC                  ; NFKD_Quick_Check
131 nt                       ; Numeric_Type
132 SB                       ; Sentence_Break
133 vo                       ; Vertical_Orientation
134 WB                       ; Word_Break
135
136 # ================================================
137 # Binary Properties
138 # ================================================
139 AHex                     ; ASCII_Hex_Digit
140 Alpha                    ; Alphabetic
141 Bidi_C                   ; Bidi_Control
142 Bidi_M                   ; Bidi_Mirrored
143 Cased                    ; Cased
144 CE                       ; Composition_Exclusion
145 CI                       ; Case_Ignorable
146 Comp_Ex                  ; Full_Composition_Exclusion
147 CWCF                     ; Changes_When_Casefolded
148 CWCM                     ; Changes_When_Casemapped
149 CWKCF                    ; Changes_When_NFKC_Casefolded
150 CWL                      ; Changes_When_Lowercased
151 CWT                      ; Changes_When_Titlecased
152 CWU                      ; Changes_When_Uppercased
153 Dash                     ; Dash
154 Dep                      ; Deprecated
155 DI                       ; Default_Ignorable_Code_Point
156 Dia                      ; Diacritic
157 Ext                      ; Extender
158 Gr_Base                  ; Grapheme_Base
159 Gr_Ext                   ; Grapheme_Extend
160 Gr_Link                  ; Grapheme_Link
161 Hex                      ; Hex_Digit
162 Hyphen                   ; Hyphen
163 IDC                      ; ID_Continue
164 Ideo                     ; Ideographic
165 IDS                      ; ID_Start
166 IDSB                     ; IDS_Binary_Operator
167 IDST                     ; IDS_Trinary_Operator
168 Join_C                   ; Join_Control
169 LOE                      ; Logical_Order_Exception
170 Lower                    ; Lowercase
171 Math                     ; Math
172 NChar                    ; Noncharacter_Code_Point
173 OAlpha                   ; Other_Alphabetic
174 ODI                      ; Other_Default_Ignorable_Code_Point
175 OGr_Ext                  ; Other_Grapheme_Extend
176 OIDC                     ; Other_ID_Continue
177 OIDS                     ; Other_ID_Start
178 OLower                   ; Other_Lowercase
179 OMath                    ; Other_Math
180 OUpper                   ; Other_Uppercase
181 Pat_Syn                  ; Pattern_Syntax
182 Pat_WS                   ; Pattern_White_Space
183 PCM                      ; Prepended_Concatenation_Mark
184 QMark                    ; Quotation_Mark
185 Radical                  ; Radical
186 RI                       ; Regional_Indicator
187 SD                       ; Soft_Dotted
188 STerm                    ; Sentence_Terminal
189 Term                     ; Terminal_Punctuation
190 UIdeo                    ; Unified_Ideograph
191 Upper                    ; Uppercase
192 VS                       ; Variation_Selector
193 WSpace                   ; White_Space                 ; space
194 XIDC                     ; XID_Continue
195 XIDS                     ; XID_Start
196 XO_NFC                   ; Expands_On_NFC
197 XO_NFD                   ; Expands_On_NFD
198 XO_NFKC                  ; Expands_On_NFKC
199 XO_NFKD                  ; Expands_On_NFKD
200
201 # ================================================
202 # Total:    121
203
204 # EOF