]> gitweb.factorcode.org Git - factor.git/blob - basis/unicode/unicode-docs.factor
vm: fix arm files
[factor.git] / basis / unicode / unicode-docs.factor
1 USING: help.markup help.syntax strings ;
2 IN: unicode
3
4 ARTICLE: "unicode" "Unicode support"
5 "The " { $vocab-link "unicode" } " vocabulary and its sub-vocabularies implement support for the Unicode 14.0 character set."
6 $nl
7 "The Unicode character set contains most of the world's writing systems. Unicode is intended as a replacement for, and is a superset of, such legacy character sets as ASCII, Latin1, MacRoman, and so on. Unicode characters are called " { $emphasis "code points" } "; Factor's " { $link "strings" } " are sequences of code points."
8 $nl
9 "The Unicode character set is accompanied by several standard algorithms for common operations like encoding text in files, capitalizing a string, finding the boundaries between words, and so on."
10 $nl
11 "The Unicode algorithms implemented by the " { $vocab-link "unicode" } " vocabulary are:"
12 { $vocab-subsections
13     { "Case mapping" "unicode.case" }
14     { "Collation and weak comparison" "unicode.collation" }
15     { "Character classes" "unicode.categories" }
16     { "Word and grapheme breaks" "unicode.breaks" }
17     { "Unicode normalization" "unicode.normalize" }
18 }
19 "The following are mostly for internal use:"
20 { $vocab-subsections
21     { "Unicode category syntax" "unicode.categories" }
22     { "Unicode data tables" "unicode.data" }
23 }
24 { $see-also "ascii" "io.encodings" } ;
25
26 ABOUT: "unicode"