]> gitweb.factorcode.org Git - factor.git/blob - basis/xml/char-classes/char-classes.factor
Making XML 30% faster
[factor.git] / basis / xml / char-classes / char-classes.factor
1 ! Copyright (C) 2005, 2009 Daniel Ehrenberg
2 ! See http://factorcode.org/license.txt for BSD license.
3 USING: kernel sequences unicode.syntax math math.order combinators
4 hints ;
5 IN: xml.char-classes
6
7 CATEGORY: 1.0name-start* Ll Lu Lo Lt Nl \u000559\u0006E5\u0006E6_: ;
8 : 1.0name-start? ( char -- ? )
9     dup 1.0name-start*? [ drop t ] 
10     [ HEX: 2BB HEX: 2C1 between? ] if ;
11
12 CATEGORY: 1.0name-char Ll Lu Lo Lt Nl Mc Me Mn Lm Nd _-.\u000387: ;
13
14 CATEGORY: 1.1name-start Ll Lu Lo Lm Ln Nl _: ;
15
16 CATEGORY: 1.1name-char Ll Lu Lo Lm Ln Nl Mc Mn Nd Pc Cf _-.\u0000b7: ;
17
18 : name-start? ( 1.0? char -- ? )
19     swap [ 1.0name-start? ] [ 1.1name-start? ] if ;
20
21 : name-char? ( 1.0? char -- ? )
22     swap [ 1.0name-char? ] [ 1.1name-char? ] if ;
23
24 : text? ( 1.0? char -- ? )
25     ! 1.0:
26     ! #x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD] | [#x10000-#x10FFFF]
27     ! 1.1:
28     ! [#x1-#xD7FF] | [#xE000-#xFFFD] | [#x10000-#x10FFFF]
29     {
30         { [ dup HEX: 20 < ] [ swap [ "\t\r\n" member? ] [ zero? not ] if ] }
31         { [ nip dup HEX: D800 < ] [ drop t ] }
32         { [ dup HEX: E000 < ] [ drop f ] }
33         [ { HEX: FFFE HEX: FFFF } member? not ]
34     } cond ;
35
36 HINTS: text? { object fixnum } ;