Delete empty unit tests files, remove 1- and 1+, reorder IN: lines in a lot of places...

[factor.git] / extra / sequence-parser / sequence-parser.factor
diff --git a/extra/sequence-parser/sequence-parser.factor b/extra/sequence-parser/sequence-parser.factor

index 4f57a7ccae1600b94de7b3ca8af47dd0e9465b6c..d14a77057f9bdb75988168b98aff8906da5b6314 100644 (file)
--- a/extra/sequence-parser/sequence-parser.factor
+++ b/extra/sequence-parser/sequence-parser.factor
@@ -1,9 +1,8 @@
  ! Copyright (C) 2005, 2009 Daniel Ehrenberg, Doug Coleman.
  ! See http://factorcode.org/license.txt for BSD license.
-USING: namespaces math kernel sequences accessors fry circular
-unicode.case unicode.categories locals combinators.short-circuit
-make combinators io splitting math.parser math.ranges
-generalizations sorting.functor math.order sorting.slots ;
+USING: accessors circular combinators.short-circuit fry io
+kernel locals math math.order sequences sorting.functor
+sorting.slots unicode.categories ;
  IN: sequence-parser
  
  TUPLE: sequence-parser sequence n ;
@@ -35,6 +34,8 @@ TUPLE: sequence-parser sequence n ;
  : advance* ( sequence-parser -- )
      advance drop ; inline
  
+: next ( sequence-parser -- obj ) [ current ] [ advance* ] bi ;
+
  : get+increment ( sequence-parser -- char/f )
      [ current ] [ advance drop ] bi ; inline
  
@@ -52,7 +53,7 @@ TUPLE: sequence-parser sequence n ;
      ] [
          [ drop n>> ]
          [ skip-until ]
-        [ drop [ n>> ] [ sequence>> ] bi ] 2tri subseq
+        [ drop [ n>> ] [ sequence>> ] bi ] 2tri subseq f like
      ] if ; inline
  
  : take-while ( sequence-parser quot: ( obj -- ? ) -- sequence/f )
@@ -87,7 +88,7 @@ TUPLE: sequence-parser sequence n ;
      ] take-until :> found
      growing sequence sequence= [
          found dup length
-        growing length 1- - head
+        growing length 1 - - head
          sequence-parser [ growing length - 1 + ] change-n drop
          ! sequence-parser advance drop
      ] [
@@ -104,12 +105,15 @@ TUPLE: sequence-parser sequence n ;
  : skip-whitespace ( sequence-parser -- sequence-parser )
      [ [ current blank? not ] take-until drop ] keep ;
  
+: skip-whitespace-eol ( sequence-parser -- sequence-parser )
+    [ [ current " \t\r" member? not ] take-until drop ] keep ;
+
  : take-rest-slice ( sequence-parser -- sequence/f )
      [ sequence>> ] [ n>> ] bi
      2dup [ length ] dip < [ 2drop f ] [ tail-slice ] if ; inline
  
  : take-rest ( sequence-parser -- sequence )
-    [ take-rest-slice ] [ sequence>> like ] bi ;
+    [ take-rest-slice ] [ sequence>> like ] bi f like ;
  
  : take-until-object ( sequence-parser obj -- sequence )
      '[ current _ = ] take-until ;
@@ -117,113 +121,28 @@ TUPLE: sequence-parser sequence n ;
  : parse-sequence ( sequence quot -- )
      [ <sequence-parser> ] dip call ; inline
  
-:: take-quoted-string ( sequence-parser escape-char quote-char -- string )
-    sequence-parser n>> :> start-n
-    sequence-parser advance
-    [
-        {
-            [ { [ previous escape-char = ] [ current quote-char = ] } 1&& ]
-            [ current quote-char = not ]
-        } 1||
-    ] take-while :> string
-    sequence-parser current quote-char = [
-        sequence-parser advance* string
-    ] [
-        start-n sequence-parser (>>n) f
-    ] if ;
-
-: (take-token) ( sequence-parser -- string )
-    skip-whitespace [ current { [ blank? ] [ f = ] } 1|| ] take-until ;
-
-:: take-token* ( sequence-parser escape-char quote-char -- string/f )
-    sequence-parser skip-whitespace
-    dup current {
-        { quote-char [ escape-char quote-char take-quoted-string ] }
-        { f [ drop f ] }
-        [ drop (take-token) ]
-    } case ;
-
-: take-token ( sequence-parser -- string/f )
-    CHAR: \ CHAR: " take-token* ;
-
  : take-integer ( sequence-parser -- n/f )
      [ current digit? ] take-while ;
  
  :: take-n ( sequence-parser n -- seq/f )
      n sequence-parser [ n>> + ] [ sequence>> length ] bi > [
-        f
+        sequence-parser take-rest
      ] [
          sequence-parser n>> dup n + sequence-parser sequence>> subseq
          sequence-parser [ n + ] change-n drop
      ] if ;
  
-: take-c-comment ( sequence-parser -- seq/f )
-    [
-        dup "/*" take-sequence [
-            "*/" take-until-sequence*
-        ] [
-            drop f
-        ] if
-    ] with-sequence-parser ;
-
-: take-c++-comment ( sequence-parser -- seq/f )
-    [
-        dup "//" take-sequence [
-            [
-                [
-                    { [ current CHAR: \n = ] [ sequence-parse-end? ] } 1||
-                ] take-until
-            ] [
-                advance drop
-            ] bi
-        ] [
-            drop f
-        ] if
-    ] with-sequence-parser ;
-
-: c-identifier-begin? ( ch -- ? )
-    CHAR: a CHAR: z [a,b]
-    CHAR: A CHAR: Z [a,b]
-    { CHAR: _ } 3append member? ;
-
-: c-identifier-ch? ( ch -- ? )
-    CHAR: a CHAR: z [a,b]
-    CHAR: A CHAR: Z [a,b]
-    CHAR: 0 CHAR: 9 [a,b]
-    { CHAR: _ } 4 nappend member? ;
-
-: take-c-identifier ( state-parser -- string/f )
-    [
-        dup current c-identifier-begin? [
-            [ current c-identifier-ch? ] take-while
-        ] [
-            drop f
-        ] if
-    ] with-sequence-parser ;
-
  << "length" [ length ] define-sorting >>
  
  : sort-tokens ( seq -- seq' )
      { length>=< <=> } sort-by ;
  
-: take-first-matching ( state-parser seq -- seq )
+: take-first-matching ( sequence-parser seq -- seq )
      swap
      '[ _ [ swap take-sequence ] with-sequence-parser ] find nip ;
  
-
-: take-longest ( state-parser seq -- seq )
+: take-longest ( sequence-parser seq -- seq )
      sort-tokens take-first-matching ;
  
-: take-c-integer ( state-parser -- string/f )
-    [
-        dup take-integer [
-            swap
-            { "ull" "uLL" "Ull" "ULL" "ll" "LL" "l" "L" "u" "U" }
-            take-longest [ append ] when*
-        ] [
-            drop f
-        ] if*
-    ] with-sequence-parser ;
-
  : write-full ( sequence-parser -- ) sequence>> write ;
  : write-rest ( sequence-parser -- ) take-rest write ;