]> gitweb.factorcode.org Git - factor.git/blob - basis/csv/csv.factor
factor: trim using lists
[factor.git] / basis / csv / csv.factor
1 ! Copyright (C) 2007, 2008 Phil Dawes, 2013 John Benediktsson
2 ! See http://factorcode.org/license.txt for BSD license.
3 USING: combinators io io.files io.streams.string kernel make
4 math namespaces sequences sequences.private unicode ;
5 IN: csv
6
7 SYMBOL: delimiter
8
9 CHAR: , delimiter set-global
10
11 <PRIVATE
12
13 MEMO: field-delimiters ( delimiter -- field-seps quote-seps )
14     [ "\r\n" swap prefix ] [ "\r\"\n" swap prefix ] bi ; inline
15
16 DEFER: quoted-field,
17
18 : maybe-escaped-quote ( delimeter stream quoted? -- delimiter stream sep/f )
19     2over stream-read1 tuck =
20     [ nip ] [
21         {
22             { CHAR: \"    [ [ CHAR: \" , ] when quoted-field, ] }
23             { CHAR: \n   [ ] } ! Error: cr inside string?
24             { CHAR: \r   [ ] } ! Error: lf inside string?
25             [ [ , drop f maybe-escaped-quote ] when* ]
26         } case
27      ] if ; inline recursive
28
29 : quoted-field, ( delimiter stream -- delimiter stream sep/f )
30     "\"" over stream-read-until drop % t maybe-escaped-quote ;
31
32 : quoted-field ( delimiter stream -- sep/f field )
33     [ quoted-field, 2nip ] "" make ;
34
35 : ?trim ( string -- string' )
36     dup length [ drop "" ] [
37         over first-unsafe unicode:blank?
38         [ drop t ] [ 1 - over nth-unsafe unicode:blank? ] if
39         [ [ unicode:blank? ] trim ] when
40     ] if-zero ; inline
41
42 : continue-field ( delimiter stream field-seps seq -- sep/f field )
43     swap rot stream-read-until [ "\"" glue ] dip
44     swap ?trim nipd ; inline
45
46 : field ( delimiter stream field-seps quote-seps -- sep/f field )
47     pick stream-read-until dup CHAR: \" = [
48         drop [ drop quoted-field ] [ continue-field ] if-empty
49     ] [ 3nipd swap ?trim ] if ;
50
51 : (stream-read-row) ( delimiter stream field-end quoted-field -- sep/f fields )
52     [ [ dup '[ dup _ = ] ] keep ] 3dip
53     '[ drop _ _ _ _ field ] produce ; inline
54
55 : (stream-read-csv) ( stream -- )
56     [ dup [ empty? ] all? [ drop ] [ , ] if ]
57     delimiter get rot over field-delimiters
58     '[ _ _ _ _ (stream-read-row) ] do while ;
59
60 PRIVATE>
61
62 : stream-read-row ( stream -- row )
63     delimiter get tuck field-delimiters
64     (stream-read-row) nip ; inline
65
66 : read-row ( -- row )
67     input-stream get stream-read-row ; inline
68
69 : stream-read-csv ( stream -- rows )
70     [ (stream-read-csv) ] { } make
71     dup ?last { "" } = [ but-last ] when ; inline
72
73 : read-csv ( -- rows )
74     input-stream get stream-read-csv ; inline
75
76 : string>csv ( string -- csv )
77     [ read-csv ] with-string-reader ;
78
79 : file>csv ( path encoding -- csv )
80     [ read-csv ] with-file-reader ;
81
82 : with-delimiter ( ch quot -- )
83     [ delimiter ] dip with-variable ; inline
84
85 <PRIVATE
86
87 : needs-escaping? ( cell delimiter -- ? )
88     '[ dup "\n\"\r" member? [ drop t ] [ _ = ] if ] any? ; inline
89
90 : escape-quotes ( cell stream -- )
91     CHAR: \" over stream-write1 swap [
92         [ over stream-write1 ]
93         [ dup CHAR: \" = [ over stream-write1 ] [ drop ] if ] bi
94     ] each CHAR: \" swap stream-write1 ;
95
96 : escape-if-required ( cell delimiter stream -- )
97     [ dupd needs-escaping? ] dip
98     [ escape-quotes ] [ stream-write ] bi-curry if ; inline
99
100 : (stream-write-row) ( row delimiter stream -- )
101     [ '[ _ _ stream-write1 ] ] 2keep
102     '[ _ _ escape-if-required ] interleave nl ; inline
103
104 PRIVATE>
105
106 : stream-write-row ( row stream -- )
107     delimiter get swap (stream-write-row) ; inline
108
109 : write-row ( row -- )
110     output-stream get stream-write-row ; inline
111
112 : stream-write-csv ( rows stream -- )
113     delimiter get swap '[ _ _ (stream-write-row) ] each ;
114
115 : write-csv ( rows -- )
116     output-stream get stream-write-csv ;
117
118 : csv>string ( csv -- string )
119     [ write-csv ] with-string-writer ;
120
121 : csv>file ( rows path encoding -- )
122     [ write-csv ] with-file-writer ;