]> gitweb.factorcode.org Git - factor.git/commitdiff
io.encodings.8-bit: more encodings, and reduce hierarchy.
authorJohn Benediktsson <mrjbq7@gmail.com>
Mon, 26 Feb 2018 18:21:35 +0000 (10:21 -0800)
committerJohn Benediktsson <mrjbq7@gmail.com>
Mon, 26 Feb 2018 18:21:35 +0000 (10:21 -0800)
120 files changed:
basis/ftp/server/server.factor
basis/http/client/client-docs.factor
basis/http/http-tests.factor
basis/io/encodings/8-bit/8-bit-docs.factor
basis/io/encodings/8-bit/8-bit-tests.factor
basis/io/encodings/8-bit/8-bit.factor
basis/io/encodings/8-bit/CP1026.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/CP500.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/CP737.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/CP775.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/CP850.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/CP852.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/CP855.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/CP857.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/CP860.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/CP861.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/CP862.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/CP863.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/CP864.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/CP865.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/CP866.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/CP869.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/CP874.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/CP875.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/CYRILLIC.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/GREEK.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/ICELAND.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/LATIN2.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/TURKISH.TXT [new file with mode: 0644]
basis/io/encodings/8-bit/arabic/arabic-docs.factor [deleted file]
basis/io/encodings/8-bit/arabic/arabic.factor [deleted file]
basis/io/encodings/8-bit/arabic/authors.txt [deleted file]
basis/io/encodings/8-bit/cp437/authors.txt [deleted file]
basis/io/encodings/8-bit/cp437/cp437-docs.factor [deleted file]
basis/io/encodings/8-bit/cp437/cp437.factor [deleted file]
basis/io/encodings/8-bit/cyrillic/authors.txt [deleted file]
basis/io/encodings/8-bit/cyrillic/cyrillic-docs.factor [deleted file]
basis/io/encodings/8-bit/cyrillic/cyrillic.factor [deleted file]
basis/io/encodings/8-bit/ebcdic/authors.txt [deleted file]
basis/io/encodings/8-bit/ebcdic/ebcdic-docs.factor [deleted file]
basis/io/encodings/8-bit/ebcdic/ebcdic.factor [deleted file]
basis/io/encodings/8-bit/greek/authors.txt [deleted file]
basis/io/encodings/8-bit/greek/greek-docs.factor [deleted file]
basis/io/encodings/8-bit/greek/greek.factor [deleted file]
basis/io/encodings/8-bit/hebrew/authors.txt [deleted file]
basis/io/encodings/8-bit/hebrew/hebrew-docs.factor [deleted file]
basis/io/encodings/8-bit/hebrew/hebrew.factor [deleted file]
basis/io/encodings/8-bit/koi8-r/authors.txt [deleted file]
basis/io/encodings/8-bit/koi8-r/koi8-r-docs.factor [deleted file]
basis/io/encodings/8-bit/koi8-r/koi8-r.factor [deleted file]
basis/io/encodings/8-bit/latin1/authors.txt [deleted file]
basis/io/encodings/8-bit/latin1/latin1-docs.factor [deleted file]
basis/io/encodings/8-bit/latin1/latin1.factor [deleted file]
basis/io/encodings/8-bit/latin10/authors.txt [deleted file]
basis/io/encodings/8-bit/latin10/latin10-docs.factor [deleted file]
basis/io/encodings/8-bit/latin10/latin10.factor [deleted file]
basis/io/encodings/8-bit/latin2/authors.txt [deleted file]
basis/io/encodings/8-bit/latin2/latin2-docs.factor [deleted file]
basis/io/encodings/8-bit/latin2/latin2.factor [deleted file]
basis/io/encodings/8-bit/latin3/authors.txt [deleted file]
basis/io/encodings/8-bit/latin3/latin3-docs.factor [deleted file]
basis/io/encodings/8-bit/latin3/latin3.factor [deleted file]
basis/io/encodings/8-bit/latin4/authors.txt [deleted file]
basis/io/encodings/8-bit/latin4/latin4-docs.factor [deleted file]
basis/io/encodings/8-bit/latin4/latin4.factor [deleted file]
basis/io/encodings/8-bit/latin5/authors.txt [deleted file]
basis/io/encodings/8-bit/latin5/latin5-docs.factor [deleted file]
basis/io/encodings/8-bit/latin5/latin5.factor [deleted file]
basis/io/encodings/8-bit/latin6/authors.txt [deleted file]
basis/io/encodings/8-bit/latin6/latin6-docs.factor [deleted file]
basis/io/encodings/8-bit/latin6/latin6.factor [deleted file]
basis/io/encodings/8-bit/latin7/authors.txt [deleted file]
basis/io/encodings/8-bit/latin7/latin7-docs.factor [deleted file]
basis/io/encodings/8-bit/latin7/latin7.factor [deleted file]
basis/io/encodings/8-bit/latin8/authors.txt [deleted file]
basis/io/encodings/8-bit/latin8/latin8-docs.factor [deleted file]
basis/io/encodings/8-bit/latin8/latin8.factor [deleted file]
basis/io/encodings/8-bit/latin9/authors.txt [deleted file]
basis/io/encodings/8-bit/latin9/latin9-docs.factor [deleted file]
basis/io/encodings/8-bit/latin9/latin9.factor [deleted file]
basis/io/encodings/8-bit/mac-roman/authors.txt [deleted file]
basis/io/encodings/8-bit/mac-roman/mac-roman-docs.factor [deleted file]
basis/io/encodings/8-bit/mac-roman/mac-roman.factor [deleted file]
basis/io/encodings/8-bit/thai/authors.txt [deleted file]
basis/io/encodings/8-bit/thai/thai-docs.factor [deleted file]
basis/io/encodings/8-bit/thai/thai.factor [deleted file]
basis/io/encodings/8-bit/windows-1250/authors.txt [deleted file]
basis/io/encodings/8-bit/windows-1250/windows-1250.factor [deleted file]
basis/io/encodings/8-bit/windows-1251/authors.txt [deleted file]
basis/io/encodings/8-bit/windows-1251/windows-1251.factor [deleted file]
basis/io/encodings/8-bit/windows-1252/authors.txt [deleted file]
basis/io/encodings/8-bit/windows-1252/windows-1252-docs.factor [deleted file]
basis/io/encodings/8-bit/windows-1252/windows-1252.factor [deleted file]
basis/io/encodings/8-bit/windows-1253/authors.txt [deleted file]
basis/io/encodings/8-bit/windows-1253/windows-1253.factor [deleted file]
basis/io/encodings/8-bit/windows-1254/authors.txt [deleted file]
basis/io/encodings/8-bit/windows-1254/windows-1254.factor [deleted file]
basis/io/encodings/8-bit/windows-1255/authors.txt [deleted file]
basis/io/encodings/8-bit/windows-1255/windows-1255.factor [deleted file]
basis/io/encodings/8-bit/windows-1256/authors.txt [deleted file]
basis/io/encodings/8-bit/windows-1256/windows-1256.factor [deleted file]
basis/io/encodings/8-bit/windows-1257/authors.txt [deleted file]
basis/io/encodings/8-bit/windows-1257/windows-1257.factor [deleted file]
basis/io/encodings/8-bit/windows-1258/authors.txt [deleted file]
basis/io/encodings/8-bit/windows-1258/windows-1258.factor [deleted file]
basis/io/sockets/secure/openssl/openssl.factor
basis/io/streams/limited/limited-tests.factor
basis/quoted-printable/quoted-printable-tests.factor
basis/tools/deploy/test/4/4.factor
basis/xml/tests/encodings.factor
core/alien/strings/strings-tests.factor
core/io/files/files-tests.factor
extra/geobytes/geobytes.factor
extra/graphviz/graphviz-tests.factor
extra/graphviz/render/render-docs.factor
extra/graphviz/render/render.factor
extra/images/bitmap/bitmap.factor
extra/images/png/png.factor
extra/io/encodings/detect/detect-tests.factor
extra/io/encodings/detect/detect.factor

index 55b8218e74008e4d1c26c2480aed9a44ea6a0867..dbf7a6affbb05c857d4d268d637ff55b2628fea9 100644 (file)
@@ -3,12 +3,11 @@
 USING: accessors calendar calendar.format classes combinators
 combinators.short-circuit concurrency.promises continuations
 destructors ftp io io.directories io.encodings
-io.encodings.8-bit.latin1 io.encodings.binary io.encodings.utf8
-io.files io.files.info io.files.types io.pathnames
-io.servers io.sockets io.streams.string io.timeouts
-kernel logging math math.bitwise math.parser namespaces
-sequences simple-tokenizer splitting strings threads
-tools.files unicode ;
+io.encodings.8-bit io.encodings.binary io.encodings.utf8
+io.files io.files.info io.pathnames io.servers io.sockets
+io.streams.string io.timeouts kernel logging math math.bitwise
+math.parser namespaces sequences simple-tokenizer splitting
+strings threads tools.files unicode ;
 IN: ftp.server
 
 SYMBOL: server
index 01a3695de315c756a6031c348fb21d741699a208..a6e7996fd53fcd4fedd6c415868754cafe929251 100644 (file)
@@ -1,6 +1,6 @@
 USING: assocs byte-arrays destructors help.markup help.syntax http
 http.client.post-data.private http.client.private
-io.encodings.8-bit.latin1 io.encodings.binary io.pathnames kernel
+io.encodings.8-bit io.encodings.binary io.pathnames kernel
 sequences strings urls urls.encoding ;
 IN: http.client
 
index fe70a00e399d27ee5865e52611123f14e9980807..ab83ba1f86a9889275ae0a22a472fffc826c79d1 100644 (file)
@@ -3,7 +3,7 @@ http.client.private tools.test multiline fry io.streams.string io.crlf
 io.encodings.utf8 io.encodings.8-bit io.encodings.binary io.encodings.string
 io.encodings.ascii kernel arrays splitting sequences assocs io.sockets db
 db.sqlite make continuations urls hashtables accessors namespaces xml.data
-io.encodings.8-bit.latin1 random combinators.short-circuit literals ;
+random combinators.short-circuit literals ;
 IN: http.tests
 
 { "text/plain" "UTF-8" } [ "text/plain" parse-content-type ] unit-test
index b0677e80bd201e5937071417006d826bb2db7ec5..5c15f902f43e3874f30bda2f9041fe17a3a478b5 100644 (file)
@@ -1,38 +1,89 @@
 ! Copyright (C) 2008 Daniel Ehrenberg
 ! See http://factorcode.org/license.txt for BSD license.
-USING: help.syntax help.markup io.encodings.8-bit.private
-strings ;
+USING: help.syntax help.markup strings ;
 IN: io.encodings.8-bit
 
+HELP: ebcdic
+{ $var-description "EBCDIC is an 8-bit legacy encoding designed for IBM mainframes like System/360 in the 1960s. It has since fallen into disuse. It contains large unallocated regions, and the version included here (code page 37) contains auxiliary characters in this region for English- and Portugese-speaking countries." }
+{ $see-also "encodings-introduction" } ;
+
+HELP: koi8-r
+{ $var-description "KOI8-R is an 8-bit superset of ASCII which encodes the Cyrillic alphabet, as used in Russian and Bulgarian. Characters are in such an order that, if the eight bit is stripped, text is still interpretable as ASCII. Block-building characters also exist." }
+{ $see-also "encodings-introduction" } ;
+
+HELP: latin/arabic
+{ $var-description "This is the ISO-8859-6 encoding, also called Latin/Arabic. It is an 8-bit superset of ASCII and provides the characters necessary for Arabic, though not other languages which use Arabic script." }
+{ $see-also "encodings-introduction" } ;
+
+HELP: latin/cyrillic
+{ $var-description "This is the ISO-8859-5 encoding, also called Latin/Cyrillic. It is an 8-bit superset of ASCII and provides the characters necessary for most languages which use Cyrilic, including Russian, Macedonian, Belarusian, Bulgarian, Serbian, and Ukrainian. KOI8-R is used much more commonly." }
+{ $see-also "encodings-introduction" } ;
+
+HELP: latin/greek
+{ $description "This is the ISO-8859-7 encoding, also called Latin/Greek. It is an 8-bit superset of ASCII and provides the characters necessary for Greek written in modern monotonic orthography, or ancient Greek without accent marks." }
+{ $see-also "encodings-introduction" } ;
+
+HELP: latin/hebrew
+{ $var-description "This is the ISO-8859-8 encoding, also called Latin/Hebrew. It is an 8-bit superset of ASCII and provides the characters necessary for modern Hebrew without explicit vowels. Generally, this is interpreted in logical order, making it ISO-8859-8-I, technically." }
+{ $see-also "encodings-introduction" } ;
+
+HELP: latin/thai
+{ $var-description "This is the ISO-8859-11 encoding, also called Latin/Thai. It is an 8-bit superset of ASCII containing the characters necessary to represent Thai. It is basically identical to TIS-620." }
+{ $see-also "encodings-introduction" } ;
+
+HELP: latin1
+{ $var-description "This is the ISO-8859-1 encoding, also called Latin-1: Western European. It is an 8-bit superset of ASCII which is the default for a mimetype starting with 'text' and provides the characters necessary for most western European languages." }
+{ $see-also "encodings-introduction" } ;
+
+HELP: latin2
+{ $var-description "This is the ISO-8859-2 encoding, also called Latin-2: Eastern European. It is an 8-bit superset of ASCII and provides the characters necessary for most eastern European languages." }
+{ $see-also "encodings-introduction" } ;
+
+HELP: latin3
+{ $var-description "This is the ISO-8859-3 encoding, also called Latin-3: South European. It is an 8-bit superset of ASCII and provides the characters necessary for Turkish, Maltese and Esperanto." }
+{ $see-also "encodings-introduction" } ;
+
+HELP: latin4
+{ $description "This is the ISO-8859-4 encoding, also called Latin-4: North European. It is an 8-bit superset of ASCII and provides the characters necessary for Latvian, Lithuanian, Estonian, Greenlandic and Sami." }
+{ $see-also "encodings-introduction" } ;
+
+HELP: latin5
+{ $var-description "This is the ISO-8859-9 encoding, also called Latin-5: Turkish. It is an 8-bit superset of ASCII and provides the characters necessary for Turkish, similar to Latin-1 but replacing the spots used for Icelandic with characters used in Turkish." }
+{ $see-also "encodings-introduction" } ;
+
+HELP: latin6
+{ $var-description "This is the ISO-8859-10 encoding, also called Latin-6: Nordic. It is an 8-bit superset of ASCII containing the same characters as Latin-4, but rearranged to be of better use to nordic languages." }
+{ $see-also "encodings-introduction" } ;
+
+HELP: latin7
+{ $var-description "This is the ISO-8859-13 encoding, also called Latin-7: Baltic Rim. It is an 8-bit superset of ASCII containing all characters necessary to represent Baltic Rim languages, as previous character sets were incomplete." }
+{ $see-also "encodings-introduction" } ;
+
+HELP: latin8
+{ $var-description "This is the ISO-8859-14 encoding, also called Latin-8: Celtic. It is an 8-bit superset of ASCII designed for Celtic languages like Gaelic and Breton." }
+{ $see-also "encodings-introduction" } ;
+
+HELP: latin9
+{ $var-description "This is the ISO-8859-15 encoding, also called Latin-9 and unofficially as Latin-0. It is an 8-bit superset of ASCII designed as a modification of Latin-1, removing little-used characters in favor of the Euro symbol and other characters." }
+{ $see-also "encodings-introduction" } ;
+
+HELP: latin10
+{ $var-description "This is the ISO-8859-16 encoding, also called Latin-10: South-Eastern European. It is an 8-bit superset of ASCII." }
+{ $see-also "encodings-introduction" } ;
+
+HELP: cp437
+{ $var-description "This is the IBM437 encoding, also called CP437. It is an 8-bit superset of ASCII and provides the original DOS character set with the box-drawing characters used to draw windows and frames on the text terminals back in the day." }
+{ $see-also "encodings-introduction" } ;
+
+HELP: mac-roman
+{ $var-description "Mac Roman is an 8-bit superset of ASCII which was the standard encoding on Mac OS prior to version 10. It is incompatible with Latin-1 in all but a few places and ASCII, and it is suitable for encoding many Western European languages." }
+{ $see-also "encodings-introduction" } ;
+
+HELP: windows-1252
+{ $var-description "Windows 1252 is an 8-bit superset of ASCII which is closely related to Latin-1. Control characters in the 0x80 to 0x9F range are replaced with printable characters such as the Euro symbol." }
+{ $see-also "encodings-introduction" } ;
+
 ARTICLE: "io.encodings.8-bit" "Legacy 8-bit encodings"
-"Many encodings are a simple mapping of bytes onto characters. The " { $vocab-link "io.encodings.8-bit" } " vocabulary implements these generically using existing resource files. These encodings should be used with extreme caution, as fully general Unicode encodings like UTF-8 are nearly always more appropriate. The following 8-bit encodings are available:"
-{ $list
-    { $vocab-link "io.encodings.8-bit.ebcdic" }
-    { $vocab-link "io.encodings.8-bit.latin1" }
-    { $vocab-link "io.encodings.8-bit.latin2" }
-    { $vocab-link "io.encodings.8-bit.latin3" }
-    { $vocab-link "io.encodings.8-bit.latin4" }
-    { $vocab-link "io.encodings.8-bit.cyrillic" }
-    { $vocab-link "io.encodings.8-bit.arabic" }
-    { $vocab-link "io.encodings.8-bit.greek" }
-    { $vocab-link "io.encodings.8-bit.hebrew" }
-    { $vocab-link "io.encodings.8-bit.latin5" }
-    { $vocab-link "io.encodings.8-bit.latin6" }
-    { $vocab-link "io.encodings.8-bit.thai" }
-    { $vocab-link "io.encodings.8-bit.latin7" }
-    { $vocab-link "io.encodings.8-bit.latin8" }
-    { $vocab-link "io.encodings.8-bit.latin9" }
-    { $vocab-link "io.encodings.8-bit.koi8-r" }
-    { $vocab-link "io.encodings.8-bit.mac-roman" }
-    { $vocab-link "io.encodings.8-bit.windows-1250" }
-    { $vocab-link "io.encodings.8-bit.windows-1251" }
-    { $vocab-link "io.encodings.8-bit.windows-1252" }
-    { $vocab-link "io.encodings.8-bit.windows-1253" }
-    { $vocab-link "io.encodings.8-bit.windows-1254" }
-    { $vocab-link "io.encodings.8-bit.windows-1255" }
-    { $vocab-link "io.encodings.8-bit.windows-1256" }
-    { $vocab-link "io.encodings.8-bit.windows-1257" }
-    { $vocab-link "io.encodings.8-bit.windows-1258" }
-} ;
+"Many encodings are a simple mapping of bytes onto characters. The " { $vocab-link "io.encodings.8-bit" } " vocabulary implements these generically using existing resource files. These encodings should be used with extreme caution, as fully general Unicode encodings like UTF-8 are nearly always more appropriate." ;
 
 ABOUT: "io.encodings.8-bit"
index 84d5da84309181c8995f3f62c47055a85a3aaa97..758b0ef48be142d901215ee0f590b019d14284d7 100644 (file)
@@ -1,6 +1,5 @@
-USING: io.encodings.string io.encodings.8-bit
-io.encodings.8-bit.private tools.test strings arrays
-io.encodings.8-bit.latin1 io.encodings.8-bit.windows-1252 ;
+USING: arrays io.encodings.string io.encodings.8-bit
+io.encodings.8-bit.private strings tools.test ;
 
 { B{ CHAR: f CHAR: o CHAR: o } } [ "foo" latin1 encode ] unit-test
 [ { 256 } >string latin1 encode ] must-fail
index 8aeb292efe60ccf5006c58fc07754c705707c065..6df0f4f666e562bf290c021138bdf4fc56db91a9 100644 (file)
@@ -1,12 +1,11 @@
 ! Copyright (C) 2008 Daniel Ehrenberg, Doug Coleman.
 ! See http://factorcode.org/license.txt for BSD license.
-USING: arrays assocs biassocs kernel io.encodings math.parser
-sequences hashtables io.encodings.ascii generic parser
-classes.tuple words words.symbol io io.files splitting
-namespaces math compiler.units accessors classes.singleton
-classes.mixin io.encodings.iana fry simple-flat-file lexer ;
+USING: accessors assocs biassocs classes.mixin classes.singleton
+fry io io.encodings io.encodings.iana kernel lexer namespaces
+parser sequences simple-flat-file ;
 IN: io.encodings.8-bit
 
+<<
 <PRIVATE
 
 : encoding-file ( file-name -- stream )
@@ -55,3 +54,53 @@ M: 8-bit-encoding <decoder>
 PRIVATE>
 
 SYNTAX: 8-BIT: scan-token scan-token scan-token load-encoding ;
+>>
+
+8-BIT: cp437 IBM437 CP437
+8-BIT: cp500 IBM500 CP500
+8-BIT: cp775 IBM775 CP775
+8-BIT: cp850 IBM850 CP850
+8-BIT: cp852 IBM852 CP852
+8-BIT: cp855 IBM855 CP855
+8-BIT: cp857 IBM857 CP857
+8-BIT: cp860 IBM860 CP860
+8-BIT: cp861 IBM861 CP861
+8-BIT: cp862 IBM862 CP862
+8-BIT: cp863 IBM863 CP863
+8-BIT: cp864 IBM864 CP864
+8-BIT: cp865 IBM865 CP865
+8-BIT: cp866 IBM866 CP866
+8-BIT: cp869 IBM869 CP869
+8-BIT: cp1026 IBM1026 CP1026
+8-BIT: ebcdic IBM037 CP037
+8-BIT: koi8-r KOI8-R KOI8-R
+8-BIT: latin/arabic ISO_8859-6:1987 8859-6
+8-BIT: latin/cyrillic ISO_8859-5:1988 8859-5
+8-BIT: latin/greek ISO_8859-7:1987 8859-7
+8-BIT: latin/hebrew ISO_8859-8:1988 8859-8
+8-BIT: latin/thai TIS-620 8859-11
+8-BIT: latin1 ISO_8859-1:1987 8859-1
+8-BIT: latin2 ISO_8859-2:1987 8859-2
+8-BIT: latin3 ISO_8859-3:1988 8859-3
+8-BIT: latin4 ISO_8859-4:1988 8859-4
+8-BIT: latin5 ISO_8859-9:1989 8859-9
+8-BIT: latin6 ISO-8859-10 8859-10
+8-BIT: latin7 ISO-8859-13 8859-13
+8-BIT: latin8 ISO-8859-14 8859-14
+8-BIT: latin9 ISO-8859-15 8859-15
+8-BIT: latin10 ISO-8859-16 8859-16
+8-BIT: mac-roman macintosh ROMAN
+! 8-BIT: mac-cyrillic mac-cyrillic CYRILLIC
+! 8-BIT: mac-greek mac-greek GREEK
+! 8-BIT: mac-icelandic mac-icelandic ICELAND
+! 8-BIT: mac-latin2 mac-latin2 LATIN2
+! 8-BIT: mac-turkish mac-turkish TURKISH
+8-BIT: windows-1250 windows-1250 CP1250
+8-BIT: windows-1251 windows-1251 CP1251
+8-BIT: windows-1252 windows-1252 CP1252
+8-BIT: windows-1253 windows-1253 CP1253
+8-BIT: windows-1254 windows-1254 CP1254
+8-BIT: windows-1255 windows-1255 CP1255
+8-BIT: windows-1256 windows-1256 CP1256
+8-BIT: windows-1257 windows-1257 CP1257
+8-BIT: windows-1258 windows-1258 CP1258
diff --git a/basis/io/encodings/8-bit/CP1026.TXT b/basis/io/encodings/8-bit/CP1026.TXT
new file mode 100644 (file)
index 0000000..fcfcd34
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp1026_IBMLatin5Turkish to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#         
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp1026_IBMLatin5Turkish code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp1026_IBMLatin5Turkish order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x009C  #CONTROL
+0x05   0x0009  #HORIZONTAL TABULATION
+0x06   0x0086  #CONTROL
+0x07   0x007F  #DELETE
+0x08   0x0097  #CONTROL
+0x09   0x008D  #CONTROL
+0x0A   0x008E  #CONTROL
+0x0B   0x000B  #VERTICAL TABULATION
+0x0C   0x000C  #FORM FEED
+0x0D   0x000D  #CARRIAGE RETURN
+0x0E   0x000E  #SHIFT OUT
+0x0F   0x000F  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x009D  #CONTROL
+0x15   0x0085  #CONTROL
+0x16   0x0008  #BACKSPACE
+0x17   0x0087  #CONTROL
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1A   0x0092  #CONTROL
+0x1B   0x008F  #CONTROL
+0x1C   0x001C  #FILE SEPARATOR
+0x1D   0x001D  #GROUP SEPARATOR
+0x1E   0x001E  #RECORD SEPARATOR
+0x1F   0x001F  #UNIT SEPARATOR
+0x20   0x0080  #CONTROL
+0x21   0x0081  #CONTROL
+0x22   0x0082  #CONTROL
+0x23   0x0083  #CONTROL
+0x24   0x0084  #CONTROL
+0x25   0x000A  #LINE FEED
+0x26   0x0017  #END OF TRANSMISSION BLOCK
+0x27   0x001B  #ESCAPE
+0x28   0x0088  #CONTROL
+0x29   0x0089  #CONTROL
+0x2A   0x008A  #CONTROL
+0x2B   0x008B  #CONTROL
+0x2C   0x008C  #CONTROL
+0x2D   0x0005  #ENQUIRY
+0x2E   0x0006  #ACKNOWLEDGE
+0x2F   0x0007  #BELL
+0x30   0x0090  #CONTROL
+0x31   0x0091  #CONTROL
+0x32   0x0016  #SYNCHRONOUS IDLE
+0x33   0x0093  #CONTROL
+0x34   0x0094  #CONTROL
+0x35   0x0095  #CONTROL
+0x36   0x0096  #CONTROL
+0x37   0x0004  #END OF TRANSMISSION
+0x38   0x0098  #CONTROL
+0x39   0x0099  #CONTROL
+0x3A   0x009A  #CONTROL
+0x3B   0x009B  #CONTROL
+0x3C   0x0014  #DEVICE CONTROL FOUR
+0x3D   0x0015  #NEGATIVE ACKNOWLEDGE
+0x3E   0x009E  #CONTROL
+0x3F   0x001A  #SUBSTITUTE
+0x40   0x0020  #SPACE
+0x41   0x00A0  #NO-BREAK SPACE
+0x42   0x00E2  #LATIN SMALL LETTER A WITH CIRCUMFLEX
+0x43   0x00E4  #LATIN SMALL LETTER A WITH DIAERESIS
+0x44   0x00E0  #LATIN SMALL LETTER A WITH GRAVE
+0x45   0x00E1  #LATIN SMALL LETTER A WITH ACUTE
+0x46   0x00E3  #LATIN SMALL LETTER A WITH TILDE
+0x47   0x00E5  #LATIN SMALL LETTER A WITH RING ABOVE
+0x48   0x007B  #LEFT CURLY BRACKET
+0x49   0x00F1  #LATIN SMALL LETTER N WITH TILDE
+0x4A   0x00C7  #LATIN CAPITAL LETTER C WITH CEDILLA
+0x4B   0x002E  #FULL STOP
+0x4C   0x003C  #LESS-THAN SIGN
+0x4D   0x0028  #LEFT PARENTHESIS
+0x4E   0x002B  #PLUS SIGN
+0x4F   0x0021  #EXCLAMATION MARK
+0x50   0x0026  #AMPERSAND
+0x51   0x00E9  #LATIN SMALL LETTER E WITH ACUTE
+0x52   0x00EA  #LATIN SMALL LETTER E WITH CIRCUMFLEX
+0x53   0x00EB  #LATIN SMALL LETTER E WITH DIAERESIS
+0x54   0x00E8  #LATIN SMALL LETTER E WITH GRAVE
+0x55   0x00ED  #LATIN SMALL LETTER I WITH ACUTE
+0x56   0x00EE  #LATIN SMALL LETTER I WITH CIRCUMFLEX
+0x57   0x00EF  #LATIN SMALL LETTER I WITH DIAERESIS
+0x58   0x00EC  #LATIN SMALL LETTER I WITH GRAVE
+0x59   0x00DF  #LATIN SMALL LETTER SHARP S (GERMAN)
+0x5A   0x011E  #LATIN CAPITAL LETTER G WITH BREVE
+0x5B   0x0130  #LATIN CAPITAL LETTER I WITH DOT ABOVE
+0x5C   0x002A  #ASTERISK
+0x5D   0x0029  #RIGHT PARENTHESIS
+0x5E   0x003B  #SEMICOLON
+0x5F   0x005E  #CIRCUMFLEX ACCENT
+0x60   0x002D  #HYPHEN-MINUS
+0x61   0x002F  #SOLIDUS
+0x62   0x00C2  #LATIN CAPITAL LETTER A WITH CIRCUMFLEX
+0x63   0x00C4  #LATIN CAPITAL LETTER A WITH DIAERESIS
+0x64   0x00C0  #LATIN CAPITAL LETTER A WITH GRAVE
+0x65   0x00C1  #LATIN CAPITAL LETTER A WITH ACUTE
+0x66   0x00C3  #LATIN CAPITAL LETTER A WITH TILDE
+0x67   0x00C5  #LATIN CAPITAL LETTER A WITH RING ABOVE
+0x68   0x005B  #LEFT SQUARE BRACKET
+0x69   0x00D1  #LATIN CAPITAL LETTER N WITH TILDE
+0x6A   0x015F  #LATIN SMALL LETTER S WITH CEDILLA
+0x6B   0x002C  #COMMA
+0x6C   0x0025  #PERCENT SIGN
+0x6D   0x005F  #LOW LINE
+0x6E   0x003E  #GREATER-THAN SIGN
+0x6F   0x003F  #QUESTION MARK
+0x70   0x00F8  #LATIN SMALL LETTER O WITH STROKE
+0x71   0x00C9  #LATIN CAPITAL LETTER E WITH ACUTE
+0x72   0x00CA  #LATIN CAPITAL LETTER E WITH CIRCUMFLEX
+0x73   0x00CB  #LATIN CAPITAL LETTER E WITH DIAERESIS
+0x74   0x00C8  #LATIN CAPITAL LETTER E WITH GRAVE
+0x75   0x00CD  #LATIN CAPITAL LETTER I WITH ACUTE
+0x76   0x00CE  #LATIN CAPITAL LETTER I WITH CIRCUMFLEX
+0x77   0x00CF  #LATIN CAPITAL LETTER I WITH DIAERESIS
+0x78   0x00CC  #LATIN CAPITAL LETTER I WITH GRAVE
+0x79   0x0131  #LATIN SMALL LETTER DOTLESS I
+0x7A   0x003A  #COLON
+0x7B   0x00D6  #LATIN CAPITAL LETTER O WITH DIAERESIS
+0x7C   0x015E  #LATIN CAPITAL LETTER S WITH CEDILLA
+0x7D   0x0027  #APOSTROPHE
+0x7E   0x003D  #EQUALS SIGN
+0x7F   0x00DC  #LATIN CAPITAL LETTER U WITH DIAERESIS
+0x80   0x00D8  #LATIN CAPITAL LETTER O WITH STROKE
+0x81   0x0061  #LATIN SMALL LETTER A
+0x82   0x0062  #LATIN SMALL LETTER B
+0x83   0x0063  #LATIN SMALL LETTER C
+0x84   0x0064  #LATIN SMALL LETTER D
+0x85   0x0065  #LATIN SMALL LETTER E
+0x86   0x0066  #LATIN SMALL LETTER F
+0x87   0x0067  #LATIN SMALL LETTER G
+0x88   0x0068  #LATIN SMALL LETTER H
+0x89   0x0069  #LATIN SMALL LETTER I
+0x8A   0x00AB  #LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+0x8B   0x00BB  #RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
+0x8C   0x007D  #RIGHT CURLY BRACKET
+0x8D   0x0060  #GRAVE ACCENT
+0x8E   0x00A6  #BROKEN BAR
+0x8F   0x00B1  #PLUS-MINUS SIGN
+0x90   0x00B0  #DEGREE SIGN
+0x91   0x006A  #LATIN SMALL LETTER J
+0x92   0x006B  #LATIN SMALL LETTER K
+0x93   0x006C  #LATIN SMALL LETTER L
+0x94   0x006D  #LATIN SMALL LETTER M
+0x95   0x006E  #LATIN SMALL LETTER N
+0x96   0x006F  #LATIN SMALL LETTER O
+0x97   0x0070  #LATIN SMALL LETTER P
+0x98   0x0071  #LATIN SMALL LETTER Q
+0x99   0x0072  #LATIN SMALL LETTER R
+0x9A   0x00AA  #FEMININE ORDINAL INDICATOR
+0x9B   0x00BA  #MASCULINE ORDINAL INDICATOR
+0x9C   0x00E6  #LATIN SMALL LIGATURE AE
+0x9D   0x00B8  #CEDILLA
+0x9E   0x00C6  #LATIN CAPITAL LIGATURE AE
+0x9F   0x00A4  #CURRENCY SIGN
+0xA0   0x00B5  #MICRO SIGN
+0xA1   0x00F6  #LATIN SMALL LETTER O WITH DIAERESIS
+0xA2   0x0073  #LATIN SMALL LETTER S
+0xA3   0x0074  #LATIN SMALL LETTER T
+0xA4   0x0075  #LATIN SMALL LETTER U
+0xA5   0x0076  #LATIN SMALL LETTER V
+0xA6   0x0077  #LATIN SMALL LETTER W
+0xA7   0x0078  #LATIN SMALL LETTER X
+0xA8   0x0079  #LATIN SMALL LETTER Y
+0xA9   0x007A  #LATIN SMALL LETTER Z
+0xAA   0x00A1  #INVERTED EXCLAMATION MARK
+0xAB   0x00BF  #INVERTED QUESTION MARK
+0xAC   0x005D  #RIGHT SQUARE BRACKET
+0xAD   0x0024  #DOLLAR SIGN
+0xAE   0x0040  #COMMERCIAL AT
+0xAF   0x00AE  #REGISTERED SIGN
+0xB0   0x00A2  #CENT SIGN
+0xB1   0x00A3  #POUND SIGN
+0xB2   0x00A5  #YEN SIGN
+0xB3   0x00B7  #MIDDLE DOT
+0xB4   0x00A9  #COPYRIGHT SIGN
+0xB5   0x00A7  #SECTION SIGN
+0xB6   0x00B6  #PILCROW SIGN
+0xB7   0x00BC  #VULGAR FRACTION ONE QUARTER
+0xB8   0x00BD  #VULGAR FRACTION ONE HALF
+0xB9   0x00BE  #VULGAR FRACTION THREE QUARTERS
+0xBA   0x00AC  #NOT SIGN
+0xBB   0x007C  #VERTICAL LINE
+0xBC   0x00AF  #MACRON
+0xBD   0x00A8  #DIAERESIS
+0xBE   0x00B4  #ACUTE ACCENT
+0xBF   0x00D7  #MULTIPLICATION SIGN
+0xC0   0x00E7  #LATIN SMALL LETTER C WITH CEDILLA
+0xC1   0x0041  #LATIN CAPITAL LETTER A
+0xC2   0x0042  #LATIN CAPITAL LETTER B
+0xC3   0x0043  #LATIN CAPITAL LETTER C
+0xC4   0x0044  #LATIN CAPITAL LETTER D
+0xC5   0x0045  #LATIN CAPITAL LETTER E
+0xC6   0x0046  #LATIN CAPITAL LETTER F
+0xC7   0x0047  #LATIN CAPITAL LETTER G
+0xC8   0x0048  #LATIN CAPITAL LETTER H
+0xC9   0x0049  #LATIN CAPITAL LETTER I
+0xCA   0x00AD  #SOFT HYPHEN
+0xCB   0x00F4  #LATIN SMALL LETTER O WITH CIRCUMFLEX
+0xCC   0x007E  #TILDE
+0xCD   0x00F2  #LATIN SMALL LETTER O WITH GRAVE
+0xCE   0x00F3  #LATIN SMALL LETTER O WITH ACUTE
+0xCF   0x00F5  #LATIN SMALL LETTER O WITH TILDE
+0xD0   0x011F  #LATIN SMALL LETTER G WITH BREVE
+0xD1   0x004A  #LATIN CAPITAL LETTER J
+0xD2   0x004B  #LATIN CAPITAL LETTER K
+0xD3   0x004C  #LATIN CAPITAL LETTER L
+0xD4   0x004D  #LATIN CAPITAL LETTER M
+0xD5   0x004E  #LATIN CAPITAL LETTER N
+0xD6   0x004F  #LATIN CAPITAL LETTER O
+0xD7   0x0050  #LATIN CAPITAL LETTER P
+0xD8   0x0051  #LATIN CAPITAL LETTER Q
+0xD9   0x0052  #LATIN CAPITAL LETTER R
+0xDA   0x00B9  #SUPERSCRIPT ONE
+0xDB   0x00FB  #LATIN SMALL LETTER U WITH CIRCUMFLEX
+0xDC   0x005C  #REVERSE SOLIDUS
+0xDD   0x00F9  #LATIN SMALL LETTER U WITH GRAVE
+0xDE   0x00FA  #LATIN SMALL LETTER U WITH ACUTE
+0xDF   0x00FF  #LATIN SMALL LETTER Y WITH DIAERESIS
+0xE0   0x00FC  #LATIN SMALL LETTER U WITH DIAERESIS
+0xE1   0x00F7  #DIVISION SIGN
+0xE2   0x0053  #LATIN CAPITAL LETTER S
+0xE3   0x0054  #LATIN CAPITAL LETTER T
+0xE4   0x0055  #LATIN CAPITAL LETTER U
+0xE5   0x0056  #LATIN CAPITAL LETTER V
+0xE6   0x0057  #LATIN CAPITAL LETTER W
+0xE7   0x0058  #LATIN CAPITAL LETTER X
+0xE8   0x0059  #LATIN CAPITAL LETTER Y
+0xE9   0x005A  #LATIN CAPITAL LETTER Z
+0xEA   0x00B2  #SUPERSCRIPT TWO
+0xEB   0x00D4  #LATIN CAPITAL LETTER O WITH CIRCUMFLEX
+0xEC   0x0023  #NUMBER SIGN
+0xED   0x00D2  #LATIN CAPITAL LETTER O WITH GRAVE
+0xEE   0x00D3  #LATIN CAPITAL LETTER O WITH ACUTE
+0xEF   0x00D5  #LATIN CAPITAL LETTER O WITH TILDE
+0xF0   0x0030  #DIGIT ZERO
+0xF1   0x0031  #DIGIT ONE
+0xF2   0x0032  #DIGIT TWO
+0xF3   0x0033  #DIGIT THREE
+0xF4   0x0034  #DIGIT FOUR
+0xF5   0x0035  #DIGIT FIVE
+0xF6   0x0036  #DIGIT SIX
+0xF7   0x0037  #DIGIT SEVEN
+0xF8   0x0038  #DIGIT EIGHT
+0xF9   0x0039  #DIGIT NINE
+0xFA   0x00B3  #SUPERSCRIPT THREE
+0xFB   0x00DB  #LATIN CAPITAL LETTER U WITH CIRCUMFLEX
+0xFC   0x0022  #QUOTATION MARK
+0xFD   0x00D9  #LATIN CAPITAL LETTER U WITH GRAVE
+0xFE   0x00DA  #LATIN CAPITAL LETTER U WITH ACUTE
+0xFF   0x009F  #CONTROL
diff --git a/basis/io/encodings/8-bit/CP500.TXT b/basis/io/encodings/8-bit/CP500.TXT
new file mode 100644 (file)
index 0000000..87b3e90
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp500_IBMInternational to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp500_IBMInternational code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp500_IBMInternational order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x009C  #CONTROL
+0x05   0x0009  #HORIZONTAL TABULATION
+0x06   0x0086  #CONTROL
+0x07   0x007F  #DELETE
+0x08   0x0097  #CONTROL
+0x09   0x008D  #CONTROL
+0x0A   0x008E  #CONTROL
+0x0B   0x000B  #VERTICAL TABULATION
+0x0C   0x000C  #FORM FEED
+0x0D   0x000D  #CARRIAGE RETURN
+0x0E   0x000E  #SHIFT OUT
+0x0F   0x000F  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x009D  #CONTROL
+0x15   0x0085  #CONTROL
+0x16   0x0008  #BACKSPACE
+0x17   0x0087  #CONTROL
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1A   0x0092  #CONTROL
+0x1B   0x008F  #CONTROL
+0x1C   0x001C  #FILE SEPARATOR
+0x1D   0x001D  #GROUP SEPARATOR
+0x1E   0x001E  #RECORD SEPARATOR
+0x1F   0x001F  #UNIT SEPARATOR
+0x20   0x0080  #CONTROL
+0x21   0x0081  #CONTROL
+0x22   0x0082  #CONTROL
+0x23   0x0083  #CONTROL
+0x24   0x0084  #CONTROL
+0x25   0x000A  #LINE FEED
+0x26   0x0017  #END OF TRANSMISSION BLOCK
+0x27   0x001B  #ESCAPE
+0x28   0x0088  #CONTROL
+0x29   0x0089  #CONTROL
+0x2A   0x008A  #CONTROL
+0x2B   0x008B  #CONTROL
+0x2C   0x008C  #CONTROL
+0x2D   0x0005  #ENQUIRY
+0x2E   0x0006  #ACKNOWLEDGE
+0x2F   0x0007  #BELL
+0x30   0x0090  #CONTROL
+0x31   0x0091  #CONTROL
+0x32   0x0016  #SYNCHRONOUS IDLE
+0x33   0x0093  #CONTROL
+0x34   0x0094  #CONTROL
+0x35   0x0095  #CONTROL
+0x36   0x0096  #CONTROL
+0x37   0x0004  #END OF TRANSMISSION
+0x38   0x0098  #CONTROL
+0x39   0x0099  #CONTROL
+0x3A   0x009A  #CONTROL
+0x3B   0x009B  #CONTROL
+0x3C   0x0014  #DEVICE CONTROL FOUR
+0x3D   0x0015  #NEGATIVE ACKNOWLEDGE
+0x3E   0x009E  #CONTROL
+0x3F   0x001A  #SUBSTITUTE
+0x40   0x0020  #SPACE
+0x41   0x00A0  #NO-BREAK SPACE
+0x42   0x00E2  #LATIN SMALL LETTER A WITH CIRCUMFLEX
+0x43   0x00E4  #LATIN SMALL LETTER A WITH DIAERESIS
+0x44   0x00E0  #LATIN SMALL LETTER A WITH GRAVE
+0x45   0x00E1  #LATIN SMALL LETTER A WITH ACUTE
+0x46   0x00E3  #LATIN SMALL LETTER A WITH TILDE
+0x47   0x00E5  #LATIN SMALL LETTER A WITH RING ABOVE
+0x48   0x00E7  #LATIN SMALL LETTER C WITH CEDILLA
+0x49   0x00F1  #LATIN SMALL LETTER N WITH TILDE
+0x4A   0x005B  #LEFT SQUARE BRACKET
+0x4B   0x002E  #FULL STOP
+0x4C   0x003C  #LESS-THAN SIGN
+0x4D   0x0028  #LEFT PARENTHESIS
+0x4E   0x002B  #PLUS SIGN
+0x4F   0x0021  #EXCLAMATION MARK
+0x50   0x0026  #AMPERSAND
+0x51   0x00E9  #LATIN SMALL LETTER E WITH ACUTE
+0x52   0x00EA  #LATIN SMALL LETTER E WITH CIRCUMFLEX
+0x53   0x00EB  #LATIN SMALL LETTER E WITH DIAERESIS
+0x54   0x00E8  #LATIN SMALL LETTER E WITH GRAVE
+0x55   0x00ED  #LATIN SMALL LETTER I WITH ACUTE
+0x56   0x00EE  #LATIN SMALL LETTER I WITH CIRCUMFLEX
+0x57   0x00EF  #LATIN SMALL LETTER I WITH DIAERESIS
+0x58   0x00EC  #LATIN SMALL LETTER I WITH GRAVE
+0x59   0x00DF  #LATIN SMALL LETTER SHARP S (GERMAN)
+0x5A   0x005D  #RIGHT SQUARE BRACKET
+0x5B   0x0024  #DOLLAR SIGN
+0x5C   0x002A  #ASTERISK
+0x5D   0x0029  #RIGHT PARENTHESIS
+0x5E   0x003B  #SEMICOLON
+0x5F   0x005E  #CIRCUMFLEX ACCENT
+0x60   0x002D  #HYPHEN-MINUS
+0x61   0x002F  #SOLIDUS
+0x62   0x00C2  #LATIN CAPITAL LETTER A WITH CIRCUMFLEX
+0x63   0x00C4  #LATIN CAPITAL LETTER A WITH DIAERESIS
+0x64   0x00C0  #LATIN CAPITAL LETTER A WITH GRAVE
+0x65   0x00C1  #LATIN CAPITAL LETTER A WITH ACUTE
+0x66   0x00C3  #LATIN CAPITAL LETTER A WITH TILDE
+0x67   0x00C5  #LATIN CAPITAL LETTER A WITH RING ABOVE
+0x68   0x00C7  #LATIN CAPITAL LETTER C WITH CEDILLA
+0x69   0x00D1  #LATIN CAPITAL LETTER N WITH TILDE
+0x6A   0x00A6  #BROKEN BAR
+0x6B   0x002C  #COMMA
+0x6C   0x0025  #PERCENT SIGN
+0x6D   0x005F  #LOW LINE
+0x6E   0x003E  #GREATER-THAN SIGN
+0x6F   0x003F  #QUESTION MARK
+0x70   0x00F8  #LATIN SMALL LETTER O WITH STROKE
+0x71   0x00C9  #LATIN CAPITAL LETTER E WITH ACUTE
+0x72   0x00CA  #LATIN CAPITAL LETTER E WITH CIRCUMFLEX
+0x73   0x00CB  #LATIN CAPITAL LETTER E WITH DIAERESIS
+0x74   0x00C8  #LATIN CAPITAL LETTER E WITH GRAVE
+0x75   0x00CD  #LATIN CAPITAL LETTER I WITH ACUTE
+0x76   0x00CE  #LATIN CAPITAL LETTER I WITH CIRCUMFLEX
+0x77   0x00CF  #LATIN CAPITAL LETTER I WITH DIAERESIS
+0x78   0x00CC  #LATIN CAPITAL LETTER I WITH GRAVE
+0x79   0x0060  #GRAVE ACCENT
+0x7A   0x003A  #COLON
+0x7B   0x0023  #NUMBER SIGN
+0x7C   0x0040  #COMMERCIAL AT
+0x7D   0x0027  #APOSTROPHE
+0x7E   0x003D  #EQUALS SIGN
+0x7F   0x0022  #QUOTATION MARK
+0x80   0x00D8  #LATIN CAPITAL LETTER O WITH STROKE
+0x81   0x0061  #LATIN SMALL LETTER A
+0x82   0x0062  #LATIN SMALL LETTER B
+0x83   0x0063  #LATIN SMALL LETTER C
+0x84   0x0064  #LATIN SMALL LETTER D
+0x85   0x0065  #LATIN SMALL LETTER E
+0x86   0x0066  #LATIN SMALL LETTER F
+0x87   0x0067  #LATIN SMALL LETTER G
+0x88   0x0068  #LATIN SMALL LETTER H
+0x89   0x0069  #LATIN SMALL LETTER I
+0x8A   0x00AB  #LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+0x8B   0x00BB  #RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
+0x8C   0x00F0  #LATIN SMALL LETTER ETH (ICELANDIC)
+0x8D   0x00FD  #LATIN SMALL LETTER Y WITH ACUTE
+0x8E   0x00FE  #LATIN SMALL LETTER THORN (ICELANDIC)
+0x8F   0x00B1  #PLUS-MINUS SIGN
+0x90   0x00B0  #DEGREE SIGN
+0x91   0x006A  #LATIN SMALL LETTER J
+0x92   0x006B  #LATIN SMALL LETTER K
+0x93   0x006C  #LATIN SMALL LETTER L
+0x94   0x006D  #LATIN SMALL LETTER M
+0x95   0x006E  #LATIN SMALL LETTER N
+0x96   0x006F  #LATIN SMALL LETTER O
+0x97   0x0070  #LATIN SMALL LETTER P
+0x98   0x0071  #LATIN SMALL LETTER Q
+0x99   0x0072  #LATIN SMALL LETTER R
+0x9A   0x00AA  #FEMININE ORDINAL INDICATOR
+0x9B   0x00BA  #MASCULINE ORDINAL INDICATOR
+0x9C   0x00E6  #LATIN SMALL LIGATURE AE
+0x9D   0x00B8  #CEDILLA
+0x9E   0x00C6  #LATIN CAPITAL LIGATURE AE
+0x9F   0x00A4  #CURRENCY SIGN
+0xA0   0x00B5  #MICRO SIGN
+0xA1   0x007E  #TILDE
+0xA2   0x0073  #LATIN SMALL LETTER S
+0xA3   0x0074  #LATIN SMALL LETTER T
+0xA4   0x0075  #LATIN SMALL LETTER U
+0xA5   0x0076  #LATIN SMALL LETTER V
+0xA6   0x0077  #LATIN SMALL LETTER W
+0xA7   0x0078  #LATIN SMALL LETTER X
+0xA8   0x0079  #LATIN SMALL LETTER Y
+0xA9   0x007A  #LATIN SMALL LETTER Z
+0xAA   0x00A1  #INVERTED EXCLAMATION MARK
+0xAB   0x00BF  #INVERTED QUESTION MARK
+0xAC   0x00D0  #LATIN CAPITAL LETTER ETH (ICELANDIC)
+0xAD   0x00DD  #LATIN CAPITAL LETTER Y WITH ACUTE
+0xAE   0x00DE  #LATIN CAPITAL LETTER THORN (ICELANDIC)
+0xAF   0x00AE  #REGISTERED SIGN
+0xB0   0x00A2  #CENT SIGN
+0xB1   0x00A3  #POUND SIGN
+0xB2   0x00A5  #YEN SIGN
+0xB3   0x00B7  #MIDDLE DOT
+0xB4   0x00A9  #COPYRIGHT SIGN
+0xB5   0x00A7  #SECTION SIGN
+0xB6   0x00B6  #PILCROW SIGN
+0xB7   0x00BC  #VULGAR FRACTION ONE QUARTER
+0xB8   0x00BD  #VULGAR FRACTION ONE HALF
+0xB9   0x00BE  #VULGAR FRACTION THREE QUARTERS
+0xBA   0x00AC  #NOT SIGN
+0xBB   0x007C  #VERTICAL LINE
+0xBC   0x00AF  #MACRON
+0xBD   0x00A8  #DIAERESIS
+0xBE   0x00B4  #ACUTE ACCENT
+0xBF   0x00D7  #MULTIPLICATION SIGN
+0xC0   0x007B  #LEFT CURLY BRACKET
+0xC1   0x0041  #LATIN CAPITAL LETTER A
+0xC2   0x0042  #LATIN CAPITAL LETTER B
+0xC3   0x0043  #LATIN CAPITAL LETTER C
+0xC4   0x0044  #LATIN CAPITAL LETTER D
+0xC5   0x0045  #LATIN CAPITAL LETTER E
+0xC6   0x0046  #LATIN CAPITAL LETTER F
+0xC7   0x0047  #LATIN CAPITAL LETTER G
+0xC8   0x0048  #LATIN CAPITAL LETTER H
+0xC9   0x0049  #LATIN CAPITAL LETTER I
+0xCA   0x00AD  #SOFT HYPHEN
+0xCB   0x00F4  #LATIN SMALL LETTER O WITH CIRCUMFLEX
+0xCC   0x00F6  #LATIN SMALL LETTER O WITH DIAERESIS
+0xCD   0x00F2  #LATIN SMALL LETTER O WITH GRAVE
+0xCE   0x00F3  #LATIN SMALL LETTER O WITH ACUTE
+0xCF   0x00F5  #LATIN SMALL LETTER O WITH TILDE
+0xD0   0x007D  #RIGHT CURLY BRACKET
+0xD1   0x004A  #LATIN CAPITAL LETTER J
+0xD2   0x004B  #LATIN CAPITAL LETTER K
+0xD3   0x004C  #LATIN CAPITAL LETTER L
+0xD4   0x004D  #LATIN CAPITAL LETTER M
+0xD5   0x004E  #LATIN CAPITAL LETTER N
+0xD6   0x004F  #LATIN CAPITAL LETTER O
+0xD7   0x0050  #LATIN CAPITAL LETTER P
+0xD8   0x0051  #LATIN CAPITAL LETTER Q
+0xD9   0x0052  #LATIN CAPITAL LETTER R
+0xDA   0x00B9  #SUPERSCRIPT ONE
+0xDB   0x00FB  #LATIN SMALL LETTER U WITH CIRCUMFLEX
+0xDC   0x00FC  #LATIN SMALL LETTER U WITH DIAERESIS
+0xDD   0x00F9  #LATIN SMALL LETTER U WITH GRAVE
+0xDE   0x00FA  #LATIN SMALL LETTER U WITH ACUTE
+0xDF   0x00FF  #LATIN SMALL LETTER Y WITH DIAERESIS
+0xE0   0x005C  #REVERSE SOLIDUS
+0xE1   0x00F7  #DIVISION SIGN
+0xE2   0x0053  #LATIN CAPITAL LETTER S
+0xE3   0x0054  #LATIN CAPITAL LETTER T
+0xE4   0x0055  #LATIN CAPITAL LETTER U
+0xE5   0x0056  #LATIN CAPITAL LETTER V
+0xE6   0x0057  #LATIN CAPITAL LETTER W
+0xE7   0x0058  #LATIN CAPITAL LETTER X
+0xE8   0x0059  #LATIN CAPITAL LETTER Y
+0xE9   0x005A  #LATIN CAPITAL LETTER Z
+0xEA   0x00B2  #SUPERSCRIPT TWO
+0xEB   0x00D4  #LATIN CAPITAL LETTER O WITH CIRCUMFLEX
+0xEC   0x00D6  #LATIN CAPITAL LETTER O WITH DIAERESIS
+0xED   0x00D2  #LATIN CAPITAL LETTER O WITH GRAVE
+0xEE   0x00D3  #LATIN CAPITAL LETTER O WITH ACUTE
+0xEF   0x00D5  #LATIN CAPITAL LETTER O WITH TILDE
+0xF0   0x0030  #DIGIT ZERO
+0xF1   0x0031  #DIGIT ONE
+0xF2   0x0032  #DIGIT TWO
+0xF3   0x0033  #DIGIT THREE
+0xF4   0x0034  #DIGIT FOUR
+0xF5   0x0035  #DIGIT FIVE
+0xF6   0x0036  #DIGIT SIX
+0xF7   0x0037  #DIGIT SEVEN
+0xF8   0x0038  #DIGIT EIGHT
+0xF9   0x0039  #DIGIT NINE
+0xFA   0x00B3  #SUPERSCRIPT THREE
+0xFB   0x00DB  #LATIN CAPITAL LETTER U WITH CIRCUMFLEX
+0xFC   0x00DC  #LATIN CAPITAL LETTER U WITH DIAERESIS
+0xFD   0x00D9  #LATIN CAPITAL LETTER U WITH GRAVE
+0xFE   0x00DA  #LATIN CAPITAL LETTER U WITH ACUTE
+0xFF   0x009F  #CONTROL
diff --git a/basis/io/encodings/8-bit/CP737.TXT b/basis/io/encodings/8-bit/CP737.TXT
new file mode 100644 (file)
index 0000000..08ec277
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp737_DOSGreek to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp737_DOSGreek code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp737_DOSGreek order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0a   0x000a  #LINE FEED
+0x0b   0x000b  #VERTICAL TABULATION
+0x0c   0x000c  #FORM FEED
+0x0d   0x000d  #CARRIAGE RETURN
+0x0e   0x000e  #SHIFT OUT
+0x0f   0x000f  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1a   0x001a  #SUBSTITUTE
+0x1b   0x001b  #ESCAPE
+0x1c   0x001c  #FILE SEPARATOR
+0x1d   0x001d  #GROUP SEPARATOR
+0x1e   0x001e  #RECORD SEPARATOR
+0x1f   0x001f  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x0025  #PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2a   0x002a  #ASTERISK
+0x2b   0x002b  #PLUS SIGN
+0x2c   0x002c  #COMMA
+0x2d   0x002d  #HYPHEN-MINUS
+0x2e   0x002e  #FULL STOP
+0x2f   0x002f  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3a   0x003a  #COLON
+0x3b   0x003b  #SEMICOLON
+0x3c   0x003c  #LESS-THAN SIGN
+0x3d   0x003d  #EQUALS SIGN
+0x3e   0x003e  #GREATER-THAN SIGN
+0x3f   0x003f  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4a   0x004a  #LATIN CAPITAL LETTER J
+0x4b   0x004b  #LATIN CAPITAL LETTER K
+0x4c   0x004c  #LATIN CAPITAL LETTER L
+0x4d   0x004d  #LATIN CAPITAL LETTER M
+0x4e   0x004e  #LATIN CAPITAL LETTER N
+0x4f   0x004f  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5a   0x005a  #LATIN CAPITAL LETTER Z
+0x5b   0x005b  #LEFT SQUARE BRACKET
+0x5c   0x005c  #REVERSE SOLIDUS
+0x5d   0x005d  #RIGHT SQUARE BRACKET
+0x5e   0x005e  #CIRCUMFLEX ACCENT
+0x5f   0x005f  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6a   0x006a  #LATIN SMALL LETTER J
+0x6b   0x006b  #LATIN SMALL LETTER K
+0x6c   0x006c  #LATIN SMALL LETTER L
+0x6d   0x006d  #LATIN SMALL LETTER M
+0x6e   0x006e  #LATIN SMALL LETTER N
+0x6f   0x006f  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7a   0x007a  #LATIN SMALL LETTER Z
+0x7b   0x007b  #LEFT CURLY BRACKET
+0x7c   0x007c  #VERTICAL LINE
+0x7d   0x007d  #RIGHT CURLY BRACKET
+0x7e   0x007e  #TILDE
+0x7f   0x007f  #DELETE
+0x80   0x0391  #GREEK CAPITAL LETTER ALPHA
+0x81   0x0392  #GREEK CAPITAL LETTER BETA
+0x82   0x0393  #GREEK CAPITAL LETTER GAMMA
+0x83   0x0394  #GREEK CAPITAL LETTER DELTA
+0x84   0x0395  #GREEK CAPITAL LETTER EPSILON
+0x85   0x0396  #GREEK CAPITAL LETTER ZETA
+0x86   0x0397  #GREEK CAPITAL LETTER ETA
+0x87   0x0398  #GREEK CAPITAL LETTER THETA
+0x88   0x0399  #GREEK CAPITAL LETTER IOTA
+0x89   0x039a  #GREEK CAPITAL LETTER KAPPA
+0x8a   0x039b  #GREEK CAPITAL LETTER LAMDA
+0x8b   0x039c  #GREEK CAPITAL LETTER MU
+0x8c   0x039d  #GREEK CAPITAL LETTER NU
+0x8d   0x039e  #GREEK CAPITAL LETTER XI
+0x8e   0x039f  #GREEK CAPITAL LETTER OMICRON
+0x8f   0x03a0  #GREEK CAPITAL LETTER PI
+0x90   0x03a1  #GREEK CAPITAL LETTER RHO
+0x91   0x03a3  #GREEK CAPITAL LETTER SIGMA
+0x92   0x03a4  #GREEK CAPITAL LETTER TAU
+0x93   0x03a5  #GREEK CAPITAL LETTER UPSILON
+0x94   0x03a6  #GREEK CAPITAL LETTER PHI
+0x95   0x03a7  #GREEK CAPITAL LETTER CHI
+0x96   0x03a8  #GREEK CAPITAL LETTER PSI
+0x97   0x03a9  #GREEK CAPITAL LETTER OMEGA
+0x98   0x03b1  #GREEK SMALL LETTER ALPHA
+0x99   0x03b2  #GREEK SMALL LETTER BETA
+0x9a   0x03b3  #GREEK SMALL LETTER GAMMA
+0x9b   0x03b4  #GREEK SMALL LETTER DELTA
+0x9c   0x03b5  #GREEK SMALL LETTER EPSILON
+0x9d   0x03b6  #GREEK SMALL LETTER ZETA
+0x9e   0x03b7  #GREEK SMALL LETTER ETA
+0x9f   0x03b8  #GREEK SMALL LETTER THETA
+0xa0   0x03b9  #GREEK SMALL LETTER IOTA
+0xa1   0x03ba  #GREEK SMALL LETTER KAPPA
+0xa2   0x03bb  #GREEK SMALL LETTER LAMDA
+0xa3   0x03bc  #GREEK SMALL LETTER MU
+0xa4   0x03bd  #GREEK SMALL LETTER NU
+0xa5   0x03be  #GREEK SMALL LETTER XI
+0xa6   0x03bf  #GREEK SMALL LETTER OMICRON
+0xa7   0x03c0  #GREEK SMALL LETTER PI
+0xa8   0x03c1  #GREEK SMALL LETTER RHO
+0xa9   0x03c3  #GREEK SMALL LETTER SIGMA
+0xaa   0x03c2  #GREEK SMALL LETTER FINAL SIGMA
+0xab   0x03c4  #GREEK SMALL LETTER TAU
+0xac   0x03c5  #GREEK SMALL LETTER UPSILON
+0xad   0x03c6  #GREEK SMALL LETTER PHI
+0xae   0x03c7  #GREEK SMALL LETTER CHI
+0xaf   0x03c8  #GREEK SMALL LETTER PSI
+0xb0   0x2591  #LIGHT SHADE
+0xb1   0x2592  #MEDIUM SHADE
+0xb2   0x2593  #DARK SHADE
+0xb3   0x2502  #BOX DRAWINGS LIGHT VERTICAL
+0xb4   0x2524  #BOX DRAWINGS LIGHT VERTICAL AND LEFT
+0xb5   0x2561  #BOX DRAWINGS VERTICAL SINGLE AND LEFT DOUBLE
+0xb6   0x2562  #BOX DRAWINGS VERTICAL DOUBLE AND LEFT SINGLE
+0xb7   0x2556  #BOX DRAWINGS DOWN DOUBLE AND LEFT SINGLE
+0xb8   0x2555  #BOX DRAWINGS DOWN SINGLE AND LEFT DOUBLE
+0xb9   0x2563  #BOX DRAWINGS DOUBLE VERTICAL AND LEFT
+0xba   0x2551  #BOX DRAWINGS DOUBLE VERTICAL
+0xbb   0x2557  #BOX DRAWINGS DOUBLE DOWN AND LEFT
+0xbc   0x255d  #BOX DRAWINGS DOUBLE UP AND LEFT
+0xbd   0x255c  #BOX DRAWINGS UP DOUBLE AND LEFT SINGLE
+0xbe   0x255b  #BOX DRAWINGS UP SINGLE AND LEFT DOUBLE
+0xbf   0x2510  #BOX DRAWINGS LIGHT DOWN AND LEFT
+0xc0   0x2514  #BOX DRAWINGS LIGHT UP AND RIGHT
+0xc1   0x2534  #BOX DRAWINGS LIGHT UP AND HORIZONTAL
+0xc2   0x252c  #BOX DRAWINGS LIGHT DOWN AND HORIZONTAL
+0xc3   0x251c  #BOX DRAWINGS LIGHT VERTICAL AND RIGHT
+0xc4   0x2500  #BOX DRAWINGS LIGHT HORIZONTAL
+0xc5   0x253c  #BOX DRAWINGS LIGHT VERTICAL AND HORIZONTAL
+0xc6   0x255e  #BOX DRAWINGS VERTICAL SINGLE AND RIGHT DOUBLE
+0xc7   0x255f  #BOX DRAWINGS VERTICAL DOUBLE AND RIGHT SINGLE
+0xc8   0x255a  #BOX DRAWINGS DOUBLE UP AND RIGHT
+0xc9   0x2554  #BOX DRAWINGS DOUBLE DOWN AND RIGHT
+0xca   0x2569  #BOX DRAWINGS DOUBLE UP AND HORIZONTAL
+0xcb   0x2566  #BOX DRAWINGS DOUBLE DOWN AND HORIZONTAL
+0xcc   0x2560  #BOX DRAWINGS DOUBLE VERTICAL AND RIGHT
+0xcd   0x2550  #BOX DRAWINGS DOUBLE HORIZONTAL
+0xce   0x256c  #BOX DRAWINGS DOUBLE VERTICAL AND HORIZONTAL
+0xcf   0x2567  #BOX DRAWINGS UP SINGLE AND HORIZONTAL DOUBLE
+0xd0   0x2568  #BOX DRAWINGS UP DOUBLE AND HORIZONTAL SINGLE
+0xd1   0x2564  #BOX DRAWINGS DOWN SINGLE AND HORIZONTAL DOUBLE
+0xd2   0x2565  #BOX DRAWINGS DOWN DOUBLE AND HORIZONTAL SINGLE
+0xd3   0x2559  #BOX DRAWINGS UP DOUBLE AND RIGHT SINGLE
+0xd4   0x2558  #BOX DRAWINGS UP SINGLE AND RIGHT DOUBLE
+0xd5   0x2552  #BOX DRAWINGS DOWN SINGLE AND RIGHT DOUBLE
+0xd6   0x2553  #BOX DRAWINGS DOWN DOUBLE AND RIGHT SINGLE
+0xd7   0x256b  #BOX DRAWINGS VERTICAL DOUBLE AND HORIZONTAL SINGLE
+0xd8   0x256a  #BOX DRAWINGS VERTICAL SINGLE AND HORIZONTAL DOUBLE
+0xd9   0x2518  #BOX DRAWINGS LIGHT UP AND LEFT
+0xda   0x250c  #BOX DRAWINGS LIGHT DOWN AND RIGHT
+0xdb   0x2588  #FULL BLOCK
+0xdc   0x2584  #LOWER HALF BLOCK
+0xdd   0x258c  #LEFT HALF BLOCK
+0xde   0x2590  #RIGHT HALF BLOCK
+0xdf   0x2580  #UPPER HALF BLOCK
+0xe0   0x03c9  #GREEK SMALL LETTER OMEGA
+0xe1   0x03ac  #GREEK SMALL LETTER ALPHA WITH TONOS
+0xe2   0x03ad  #GREEK SMALL LETTER EPSILON WITH TONOS
+0xe3   0x03ae  #GREEK SMALL LETTER ETA WITH TONOS
+0xe4   0x03ca  #GREEK SMALL LETTER IOTA WITH DIALYTIKA
+0xe5   0x03af  #GREEK SMALL LETTER IOTA WITH TONOS
+0xe6   0x03cc  #GREEK SMALL LETTER OMICRON WITH TONOS
+0xe7   0x03cd  #GREEK SMALL LETTER UPSILON WITH TONOS
+0xe8   0x03cb  #GREEK SMALL LETTER UPSILON WITH DIALYTIKA
+0xe9   0x03ce  #GREEK SMALL LETTER OMEGA WITH TONOS
+0xea   0x0386  #GREEK CAPITAL LETTER ALPHA WITH TONOS
+0xeb   0x0388  #GREEK CAPITAL LETTER EPSILON WITH TONOS
+0xec   0x0389  #GREEK CAPITAL LETTER ETA WITH TONOS
+0xed   0x038a  #GREEK CAPITAL LETTER IOTA WITH TONOS
+0xee   0x038c  #GREEK CAPITAL LETTER OMICRON WITH TONOS
+0xef   0x038e  #GREEK CAPITAL LETTER UPSILON WITH TONOS
+0xf0   0x038f  #GREEK CAPITAL LETTER OMEGA WITH TONOS
+0xf1   0x00b1  #PLUS-MINUS SIGN
+0xf2   0x2265  #GREATER-THAN OR EQUAL TO
+0xf3   0x2264  #LESS-THAN OR EQUAL TO
+0xf4   0x03aa  #GREEK CAPITAL LETTER IOTA WITH DIALYTIKA
+0xf5   0x03ab  #GREEK CAPITAL LETTER UPSILON WITH DIALYTIKA
+0xf6   0x00f7  #DIVISION SIGN
+0xf7   0x2248  #ALMOST EQUAL TO
+0xf8   0x00b0  #DEGREE SIGN
+0xf9   0x2219  #BULLET OPERATOR
+0xfa   0x00b7  #MIDDLE DOT
+0xfb   0x221a  #SQUARE ROOT
+0xfc   0x207f  #SUPERSCRIPT LATIN SMALL LETTER N
+0xfd   0x00b2  #SUPERSCRIPT TWO
+0xfe   0x25a0  #BLACK SQUARE
+0xff   0x00a0  #NO-BREAK SPACE
diff --git a/basis/io/encodings/8-bit/CP775.TXT b/basis/io/encodings/8-bit/CP775.TXT
new file mode 100644 (file)
index 0000000..1cd451c
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp775_DOSBaltRim to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp775_DOSBaltRim code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp775_DOSBaltRim order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0a   0x000a  #LINE FEED
+0x0b   0x000b  #VERTICAL TABULATION
+0x0c   0x000c  #FORM FEED
+0x0d   0x000d  #CARRIAGE RETURN
+0x0e   0x000e  #SHIFT OUT
+0x0f   0x000f  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1a   0x001a  #SUBSTITUTE
+0x1b   0x001b  #ESCAPE
+0x1c   0x001c  #FILE SEPARATOR
+0x1d   0x001d  #GROUP SEPARATOR
+0x1e   0x001e  #RECORD SEPARATOR
+0x1f   0x001f  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x0025  #PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2a   0x002a  #ASTERISK
+0x2b   0x002b  #PLUS SIGN
+0x2c   0x002c  #COMMA
+0x2d   0x002d  #HYPHEN-MINUS
+0x2e   0x002e  #FULL STOP
+0x2f   0x002f  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3a   0x003a  #COLON
+0x3b   0x003b  #SEMICOLON
+0x3c   0x003c  #LESS-THAN SIGN
+0x3d   0x003d  #EQUALS SIGN
+0x3e   0x003e  #GREATER-THAN SIGN
+0x3f   0x003f  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4a   0x004a  #LATIN CAPITAL LETTER J
+0x4b   0x004b  #LATIN CAPITAL LETTER K
+0x4c   0x004c  #LATIN CAPITAL LETTER L
+0x4d   0x004d  #LATIN CAPITAL LETTER M
+0x4e   0x004e  #LATIN CAPITAL LETTER N
+0x4f   0x004f  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5a   0x005a  #LATIN CAPITAL LETTER Z
+0x5b   0x005b  #LEFT SQUARE BRACKET
+0x5c   0x005c  #REVERSE SOLIDUS
+0x5d   0x005d  #RIGHT SQUARE BRACKET
+0x5e   0x005e  #CIRCUMFLEX ACCENT
+0x5f   0x005f  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6a   0x006a  #LATIN SMALL LETTER J
+0x6b   0x006b  #LATIN SMALL LETTER K
+0x6c   0x006c  #LATIN SMALL LETTER L
+0x6d   0x006d  #LATIN SMALL LETTER M
+0x6e   0x006e  #LATIN SMALL LETTER N
+0x6f   0x006f  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7a   0x007a  #LATIN SMALL LETTER Z
+0x7b   0x007b  #LEFT CURLY BRACKET
+0x7c   0x007c  #VERTICAL LINE
+0x7d   0x007d  #RIGHT CURLY BRACKET
+0x7e   0x007e  #TILDE
+0x7f   0x007f  #DELETE
+0x80   0x0106  #LATIN CAPITAL LETTER C WITH ACUTE
+0x81   0x00fc  #LATIN SMALL LETTER U WITH DIAERESIS
+0x82   0x00e9  #LATIN SMALL LETTER E WITH ACUTE
+0x83   0x0101  #LATIN SMALL LETTER A WITH MACRON
+0x84   0x00e4  #LATIN SMALL LETTER A WITH DIAERESIS
+0x85   0x0123  #LATIN SMALL LETTER G WITH CEDILLA
+0x86   0x00e5  #LATIN SMALL LETTER A WITH RING ABOVE
+0x87   0x0107  #LATIN SMALL LETTER C WITH ACUTE
+0x88   0x0142  #LATIN SMALL LETTER L WITH STROKE
+0x89   0x0113  #LATIN SMALL LETTER E WITH MACRON
+0x8a   0x0156  #LATIN CAPITAL LETTER R WITH CEDILLA
+0x8b   0x0157  #LATIN SMALL LETTER R WITH CEDILLA
+0x8c   0x012b  #LATIN SMALL LETTER I WITH MACRON
+0x8d   0x0179  #LATIN CAPITAL LETTER Z WITH ACUTE
+0x8e   0x00c4  #LATIN CAPITAL LETTER A WITH DIAERESIS
+0x8f   0x00c5  #LATIN CAPITAL LETTER A WITH RING ABOVE
+0x90   0x00c9  #LATIN CAPITAL LETTER E WITH ACUTE
+0x91   0x00e6  #LATIN SMALL LIGATURE AE
+0x92   0x00c6  #LATIN CAPITAL LIGATURE AE
+0x93   0x014d  #LATIN SMALL LETTER O WITH MACRON
+0x94   0x00f6  #LATIN SMALL LETTER O WITH DIAERESIS
+0x95   0x0122  #LATIN CAPITAL LETTER G WITH CEDILLA
+0x96   0x00a2  #CENT SIGN
+0x97   0x015a  #LATIN CAPITAL LETTER S WITH ACUTE
+0x98   0x015b  #LATIN SMALL LETTER S WITH ACUTE
+0x99   0x00d6  #LATIN CAPITAL LETTER O WITH DIAERESIS
+0x9a   0x00dc  #LATIN CAPITAL LETTER U WITH DIAERESIS
+0x9b   0x00f8  #LATIN SMALL LETTER O WITH STROKE
+0x9c   0x00a3  #POUND SIGN
+0x9d   0x00d8  #LATIN CAPITAL LETTER O WITH STROKE
+0x9e   0x00d7  #MULTIPLICATION SIGN
+0x9f   0x00a4  #CURRENCY SIGN
+0xa0   0x0100  #LATIN CAPITAL LETTER A WITH MACRON
+0xa1   0x012a  #LATIN CAPITAL LETTER I WITH MACRON
+0xa2   0x00f3  #LATIN SMALL LETTER O WITH ACUTE
+0xa3   0x017b  #LATIN CAPITAL LETTER Z WITH DOT ABOVE
+0xa4   0x017c  #LATIN SMALL LETTER Z WITH DOT ABOVE
+0xa5   0x017a  #LATIN SMALL LETTER Z WITH ACUTE
+0xa6   0x201d  #RIGHT DOUBLE QUOTATION MARK
+0xa7   0x00a6  #BROKEN BAR
+0xa8   0x00a9  #COPYRIGHT SIGN
+0xa9   0x00ae  #REGISTERED SIGN
+0xaa   0x00ac  #NOT SIGN
+0xab   0x00bd  #VULGAR FRACTION ONE HALF
+0xac   0x00bc  #VULGAR FRACTION ONE QUARTER
+0xad   0x0141  #LATIN CAPITAL LETTER L WITH STROKE
+0xae   0x00ab  #LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xaf   0x00bb  #RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xb0   0x2591  #LIGHT SHADE
+0xb1   0x2592  #MEDIUM SHADE
+0xb2   0x2593  #DARK SHADE
+0xb3   0x2502  #BOX DRAWINGS LIGHT VERTICAL
+0xb4   0x2524  #BOX DRAWINGS LIGHT VERTICAL AND LEFT
+0xb5   0x0104  #LATIN CAPITAL LETTER A WITH OGONEK
+0xb6   0x010c  #LATIN CAPITAL LETTER C WITH CARON
+0xb7   0x0118  #LATIN CAPITAL LETTER E WITH OGONEK
+0xb8   0x0116  #LATIN CAPITAL LETTER E WITH DOT ABOVE
+0xb9   0x2563  #BOX DRAWINGS DOUBLE VERTICAL AND LEFT
+0xba   0x2551  #BOX DRAWINGS DOUBLE VERTICAL
+0xbb   0x2557  #BOX DRAWINGS DOUBLE DOWN AND LEFT
+0xbc   0x255d  #BOX DRAWINGS DOUBLE UP AND LEFT
+0xbd   0x012e  #LATIN CAPITAL LETTER I WITH OGONEK
+0xbe   0x0160  #LATIN CAPITAL LETTER S WITH CARON
+0xbf   0x2510  #BOX DRAWINGS LIGHT DOWN AND LEFT
+0xc0   0x2514  #BOX DRAWINGS LIGHT UP AND RIGHT
+0xc1   0x2534  #BOX DRAWINGS LIGHT UP AND HORIZONTAL
+0xc2   0x252c  #BOX DRAWINGS LIGHT DOWN AND HORIZONTAL
+0xc3   0x251c  #BOX DRAWINGS LIGHT VERTICAL AND RIGHT
+0xc4   0x2500  #BOX DRAWINGS LIGHT HORIZONTAL
+0xc5   0x253c  #BOX DRAWINGS LIGHT VERTICAL AND HORIZONTAL
+0xc6   0x0172  #LATIN CAPITAL LETTER U WITH OGONEK
+0xc7   0x016a  #LATIN CAPITAL LETTER U WITH MACRON
+0xc8   0x255a  #BOX DRAWINGS DOUBLE UP AND RIGHT
+0xc9   0x2554  #BOX DRAWINGS DOUBLE DOWN AND RIGHT
+0xca   0x2569  #BOX DRAWINGS DOUBLE UP AND HORIZONTAL
+0xcb   0x2566  #BOX DRAWINGS DOUBLE DOWN AND HORIZONTAL
+0xcc   0x2560  #BOX DRAWINGS DOUBLE VERTICAL AND RIGHT
+0xcd   0x2550  #BOX DRAWINGS DOUBLE HORIZONTAL
+0xce   0x256c  #BOX DRAWINGS DOUBLE VERTICAL AND HORIZONTAL
+0xcf   0x017d  #LATIN CAPITAL LETTER Z WITH CARON
+0xd0   0x0105  #LATIN SMALL LETTER A WITH OGONEK
+0xd1   0x010d  #LATIN SMALL LETTER C WITH CARON
+0xd2   0x0119  #LATIN SMALL LETTER E WITH OGONEK
+0xd3   0x0117  #LATIN SMALL LETTER E WITH DOT ABOVE
+0xd4   0x012f  #LATIN SMALL LETTER I WITH OGONEK
+0xd5   0x0161  #LATIN SMALL LETTER S WITH CARON
+0xd6   0x0173  #LATIN SMALL LETTER U WITH OGONEK
+0xd7   0x016b  #LATIN SMALL LETTER U WITH MACRON
+0xd8   0x017e  #LATIN SMALL LETTER Z WITH CARON
+0xd9   0x2518  #BOX DRAWINGS LIGHT UP AND LEFT
+0xda   0x250c  #BOX DRAWINGS LIGHT DOWN AND RIGHT
+0xdb   0x2588  #FULL BLOCK
+0xdc   0x2584  #LOWER HALF BLOCK
+0xdd   0x258c  #LEFT HALF BLOCK
+0xde   0x2590  #RIGHT HALF BLOCK
+0xdf   0x2580  #UPPER HALF BLOCK
+0xe0   0x00d3  #LATIN CAPITAL LETTER O WITH ACUTE
+0xe1   0x00df  #LATIN SMALL LETTER SHARP S (GERMAN)
+0xe2   0x014c  #LATIN CAPITAL LETTER O WITH MACRON
+0xe3   0x0143  #LATIN CAPITAL LETTER N WITH ACUTE
+0xe4   0x00f5  #LATIN SMALL LETTER O WITH TILDE
+0xe5   0x00d5  #LATIN CAPITAL LETTER O WITH TILDE
+0xe6   0x00b5  #MICRO SIGN
+0xe7   0x0144  #LATIN SMALL LETTER N WITH ACUTE
+0xe8   0x0136  #LATIN CAPITAL LETTER K WITH CEDILLA
+0xe9   0x0137  #LATIN SMALL LETTER K WITH CEDILLA
+0xea   0x013b  #LATIN CAPITAL LETTER L WITH CEDILLA
+0xeb   0x013c  #LATIN SMALL LETTER L WITH CEDILLA
+0xec   0x0146  #LATIN SMALL LETTER N WITH CEDILLA
+0xed   0x0112  #LATIN CAPITAL LETTER E WITH MACRON
+0xee   0x0145  #LATIN CAPITAL LETTER N WITH CEDILLA
+0xef   0x2019  #RIGHT SINGLE QUOTATION MARK
+0xf0   0x00ad  #SOFT HYPHEN
+0xf1   0x00b1  #PLUS-MINUS SIGN
+0xf2   0x201c  #LEFT DOUBLE QUOTATION MARK
+0xf3   0x00be  #VULGAR FRACTION THREE QUARTERS
+0xf4   0x00b6  #PILCROW SIGN
+0xf5   0x00a7  #SECTION SIGN
+0xf6   0x00f7  #DIVISION SIGN
+0xf7   0x201e  #DOUBLE LOW-9 QUOTATION MARK
+0xf8   0x00b0  #DEGREE SIGN
+0xf9   0x2219  #BULLET OPERATOR
+0xfa   0x00b7  #MIDDLE DOT
+0xfb   0x00b9  #SUPERSCRIPT ONE
+0xfc   0x00b3  #SUPERSCRIPT THREE
+0xfd   0x00b2  #SUPERSCRIPT TWO
+0xfe   0x25a0  #BLACK SQUARE
+0xff   0x00a0  #NO-BREAK SPACE
diff --git a/basis/io/encodings/8-bit/CP850.TXT b/basis/io/encodings/8-bit/CP850.TXT
new file mode 100644 (file)
index 0000000..26a4232
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp850_DOSLatin1 to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp850_DOSLatin1 code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp850_DOSLatin1 order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0a   0x000a  #LINE FEED
+0x0b   0x000b  #VERTICAL TABULATION
+0x0c   0x000c  #FORM FEED
+0x0d   0x000d  #CARRIAGE RETURN
+0x0e   0x000e  #SHIFT OUT
+0x0f   0x000f  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1a   0x001a  #SUBSTITUTE
+0x1b   0x001b  #ESCAPE
+0x1c   0x001c  #FILE SEPARATOR
+0x1d   0x001d  #GROUP SEPARATOR
+0x1e   0x001e  #RECORD SEPARATOR
+0x1f   0x001f  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x0025  #PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2a   0x002a  #ASTERISK
+0x2b   0x002b  #PLUS SIGN
+0x2c   0x002c  #COMMA
+0x2d   0x002d  #HYPHEN-MINUS
+0x2e   0x002e  #FULL STOP
+0x2f   0x002f  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3a   0x003a  #COLON
+0x3b   0x003b  #SEMICOLON
+0x3c   0x003c  #LESS-THAN SIGN
+0x3d   0x003d  #EQUALS SIGN
+0x3e   0x003e  #GREATER-THAN SIGN
+0x3f   0x003f  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4a   0x004a  #LATIN CAPITAL LETTER J
+0x4b   0x004b  #LATIN CAPITAL LETTER K
+0x4c   0x004c  #LATIN CAPITAL LETTER L
+0x4d   0x004d  #LATIN CAPITAL LETTER M
+0x4e   0x004e  #LATIN CAPITAL LETTER N
+0x4f   0x004f  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5a   0x005a  #LATIN CAPITAL LETTER Z
+0x5b   0x005b  #LEFT SQUARE BRACKET
+0x5c   0x005c  #REVERSE SOLIDUS
+0x5d   0x005d  #RIGHT SQUARE BRACKET
+0x5e   0x005e  #CIRCUMFLEX ACCENT
+0x5f   0x005f  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6a   0x006a  #LATIN SMALL LETTER J
+0x6b   0x006b  #LATIN SMALL LETTER K
+0x6c   0x006c  #LATIN SMALL LETTER L
+0x6d   0x006d  #LATIN SMALL LETTER M
+0x6e   0x006e  #LATIN SMALL LETTER N
+0x6f   0x006f  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7a   0x007a  #LATIN SMALL LETTER Z
+0x7b   0x007b  #LEFT CURLY BRACKET
+0x7c   0x007c  #VERTICAL LINE
+0x7d   0x007d  #RIGHT CURLY BRACKET
+0x7e   0x007e  #TILDE
+0x7f   0x007f  #DELETE
+0x80   0x00c7  #LATIN CAPITAL LETTER C WITH CEDILLA
+0x81   0x00fc  #LATIN SMALL LETTER U WITH DIAERESIS
+0x82   0x00e9  #LATIN SMALL LETTER E WITH ACUTE
+0x83   0x00e2  #LATIN SMALL LETTER A WITH CIRCUMFLEX
+0x84   0x00e4  #LATIN SMALL LETTER A WITH DIAERESIS
+0x85   0x00e0  #LATIN SMALL LETTER A WITH GRAVE
+0x86   0x00e5  #LATIN SMALL LETTER A WITH RING ABOVE
+0x87   0x00e7  #LATIN SMALL LETTER C WITH CEDILLA
+0x88   0x00ea  #LATIN SMALL LETTER E WITH CIRCUMFLEX
+0x89   0x00eb  #LATIN SMALL LETTER E WITH DIAERESIS
+0x8a   0x00e8  #LATIN SMALL LETTER E WITH GRAVE
+0x8b   0x00ef  #LATIN SMALL LETTER I WITH DIAERESIS
+0x8c   0x00ee  #LATIN SMALL LETTER I WITH CIRCUMFLEX
+0x8d   0x00ec  #LATIN SMALL LETTER I WITH GRAVE
+0x8e   0x00c4  #LATIN CAPITAL LETTER A WITH DIAERESIS
+0x8f   0x00c5  #LATIN CAPITAL LETTER A WITH RING ABOVE
+0x90   0x00c9  #LATIN CAPITAL LETTER E WITH ACUTE
+0x91   0x00e6  #LATIN SMALL LIGATURE AE
+0x92   0x00c6  #LATIN CAPITAL LIGATURE AE
+0x93   0x00f4  #LATIN SMALL LETTER O WITH CIRCUMFLEX
+0x94   0x00f6  #LATIN SMALL LETTER O WITH DIAERESIS
+0x95   0x00f2  #LATIN SMALL LETTER O WITH GRAVE
+0x96   0x00fb  #LATIN SMALL LETTER U WITH CIRCUMFLEX
+0x97   0x00f9  #LATIN SMALL LETTER U WITH GRAVE
+0x98   0x00ff  #LATIN SMALL LETTER Y WITH DIAERESIS
+0x99   0x00d6  #LATIN CAPITAL LETTER O WITH DIAERESIS
+0x9a   0x00dc  #LATIN CAPITAL LETTER U WITH DIAERESIS
+0x9b   0x00f8  #LATIN SMALL LETTER O WITH STROKE
+0x9c   0x00a3  #POUND SIGN
+0x9d   0x00d8  #LATIN CAPITAL LETTER O WITH STROKE
+0x9e   0x00d7  #MULTIPLICATION SIGN
+0x9f   0x0192  #LATIN SMALL LETTER F WITH HOOK
+0xa0   0x00e1  #LATIN SMALL LETTER A WITH ACUTE
+0xa1   0x00ed  #LATIN SMALL LETTER I WITH ACUTE
+0xa2   0x00f3  #LATIN SMALL LETTER O WITH ACUTE
+0xa3   0x00fa  #LATIN SMALL LETTER U WITH ACUTE
+0xa4   0x00f1  #LATIN SMALL LETTER N WITH TILDE
+0xa5   0x00d1  #LATIN CAPITAL LETTER N WITH TILDE
+0xa6   0x00aa  #FEMININE ORDINAL INDICATOR
+0xa7   0x00ba  #MASCULINE ORDINAL INDICATOR
+0xa8   0x00bf  #INVERTED QUESTION MARK
+0xa9   0x00ae  #REGISTERED SIGN
+0xaa   0x00ac  #NOT SIGN
+0xab   0x00bd  #VULGAR FRACTION ONE HALF
+0xac   0x00bc  #VULGAR FRACTION ONE QUARTER
+0xad   0x00a1  #INVERTED EXCLAMATION MARK
+0xae   0x00ab  #LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xaf   0x00bb  #RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xb0   0x2591  #LIGHT SHADE
+0xb1   0x2592  #MEDIUM SHADE
+0xb2   0x2593  #DARK SHADE
+0xb3   0x2502  #BOX DRAWINGS LIGHT VERTICAL
+0xb4   0x2524  #BOX DRAWINGS LIGHT VERTICAL AND LEFT
+0xb5   0x00c1  #LATIN CAPITAL LETTER A WITH ACUTE
+0xb6   0x00c2  #LATIN CAPITAL LETTER A WITH CIRCUMFLEX
+0xb7   0x00c0  #LATIN CAPITAL LETTER A WITH GRAVE
+0xb8   0x00a9  #COPYRIGHT SIGN
+0xb9   0x2563  #BOX DRAWINGS DOUBLE VERTICAL AND LEFT
+0xba   0x2551  #BOX DRAWINGS DOUBLE VERTICAL
+0xbb   0x2557  #BOX DRAWINGS DOUBLE DOWN AND LEFT
+0xbc   0x255d  #BOX DRAWINGS DOUBLE UP AND LEFT
+0xbd   0x00a2  #CENT SIGN
+0xbe   0x00a5  #YEN SIGN
+0xbf   0x2510  #BOX DRAWINGS LIGHT DOWN AND LEFT
+0xc0   0x2514  #BOX DRAWINGS LIGHT UP AND RIGHT
+0xc1   0x2534  #BOX DRAWINGS LIGHT UP AND HORIZONTAL
+0xc2   0x252c  #BOX DRAWINGS LIGHT DOWN AND HORIZONTAL
+0xc3   0x251c  #BOX DRAWINGS LIGHT VERTICAL AND RIGHT
+0xc4   0x2500  #BOX DRAWINGS LIGHT HORIZONTAL
+0xc5   0x253c  #BOX DRAWINGS LIGHT VERTICAL AND HORIZONTAL
+0xc6   0x00e3  #LATIN SMALL LETTER A WITH TILDE
+0xc7   0x00c3  #LATIN CAPITAL LETTER A WITH TILDE
+0xc8   0x255a  #BOX DRAWINGS DOUBLE UP AND RIGHT
+0xc9   0x2554  #BOX DRAWINGS DOUBLE DOWN AND RIGHT
+0xca   0x2569  #BOX DRAWINGS DOUBLE UP AND HORIZONTAL
+0xcb   0x2566  #BOX DRAWINGS DOUBLE DOWN AND HORIZONTAL
+0xcc   0x2560  #BOX DRAWINGS DOUBLE VERTICAL AND RIGHT
+0xcd   0x2550  #BOX DRAWINGS DOUBLE HORIZONTAL
+0xce   0x256c  #BOX DRAWINGS DOUBLE VERTICAL AND HORIZONTAL
+0xcf   0x00a4  #CURRENCY SIGN
+0xd0   0x00f0  #LATIN SMALL LETTER ETH
+0xd1   0x00d0  #LATIN CAPITAL LETTER ETH
+0xd2   0x00ca  #LATIN CAPITAL LETTER E WITH CIRCUMFLEX
+0xd3   0x00cb  #LATIN CAPITAL LETTER E WITH DIAERESIS
+0xd4   0x00c8  #LATIN CAPITAL LETTER E WITH GRAVE
+0xd5   0x0131  #LATIN SMALL LETTER DOTLESS I
+0xd6   0x00cd  #LATIN CAPITAL LETTER I WITH ACUTE
+0xd7   0x00ce  #LATIN CAPITAL LETTER I WITH CIRCUMFLEX
+0xd8   0x00cf  #LATIN CAPITAL LETTER I WITH DIAERESIS
+0xd9   0x2518  #BOX DRAWINGS LIGHT UP AND LEFT
+0xda   0x250c  #BOX DRAWINGS LIGHT DOWN AND RIGHT
+0xdb   0x2588  #FULL BLOCK
+0xdc   0x2584  #LOWER HALF BLOCK
+0xdd   0x00a6  #BROKEN BAR
+0xde   0x00cc  #LATIN CAPITAL LETTER I WITH GRAVE
+0xdf   0x2580  #UPPER HALF BLOCK
+0xe0   0x00d3  #LATIN CAPITAL LETTER O WITH ACUTE
+0xe1   0x00df  #LATIN SMALL LETTER SHARP S
+0xe2   0x00d4  #LATIN CAPITAL LETTER O WITH CIRCUMFLEX
+0xe3   0x00d2  #LATIN CAPITAL LETTER O WITH GRAVE
+0xe4   0x00f5  #LATIN SMALL LETTER O WITH TILDE
+0xe5   0x00d5  #LATIN CAPITAL LETTER O WITH TILDE
+0xe6   0x00b5  #MICRO SIGN
+0xe7   0x00fe  #LATIN SMALL LETTER THORN
+0xe8   0x00de  #LATIN CAPITAL LETTER THORN
+0xe9   0x00da  #LATIN CAPITAL LETTER U WITH ACUTE
+0xea   0x00db  #LATIN CAPITAL LETTER U WITH CIRCUMFLEX
+0xeb   0x00d9  #LATIN CAPITAL LETTER U WITH GRAVE
+0xec   0x00fd  #LATIN SMALL LETTER Y WITH ACUTE
+0xed   0x00dd  #LATIN CAPITAL LETTER Y WITH ACUTE
+0xee   0x00af  #MACRON
+0xef   0x00b4  #ACUTE ACCENT
+0xf0   0x00ad  #SOFT HYPHEN
+0xf1   0x00b1  #PLUS-MINUS SIGN
+0xf2   0x2017  #DOUBLE LOW LINE
+0xf3   0x00be  #VULGAR FRACTION THREE QUARTERS
+0xf4   0x00b6  #PILCROW SIGN
+0xf5   0x00a7  #SECTION SIGN
+0xf6   0x00f7  #DIVISION SIGN
+0xf7   0x00b8  #CEDILLA
+0xf8   0x00b0  #DEGREE SIGN
+0xf9   0x00a8  #DIAERESIS
+0xfa   0x00b7  #MIDDLE DOT
+0xfb   0x00b9  #SUPERSCRIPT ONE
+0xfc   0x00b3  #SUPERSCRIPT THREE
+0xfd   0x00b2  #SUPERSCRIPT TWO
+0xfe   0x25a0  #BLACK SQUARE
+0xff   0x00a0  #NO-BREAK SPACE
diff --git a/basis/io/encodings/8-bit/CP852.TXT b/basis/io/encodings/8-bit/CP852.TXT
new file mode 100644 (file)
index 0000000..6a4b61f
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp852_DOSLatin2 to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp852_DOSLatin2 code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp852_DOSLatin2 order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0a   0x000a  #LINE FEED
+0x0b   0x000b  #VERTICAL TABULATION
+0x0c   0x000c  #FORM FEED
+0x0d   0x000d  #CARRIAGE RETURN
+0x0e   0x000e  #SHIFT OUT
+0x0f   0x000f  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1a   0x001a  #SUBSTITUTE
+0x1b   0x001b  #ESCAPE
+0x1c   0x001c  #FILE SEPARATOR
+0x1d   0x001d  #GROUP SEPARATOR
+0x1e   0x001e  #RECORD SEPARATOR
+0x1f   0x001f  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x0025  #PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2a   0x002a  #ASTERISK
+0x2b   0x002b  #PLUS SIGN
+0x2c   0x002c  #COMMA
+0x2d   0x002d  #HYPHEN-MINUS
+0x2e   0x002e  #FULL STOP
+0x2f   0x002f  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3a   0x003a  #COLON
+0x3b   0x003b  #SEMICOLON
+0x3c   0x003c  #LESS-THAN SIGN
+0x3d   0x003d  #EQUALS SIGN
+0x3e   0x003e  #GREATER-THAN SIGN
+0x3f   0x003f  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4a   0x004a  #LATIN CAPITAL LETTER J
+0x4b   0x004b  #LATIN CAPITAL LETTER K
+0x4c   0x004c  #LATIN CAPITAL LETTER L
+0x4d   0x004d  #LATIN CAPITAL LETTER M
+0x4e   0x004e  #LATIN CAPITAL LETTER N
+0x4f   0x004f  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5a   0x005a  #LATIN CAPITAL LETTER Z
+0x5b   0x005b  #LEFT SQUARE BRACKET
+0x5c   0x005c  #REVERSE SOLIDUS
+0x5d   0x005d  #RIGHT SQUARE BRACKET
+0x5e   0x005e  #CIRCUMFLEX ACCENT
+0x5f   0x005f  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6a   0x006a  #LATIN SMALL LETTER J
+0x6b   0x006b  #LATIN SMALL LETTER K
+0x6c   0x006c  #LATIN SMALL LETTER L
+0x6d   0x006d  #LATIN SMALL LETTER M
+0x6e   0x006e  #LATIN SMALL LETTER N
+0x6f   0x006f  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7a   0x007a  #LATIN SMALL LETTER Z
+0x7b   0x007b  #LEFT CURLY BRACKET
+0x7c   0x007c  #VERTICAL LINE
+0x7d   0x007d  #RIGHT CURLY BRACKET
+0x7e   0x007e  #TILDE
+0x7f   0x007f  #DELETE
+0x80   0x00c7  #LATIN CAPITAL LETTER C WITH CEDILLA
+0x81   0x00fc  #LATIN SMALL LETTER U WITH DIAERESIS
+0x82   0x00e9  #LATIN SMALL LETTER E WITH ACUTE
+0x83   0x00e2  #LATIN SMALL LETTER A WITH CIRCUMFLEX
+0x84   0x00e4  #LATIN SMALL LETTER A WITH DIAERESIS
+0x85   0x016f  #LATIN SMALL LETTER U WITH RING ABOVE
+0x86   0x0107  #LATIN SMALL LETTER C WITH ACUTE
+0x87   0x00e7  #LATIN SMALL LETTER C WITH CEDILLA
+0x88   0x0142  #LATIN SMALL LETTER L WITH STROKE
+0x89   0x00eb  #LATIN SMALL LETTER E WITH DIAERESIS
+0x8a   0x0150  #LATIN CAPITAL LETTER O WITH DOUBLE ACUTE
+0x8b   0x0151  #LATIN SMALL LETTER O WITH DOUBLE ACUTE
+0x8c   0x00ee  #LATIN SMALL LETTER I WITH CIRCUMFLEX
+0x8d   0x0179  #LATIN CAPITAL LETTER Z WITH ACUTE
+0x8e   0x00c4  #LATIN CAPITAL LETTER A WITH DIAERESIS
+0x8f   0x0106  #LATIN CAPITAL LETTER C WITH ACUTE
+0x90   0x00c9  #LATIN CAPITAL LETTER E WITH ACUTE
+0x91   0x0139  #LATIN CAPITAL LETTER L WITH ACUTE
+0x92   0x013a  #LATIN SMALL LETTER L WITH ACUTE
+0x93   0x00f4  #LATIN SMALL LETTER O WITH CIRCUMFLEX
+0x94   0x00f6  #LATIN SMALL LETTER O WITH DIAERESIS
+0x95   0x013d  #LATIN CAPITAL LETTER L WITH CARON
+0x96   0x013e  #LATIN SMALL LETTER L WITH CARON
+0x97   0x015a  #LATIN CAPITAL LETTER S WITH ACUTE
+0x98   0x015b  #LATIN SMALL LETTER S WITH ACUTE
+0x99   0x00d6  #LATIN CAPITAL LETTER O WITH DIAERESIS
+0x9a   0x00dc  #LATIN CAPITAL LETTER U WITH DIAERESIS
+0x9b   0x0164  #LATIN CAPITAL LETTER T WITH CARON
+0x9c   0x0165  #LATIN SMALL LETTER T WITH CARON
+0x9d   0x0141  #LATIN CAPITAL LETTER L WITH STROKE
+0x9e   0x00d7  #MULTIPLICATION SIGN
+0x9f   0x010d  #LATIN SMALL LETTER C WITH CARON
+0xa0   0x00e1  #LATIN SMALL LETTER A WITH ACUTE
+0xa1   0x00ed  #LATIN SMALL LETTER I WITH ACUTE
+0xa2   0x00f3  #LATIN SMALL LETTER O WITH ACUTE
+0xa3   0x00fa  #LATIN SMALL LETTER U WITH ACUTE
+0xa4   0x0104  #LATIN CAPITAL LETTER A WITH OGONEK
+0xa5   0x0105  #LATIN SMALL LETTER A WITH OGONEK
+0xa6   0x017d  #LATIN CAPITAL LETTER Z WITH CARON
+0xa7   0x017e  #LATIN SMALL LETTER Z WITH CARON
+0xa8   0x0118  #LATIN CAPITAL LETTER E WITH OGONEK
+0xa9   0x0119  #LATIN SMALL LETTER E WITH OGONEK
+0xaa   0x00ac  #NOT SIGN
+0xab   0x017a  #LATIN SMALL LETTER Z WITH ACUTE
+0xac   0x010c  #LATIN CAPITAL LETTER C WITH CARON
+0xad   0x015f  #LATIN SMALL LETTER S WITH CEDILLA
+0xae   0x00ab  #LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xaf   0x00bb  #RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xb0   0x2591  #LIGHT SHADE
+0xb1   0x2592  #MEDIUM SHADE
+0xb2   0x2593  #DARK SHADE
+0xb3   0x2502  #BOX DRAWINGS LIGHT VERTICAL
+0xb4   0x2524  #BOX DRAWINGS LIGHT VERTICAL AND LEFT
+0xb5   0x00c1  #LATIN CAPITAL LETTER A WITH ACUTE
+0xb6   0x00c2  #LATIN CAPITAL LETTER A WITH CIRCUMFLEX
+0xb7   0x011a  #LATIN CAPITAL LETTER E WITH CARON
+0xb8   0x015e  #LATIN CAPITAL LETTER S WITH CEDILLA
+0xb9   0x2563  #BOX DRAWINGS DOUBLE VERTICAL AND LEFT
+0xba   0x2551  #BOX DRAWINGS DOUBLE VERTICAL
+0xbb   0x2557  #BOX DRAWINGS DOUBLE DOWN AND LEFT
+0xbc   0x255d  #BOX DRAWINGS DOUBLE UP AND LEFT
+0xbd   0x017b  #LATIN CAPITAL LETTER Z WITH DOT ABOVE
+0xbe   0x017c  #LATIN SMALL LETTER Z WITH DOT ABOVE
+0xbf   0x2510  #BOX DRAWINGS LIGHT DOWN AND LEFT
+0xc0   0x2514  #BOX DRAWINGS LIGHT UP AND RIGHT
+0xc1   0x2534  #BOX DRAWINGS LIGHT UP AND HORIZONTAL
+0xc2   0x252c  #BOX DRAWINGS LIGHT DOWN AND HORIZONTAL
+0xc3   0x251c  #BOX DRAWINGS LIGHT VERTICAL AND RIGHT
+0xc4   0x2500  #BOX DRAWINGS LIGHT HORIZONTAL
+0xc5   0x253c  #BOX DRAWINGS LIGHT VERTICAL AND HORIZONTAL
+0xc6   0x0102  #LATIN CAPITAL LETTER A WITH BREVE
+0xc7   0x0103  #LATIN SMALL LETTER A WITH BREVE
+0xc8   0x255a  #BOX DRAWINGS DOUBLE UP AND RIGHT
+0xc9   0x2554  #BOX DRAWINGS DOUBLE DOWN AND RIGHT
+0xca   0x2569  #BOX DRAWINGS DOUBLE UP AND HORIZONTAL
+0xcb   0x2566  #BOX DRAWINGS DOUBLE DOWN AND HORIZONTAL
+0xcc   0x2560  #BOX DRAWINGS DOUBLE VERTICAL AND RIGHT
+0xcd   0x2550  #BOX DRAWINGS DOUBLE HORIZONTAL
+0xce   0x256c  #BOX DRAWINGS DOUBLE VERTICAL AND HORIZONTAL
+0xcf   0x00a4  #CURRENCY SIGN
+0xd0   0x0111  #LATIN SMALL LETTER D WITH STROKE
+0xd1   0x0110  #LATIN CAPITAL LETTER D WITH STROKE
+0xd2   0x010e  #LATIN CAPITAL LETTER D WITH CARON
+0xd3   0x00cb  #LATIN CAPITAL LETTER E WITH DIAERESIS
+0xd4   0x010f  #LATIN SMALL LETTER D WITH CARON
+0xd5   0x0147  #LATIN CAPITAL LETTER N WITH CARON
+0xd6   0x00cd  #LATIN CAPITAL LETTER I WITH ACUTE
+0xd7   0x00ce  #LATIN CAPITAL LETTER I WITH CIRCUMFLEX
+0xd8   0x011b  #LATIN SMALL LETTER E WITH CARON
+0xd9   0x2518  #BOX DRAWINGS LIGHT UP AND LEFT
+0xda   0x250c  #BOX DRAWINGS LIGHT DOWN AND RIGHT
+0xdb   0x2588  #FULL BLOCK
+0xdc   0x2584  #LOWER HALF BLOCK
+0xdd   0x0162  #LATIN CAPITAL LETTER T WITH CEDILLA
+0xde   0x016e  #LATIN CAPITAL LETTER U WITH RING ABOVE
+0xdf   0x2580  #UPPER HALF BLOCK
+0xe0   0x00d3  #LATIN CAPITAL LETTER O WITH ACUTE
+0xe1   0x00df  #LATIN SMALL LETTER SHARP S
+0xe2   0x00d4  #LATIN CAPITAL LETTER O WITH CIRCUMFLEX
+0xe3   0x0143  #LATIN CAPITAL LETTER N WITH ACUTE
+0xe4   0x0144  #LATIN SMALL LETTER N WITH ACUTE
+0xe5   0x0148  #LATIN SMALL LETTER N WITH CARON
+0xe6   0x0160  #LATIN CAPITAL LETTER S WITH CARON
+0xe7   0x0161  #LATIN SMALL LETTER S WITH CARON
+0xe8   0x0154  #LATIN CAPITAL LETTER R WITH ACUTE
+0xe9   0x00da  #LATIN CAPITAL LETTER U WITH ACUTE
+0xea   0x0155  #LATIN SMALL LETTER R WITH ACUTE
+0xeb   0x0170  #LATIN CAPITAL LETTER U WITH DOUBLE ACUTE
+0xec   0x00fd  #LATIN SMALL LETTER Y WITH ACUTE
+0xed   0x00dd  #LATIN CAPITAL LETTER Y WITH ACUTE
+0xee   0x0163  #LATIN SMALL LETTER T WITH CEDILLA
+0xef   0x00b4  #ACUTE ACCENT
+0xf0   0x00ad  #SOFT HYPHEN
+0xf1   0x02dd  #DOUBLE ACUTE ACCENT
+0xf2   0x02db  #OGONEK
+0xf3   0x02c7  #CARON
+0xf4   0x02d8  #BREVE
+0xf5   0x00a7  #SECTION SIGN
+0xf6   0x00f7  #DIVISION SIGN
+0xf7   0x00b8  #CEDILLA
+0xf8   0x00b0  #DEGREE SIGN
+0xf9   0x00a8  #DIAERESIS
+0xfa   0x02d9  #DOT ABOVE
+0xfb   0x0171  #LATIN SMALL LETTER U WITH DOUBLE ACUTE
+0xfc   0x0158  #LATIN CAPITAL LETTER R WITH CARON
+0xfd   0x0159  #LATIN SMALL LETTER R WITH CARON
+0xfe   0x25a0  #BLACK SQUARE
+0xff   0x00a0  #NO-BREAK SPACE
diff --git a/basis/io/encodings/8-bit/CP855.TXT b/basis/io/encodings/8-bit/CP855.TXT
new file mode 100644 (file)
index 0000000..92951d9
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp855_DOSCyrillic to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp855_DOSCyrillic code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp855_DOSCyrillic order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0a   0x000a  #LINE FEED
+0x0b   0x000b  #VERTICAL TABULATION
+0x0c   0x000c  #FORM FEED
+0x0d   0x000d  #CARRIAGE RETURN
+0x0e   0x000e  #SHIFT OUT
+0x0f   0x000f  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1a   0x001a  #SUBSTITUTE
+0x1b   0x001b  #ESCAPE
+0x1c   0x001c  #FILE SEPARATOR
+0x1d   0x001d  #GROUP SEPARATOR
+0x1e   0x001e  #RECORD SEPARATOR
+0x1f   0x001f  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x0025  #PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2a   0x002a  #ASTERISK
+0x2b   0x002b  #PLUS SIGN
+0x2c   0x002c  #COMMA
+0x2d   0x002d  #HYPHEN-MINUS
+0x2e   0x002e  #FULL STOP
+0x2f   0x002f  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3a   0x003a  #COLON
+0x3b   0x003b  #SEMICOLON
+0x3c   0x003c  #LESS-THAN SIGN
+0x3d   0x003d  #EQUALS SIGN
+0x3e   0x003e  #GREATER-THAN SIGN
+0x3f   0x003f  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4a   0x004a  #LATIN CAPITAL LETTER J
+0x4b   0x004b  #LATIN CAPITAL LETTER K
+0x4c   0x004c  #LATIN CAPITAL LETTER L
+0x4d   0x004d  #LATIN CAPITAL LETTER M
+0x4e   0x004e  #LATIN CAPITAL LETTER N
+0x4f   0x004f  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5a   0x005a  #LATIN CAPITAL LETTER Z
+0x5b   0x005b  #LEFT SQUARE BRACKET
+0x5c   0x005c  #REVERSE SOLIDUS
+0x5d   0x005d  #RIGHT SQUARE BRACKET
+0x5e   0x005e  #CIRCUMFLEX ACCENT
+0x5f   0x005f  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6a   0x006a  #LATIN SMALL LETTER J
+0x6b   0x006b  #LATIN SMALL LETTER K
+0x6c   0x006c  #LATIN SMALL LETTER L
+0x6d   0x006d  #LATIN SMALL LETTER M
+0x6e   0x006e  #LATIN SMALL LETTER N
+0x6f   0x006f  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7a   0x007a  #LATIN SMALL LETTER Z
+0x7b   0x007b  #LEFT CURLY BRACKET
+0x7c   0x007c  #VERTICAL LINE
+0x7d   0x007d  #RIGHT CURLY BRACKET
+0x7e   0x007e  #TILDE
+0x7f   0x007f  #DELETE
+0x80   0x0452  #CYRILLIC SMALL LETTER DJE
+0x81   0x0402  #CYRILLIC CAPITAL LETTER DJE
+0x82   0x0453  #CYRILLIC SMALL LETTER GJE
+0x83   0x0403  #CYRILLIC CAPITAL LETTER GJE
+0x84   0x0451  #CYRILLIC SMALL LETTER IO
+0x85   0x0401  #CYRILLIC CAPITAL LETTER IO
+0x86   0x0454  #CYRILLIC SMALL LETTER UKRAINIAN IE
+0x87   0x0404  #CYRILLIC CAPITAL LETTER UKRAINIAN IE
+0x88   0x0455  #CYRILLIC SMALL LETTER DZE
+0x89   0x0405  #CYRILLIC CAPITAL LETTER DZE
+0x8a   0x0456  #CYRILLIC SMALL LETTER BYELORUSSIAN-UKRAINIAN I
+0x8b   0x0406  #CYRILLIC CAPITAL LETTER BYELORUSSIAN-UKRAINIAN I
+0x8c   0x0457  #CYRILLIC SMALL LETTER YI
+0x8d   0x0407  #CYRILLIC CAPITAL LETTER YI
+0x8e   0x0458  #CYRILLIC SMALL LETTER JE
+0x8f   0x0408  #CYRILLIC CAPITAL LETTER JE
+0x90   0x0459  #CYRILLIC SMALL LETTER LJE
+0x91   0x0409  #CYRILLIC CAPITAL LETTER LJE
+0x92   0x045a  #CYRILLIC SMALL LETTER NJE
+0x93   0x040a  #CYRILLIC CAPITAL LETTER NJE
+0x94   0x045b  #CYRILLIC SMALL LETTER TSHE
+0x95   0x040b  #CYRILLIC CAPITAL LETTER TSHE
+0x96   0x045c  #CYRILLIC SMALL LETTER KJE
+0x97   0x040c  #CYRILLIC CAPITAL LETTER KJE
+0x98   0x045e  #CYRILLIC SMALL LETTER SHORT U
+0x99   0x040e  #CYRILLIC CAPITAL LETTER SHORT U
+0x9a   0x045f  #CYRILLIC SMALL LETTER DZHE
+0x9b   0x040f  #CYRILLIC CAPITAL LETTER DZHE
+0x9c   0x044e  #CYRILLIC SMALL LETTER YU
+0x9d   0x042e  #CYRILLIC CAPITAL LETTER YU
+0x9e   0x044a  #CYRILLIC SMALL LETTER HARD SIGN
+0x9f   0x042a  #CYRILLIC CAPITAL LETTER HARD SIGN
+0xa0   0x0430  #CYRILLIC SMALL LETTER A
+0xa1   0x0410  #CYRILLIC CAPITAL LETTER A
+0xa2   0x0431  #CYRILLIC SMALL LETTER BE
+0xa3   0x0411  #CYRILLIC CAPITAL LETTER BE
+0xa4   0x0446  #CYRILLIC SMALL LETTER TSE
+0xa5   0x0426  #CYRILLIC CAPITAL LETTER TSE
+0xa6   0x0434  #CYRILLIC SMALL LETTER DE
+0xa7   0x0414  #CYRILLIC CAPITAL LETTER DE
+0xa8   0x0435  #CYRILLIC SMALL LETTER IE
+0xa9   0x0415  #CYRILLIC CAPITAL LETTER IE
+0xaa   0x0444  #CYRILLIC SMALL LETTER EF
+0xab   0x0424  #CYRILLIC CAPITAL LETTER EF
+0xac   0x0433  #CYRILLIC SMALL LETTER GHE
+0xad   0x0413  #CYRILLIC CAPITAL LETTER GHE
+0xae   0x00ab  #LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xaf   0x00bb  #RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xb0   0x2591  #LIGHT SHADE
+0xb1   0x2592  #MEDIUM SHADE
+0xb2   0x2593  #DARK SHADE
+0xb3   0x2502  #BOX DRAWINGS LIGHT VERTICAL
+0xb4   0x2524  #BOX DRAWINGS LIGHT VERTICAL AND LEFT
+0xb5   0x0445  #CYRILLIC SMALL LETTER HA
+0xb6   0x0425  #CYRILLIC CAPITAL LETTER HA
+0xb7   0x0438  #CYRILLIC SMALL LETTER I
+0xb8   0x0418  #CYRILLIC CAPITAL LETTER I
+0xb9   0x2563  #BOX DRAWINGS DOUBLE VERTICAL AND LEFT
+0xba   0x2551  #BOX DRAWINGS DOUBLE VERTICAL
+0xbb   0x2557  #BOX DRAWINGS DOUBLE DOWN AND LEFT
+0xbc   0x255d  #BOX DRAWINGS DOUBLE UP AND LEFT
+0xbd   0x0439  #CYRILLIC SMALL LETTER SHORT I
+0xbe   0x0419  #CYRILLIC CAPITAL LETTER SHORT I
+0xbf   0x2510  #BOX DRAWINGS LIGHT DOWN AND LEFT
+0xc0   0x2514  #BOX DRAWINGS LIGHT UP AND RIGHT
+0xc1   0x2534  #BOX DRAWINGS LIGHT UP AND HORIZONTAL
+0xc2   0x252c  #BOX DRAWINGS LIGHT DOWN AND HORIZONTAL
+0xc3   0x251c  #BOX DRAWINGS LIGHT VERTICAL AND RIGHT
+0xc4   0x2500  #BOX DRAWINGS LIGHT HORIZONTAL
+0xc5   0x253c  #BOX DRAWINGS LIGHT VERTICAL AND HORIZONTAL
+0xc6   0x043a  #CYRILLIC SMALL LETTER KA
+0xc7   0x041a  #CYRILLIC CAPITAL LETTER KA
+0xc8   0x255a  #BOX DRAWINGS DOUBLE UP AND RIGHT
+0xc9   0x2554  #BOX DRAWINGS DOUBLE DOWN AND RIGHT
+0xca   0x2569  #BOX DRAWINGS DOUBLE UP AND HORIZONTAL
+0xcb   0x2566  #BOX DRAWINGS DOUBLE DOWN AND HORIZONTAL
+0xcc   0x2560  #BOX DRAWINGS DOUBLE VERTICAL AND RIGHT
+0xcd   0x2550  #BOX DRAWINGS DOUBLE HORIZONTAL
+0xce   0x256c  #BOX DRAWINGS DOUBLE VERTICAL AND HORIZONTAL
+0xcf   0x00a4  #CURRENCY SIGN
+0xd0   0x043b  #CYRILLIC SMALL LETTER EL
+0xd1   0x041b  #CYRILLIC CAPITAL LETTER EL
+0xd2   0x043c  #CYRILLIC SMALL LETTER EM
+0xd3   0x041c  #CYRILLIC CAPITAL LETTER EM
+0xd4   0x043d  #CYRILLIC SMALL LETTER EN
+0xd5   0x041d  #CYRILLIC CAPITAL LETTER EN
+0xd6   0x043e  #CYRILLIC SMALL LETTER O
+0xd7   0x041e  #CYRILLIC CAPITAL LETTER O
+0xd8   0x043f  #CYRILLIC SMALL LETTER PE
+0xd9   0x2518  #BOX DRAWINGS LIGHT UP AND LEFT
+0xda   0x250c  #BOX DRAWINGS LIGHT DOWN AND RIGHT
+0xdb   0x2588  #FULL BLOCK
+0xdc   0x2584  #LOWER HALF BLOCK
+0xdd   0x041f  #CYRILLIC CAPITAL LETTER PE
+0xde   0x044f  #CYRILLIC SMALL LETTER YA
+0xdf   0x2580  #UPPER HALF BLOCK
+0xe0   0x042f  #CYRILLIC CAPITAL LETTER YA
+0xe1   0x0440  #CYRILLIC SMALL LETTER ER
+0xe2   0x0420  #CYRILLIC CAPITAL LETTER ER
+0xe3   0x0441  #CYRILLIC SMALL LETTER ES
+0xe4   0x0421  #CYRILLIC CAPITAL LETTER ES
+0xe5   0x0442  #CYRILLIC SMALL LETTER TE
+0xe6   0x0422  #CYRILLIC CAPITAL LETTER TE
+0xe7   0x0443  #CYRILLIC SMALL LETTER U
+0xe8   0x0423  #CYRILLIC CAPITAL LETTER U
+0xe9   0x0436  #CYRILLIC SMALL LETTER ZHE
+0xea   0x0416  #CYRILLIC CAPITAL LETTER ZHE
+0xeb   0x0432  #CYRILLIC SMALL LETTER VE
+0xec   0x0412  #CYRILLIC CAPITAL LETTER VE
+0xed   0x044c  #CYRILLIC SMALL LETTER SOFT SIGN
+0xee   0x042c  #CYRILLIC CAPITAL LETTER SOFT SIGN
+0xef   0x2116  #NUMERO SIGN
+0xf0   0x00ad  #SOFT HYPHEN
+0xf1   0x044b  #CYRILLIC SMALL LETTER YERU
+0xf2   0x042b  #CYRILLIC CAPITAL LETTER YERU
+0xf3   0x0437  #CYRILLIC SMALL LETTER ZE
+0xf4   0x0417  #CYRILLIC CAPITAL LETTER ZE
+0xf5   0x0448  #CYRILLIC SMALL LETTER SHA
+0xf6   0x0428  #CYRILLIC CAPITAL LETTER SHA
+0xf7   0x044d  #CYRILLIC SMALL LETTER E
+0xf8   0x042d  #CYRILLIC CAPITAL LETTER E
+0xf9   0x0449  #CYRILLIC SMALL LETTER SHCHA
+0xfa   0x0429  #CYRILLIC CAPITAL LETTER SHCHA
+0xfb   0x0447  #CYRILLIC SMALL LETTER CHE
+0xfc   0x0427  #CYRILLIC CAPITAL LETTER CHE
+0xfd   0x00a7  #SECTION SIGN
+0xfe   0x25a0  #BLACK SQUARE
+0xff   0x00a0  #NO-BREAK SPACE
diff --git a/basis/io/encodings/8-bit/CP857.TXT b/basis/io/encodings/8-bit/CP857.TXT
new file mode 100644 (file)
index 0000000..1b818dc
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp857_DOSTurkish to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp857_DOSTurkish code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp857_DOSTurkish order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0a   0x000a  #LINE FEED
+0x0b   0x000b  #VERTICAL TABULATION
+0x0c   0x000c  #FORM FEED
+0x0d   0x000d  #CARRIAGE RETURN
+0x0e   0x000e  #SHIFT OUT
+0x0f   0x000f  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1a   0x001a  #SUBSTITUTE
+0x1b   0x001b  #ESCAPE
+0x1c   0x001c  #FILE SEPARATOR
+0x1d   0x001d  #GROUP SEPARATOR
+0x1e   0x001e  #RECORD SEPARATOR
+0x1f   0x001f  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x0025  #PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2a   0x002a  #ASTERISK
+0x2b   0x002b  #PLUS SIGN
+0x2c   0x002c  #COMMA
+0x2d   0x002d  #HYPHEN-MINUS
+0x2e   0x002e  #FULL STOP
+0x2f   0x002f  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3a   0x003a  #COLON
+0x3b   0x003b  #SEMICOLON
+0x3c   0x003c  #LESS-THAN SIGN
+0x3d   0x003d  #EQUALS SIGN
+0x3e   0x003e  #GREATER-THAN SIGN
+0x3f   0x003f  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4a   0x004a  #LATIN CAPITAL LETTER J
+0x4b   0x004b  #LATIN CAPITAL LETTER K
+0x4c   0x004c  #LATIN CAPITAL LETTER L
+0x4d   0x004d  #LATIN CAPITAL LETTER M
+0x4e   0x004e  #LATIN CAPITAL LETTER N
+0x4f   0x004f  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5a   0x005a  #LATIN CAPITAL LETTER Z
+0x5b   0x005b  #LEFT SQUARE BRACKET
+0x5c   0x005c  #REVERSE SOLIDUS
+0x5d   0x005d  #RIGHT SQUARE BRACKET
+0x5e   0x005e  #CIRCUMFLEX ACCENT
+0x5f   0x005f  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6a   0x006a  #LATIN SMALL LETTER J
+0x6b   0x006b  #LATIN SMALL LETTER K
+0x6c   0x006c  #LATIN SMALL LETTER L
+0x6d   0x006d  #LATIN SMALL LETTER M
+0x6e   0x006e  #LATIN SMALL LETTER N
+0x6f   0x006f  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7a   0x007a  #LATIN SMALL LETTER Z
+0x7b   0x007b  #LEFT CURLY BRACKET
+0x7c   0x007c  #VERTICAL LINE
+0x7d   0x007d  #RIGHT CURLY BRACKET
+0x7e   0x007e  #TILDE
+0x7f   0x007f  #DELETE
+0x80   0x00c7  #LATIN CAPITAL LETTER C WITH CEDILLA
+0x81   0x00fc  #LATIN SMALL LETTER U WITH DIAERESIS
+0x82   0x00e9  #LATIN SMALL LETTER E WITH ACUTE
+0x83   0x00e2  #LATIN SMALL LETTER A WITH CIRCUMFLEX
+0x84   0x00e4  #LATIN SMALL LETTER A WITH DIAERESIS
+0x85   0x00e0  #LATIN SMALL LETTER A WITH GRAVE
+0x86   0x00e5  #LATIN SMALL LETTER A WITH RING ABOVE
+0x87   0x00e7  #LATIN SMALL LETTER C WITH CEDILLA
+0x88   0x00ea  #LATIN SMALL LETTER E WITH CIRCUMFLEX
+0x89   0x00eb  #LATIN SMALL LETTER E WITH DIAERESIS
+0x8a   0x00e8  #LATIN SMALL LETTER E WITH GRAVE
+0x8b   0x00ef  #LATIN SMALL LETTER I WITH DIAERESIS
+0x8c   0x00ee  #LATIN SMALL LETTER I WITH CIRCUMFLEX
+0x8d   0x0131  #LATIN SMALL LETTER DOTLESS I
+0x8e   0x00c4  #LATIN CAPITAL LETTER A WITH DIAERESIS
+0x8f   0x00c5  #LATIN CAPITAL LETTER A WITH RING ABOVE
+0x90   0x00c9  #LATIN CAPITAL LETTER E WITH ACUTE
+0x91   0x00e6  #LATIN SMALL LIGATURE AE
+0x92   0x00c6  #LATIN CAPITAL LIGATURE AE
+0x93   0x00f4  #LATIN SMALL LETTER O WITH CIRCUMFLEX
+0x94   0x00f6  #LATIN SMALL LETTER O WITH DIAERESIS
+0x95   0x00f2  #LATIN SMALL LETTER O WITH GRAVE
+0x96   0x00fb  #LATIN SMALL LETTER U WITH CIRCUMFLEX
+0x97   0x00f9  #LATIN SMALL LETTER U WITH GRAVE
+0x98   0x0130  #LATIN CAPITAL LETTER I WITH DOT ABOVE
+0x99   0x00d6  #LATIN CAPITAL LETTER O WITH DIAERESIS
+0x9a   0x00dc  #LATIN CAPITAL LETTER U WITH DIAERESIS
+0x9b   0x00f8  #LATIN SMALL LETTER O WITH STROKE
+0x9c   0x00a3  #POUND SIGN
+0x9d   0x00d8  #LATIN CAPITAL LETTER O WITH STROKE
+0x9e   0x015e  #LATIN CAPITAL LETTER S WITH CEDILLA
+0x9f   0x015f  #LATIN SMALL LETTER S WITH CEDILLA
+0xa0   0x00e1  #LATIN SMALL LETTER A WITH ACUTE
+0xa1   0x00ed  #LATIN SMALL LETTER I WITH ACUTE
+0xa2   0x00f3  #LATIN SMALL LETTER O WITH ACUTE
+0xa3   0x00fa  #LATIN SMALL LETTER U WITH ACUTE
+0xa4   0x00f1  #LATIN SMALL LETTER N WITH TILDE
+0xa5   0x00d1  #LATIN CAPITAL LETTER N WITH TILDE
+0xa6   0x011e  #LATIN CAPITAL LETTER G WITH BREVE
+0xa7   0x011f  #LATIN SMALL LETTER G WITH BREVE
+0xa8   0x00bf  #INVERTED QUESTION MARK
+0xa9   0x00ae  #REGISTERED SIGN
+0xaa   0x00ac  #NOT SIGN
+0xab   0x00bd  #VULGAR FRACTION ONE HALF
+0xac   0x00bc  #VULGAR FRACTION ONE QUARTER
+0xad   0x00a1  #INVERTED EXCLAMATION MARK
+0xae   0x00ab  #LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xaf   0x00bb  #RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xb0   0x2591  #LIGHT SHADE
+0xb1   0x2592  #MEDIUM SHADE
+0xb2   0x2593  #DARK SHADE
+0xb3   0x2502  #BOX DRAWINGS LIGHT VERTICAL
+0xb4   0x2524  #BOX DRAWINGS LIGHT VERTICAL AND LEFT
+0xb5   0x00c1  #LATIN CAPITAL LETTER A WITH ACUTE
+0xb6   0x00c2  #LATIN CAPITAL LETTER A WITH CIRCUMFLEX
+0xb7   0x00c0  #LATIN CAPITAL LETTER A WITH GRAVE
+0xb8   0x00a9  #COPYRIGHT SIGN
+0xb9   0x2563  #BOX DRAWINGS DOUBLE VERTICAL AND LEFT
+0xba   0x2551  #BOX DRAWINGS DOUBLE VERTICAL
+0xbb   0x2557  #BOX DRAWINGS DOUBLE DOWN AND LEFT
+0xbc   0x255d  #BOX DRAWINGS DOUBLE UP AND LEFT
+0xbd   0x00a2  #CENT SIGN
+0xbe   0x00a5  #YEN SIGN
+0xbf   0x2510  #BOX DRAWINGS LIGHT DOWN AND LEFT
+0xc0   0x2514  #BOX DRAWINGS LIGHT UP AND RIGHT
+0xc1   0x2534  #BOX DRAWINGS LIGHT UP AND HORIZONTAL
+0xc2   0x252c  #BOX DRAWINGS LIGHT DOWN AND HORIZONTAL
+0xc3   0x251c  #BOX DRAWINGS LIGHT VERTICAL AND RIGHT
+0xc4   0x2500  #BOX DRAWINGS LIGHT HORIZONTAL
+0xc5   0x253c  #BOX DRAWINGS LIGHT VERTICAL AND HORIZONTAL
+0xc6   0x00e3  #LATIN SMALL LETTER A WITH TILDE
+0xc7   0x00c3  #LATIN CAPITAL LETTER A WITH TILDE
+0xc8   0x255a  #BOX DRAWINGS DOUBLE UP AND RIGHT
+0xc9   0x2554  #BOX DRAWINGS DOUBLE DOWN AND RIGHT
+0xca   0x2569  #BOX DRAWINGS DOUBLE UP AND HORIZONTAL
+0xcb   0x2566  #BOX DRAWINGS DOUBLE DOWN AND HORIZONTAL
+0xcc   0x2560  #BOX DRAWINGS DOUBLE VERTICAL AND RIGHT
+0xcd   0x2550  #BOX DRAWINGS DOUBLE HORIZONTAL
+0xce   0x256c  #BOX DRAWINGS DOUBLE VERTICAL AND HORIZONTAL
+0xcf   0x00a4  #CURRENCY SIGN
+0xd0   0x00ba  #MASCULINE ORDINAL INDICATOR
+0xd1   0x00aa  #FEMININE ORDINAL INDICATOR
+0xd2   0x00ca  #LATIN CAPITAL LETTER E WITH CIRCUMFLEX
+0xd3   0x00cb  #LATIN CAPITAL LETTER E WITH DIAERESIS
+0xd4   0x00c8  #LATIN CAPITAL LETTER E WITH GRAVE
+0xd5           #UNDEFINED
+0xd6   0x00cd  #LATIN CAPITAL LETTER I WITH ACUTE
+0xd7   0x00ce  #LATIN CAPITAL LETTER I WITH CIRCUMFLEX
+0xd8   0x00cf  #LATIN CAPITAL LETTER I WITH DIAERESIS
+0xd9   0x2518  #BOX DRAWINGS LIGHT UP AND LEFT
+0xda   0x250c  #BOX DRAWINGS LIGHT DOWN AND RIGHT
+0xdb   0x2588  #FULL BLOCK
+0xdc   0x2584  #LOWER HALF BLOCK
+0xdd   0x00a6  #BROKEN BAR
+0xde   0x00cc  #LATIN CAPITAL LETTER I WITH GRAVE
+0xdf   0x2580  #UPPER HALF BLOCK
+0xe0   0x00d3  #LATIN CAPITAL LETTER O WITH ACUTE
+0xe1   0x00df  #LATIN SMALL LETTER SHARP S
+0xe2   0x00d4  #LATIN CAPITAL LETTER O WITH CIRCUMFLEX
+0xe3   0x00d2  #LATIN CAPITAL LETTER O WITH GRAVE
+0xe4   0x00f5  #LATIN SMALL LETTER O WITH TILDE
+0xe5   0x00d5  #LATIN CAPITAL LETTER O WITH TILDE
+0xe6   0x00b5  #MICRO SIGN
+0xe7           #UNDEFINED
+0xe8   0x00d7  #MULTIPLICATION SIGN
+0xe9   0x00da  #LATIN CAPITAL LETTER U WITH ACUTE
+0xea   0x00db  #LATIN CAPITAL LETTER U WITH CIRCUMFLEX
+0xeb   0x00d9  #LATIN CAPITAL LETTER U WITH GRAVE
+0xec   0x00ec  #LATIN SMALL LETTER I WITH GRAVE
+0xed   0x00ff  #LATIN SMALL LETTER Y WITH DIAERESIS
+0xee   0x00af  #MACRON
+0xef   0x00b4  #ACUTE ACCENT
+0xf0   0x00ad  #SOFT HYPHEN
+0xf1   0x00b1  #PLUS-MINUS SIGN
+0xf2           #UNDEFINED
+0xf3   0x00be  #VULGAR FRACTION THREE QUARTERS
+0xf4   0x00b6  #PILCROW SIGN
+0xf5   0x00a7  #SECTION SIGN
+0xf6   0x00f7  #DIVISION SIGN
+0xf7   0x00b8  #CEDILLA
+0xf8   0x00b0  #DEGREE SIGN
+0xf9   0x00a8  #DIAERESIS
+0xfa   0x00b7  #MIDDLE DOT
+0xfb   0x00b9  #SUPERSCRIPT ONE
+0xfc   0x00b3  #SUPERSCRIPT THREE
+0xfd   0x00b2  #SUPERSCRIPT TWO
+0xfe   0x25a0  #BLACK SQUARE
+0xff   0x00a0  #NO-BREAK SPACE
diff --git a/basis/io/encodings/8-bit/CP860.TXT b/basis/io/encodings/8-bit/CP860.TXT
new file mode 100644 (file)
index 0000000..a9a1ba4
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp860_DOSPortuguese to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp860_DOSPortuguese code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp860_DOSPortuguese order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0a   0x000a  #LINE FEED
+0x0b   0x000b  #VERTICAL TABULATION
+0x0c   0x000c  #FORM FEED
+0x0d   0x000d  #CARRIAGE RETURN
+0x0e   0x000e  #SHIFT OUT
+0x0f   0x000f  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1a   0x001a  #SUBSTITUTE
+0x1b   0x001b  #ESCAPE
+0x1c   0x001c  #FILE SEPARATOR
+0x1d   0x001d  #GROUP SEPARATOR
+0x1e   0x001e  #RECORD SEPARATOR
+0x1f   0x001f  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x0025  #PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2a   0x002a  #ASTERISK
+0x2b   0x002b  #PLUS SIGN
+0x2c   0x002c  #COMMA
+0x2d   0x002d  #HYPHEN-MINUS
+0x2e   0x002e  #FULL STOP
+0x2f   0x002f  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3a   0x003a  #COLON
+0x3b   0x003b  #SEMICOLON
+0x3c   0x003c  #LESS-THAN SIGN
+0x3d   0x003d  #EQUALS SIGN
+0x3e   0x003e  #GREATER-THAN SIGN
+0x3f   0x003f  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4a   0x004a  #LATIN CAPITAL LETTER J
+0x4b   0x004b  #LATIN CAPITAL LETTER K
+0x4c   0x004c  #LATIN CAPITAL LETTER L
+0x4d   0x004d  #LATIN CAPITAL LETTER M
+0x4e   0x004e  #LATIN CAPITAL LETTER N
+0x4f   0x004f  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5a   0x005a  #LATIN CAPITAL LETTER Z
+0x5b   0x005b  #LEFT SQUARE BRACKET
+0x5c   0x005c  #REVERSE SOLIDUS
+0x5d   0x005d  #RIGHT SQUARE BRACKET
+0x5e   0x005e  #CIRCUMFLEX ACCENT
+0x5f   0x005f  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6a   0x006a  #LATIN SMALL LETTER J
+0x6b   0x006b  #LATIN SMALL LETTER K
+0x6c   0x006c  #LATIN SMALL LETTER L
+0x6d   0x006d  #LATIN SMALL LETTER M
+0x6e   0x006e  #LATIN SMALL LETTER N
+0x6f   0x006f  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7a   0x007a  #LATIN SMALL LETTER Z
+0x7b   0x007b  #LEFT CURLY BRACKET
+0x7c   0x007c  #VERTICAL LINE
+0x7d   0x007d  #RIGHT CURLY BRACKET
+0x7e   0x007e  #TILDE
+0x7f   0x007f  #DELETE
+0x80   0x00c7  #LATIN CAPITAL LETTER C WITH CEDILLA
+0x81   0x00fc  #LATIN SMALL LETTER U WITH DIAERESIS
+0x82   0x00e9  #LATIN SMALL LETTER E WITH ACUTE
+0x83   0x00e2  #LATIN SMALL LETTER A WITH CIRCUMFLEX
+0x84   0x00e3  #LATIN SMALL LETTER A WITH TILDE
+0x85   0x00e0  #LATIN SMALL LETTER A WITH GRAVE
+0x86   0x00c1  #LATIN CAPITAL LETTER A WITH ACUTE
+0x87   0x00e7  #LATIN SMALL LETTER C WITH CEDILLA
+0x88   0x00ea  #LATIN SMALL LETTER E WITH CIRCUMFLEX
+0x89   0x00ca  #LATIN CAPITAL LETTER E WITH CIRCUMFLEX
+0x8a   0x00e8  #LATIN SMALL LETTER E WITH GRAVE
+0x8b   0x00cd  #LATIN CAPITAL LETTER I WITH ACUTE
+0x8c   0x00d4  #LATIN CAPITAL LETTER O WITH CIRCUMFLEX
+0x8d   0x00ec  #LATIN SMALL LETTER I WITH GRAVE
+0x8e   0x00c3  #LATIN CAPITAL LETTER A WITH TILDE
+0x8f   0x00c2  #LATIN CAPITAL LETTER A WITH CIRCUMFLEX
+0x90   0x00c9  #LATIN CAPITAL LETTER E WITH ACUTE
+0x91   0x00c0  #LATIN CAPITAL LETTER A WITH GRAVE
+0x92   0x00c8  #LATIN CAPITAL LETTER E WITH GRAVE
+0x93   0x00f4  #LATIN SMALL LETTER O WITH CIRCUMFLEX
+0x94   0x00f5  #LATIN SMALL LETTER O WITH TILDE
+0x95   0x00f2  #LATIN SMALL LETTER O WITH GRAVE
+0x96   0x00da  #LATIN CAPITAL LETTER U WITH ACUTE
+0x97   0x00f9  #LATIN SMALL LETTER U WITH GRAVE
+0x98   0x00cc  #LATIN CAPITAL LETTER I WITH GRAVE
+0x99   0x00d5  #LATIN CAPITAL LETTER O WITH TILDE
+0x9a   0x00dc  #LATIN CAPITAL LETTER U WITH DIAERESIS
+0x9b   0x00a2  #CENT SIGN
+0x9c   0x00a3  #POUND SIGN
+0x9d   0x00d9  #LATIN CAPITAL LETTER U WITH GRAVE
+0x9e   0x20a7  #PESETA SIGN
+0x9f   0x00d3  #LATIN CAPITAL LETTER O WITH ACUTE
+0xa0   0x00e1  #LATIN SMALL LETTER A WITH ACUTE
+0xa1   0x00ed  #LATIN SMALL LETTER I WITH ACUTE
+0xa2   0x00f3  #LATIN SMALL LETTER O WITH ACUTE
+0xa3   0x00fa  #LATIN SMALL LETTER U WITH ACUTE
+0xa4   0x00f1  #LATIN SMALL LETTER N WITH TILDE
+0xa5   0x00d1  #LATIN CAPITAL LETTER N WITH TILDE
+0xa6   0x00aa  #FEMININE ORDINAL INDICATOR
+0xa7   0x00ba  #MASCULINE ORDINAL INDICATOR
+0xa8   0x00bf  #INVERTED QUESTION MARK
+0xa9   0x00d2  #LATIN CAPITAL LETTER O WITH GRAVE
+0xaa   0x00ac  #NOT SIGN
+0xab   0x00bd  #VULGAR FRACTION ONE HALF
+0xac   0x00bc  #VULGAR FRACTION ONE QUARTER
+0xad   0x00a1  #INVERTED EXCLAMATION MARK
+0xae   0x00ab  #LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xaf   0x00bb  #RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xb0   0x2591  #LIGHT SHADE
+0xb1   0x2592  #MEDIUM SHADE
+0xb2   0x2593  #DARK SHADE
+0xb3   0x2502  #BOX DRAWINGS LIGHT VERTICAL
+0xb4   0x2524  #BOX DRAWINGS LIGHT VERTICAL AND LEFT
+0xb5   0x2561  #BOX DRAWINGS VERTICAL SINGLE AND LEFT DOUBLE
+0xb6   0x2562  #BOX DRAWINGS VERTICAL DOUBLE AND LEFT SINGLE
+0xb7   0x2556  #BOX DRAWINGS DOWN DOUBLE AND LEFT SINGLE
+0xb8   0x2555  #BOX DRAWINGS DOWN SINGLE AND LEFT DOUBLE
+0xb9   0x2563  #BOX DRAWINGS DOUBLE VERTICAL AND LEFT
+0xba   0x2551  #BOX DRAWINGS DOUBLE VERTICAL
+0xbb   0x2557  #BOX DRAWINGS DOUBLE DOWN AND LEFT
+0xbc   0x255d  #BOX DRAWINGS DOUBLE UP AND LEFT
+0xbd   0x255c  #BOX DRAWINGS UP DOUBLE AND LEFT SINGLE
+0xbe   0x255b  #BOX DRAWINGS UP SINGLE AND LEFT DOUBLE
+0xbf   0x2510  #BOX DRAWINGS LIGHT DOWN AND LEFT
+0xc0   0x2514  #BOX DRAWINGS LIGHT UP AND RIGHT
+0xc1   0x2534  #BOX DRAWINGS LIGHT UP AND HORIZONTAL
+0xc2   0x252c  #BOX DRAWINGS LIGHT DOWN AND HORIZONTAL
+0xc3   0x251c  #BOX DRAWINGS LIGHT VERTICAL AND RIGHT
+0xc4   0x2500  #BOX DRAWINGS LIGHT HORIZONTAL
+0xc5   0x253c  #BOX DRAWINGS LIGHT VERTICAL AND HORIZONTAL
+0xc6   0x255e  #BOX DRAWINGS VERTICAL SINGLE AND RIGHT DOUBLE
+0xc7   0x255f  #BOX DRAWINGS VERTICAL DOUBLE AND RIGHT SINGLE
+0xc8   0x255a  #BOX DRAWINGS DOUBLE UP AND RIGHT
+0xc9   0x2554  #BOX DRAWINGS DOUBLE DOWN AND RIGHT
+0xca   0x2569  #BOX DRAWINGS DOUBLE UP AND HORIZONTAL
+0xcb   0x2566  #BOX DRAWINGS DOUBLE DOWN AND HORIZONTAL
+0xcc   0x2560  #BOX DRAWINGS DOUBLE VERTICAL AND RIGHT
+0xcd   0x2550  #BOX DRAWINGS DOUBLE HORIZONTAL
+0xce   0x256c  #BOX DRAWINGS DOUBLE VERTICAL AND HORIZONTAL
+0xcf   0x2567  #BOX DRAWINGS UP SINGLE AND HORIZONTAL DOUBLE
+0xd0   0x2568  #BOX DRAWINGS UP DOUBLE AND HORIZONTAL SINGLE
+0xd1   0x2564  #BOX DRAWINGS DOWN SINGLE AND HORIZONTAL DOUBLE
+0xd2   0x2565  #BOX DRAWINGS DOWN DOUBLE AND HORIZONTAL SINGLE
+0xd3   0x2559  #BOX DRAWINGS UP DOUBLE AND RIGHT SINGLE
+0xd4   0x2558  #BOX DRAWINGS UP SINGLE AND RIGHT DOUBLE
+0xd5   0x2552  #BOX DRAWINGS DOWN SINGLE AND RIGHT DOUBLE
+0xd6   0x2553  #BOX DRAWINGS DOWN DOUBLE AND RIGHT SINGLE
+0xd7   0x256b  #BOX DRAWINGS VERTICAL DOUBLE AND HORIZONTAL SINGLE
+0xd8   0x256a  #BOX DRAWINGS VERTICAL SINGLE AND HORIZONTAL DOUBLE
+0xd9   0x2518  #BOX DRAWINGS LIGHT UP AND LEFT
+0xda   0x250c  #BOX DRAWINGS LIGHT DOWN AND RIGHT
+0xdb   0x2588  #FULL BLOCK
+0xdc   0x2584  #LOWER HALF BLOCK
+0xdd   0x258c  #LEFT HALF BLOCK
+0xde   0x2590  #RIGHT HALF BLOCK
+0xdf   0x2580  #UPPER HALF BLOCK
+0xe0   0x03b1  #GREEK SMALL LETTER ALPHA
+0xe1   0x00df  #LATIN SMALL LETTER SHARP S
+0xe2   0x0393  #GREEK CAPITAL LETTER GAMMA
+0xe3   0x03c0  #GREEK SMALL LETTER PI
+0xe4   0x03a3  #GREEK CAPITAL LETTER SIGMA
+0xe5   0x03c3  #GREEK SMALL LETTER SIGMA
+0xe6   0x00b5  #MICRO SIGN
+0xe7   0x03c4  #GREEK SMALL LETTER TAU
+0xe8   0x03a6  #GREEK CAPITAL LETTER PHI
+0xe9   0x0398  #GREEK CAPITAL LETTER THETA
+0xea   0x03a9  #GREEK CAPITAL LETTER OMEGA
+0xeb   0x03b4  #GREEK SMALL LETTER DELTA
+0xec   0x221e  #INFINITY
+0xed   0x03c6  #GREEK SMALL LETTER PHI
+0xee   0x03b5  #GREEK SMALL LETTER EPSILON
+0xef   0x2229  #INTERSECTION
+0xf0   0x2261  #IDENTICAL TO
+0xf1   0x00b1  #PLUS-MINUS SIGN
+0xf2   0x2265  #GREATER-THAN OR EQUAL TO
+0xf3   0x2264  #LESS-THAN OR EQUAL TO
+0xf4   0x2320  #TOP HALF INTEGRAL
+0xf5   0x2321  #BOTTOM HALF INTEGRAL
+0xf6   0x00f7  #DIVISION SIGN
+0xf7   0x2248  #ALMOST EQUAL TO
+0xf8   0x00b0  #DEGREE SIGN
+0xf9   0x2219  #BULLET OPERATOR
+0xfa   0x00b7  #MIDDLE DOT
+0xfb   0x221a  #SQUARE ROOT
+0xfc   0x207f  #SUPERSCRIPT LATIN SMALL LETTER N
+0xfd   0x00b2  #SUPERSCRIPT TWO
+0xfe   0x25a0  #BLACK SQUARE
+0xff   0x00a0  #NO-BREAK SPACE
diff --git a/basis/io/encodings/8-bit/CP861.TXT b/basis/io/encodings/8-bit/CP861.TXT
new file mode 100644 (file)
index 0000000..acf9940
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp861_DOSIcelandic to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp861_DOSIcelandic code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp861_DOSIcelandic order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0a   0x000a  #LINE FEED
+0x0b   0x000b  #VERTICAL TABULATION
+0x0c   0x000c  #FORM FEED
+0x0d   0x000d  #CARRIAGE RETURN
+0x0e   0x000e  #SHIFT OUT
+0x0f   0x000f  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1a   0x001a  #SUBSTITUTE
+0x1b   0x001b  #ESCAPE
+0x1c   0x001c  #FILE SEPARATOR
+0x1d   0x001d  #GROUP SEPARATOR
+0x1e   0x001e  #RECORD SEPARATOR
+0x1f   0x001f  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x0025  #PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2a   0x002a  #ASTERISK
+0x2b   0x002b  #PLUS SIGN
+0x2c   0x002c  #COMMA
+0x2d   0x002d  #HYPHEN-MINUS
+0x2e   0x002e  #FULL STOP
+0x2f   0x002f  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3a   0x003a  #COLON
+0x3b   0x003b  #SEMICOLON
+0x3c   0x003c  #LESS-THAN SIGN
+0x3d   0x003d  #EQUALS SIGN
+0x3e   0x003e  #GREATER-THAN SIGN
+0x3f   0x003f  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4a   0x004a  #LATIN CAPITAL LETTER J
+0x4b   0x004b  #LATIN CAPITAL LETTER K
+0x4c   0x004c  #LATIN CAPITAL LETTER L
+0x4d   0x004d  #LATIN CAPITAL LETTER M
+0x4e   0x004e  #LATIN CAPITAL LETTER N
+0x4f   0x004f  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5a   0x005a  #LATIN CAPITAL LETTER Z
+0x5b   0x005b  #LEFT SQUARE BRACKET
+0x5c   0x005c  #REVERSE SOLIDUS
+0x5d   0x005d  #RIGHT SQUARE BRACKET
+0x5e   0x005e  #CIRCUMFLEX ACCENT
+0x5f   0x005f  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6a   0x006a  #LATIN SMALL LETTER J
+0x6b   0x006b  #LATIN SMALL LETTER K
+0x6c   0x006c  #LATIN SMALL LETTER L
+0x6d   0x006d  #LATIN SMALL LETTER M
+0x6e   0x006e  #LATIN SMALL LETTER N
+0x6f   0x006f  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7a   0x007a  #LATIN SMALL LETTER Z
+0x7b   0x007b  #LEFT CURLY BRACKET
+0x7c   0x007c  #VERTICAL LINE
+0x7d   0x007d  #RIGHT CURLY BRACKET
+0x7e   0x007e  #TILDE
+0x7f   0x007f  #DELETE
+0x80   0x00c7  #LATIN CAPITAL LETTER C WITH CEDILLA
+0x81   0x00fc  #LATIN SMALL LETTER U WITH DIAERESIS
+0x82   0x00e9  #LATIN SMALL LETTER E WITH ACUTE
+0x83   0x00e2  #LATIN SMALL LETTER A WITH CIRCUMFLEX
+0x84   0x00e4  #LATIN SMALL LETTER A WITH DIAERESIS
+0x85   0x00e0  #LATIN SMALL LETTER A WITH GRAVE
+0x86   0x00e5  #LATIN SMALL LETTER A WITH RING ABOVE
+0x87   0x00e7  #LATIN SMALL LETTER C WITH CEDILLA
+0x88   0x00ea  #LATIN SMALL LETTER E WITH CIRCUMFLEX
+0x89   0x00eb  #LATIN SMALL LETTER E WITH DIAERESIS
+0x8a   0x00e8  #LATIN SMALL LETTER E WITH GRAVE
+0x8b   0x00d0  #LATIN CAPITAL LETTER ETH
+0x8c   0x00f0  #LATIN SMALL LETTER ETH
+0x8d   0x00de  #LATIN CAPITAL LETTER THORN
+0x8e   0x00c4  #LATIN CAPITAL LETTER A WITH DIAERESIS
+0x8f   0x00c5  #LATIN CAPITAL LETTER A WITH RING ABOVE
+0x90   0x00c9  #LATIN CAPITAL LETTER E WITH ACUTE
+0x91   0x00e6  #LATIN SMALL LIGATURE AE
+0x92   0x00c6  #LATIN CAPITAL LIGATURE AE
+0x93   0x00f4  #LATIN SMALL LETTER O WITH CIRCUMFLEX
+0x94   0x00f6  #LATIN SMALL LETTER O WITH DIAERESIS
+0x95   0x00fe  #LATIN SMALL LETTER THORN
+0x96   0x00fb  #LATIN SMALL LETTER U WITH CIRCUMFLEX
+0x97   0x00dd  #LATIN CAPITAL LETTER Y WITH ACUTE
+0x98   0x00fd  #LATIN SMALL LETTER Y WITH ACUTE
+0x99   0x00d6  #LATIN CAPITAL LETTER O WITH DIAERESIS
+0x9a   0x00dc  #LATIN CAPITAL LETTER U WITH DIAERESIS
+0x9b   0x00f8  #LATIN SMALL LETTER O WITH STROKE
+0x9c   0x00a3  #POUND SIGN
+0x9d   0x00d8  #LATIN CAPITAL LETTER O WITH STROKE
+0x9e   0x20a7  #PESETA SIGN
+0x9f   0x0192  #LATIN SMALL LETTER F WITH HOOK
+0xa0   0x00e1  #LATIN SMALL LETTER A WITH ACUTE
+0xa1   0x00ed  #LATIN SMALL LETTER I WITH ACUTE
+0xa2   0x00f3  #LATIN SMALL LETTER O WITH ACUTE
+0xa3   0x00fa  #LATIN SMALL LETTER U WITH ACUTE
+0xa4   0x00c1  #LATIN CAPITAL LETTER A WITH ACUTE
+0xa5   0x00cd  #LATIN CAPITAL LETTER I WITH ACUTE
+0xa6   0x00d3  #LATIN CAPITAL LETTER O WITH ACUTE
+0xa7   0x00da  #LATIN CAPITAL LETTER U WITH ACUTE
+0xa8   0x00bf  #INVERTED QUESTION MARK
+0xa9   0x2310  #REVERSED NOT SIGN
+0xaa   0x00ac  #NOT SIGN
+0xab   0x00bd  #VULGAR FRACTION ONE HALF
+0xac   0x00bc  #VULGAR FRACTION ONE QUARTER
+0xad   0x00a1  #INVERTED EXCLAMATION MARK
+0xae   0x00ab  #LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xaf   0x00bb  #RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xb0   0x2591  #LIGHT SHADE
+0xb1   0x2592  #MEDIUM SHADE
+0xb2   0x2593  #DARK SHADE
+0xb3   0x2502  #BOX DRAWINGS LIGHT VERTICAL
+0xb4   0x2524  #BOX DRAWINGS LIGHT VERTICAL AND LEFT
+0xb5   0x2561  #BOX DRAWINGS VERTICAL SINGLE AND LEFT DOUBLE
+0xb6   0x2562  #BOX DRAWINGS VERTICAL DOUBLE AND LEFT SINGLE
+0xb7   0x2556  #BOX DRAWINGS DOWN DOUBLE AND LEFT SINGLE
+0xb8   0x2555  #BOX DRAWINGS DOWN SINGLE AND LEFT DOUBLE
+0xb9   0x2563  #BOX DRAWINGS DOUBLE VERTICAL AND LEFT
+0xba   0x2551  #BOX DRAWINGS DOUBLE VERTICAL
+0xbb   0x2557  #BOX DRAWINGS DOUBLE DOWN AND LEFT
+0xbc   0x255d  #BOX DRAWINGS DOUBLE UP AND LEFT
+0xbd   0x255c  #BOX DRAWINGS UP DOUBLE AND LEFT SINGLE
+0xbe   0x255b  #BOX DRAWINGS UP SINGLE AND LEFT DOUBLE
+0xbf   0x2510  #BOX DRAWINGS LIGHT DOWN AND LEFT
+0xc0   0x2514  #BOX DRAWINGS LIGHT UP AND RIGHT
+0xc1   0x2534  #BOX DRAWINGS LIGHT UP AND HORIZONTAL
+0xc2   0x252c  #BOX DRAWINGS LIGHT DOWN AND HORIZONTAL
+0xc3   0x251c  #BOX DRAWINGS LIGHT VERTICAL AND RIGHT
+0xc4   0x2500  #BOX DRAWINGS LIGHT HORIZONTAL
+0xc5   0x253c  #BOX DRAWINGS LIGHT VERTICAL AND HORIZONTAL
+0xc6   0x255e  #BOX DRAWINGS VERTICAL SINGLE AND RIGHT DOUBLE
+0xc7   0x255f  #BOX DRAWINGS VERTICAL DOUBLE AND RIGHT SINGLE
+0xc8   0x255a  #BOX DRAWINGS DOUBLE UP AND RIGHT
+0xc9   0x2554  #BOX DRAWINGS DOUBLE DOWN AND RIGHT
+0xca   0x2569  #BOX DRAWINGS DOUBLE UP AND HORIZONTAL
+0xcb   0x2566  #BOX DRAWINGS DOUBLE DOWN AND HORIZONTAL
+0xcc   0x2560  #BOX DRAWINGS DOUBLE VERTICAL AND RIGHT
+0xcd   0x2550  #BOX DRAWINGS DOUBLE HORIZONTAL
+0xce   0x256c  #BOX DRAWINGS DOUBLE VERTICAL AND HORIZONTAL
+0xcf   0x2567  #BOX DRAWINGS UP SINGLE AND HORIZONTAL DOUBLE
+0xd0   0x2568  #BOX DRAWINGS UP DOUBLE AND HORIZONTAL SINGLE
+0xd1   0x2564  #BOX DRAWINGS DOWN SINGLE AND HORIZONTAL DOUBLE
+0xd2   0x2565  #BOX DRAWINGS DOWN DOUBLE AND HORIZONTAL SINGLE
+0xd3   0x2559  #BOX DRAWINGS UP DOUBLE AND RIGHT SINGLE
+0xd4   0x2558  #BOX DRAWINGS UP SINGLE AND RIGHT DOUBLE
+0xd5   0x2552  #BOX DRAWINGS DOWN SINGLE AND RIGHT DOUBLE
+0xd6   0x2553  #BOX DRAWINGS DOWN DOUBLE AND RIGHT SINGLE
+0xd7   0x256b  #BOX DRAWINGS VERTICAL DOUBLE AND HORIZONTAL SINGLE
+0xd8   0x256a  #BOX DRAWINGS VERTICAL SINGLE AND HORIZONTAL DOUBLE
+0xd9   0x2518  #BOX DRAWINGS LIGHT UP AND LEFT
+0xda   0x250c  #BOX DRAWINGS LIGHT DOWN AND RIGHT
+0xdb   0x2588  #FULL BLOCK
+0xdc   0x2584  #LOWER HALF BLOCK
+0xdd   0x258c  #LEFT HALF BLOCK
+0xde   0x2590  #RIGHT HALF BLOCK
+0xdf   0x2580  #UPPER HALF BLOCK
+0xe0   0x03b1  #GREEK SMALL LETTER ALPHA
+0xe1   0x00df  #LATIN SMALL LETTER SHARP S
+0xe2   0x0393  #GREEK CAPITAL LETTER GAMMA
+0xe3   0x03c0  #GREEK SMALL LETTER PI
+0xe4   0x03a3  #GREEK CAPITAL LETTER SIGMA
+0xe5   0x03c3  #GREEK SMALL LETTER SIGMA
+0xe6   0x00b5  #MICRO SIGN
+0xe7   0x03c4  #GREEK SMALL LETTER TAU
+0xe8   0x03a6  #GREEK CAPITAL LETTER PHI
+0xe9   0x0398  #GREEK CAPITAL LETTER THETA
+0xea   0x03a9  #GREEK CAPITAL LETTER OMEGA
+0xeb   0x03b4  #GREEK SMALL LETTER DELTA
+0xec   0x221e  #INFINITY
+0xed   0x03c6  #GREEK SMALL LETTER PHI
+0xee   0x03b5  #GREEK SMALL LETTER EPSILON
+0xef   0x2229  #INTERSECTION
+0xf0   0x2261  #IDENTICAL TO
+0xf1   0x00b1  #PLUS-MINUS SIGN
+0xf2   0x2265  #GREATER-THAN OR EQUAL TO
+0xf3   0x2264  #LESS-THAN OR EQUAL TO
+0xf4   0x2320  #TOP HALF INTEGRAL
+0xf5   0x2321  #BOTTOM HALF INTEGRAL
+0xf6   0x00f7  #DIVISION SIGN
+0xf7   0x2248  #ALMOST EQUAL TO
+0xf8   0x00b0  #DEGREE SIGN
+0xf9   0x2219  #BULLET OPERATOR
+0xfa   0x00b7  #MIDDLE DOT
+0xfb   0x221a  #SQUARE ROOT
+0xfc   0x207f  #SUPERSCRIPT LATIN SMALL LETTER N
+0xfd   0x00b2  #SUPERSCRIPT TWO
+0xfe   0x25a0  #BLACK SQUARE
+0xff   0x00a0  #NO-BREAK SPACE
diff --git a/basis/io/encodings/8-bit/CP862.TXT b/basis/io/encodings/8-bit/CP862.TXT
new file mode 100644 (file)
index 0000000..cd5c4c6
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp862_DOSHebrew to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp862_DOSHebrew code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp862_DOSHebrew order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0a   0x000a  #LINE FEED
+0x0b   0x000b  #VERTICAL TABULATION
+0x0c   0x000c  #FORM FEED
+0x0d   0x000d  #CARRIAGE RETURN
+0x0e   0x000e  #SHIFT OUT
+0x0f   0x000f  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1a   0x001a  #SUBSTITUTE
+0x1b   0x001b  #ESCAPE
+0x1c   0x001c  #FILE SEPARATOR
+0x1d   0x001d  #GROUP SEPARATOR
+0x1e   0x001e  #RECORD SEPARATOR
+0x1f   0x001f  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x0025  #PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2a   0x002a  #ASTERISK
+0x2b   0x002b  #PLUS SIGN
+0x2c   0x002c  #COMMA
+0x2d   0x002d  #HYPHEN-MINUS
+0x2e   0x002e  #FULL STOP
+0x2f   0x002f  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3a   0x003a  #COLON
+0x3b   0x003b  #SEMICOLON
+0x3c   0x003c  #LESS-THAN SIGN
+0x3d   0x003d  #EQUALS SIGN
+0x3e   0x003e  #GREATER-THAN SIGN
+0x3f   0x003f  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4a   0x004a  #LATIN CAPITAL LETTER J
+0x4b   0x004b  #LATIN CAPITAL LETTER K
+0x4c   0x004c  #LATIN CAPITAL LETTER L
+0x4d   0x004d  #LATIN CAPITAL LETTER M
+0x4e   0x004e  #LATIN CAPITAL LETTER N
+0x4f   0x004f  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5a   0x005a  #LATIN CAPITAL LETTER Z
+0x5b   0x005b  #LEFT SQUARE BRACKET
+0x5c   0x005c  #REVERSE SOLIDUS
+0x5d   0x005d  #RIGHT SQUARE BRACKET
+0x5e   0x005e  #CIRCUMFLEX ACCENT
+0x5f   0x005f  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6a   0x006a  #LATIN SMALL LETTER J
+0x6b   0x006b  #LATIN SMALL LETTER K
+0x6c   0x006c  #LATIN SMALL LETTER L
+0x6d   0x006d  #LATIN SMALL LETTER M
+0x6e   0x006e  #LATIN SMALL LETTER N
+0x6f   0x006f  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7a   0x007a  #LATIN SMALL LETTER Z
+0x7b   0x007b  #LEFT CURLY BRACKET
+0x7c   0x007c  #VERTICAL LINE
+0x7d   0x007d  #RIGHT CURLY BRACKET
+0x7e   0x007e  #TILDE
+0x7f   0x007f  #DELETE
+0x80   0x05d0  #HEBREW LETTER ALEF
+0x81   0x05d1  #HEBREW LETTER BET
+0x82   0x05d2  #HEBREW LETTER GIMEL
+0x83   0x05d3  #HEBREW LETTER DALET
+0x84   0x05d4  #HEBREW LETTER HE
+0x85   0x05d5  #HEBREW LETTER VAV
+0x86   0x05d6  #HEBREW LETTER ZAYIN
+0x87   0x05d7  #HEBREW LETTER HET
+0x88   0x05d8  #HEBREW LETTER TET
+0x89   0x05d9  #HEBREW LETTER YOD
+0x8a   0x05da  #HEBREW LETTER FINAL KAF
+0x8b   0x05db  #HEBREW LETTER KAF
+0x8c   0x05dc  #HEBREW LETTER LAMED
+0x8d   0x05dd  #HEBREW LETTER FINAL MEM
+0x8e   0x05de  #HEBREW LETTER MEM
+0x8f   0x05df  #HEBREW LETTER FINAL NUN
+0x90   0x05e0  #HEBREW LETTER NUN
+0x91   0x05e1  #HEBREW LETTER SAMEKH
+0x92   0x05e2  #HEBREW LETTER AYIN
+0x93   0x05e3  #HEBREW LETTER FINAL PE
+0x94   0x05e4  #HEBREW LETTER PE
+0x95   0x05e5  #HEBREW LETTER FINAL TSADI
+0x96   0x05e6  #HEBREW LETTER TSADI
+0x97   0x05e7  #HEBREW LETTER QOF
+0x98   0x05e8  #HEBREW LETTER RESH
+0x99   0x05e9  #HEBREW LETTER SHIN
+0x9a   0x05ea  #HEBREW LETTER TAV
+0x9b   0x00a2  #CENT SIGN
+0x9c   0x00a3  #POUND SIGN
+0x9d   0x00a5  #YEN SIGN
+0x9e   0x20a7  #PESETA SIGN
+0x9f   0x0192  #LATIN SMALL LETTER F WITH HOOK
+0xa0   0x00e1  #LATIN SMALL LETTER A WITH ACUTE
+0xa1   0x00ed  #LATIN SMALL LETTER I WITH ACUTE
+0xa2   0x00f3  #LATIN SMALL LETTER O WITH ACUTE
+0xa3   0x00fa  #LATIN SMALL LETTER U WITH ACUTE
+0xa4   0x00f1  #LATIN SMALL LETTER N WITH TILDE
+0xa5   0x00d1  #LATIN CAPITAL LETTER N WITH TILDE
+0xa6   0x00aa  #FEMININE ORDINAL INDICATOR
+0xa7   0x00ba  #MASCULINE ORDINAL INDICATOR
+0xa8   0x00bf  #INVERTED QUESTION MARK
+0xa9   0x2310  #REVERSED NOT SIGN
+0xaa   0x00ac  #NOT SIGN
+0xab   0x00bd  #VULGAR FRACTION ONE HALF
+0xac   0x00bc  #VULGAR FRACTION ONE QUARTER
+0xad   0x00a1  #INVERTED EXCLAMATION MARK
+0xae   0x00ab  #LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xaf   0x00bb  #RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xb0   0x2591  #LIGHT SHADE
+0xb1   0x2592  #MEDIUM SHADE
+0xb2   0x2593  #DARK SHADE
+0xb3   0x2502  #BOX DRAWINGS LIGHT VERTICAL
+0xb4   0x2524  #BOX DRAWINGS LIGHT VERTICAL AND LEFT
+0xb5   0x2561  #BOX DRAWINGS VERTICAL SINGLE AND LEFT DOUBLE
+0xb6   0x2562  #BOX DRAWINGS VERTICAL DOUBLE AND LEFT SINGLE
+0xb7   0x2556  #BOX DRAWINGS DOWN DOUBLE AND LEFT SINGLE
+0xb8   0x2555  #BOX DRAWINGS DOWN SINGLE AND LEFT DOUBLE
+0xb9   0x2563  #BOX DRAWINGS DOUBLE VERTICAL AND LEFT
+0xba   0x2551  #BOX DRAWINGS DOUBLE VERTICAL
+0xbb   0x2557  #BOX DRAWINGS DOUBLE DOWN AND LEFT
+0xbc   0x255d  #BOX DRAWINGS DOUBLE UP AND LEFT
+0xbd   0x255c  #BOX DRAWINGS UP DOUBLE AND LEFT SINGLE
+0xbe   0x255b  #BOX DRAWINGS UP SINGLE AND LEFT DOUBLE
+0xbf   0x2510  #BOX DRAWINGS LIGHT DOWN AND LEFT
+0xc0   0x2514  #BOX DRAWINGS LIGHT UP AND RIGHT
+0xc1   0x2534  #BOX DRAWINGS LIGHT UP AND HORIZONTAL
+0xc2   0x252c  #BOX DRAWINGS LIGHT DOWN AND HORIZONTAL
+0xc3   0x251c  #BOX DRAWINGS LIGHT VERTICAL AND RIGHT
+0xc4   0x2500  #BOX DRAWINGS LIGHT HORIZONTAL
+0xc5   0x253c  #BOX DRAWINGS LIGHT VERTICAL AND HORIZONTAL
+0xc6   0x255e  #BOX DRAWINGS VERTICAL SINGLE AND RIGHT DOUBLE
+0xc7   0x255f  #BOX DRAWINGS VERTICAL DOUBLE AND RIGHT SINGLE
+0xc8   0x255a  #BOX DRAWINGS DOUBLE UP AND RIGHT
+0xc9   0x2554  #BOX DRAWINGS DOUBLE DOWN AND RIGHT
+0xca   0x2569  #BOX DRAWINGS DOUBLE UP AND HORIZONTAL
+0xcb   0x2566  #BOX DRAWINGS DOUBLE DOWN AND HORIZONTAL
+0xcc   0x2560  #BOX DRAWINGS DOUBLE VERTICAL AND RIGHT
+0xcd   0x2550  #BOX DRAWINGS DOUBLE HORIZONTAL
+0xce   0x256c  #BOX DRAWINGS DOUBLE VERTICAL AND HORIZONTAL
+0xcf   0x2567  #BOX DRAWINGS UP SINGLE AND HORIZONTAL DOUBLE
+0xd0   0x2568  #BOX DRAWINGS UP DOUBLE AND HORIZONTAL SINGLE
+0xd1   0x2564  #BOX DRAWINGS DOWN SINGLE AND HORIZONTAL DOUBLE
+0xd2   0x2565  #BOX DRAWINGS DOWN DOUBLE AND HORIZONTAL SINGLE
+0xd3   0x2559  #BOX DRAWINGS UP DOUBLE AND RIGHT SINGLE
+0xd4   0x2558  #BOX DRAWINGS UP SINGLE AND RIGHT DOUBLE
+0xd5   0x2552  #BOX DRAWINGS DOWN SINGLE AND RIGHT DOUBLE
+0xd6   0x2553  #BOX DRAWINGS DOWN DOUBLE AND RIGHT SINGLE
+0xd7   0x256b  #BOX DRAWINGS VERTICAL DOUBLE AND HORIZONTAL SINGLE
+0xd8   0x256a  #BOX DRAWINGS VERTICAL SINGLE AND HORIZONTAL DOUBLE
+0xd9   0x2518  #BOX DRAWINGS LIGHT UP AND LEFT
+0xda   0x250c  #BOX DRAWINGS LIGHT DOWN AND RIGHT
+0xdb   0x2588  #FULL BLOCK
+0xdc   0x2584  #LOWER HALF BLOCK
+0xdd   0x258c  #LEFT HALF BLOCK
+0xde   0x2590  #RIGHT HALF BLOCK
+0xdf   0x2580  #UPPER HALF BLOCK
+0xe0   0x03b1  #GREEK SMALL LETTER ALPHA
+0xe1   0x00df  #LATIN SMALL LETTER SHARP S (GERMAN)
+0xe2   0x0393  #GREEK CAPITAL LETTER GAMMA
+0xe3   0x03c0  #GREEK SMALL LETTER PI
+0xe4   0x03a3  #GREEK CAPITAL LETTER SIGMA
+0xe5   0x03c3  #GREEK SMALL LETTER SIGMA
+0xe6   0x00b5  #MICRO SIGN
+0xe7   0x03c4  #GREEK SMALL LETTER TAU
+0xe8   0x03a6  #GREEK CAPITAL LETTER PHI
+0xe9   0x0398  #GREEK CAPITAL LETTER THETA
+0xea   0x03a9  #GREEK CAPITAL LETTER OMEGA
+0xeb   0x03b4  #GREEK SMALL LETTER DELTA
+0xec   0x221e  #INFINITY
+0xed   0x03c6  #GREEK SMALL LETTER PHI
+0xee   0x03b5  #GREEK SMALL LETTER EPSILON
+0xef   0x2229  #INTERSECTION
+0xf0   0x2261  #IDENTICAL TO
+0xf1   0x00b1  #PLUS-MINUS SIGN
+0xf2   0x2265  #GREATER-THAN OR EQUAL TO
+0xf3   0x2264  #LESS-THAN OR EQUAL TO
+0xf4   0x2320  #TOP HALF INTEGRAL
+0xf5   0x2321  #BOTTOM HALF INTEGRAL
+0xf6   0x00f7  #DIVISION SIGN
+0xf7   0x2248  #ALMOST EQUAL TO
+0xf8   0x00b0  #DEGREE SIGN
+0xf9   0x2219  #BULLET OPERATOR
+0xfa   0x00b7  #MIDDLE DOT
+0xfb   0x221a  #SQUARE ROOT
+0xfc   0x207f  #SUPERSCRIPT LATIN SMALL LETTER N
+0xfd   0x00b2  #SUPERSCRIPT TWO
+0xfe   0x25a0  #BLACK SQUARE
+0xff   0x00a0  #NO-BREAK SPACE
diff --git a/basis/io/encodings/8-bit/CP863.TXT b/basis/io/encodings/8-bit/CP863.TXT
new file mode 100644 (file)
index 0000000..3b0181d
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp863_DOSCanadaF to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp863_DOSCanadaF code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp863_DOSCanadaF order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0a   0x000a  #LINE FEED
+0x0b   0x000b  #VERTICAL TABULATION
+0x0c   0x000c  #FORM FEED
+0x0d   0x000d  #CARRIAGE RETURN
+0x0e   0x000e  #SHIFT OUT
+0x0f   0x000f  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1a   0x001a  #SUBSTITUTE
+0x1b   0x001b  #ESCAPE
+0x1c   0x001c  #FILE SEPARATOR
+0x1d   0x001d  #GROUP SEPARATOR
+0x1e   0x001e  #RECORD SEPARATOR
+0x1f   0x001f  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x0025  #PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2a   0x002a  #ASTERISK
+0x2b   0x002b  #PLUS SIGN
+0x2c   0x002c  #COMMA
+0x2d   0x002d  #HYPHEN-MINUS
+0x2e   0x002e  #FULL STOP
+0x2f   0x002f  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3a   0x003a  #COLON
+0x3b   0x003b  #SEMICOLON
+0x3c   0x003c  #LESS-THAN SIGN
+0x3d   0x003d  #EQUALS SIGN
+0x3e   0x003e  #GREATER-THAN SIGN
+0x3f   0x003f  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4a   0x004a  #LATIN CAPITAL LETTER J
+0x4b   0x004b  #LATIN CAPITAL LETTER K
+0x4c   0x004c  #LATIN CAPITAL LETTER L
+0x4d   0x004d  #LATIN CAPITAL LETTER M
+0x4e   0x004e  #LATIN CAPITAL LETTER N
+0x4f   0x004f  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5a   0x005a  #LATIN CAPITAL LETTER Z
+0x5b   0x005b  #LEFT SQUARE BRACKET
+0x5c   0x005c  #REVERSE SOLIDUS
+0x5d   0x005d  #RIGHT SQUARE BRACKET
+0x5e   0x005e  #CIRCUMFLEX ACCENT
+0x5f   0x005f  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6a   0x006a  #LATIN SMALL LETTER J
+0x6b   0x006b  #LATIN SMALL LETTER K
+0x6c   0x006c  #LATIN SMALL LETTER L
+0x6d   0x006d  #LATIN SMALL LETTER M
+0x6e   0x006e  #LATIN SMALL LETTER N
+0x6f   0x006f  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7a   0x007a  #LATIN SMALL LETTER Z
+0x7b   0x007b  #LEFT CURLY BRACKET
+0x7c   0x007c  #VERTICAL LINE
+0x7d   0x007d  #RIGHT CURLY BRACKET
+0x7e   0x007e  #TILDE
+0x7f   0x007f  #DELETE
+0x80   0x00c7  #LATIN CAPITAL LETTER C WITH CEDILLA
+0x81   0x00fc  #LATIN SMALL LETTER U WITH DIAERESIS
+0x82   0x00e9  #LATIN SMALL LETTER E WITH ACUTE
+0x83   0x00e2  #LATIN SMALL LETTER A WITH CIRCUMFLEX
+0x84   0x00c2  #LATIN CAPITAL LETTER A WITH CIRCUMFLEX
+0x85   0x00e0  #LATIN SMALL LETTER A WITH GRAVE
+0x86   0x00b6  #PILCROW SIGN
+0x87   0x00e7  #LATIN SMALL LETTER C WITH CEDILLA
+0x88   0x00ea  #LATIN SMALL LETTER E WITH CIRCUMFLEX
+0x89   0x00eb  #LATIN SMALL LETTER E WITH DIAERESIS
+0x8a   0x00e8  #LATIN SMALL LETTER E WITH GRAVE
+0x8b   0x00ef  #LATIN SMALL LETTER I WITH DIAERESIS
+0x8c   0x00ee  #LATIN SMALL LETTER I WITH CIRCUMFLEX
+0x8d   0x2017  #DOUBLE LOW LINE
+0x8e   0x00c0  #LATIN CAPITAL LETTER A WITH GRAVE
+0x8f   0x00a7  #SECTION SIGN
+0x90   0x00c9  #LATIN CAPITAL LETTER E WITH ACUTE
+0x91   0x00c8  #LATIN CAPITAL LETTER E WITH GRAVE
+0x92   0x00ca  #LATIN CAPITAL LETTER E WITH CIRCUMFLEX
+0x93   0x00f4  #LATIN SMALL LETTER O WITH CIRCUMFLEX
+0x94   0x00cb  #LATIN CAPITAL LETTER E WITH DIAERESIS
+0x95   0x00cf  #LATIN CAPITAL LETTER I WITH DIAERESIS
+0x96   0x00fb  #LATIN SMALL LETTER U WITH CIRCUMFLEX
+0x97   0x00f9  #LATIN SMALL LETTER U WITH GRAVE
+0x98   0x00a4  #CURRENCY SIGN
+0x99   0x00d4  #LATIN CAPITAL LETTER O WITH CIRCUMFLEX
+0x9a   0x00dc  #LATIN CAPITAL LETTER U WITH DIAERESIS
+0x9b   0x00a2  #CENT SIGN
+0x9c   0x00a3  #POUND SIGN
+0x9d   0x00d9  #LATIN CAPITAL LETTER U WITH GRAVE
+0x9e   0x00db  #LATIN CAPITAL LETTER U WITH CIRCUMFLEX
+0x9f   0x0192  #LATIN SMALL LETTER F WITH HOOK
+0xa0   0x00a6  #BROKEN BAR
+0xa1   0x00b4  #ACUTE ACCENT
+0xa2   0x00f3  #LATIN SMALL LETTER O WITH ACUTE
+0xa3   0x00fa  #LATIN SMALL LETTER U WITH ACUTE
+0xa4   0x00a8  #DIAERESIS
+0xa5   0x00b8  #CEDILLA
+0xa6   0x00b3  #SUPERSCRIPT THREE
+0xa7   0x00af  #MACRON
+0xa8   0x00ce  #LATIN CAPITAL LETTER I WITH CIRCUMFLEX
+0xa9   0x2310  #REVERSED NOT SIGN
+0xaa   0x00ac  #NOT SIGN
+0xab   0x00bd  #VULGAR FRACTION ONE HALF
+0xac   0x00bc  #VULGAR FRACTION ONE QUARTER
+0xad   0x00be  #VULGAR FRACTION THREE QUARTERS
+0xae   0x00ab  #LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xaf   0x00bb  #RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xb0   0x2591  #LIGHT SHADE
+0xb1   0x2592  #MEDIUM SHADE
+0xb2   0x2593  #DARK SHADE
+0xb3   0x2502  #BOX DRAWINGS LIGHT VERTICAL
+0xb4   0x2524  #BOX DRAWINGS LIGHT VERTICAL AND LEFT
+0xb5   0x2561  #BOX DRAWINGS VERTICAL SINGLE AND LEFT DOUBLE
+0xb6   0x2562  #BOX DRAWINGS VERTICAL DOUBLE AND LEFT SINGLE
+0xb7   0x2556  #BOX DRAWINGS DOWN DOUBLE AND LEFT SINGLE
+0xb8   0x2555  #BOX DRAWINGS DOWN SINGLE AND LEFT DOUBLE
+0xb9   0x2563  #BOX DRAWINGS DOUBLE VERTICAL AND LEFT
+0xba   0x2551  #BOX DRAWINGS DOUBLE VERTICAL
+0xbb   0x2557  #BOX DRAWINGS DOUBLE DOWN AND LEFT
+0xbc   0x255d  #BOX DRAWINGS DOUBLE UP AND LEFT
+0xbd   0x255c  #BOX DRAWINGS UP DOUBLE AND LEFT SINGLE
+0xbe   0x255b  #BOX DRAWINGS UP SINGLE AND LEFT DOUBLE
+0xbf   0x2510  #BOX DRAWINGS LIGHT DOWN AND LEFT
+0xc0   0x2514  #BOX DRAWINGS LIGHT UP AND RIGHT
+0xc1   0x2534  #BOX DRAWINGS LIGHT UP AND HORIZONTAL
+0xc2   0x252c  #BOX DRAWINGS LIGHT DOWN AND HORIZONTAL
+0xc3   0x251c  #BOX DRAWINGS LIGHT VERTICAL AND RIGHT
+0xc4   0x2500  #BOX DRAWINGS LIGHT HORIZONTAL
+0xc5   0x253c  #BOX DRAWINGS LIGHT VERTICAL AND HORIZONTAL
+0xc6   0x255e  #BOX DRAWINGS VERTICAL SINGLE AND RIGHT DOUBLE
+0xc7   0x255f  #BOX DRAWINGS VERTICAL DOUBLE AND RIGHT SINGLE
+0xc8   0x255a  #BOX DRAWINGS DOUBLE UP AND RIGHT
+0xc9   0x2554  #BOX DRAWINGS DOUBLE DOWN AND RIGHT
+0xca   0x2569  #BOX DRAWINGS DOUBLE UP AND HORIZONTAL
+0xcb   0x2566  #BOX DRAWINGS DOUBLE DOWN AND HORIZONTAL
+0xcc   0x2560  #BOX DRAWINGS DOUBLE VERTICAL AND RIGHT
+0xcd   0x2550  #BOX DRAWINGS DOUBLE HORIZONTAL
+0xce   0x256c  #BOX DRAWINGS DOUBLE VERTICAL AND HORIZONTAL
+0xcf   0x2567  #BOX DRAWINGS UP SINGLE AND HORIZONTAL DOUBLE
+0xd0   0x2568  #BOX DRAWINGS UP DOUBLE AND HORIZONTAL SINGLE
+0xd1   0x2564  #BOX DRAWINGS DOWN SINGLE AND HORIZONTAL DOUBLE
+0xd2   0x2565  #BOX DRAWINGS DOWN DOUBLE AND HORIZONTAL SINGLE
+0xd3   0x2559  #BOX DRAWINGS UP DOUBLE AND RIGHT SINGLE
+0xd4   0x2558  #BOX DRAWINGS UP SINGLE AND RIGHT DOUBLE
+0xd5   0x2552  #BOX DRAWINGS DOWN SINGLE AND RIGHT DOUBLE
+0xd6   0x2553  #BOX DRAWINGS DOWN DOUBLE AND RIGHT SINGLE
+0xd7   0x256b  #BOX DRAWINGS VERTICAL DOUBLE AND HORIZONTAL SINGLE
+0xd8   0x256a  #BOX DRAWINGS VERTICAL SINGLE AND HORIZONTAL DOUBLE
+0xd9   0x2518  #BOX DRAWINGS LIGHT UP AND LEFT
+0xda   0x250c  #BOX DRAWINGS LIGHT DOWN AND RIGHT
+0xdb   0x2588  #FULL BLOCK
+0xdc   0x2584  #LOWER HALF BLOCK
+0xdd   0x258c  #LEFT HALF BLOCK
+0xde   0x2590  #RIGHT HALF BLOCK
+0xdf   0x2580  #UPPER HALF BLOCK
+0xe0   0x03b1  #GREEK SMALL LETTER ALPHA
+0xe1   0x00df  #LATIN SMALL LETTER SHARP S
+0xe2   0x0393  #GREEK CAPITAL LETTER GAMMA
+0xe3   0x03c0  #GREEK SMALL LETTER PI
+0xe4   0x03a3  #GREEK CAPITAL LETTER SIGMA
+0xe5   0x03c3  #GREEK SMALL LETTER SIGMA
+0xe6   0x00b5  #MICRO SIGN
+0xe7   0x03c4  #GREEK SMALL LETTER TAU
+0xe8   0x03a6  #GREEK CAPITAL LETTER PHI
+0xe9   0x0398  #GREEK CAPITAL LETTER THETA
+0xea   0x03a9  #GREEK CAPITAL LETTER OMEGA
+0xeb   0x03b4  #GREEK SMALL LETTER DELTA
+0xec   0x221e  #INFINITY
+0xed   0x03c6  #GREEK SMALL LETTER PHI
+0xee   0x03b5  #GREEK SMALL LETTER EPSILON
+0xef   0x2229  #INTERSECTION
+0xf0   0x2261  #IDENTICAL TO
+0xf1   0x00b1  #PLUS-MINUS SIGN
+0xf2   0x2265  #GREATER-THAN OR EQUAL TO
+0xf3   0x2264  #LESS-THAN OR EQUAL TO
+0xf4   0x2320  #TOP HALF INTEGRAL
+0xf5   0x2321  #BOTTOM HALF INTEGRAL
+0xf6   0x00f7  #DIVISION SIGN
+0xf7   0x2248  #ALMOST EQUAL TO
+0xf8   0x00b0  #DEGREE SIGN
+0xf9   0x2219  #BULLET OPERATOR
+0xfa   0x00b7  #MIDDLE DOT
+0xfb   0x221a  #SQUARE ROOT
+0xfc   0x207f  #SUPERSCRIPT LATIN SMALL LETTER N
+0xfd   0x00b2  #SUPERSCRIPT TWO
+0xfe   0x25a0  #BLACK SQUARE
+0xff   0x00a0  #NO-BREAK SPACE
diff --git a/basis/io/encodings/8-bit/CP864.TXT b/basis/io/encodings/8-bit/CP864.TXT
new file mode 100644 (file)
index 0000000..f80fa2c
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp864_DOSArabic to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp864_DOSArabic code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp864_DOSArabic order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0a   0x000a  #LINE FEED
+0x0b   0x000b  #VERTICAL TABULATION
+0x0c   0x000c  #FORM FEED
+0x0d   0x000d  #CARRIAGE RETURN
+0x0e   0x000e  #SHIFT OUT
+0x0f   0x000f  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1a   0x001a  #SUBSTITUTE
+0x1b   0x001b  #ESCAPE
+0x1c   0x001c  #FILE SEPARATOR
+0x1d   0x001d  #GROUP SEPARATOR
+0x1e   0x001e  #RECORD SEPARATOR
+0x1f   0x001f  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x066a  #ARABIC PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2a   0x002a  #ASTERISK
+0x2b   0x002b  #PLUS SIGN
+0x2c   0x002c  #COMMA
+0x2d   0x002d  #HYPHEN-MINUS
+0x2e   0x002e  #FULL STOP
+0x2f   0x002f  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3a   0x003a  #COLON
+0x3b   0x003b  #SEMICOLON
+0x3c   0x003c  #LESS-THAN SIGN
+0x3d   0x003d  #EQUALS SIGN
+0x3e   0x003e  #GREATER-THAN SIGN
+0x3f   0x003f  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4a   0x004a  #LATIN CAPITAL LETTER J
+0x4b   0x004b  #LATIN CAPITAL LETTER K
+0x4c   0x004c  #LATIN CAPITAL LETTER L
+0x4d   0x004d  #LATIN CAPITAL LETTER M
+0x4e   0x004e  #LATIN CAPITAL LETTER N
+0x4f   0x004f  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5a   0x005a  #LATIN CAPITAL LETTER Z
+0x5b   0x005b  #LEFT SQUARE BRACKET
+0x5c   0x005c  #REVERSE SOLIDUS
+0x5d   0x005d  #RIGHT SQUARE BRACKET
+0x5e   0x005e  #CIRCUMFLEX ACCENT
+0x5f   0x005f  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6a   0x006a  #LATIN SMALL LETTER J
+0x6b   0x006b  #LATIN SMALL LETTER K
+0x6c   0x006c  #LATIN SMALL LETTER L
+0x6d   0x006d  #LATIN SMALL LETTER M
+0x6e   0x006e  #LATIN SMALL LETTER N
+0x6f   0x006f  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7a   0x007a  #LATIN SMALL LETTER Z
+0x7b   0x007b  #LEFT CURLY BRACKET
+0x7c   0x007c  #VERTICAL LINE
+0x7d   0x007d  #RIGHT CURLY BRACKET
+0x7e   0x007e  #TILDE
+0x7f   0x007f  #DELETE
+0x80   0x00b0  #DEGREE SIGN
+0x81   0x00b7  #MIDDLE DOT
+0x82   0x2219  #BULLET OPERATOR
+0x83   0x221a  #SQUARE ROOT
+0x84   0x2592  #MEDIUM SHADE
+0x85   0x2500  #FORMS LIGHT HORIZONTAL
+0x86   0x2502  #FORMS LIGHT VERTICAL
+0x87   0x253c  #FORMS LIGHT VERTICAL AND HORIZONTAL
+0x88   0x2524  #FORMS LIGHT VERTICAL AND LEFT
+0x89   0x252c  #FORMS LIGHT DOWN AND HORIZONTAL
+0x8a   0x251c  #FORMS LIGHT VERTICAL AND RIGHT
+0x8b   0x2534  #FORMS LIGHT UP AND HORIZONTAL
+0x8c   0x2510  #FORMS LIGHT DOWN AND LEFT
+0x8d   0x250c  #FORMS LIGHT DOWN AND RIGHT
+0x8e   0x2514  #FORMS LIGHT UP AND RIGHT
+0x8f   0x2518  #FORMS LIGHT UP AND LEFT
+0x90   0x03b2  #GREEK SMALL BETA
+0x91   0x221e  #INFINITY
+0x92   0x03c6  #GREEK SMALL PHI
+0x93   0x00b1  #PLUS-OR-MINUS SIGN
+0x94   0x00bd  #FRACTION 1/2
+0x95   0x00bc  #FRACTION 1/4
+0x96   0x2248  #ALMOST EQUAL TO
+0x97   0x00ab  #LEFT POINTING GUILLEMET
+0x98   0x00bb  #RIGHT POINTING GUILLEMET
+0x99   0xfef7  #ARABIC LIGATURE LAM WITH ALEF WITH HAMZA ABOVE ISOLATED FORM
+0x9a   0xfef8  #ARABIC LIGATURE LAM WITH ALEF WITH HAMZA ABOVE FINAL FORM
+0x9b           #UNDEFINED
+0x9c           #UNDEFINED
+0x9d   0xfefb  #ARABIC LIGATURE LAM WITH ALEF ISOLATED FORM
+0x9e   0xfefc  #ARABIC LIGATURE LAM WITH ALEF FINAL FORM
+0x9f           #UNDEFINED
+0xa0   0x00a0  #NON-BREAKING SPACE
+0xa1   0x00ad  #SOFT HYPHEN
+0xa2   0xfe82  #ARABIC LETTER ALEF WITH MADDA ABOVE FINAL FORM
+0xa3   0x00a3  #POUND SIGN
+0xa4   0x00a4  #CURRENCY SIGN
+0xa5   0xfe84  #ARABIC LETTER ALEF WITH HAMZA ABOVE FINAL FORM
+0xa6           #UNDEFINED
+0xa7           #UNDEFINED
+0xa8   0xfe8e  #ARABIC LETTER ALEF FINAL FORM
+0xa9   0xfe8f  #ARABIC LETTER BEH ISOLATED FORM
+0xaa   0xfe95  #ARABIC LETTER TEH ISOLATED FORM
+0xab   0xfe99  #ARABIC LETTER THEH ISOLATED FORM
+0xac   0x060c  #ARABIC COMMA
+0xad   0xfe9d  #ARABIC LETTER JEEM ISOLATED FORM
+0xae   0xfea1  #ARABIC LETTER HAH ISOLATED FORM
+0xaf   0xfea5  #ARABIC LETTER KHAH ISOLATED FORM
+0xb0   0x0660  #ARABIC-INDIC DIGIT ZERO
+0xb1   0x0661  #ARABIC-INDIC DIGIT ONE
+0xb2   0x0662  #ARABIC-INDIC DIGIT TWO
+0xb3   0x0663  #ARABIC-INDIC DIGIT THREE
+0xb4   0x0664  #ARABIC-INDIC DIGIT FOUR
+0xb5   0x0665  #ARABIC-INDIC DIGIT FIVE
+0xb6   0x0666  #ARABIC-INDIC DIGIT SIX
+0xb7   0x0667  #ARABIC-INDIC DIGIT SEVEN
+0xb8   0x0668  #ARABIC-INDIC DIGIT EIGHT
+0xb9   0x0669  #ARABIC-INDIC DIGIT NINE
+0xba   0xfed1  #ARABIC LETTER FEH ISOLATED FORM
+0xbb   0x061b  #ARABIC SEMICOLON
+0xbc   0xfeb1  #ARABIC LETTER SEEN ISOLATED FORM
+0xbd   0xfeb5  #ARABIC LETTER SHEEN ISOLATED FORM
+0xbe   0xfeb9  #ARABIC LETTER SAD ISOLATED FORM
+0xbf   0x061f  #ARABIC QUESTION MARK
+0xc0   0x00a2  #CENT SIGN
+0xc1   0xfe80  #ARABIC LETTER HAMZA ISOLATED FORM
+0xc2   0xfe81  #ARABIC LETTER ALEF WITH MADDA ABOVE ISOLATED FORM
+0xc3   0xfe83  #ARABIC LETTER ALEF WITH HAMZA ABOVE ISOLATED FORM
+0xc4   0xfe85  #ARABIC LETTER WAW WITH HAMZA ABOVE ISOLATED FORM
+0xc5   0xfeca  #ARABIC LETTER AIN FINAL FORM
+0xc6   0xfe8b  #ARABIC LETTER YEH WITH HAMZA ABOVE INITIAL FORM
+0xc7   0xfe8d  #ARABIC LETTER ALEF ISOLATED FORM
+0xc8   0xfe91  #ARABIC LETTER BEH INITIAL FORM
+0xc9   0xfe93  #ARABIC LETTER TEH MARBUTA ISOLATED FORM
+0xca   0xfe97  #ARABIC LETTER TEH INITIAL FORM
+0xcb   0xfe9b  #ARABIC LETTER THEH INITIAL FORM
+0xcc   0xfe9f  #ARABIC LETTER JEEM INITIAL FORM
+0xcd   0xfea3  #ARABIC LETTER HAH INITIAL FORM
+0xce   0xfea7  #ARABIC LETTER KHAH INITIAL FORM
+0xcf   0xfea9  #ARABIC LETTER DAL ISOLATED FORM
+0xd0   0xfeab  #ARABIC LETTER THAL ISOLATED FORM
+0xd1   0xfead  #ARABIC LETTER REH ISOLATED FORM
+0xd2   0xfeaf  #ARABIC LETTER ZAIN ISOLATED FORM
+0xd3   0xfeb3  #ARABIC LETTER SEEN INITIAL FORM
+0xd4   0xfeb7  #ARABIC LETTER SHEEN INITIAL FORM
+0xd5   0xfebb  #ARABIC LETTER SAD INITIAL FORM
+0xd6   0xfebf  #ARABIC LETTER DAD INITIAL FORM
+0xd7   0xfec1  #ARABIC LETTER TAH ISOLATED FORM
+0xd8   0xfec5  #ARABIC LETTER ZAH ISOLATED FORM
+0xd9   0xfecb  #ARABIC LETTER AIN INITIAL FORM
+0xda   0xfecf  #ARABIC LETTER GHAIN INITIAL FORM
+0xdb   0x00a6  #BROKEN VERTICAL BAR
+0xdc   0x00ac  #NOT SIGN
+0xdd   0x00f7  #DIVISION SIGN
+0xde   0x00d7  #MULTIPLICATION SIGN
+0xdf   0xfec9  #ARABIC LETTER AIN ISOLATED FORM
+0xe0   0x0640  #ARABIC TATWEEL
+0xe1   0xfed3  #ARABIC LETTER FEH INITIAL FORM
+0xe2   0xfed7  #ARABIC LETTER QAF INITIAL FORM
+0xe3   0xfedb  #ARABIC LETTER KAF INITIAL FORM
+0xe4   0xfedf  #ARABIC LETTER LAM INITIAL FORM
+0xe5   0xfee3  #ARABIC LETTER MEEM INITIAL FORM
+0xe6   0xfee7  #ARABIC LETTER NOON INITIAL FORM
+0xe7   0xfeeb  #ARABIC LETTER HEH INITIAL FORM
+0xe8   0xfeed  #ARABIC LETTER WAW ISOLATED FORM
+0xe9   0xfeef  #ARABIC LETTER ALEF MAKSURA ISOLATED FORM
+0xea   0xfef3  #ARABIC LETTER YEH INITIAL FORM
+0xeb   0xfebd  #ARABIC LETTER DAD ISOLATED FORM
+0xec   0xfecc  #ARABIC LETTER AIN MEDIAL FORM
+0xed   0xfece  #ARABIC LETTER GHAIN FINAL FORM
+0xee   0xfecd  #ARABIC LETTER GHAIN ISOLATED FORM
+0xef   0xfee1  #ARABIC LETTER MEEM ISOLATED FORM
+0xf0   0xfe7d  #ARABIC SHADDA MEDIAL FORM
+0xf1   0x0651  #ARABIC SHADDAH
+0xf2   0xfee5  #ARABIC LETTER NOON ISOLATED FORM
+0xf3   0xfee9  #ARABIC LETTER HEH ISOLATED FORM
+0xf4   0xfeec  #ARABIC LETTER HEH MEDIAL FORM
+0xf5   0xfef0  #ARABIC LETTER ALEF MAKSURA FINAL FORM
+0xf6   0xfef2  #ARABIC LETTER YEH FINAL FORM
+0xf7   0xfed0  #ARABIC LETTER GHAIN MEDIAL FORM
+0xf8   0xfed5  #ARABIC LETTER QAF ISOLATED FORM
+0xf9   0xfef5  #ARABIC LIGATURE LAM WITH ALEF WITH MADDA ABOVE ISOLATED FORM
+0xfa   0xfef6  #ARABIC LIGATURE LAM WITH ALEF WITH MADDA ABOVE FINAL FORM
+0xfb   0xfedd  #ARABIC LETTER LAM ISOLATED FORM
+0xfc   0xfed9  #ARABIC LETTER KAF ISOLATED FORM
+0xfd   0xfef1  #ARABIC LETTER YEH ISOLATED FORM
+0xfe   0x25a0  #BLACK SQUARE
+0xff           #UNDEFINED
diff --git a/basis/io/encodings/8-bit/CP865.TXT b/basis/io/encodings/8-bit/CP865.TXT
new file mode 100644 (file)
index 0000000..9871266
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp865_DOSNordic to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp865_DOSNordic code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp865_DOSNordic order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0a   0x000a  #LINE FEED
+0x0b   0x000b  #VERTICAL TABULATION
+0x0c   0x000c  #FORM FEED
+0x0d   0x000d  #CARRIAGE RETURN
+0x0e   0x000e  #SHIFT OUT
+0x0f   0x000f  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1a   0x001a  #SUBSTITUTE
+0x1b   0x001b  #ESCAPE
+0x1c   0x001c  #FILE SEPARATOR
+0x1d   0x001d  #GROUP SEPARATOR
+0x1e   0x001e  #RECORD SEPARATOR
+0x1f   0x001f  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x0025  #PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2a   0x002a  #ASTERISK
+0x2b   0x002b  #PLUS SIGN
+0x2c   0x002c  #COMMA
+0x2d   0x002d  #HYPHEN-MINUS
+0x2e   0x002e  #FULL STOP
+0x2f   0x002f  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3a   0x003a  #COLON
+0x3b   0x003b  #SEMICOLON
+0x3c   0x003c  #LESS-THAN SIGN
+0x3d   0x003d  #EQUALS SIGN
+0x3e   0x003e  #GREATER-THAN SIGN
+0x3f   0x003f  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4a   0x004a  #LATIN CAPITAL LETTER J
+0x4b   0x004b  #LATIN CAPITAL LETTER K
+0x4c   0x004c  #LATIN CAPITAL LETTER L
+0x4d   0x004d  #LATIN CAPITAL LETTER M
+0x4e   0x004e  #LATIN CAPITAL LETTER N
+0x4f   0x004f  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5a   0x005a  #LATIN CAPITAL LETTER Z
+0x5b   0x005b  #LEFT SQUARE BRACKET
+0x5c   0x005c  #REVERSE SOLIDUS
+0x5d   0x005d  #RIGHT SQUARE BRACKET
+0x5e   0x005e  #CIRCUMFLEX ACCENT
+0x5f   0x005f  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6a   0x006a  #LATIN SMALL LETTER J
+0x6b   0x006b  #LATIN SMALL LETTER K
+0x6c   0x006c  #LATIN SMALL LETTER L
+0x6d   0x006d  #LATIN SMALL LETTER M
+0x6e   0x006e  #LATIN SMALL LETTER N
+0x6f   0x006f  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7a   0x007a  #LATIN SMALL LETTER Z
+0x7b   0x007b  #LEFT CURLY BRACKET
+0x7c   0x007c  #VERTICAL LINE
+0x7d   0x007d  #RIGHT CURLY BRACKET
+0x7e   0x007e  #TILDE
+0x7f   0x007f  #DELETE
+0x80   0x00c7  #LATIN CAPITAL LETTER C WITH CEDILLA
+0x81   0x00fc  #LATIN SMALL LETTER U WITH DIAERESIS
+0x82   0x00e9  #LATIN SMALL LETTER E WITH ACUTE
+0x83   0x00e2  #LATIN SMALL LETTER A WITH CIRCUMFLEX
+0x84   0x00e4  #LATIN SMALL LETTER A WITH DIAERESIS
+0x85   0x00e0  #LATIN SMALL LETTER A WITH GRAVE
+0x86   0x00e5  #LATIN SMALL LETTER A WITH RING ABOVE
+0x87   0x00e7  #LATIN SMALL LETTER C WITH CEDILLA
+0x88   0x00ea  #LATIN SMALL LETTER E WITH CIRCUMFLEX
+0x89   0x00eb  #LATIN SMALL LETTER E WITH DIAERESIS
+0x8a   0x00e8  #LATIN SMALL LETTER E WITH GRAVE
+0x8b   0x00ef  #LATIN SMALL LETTER I WITH DIAERESIS
+0x8c   0x00ee  #LATIN SMALL LETTER I WITH CIRCUMFLEX
+0x8d   0x00ec  #LATIN SMALL LETTER I WITH GRAVE
+0x8e   0x00c4  #LATIN CAPITAL LETTER A WITH DIAERESIS
+0x8f   0x00c5  #LATIN CAPITAL LETTER A WITH RING ABOVE
+0x90   0x00c9  #LATIN CAPITAL LETTER E WITH ACUTE
+0x91   0x00e6  #LATIN SMALL LIGATURE AE
+0x92   0x00c6  #LATIN CAPITAL LIGATURE AE
+0x93   0x00f4  #LATIN SMALL LETTER O WITH CIRCUMFLEX
+0x94   0x00f6  #LATIN SMALL LETTER O WITH DIAERESIS
+0x95   0x00f2  #LATIN SMALL LETTER O WITH GRAVE
+0x96   0x00fb  #LATIN SMALL LETTER U WITH CIRCUMFLEX
+0x97   0x00f9  #LATIN SMALL LETTER U WITH GRAVE
+0x98   0x00ff  #LATIN SMALL LETTER Y WITH DIAERESIS
+0x99   0x00d6  #LATIN CAPITAL LETTER O WITH DIAERESIS
+0x9a   0x00dc  #LATIN CAPITAL LETTER U WITH DIAERESIS
+0x9b   0x00f8  #LATIN SMALL LETTER O WITH STROKE
+0x9c   0x00a3  #POUND SIGN
+0x9d   0x00d8  #LATIN CAPITAL LETTER O WITH STROKE
+0x9e   0x20a7  #PESETA SIGN
+0x9f   0x0192  #LATIN SMALL LETTER F WITH HOOK
+0xa0   0x00e1  #LATIN SMALL LETTER A WITH ACUTE
+0xa1   0x00ed  #LATIN SMALL LETTER I WITH ACUTE
+0xa2   0x00f3  #LATIN SMALL LETTER O WITH ACUTE
+0xa3   0x00fa  #LATIN SMALL LETTER U WITH ACUTE
+0xa4   0x00f1  #LATIN SMALL LETTER N WITH TILDE
+0xa5   0x00d1  #LATIN CAPITAL LETTER N WITH TILDE
+0xa6   0x00aa  #FEMININE ORDINAL INDICATOR
+0xa7   0x00ba  #MASCULINE ORDINAL INDICATOR
+0xa8   0x00bf  #INVERTED QUESTION MARK
+0xa9   0x2310  #REVERSED NOT SIGN
+0xaa   0x00ac  #NOT SIGN
+0xab   0x00bd  #VULGAR FRACTION ONE HALF
+0xac   0x00bc  #VULGAR FRACTION ONE QUARTER
+0xad   0x00a1  #INVERTED EXCLAMATION MARK
+0xae   0x00ab  #LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xaf   0x00a4  #CURRENCY SIGN
+0xb0   0x2591  #LIGHT SHADE
+0xb1   0x2592  #MEDIUM SHADE
+0xb2   0x2593  #DARK SHADE
+0xb3   0x2502  #BOX DRAWINGS LIGHT VERTICAL
+0xb4   0x2524  #BOX DRAWINGS LIGHT VERTICAL AND LEFT
+0xb5   0x2561  #BOX DRAWINGS VERTICAL SINGLE AND LEFT DOUBLE
+0xb6   0x2562  #BOX DRAWINGS VERTICAL DOUBLE AND LEFT SINGLE
+0xb7   0x2556  #BOX DRAWINGS DOWN DOUBLE AND LEFT SINGLE
+0xb8   0x2555  #BOX DRAWINGS DOWN SINGLE AND LEFT DOUBLE
+0xb9   0x2563  #BOX DRAWINGS DOUBLE VERTICAL AND LEFT
+0xba   0x2551  #BOX DRAWINGS DOUBLE VERTICAL
+0xbb   0x2557  #BOX DRAWINGS DOUBLE DOWN AND LEFT
+0xbc   0x255d  #BOX DRAWINGS DOUBLE UP AND LEFT
+0xbd   0x255c  #BOX DRAWINGS UP DOUBLE AND LEFT SINGLE
+0xbe   0x255b  #BOX DRAWINGS UP SINGLE AND LEFT DOUBLE
+0xbf   0x2510  #BOX DRAWINGS LIGHT DOWN AND LEFT
+0xc0   0x2514  #BOX DRAWINGS LIGHT UP AND RIGHT
+0xc1   0x2534  #BOX DRAWINGS LIGHT UP AND HORIZONTAL
+0xc2   0x252c  #BOX DRAWINGS LIGHT DOWN AND HORIZONTAL
+0xc3   0x251c  #BOX DRAWINGS LIGHT VERTICAL AND RIGHT
+0xc4   0x2500  #BOX DRAWINGS LIGHT HORIZONTAL
+0xc5   0x253c  #BOX DRAWINGS LIGHT VERTICAL AND HORIZONTAL
+0xc6   0x255e  #BOX DRAWINGS VERTICAL SINGLE AND RIGHT DOUBLE
+0xc7   0x255f  #BOX DRAWINGS VERTICAL DOUBLE AND RIGHT SINGLE
+0xc8   0x255a  #BOX DRAWINGS DOUBLE UP AND RIGHT
+0xc9   0x2554  #BOX DRAWINGS DOUBLE DOWN AND RIGHT
+0xca   0x2569  #BOX DRAWINGS DOUBLE UP AND HORIZONTAL
+0xcb   0x2566  #BOX DRAWINGS DOUBLE DOWN AND HORIZONTAL
+0xcc   0x2560  #BOX DRAWINGS DOUBLE VERTICAL AND RIGHT
+0xcd   0x2550  #BOX DRAWINGS DOUBLE HORIZONTAL
+0xce   0x256c  #BOX DRAWINGS DOUBLE VERTICAL AND HORIZONTAL
+0xcf   0x2567  #BOX DRAWINGS UP SINGLE AND HORIZONTAL DOUBLE
+0xd0   0x2568  #BOX DRAWINGS UP DOUBLE AND HORIZONTAL SINGLE
+0xd1   0x2564  #BOX DRAWINGS DOWN SINGLE AND HORIZONTAL DOUBLE
+0xd2   0x2565  #BOX DRAWINGS DOWN DOUBLE AND HORIZONTAL SINGLE
+0xd3   0x2559  #BOX DRAWINGS UP DOUBLE AND RIGHT SINGLE
+0xd4   0x2558  #BOX DRAWINGS UP SINGLE AND RIGHT DOUBLE
+0xd5   0x2552  #BOX DRAWINGS DOWN SINGLE AND RIGHT DOUBLE
+0xd6   0x2553  #BOX DRAWINGS DOWN DOUBLE AND RIGHT SINGLE
+0xd7   0x256b  #BOX DRAWINGS VERTICAL DOUBLE AND HORIZONTAL SINGLE
+0xd8   0x256a  #BOX DRAWINGS VERTICAL SINGLE AND HORIZONTAL DOUBLE
+0xd9   0x2518  #BOX DRAWINGS LIGHT UP AND LEFT
+0xda   0x250c  #BOX DRAWINGS LIGHT DOWN AND RIGHT
+0xdb   0x2588  #FULL BLOCK
+0xdc   0x2584  #LOWER HALF BLOCK
+0xdd   0x258c  #LEFT HALF BLOCK
+0xde   0x2590  #RIGHT HALF BLOCK
+0xdf   0x2580  #UPPER HALF BLOCK
+0xe0   0x03b1  #GREEK SMALL LETTER ALPHA
+0xe1   0x00df  #LATIN SMALL LETTER SHARP S
+0xe2   0x0393  #GREEK CAPITAL LETTER GAMMA
+0xe3   0x03c0  #GREEK SMALL LETTER PI
+0xe4   0x03a3  #GREEK CAPITAL LETTER SIGMA
+0xe5   0x03c3  #GREEK SMALL LETTER SIGMA
+0xe6   0x00b5  #MICRO SIGN
+0xe7   0x03c4  #GREEK SMALL LETTER TAU
+0xe8   0x03a6  #GREEK CAPITAL LETTER PHI
+0xe9   0x0398  #GREEK CAPITAL LETTER THETA
+0xea   0x03a9  #GREEK CAPITAL LETTER OMEGA
+0xeb   0x03b4  #GREEK SMALL LETTER DELTA
+0xec   0x221e  #INFINITY
+0xed   0x03c6  #GREEK SMALL LETTER PHI
+0xee   0x03b5  #GREEK SMALL LETTER EPSILON
+0xef   0x2229  #INTERSECTION
+0xf0   0x2261  #IDENTICAL TO
+0xf1   0x00b1  #PLUS-MINUS SIGN
+0xf2   0x2265  #GREATER-THAN OR EQUAL TO
+0xf3   0x2264  #LESS-THAN OR EQUAL TO
+0xf4   0x2320  #TOP HALF INTEGRAL
+0xf5   0x2321  #BOTTOM HALF INTEGRAL
+0xf6   0x00f7  #DIVISION SIGN
+0xf7   0x2248  #ALMOST EQUAL TO
+0xf8   0x00b0  #DEGREE SIGN
+0xf9   0x2219  #BULLET OPERATOR
+0xfa   0x00b7  #MIDDLE DOT
+0xfb   0x221a  #SQUARE ROOT
+0xfc   0x207f  #SUPERSCRIPT LATIN SMALL LETTER N
+0xfd   0x00b2  #SUPERSCRIPT TWO
+0xfe   0x25a0  #BLACK SQUARE
+0xff   0x00a0  #NO-BREAK SPACE
diff --git a/basis/io/encodings/8-bit/CP866.TXT b/basis/io/encodings/8-bit/CP866.TXT
new file mode 100644 (file)
index 0000000..959d4ab
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp866_DOSCyrillicRussian to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp866_DOSCyrillicRussian code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp866_DOSCyrillicRussian order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0a   0x000a  #LINE FEED
+0x0b   0x000b  #VERTICAL TABULATION
+0x0c   0x000c  #FORM FEED
+0x0d   0x000d  #CARRIAGE RETURN
+0x0e   0x000e  #SHIFT OUT
+0x0f   0x000f  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1a   0x001a  #SUBSTITUTE
+0x1b   0x001b  #ESCAPE
+0x1c   0x001c  #FILE SEPARATOR
+0x1d   0x001d  #GROUP SEPARATOR
+0x1e   0x001e  #RECORD SEPARATOR
+0x1f   0x001f  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x0025  #PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2a   0x002a  #ASTERISK
+0x2b   0x002b  #PLUS SIGN
+0x2c   0x002c  #COMMA
+0x2d   0x002d  #HYPHEN-MINUS
+0x2e   0x002e  #FULL STOP
+0x2f   0x002f  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3a   0x003a  #COLON
+0x3b   0x003b  #SEMICOLON
+0x3c   0x003c  #LESS-THAN SIGN
+0x3d   0x003d  #EQUALS SIGN
+0x3e   0x003e  #GREATER-THAN SIGN
+0x3f   0x003f  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4a   0x004a  #LATIN CAPITAL LETTER J
+0x4b   0x004b  #LATIN CAPITAL LETTER K
+0x4c   0x004c  #LATIN CAPITAL LETTER L
+0x4d   0x004d  #LATIN CAPITAL LETTER M
+0x4e   0x004e  #LATIN CAPITAL LETTER N
+0x4f   0x004f  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5a   0x005a  #LATIN CAPITAL LETTER Z
+0x5b   0x005b  #LEFT SQUARE BRACKET
+0x5c   0x005c  #REVERSE SOLIDUS
+0x5d   0x005d  #RIGHT SQUARE BRACKET
+0x5e   0x005e  #CIRCUMFLEX ACCENT
+0x5f   0x005f  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6a   0x006a  #LATIN SMALL LETTER J
+0x6b   0x006b  #LATIN SMALL LETTER K
+0x6c   0x006c  #LATIN SMALL LETTER L
+0x6d   0x006d  #LATIN SMALL LETTER M
+0x6e   0x006e  #LATIN SMALL LETTER N
+0x6f   0x006f  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7a   0x007a  #LATIN SMALL LETTER Z
+0x7b   0x007b  #LEFT CURLY BRACKET
+0x7c   0x007c  #VERTICAL LINE
+0x7d   0x007d  #RIGHT CURLY BRACKET
+0x7e   0x007e  #TILDE
+0x7f   0x007f  #DELETE
+0x80   0x0410  #CYRILLIC CAPITAL LETTER A
+0x81   0x0411  #CYRILLIC CAPITAL LETTER BE
+0x82   0x0412  #CYRILLIC CAPITAL LETTER VE
+0x83   0x0413  #CYRILLIC CAPITAL LETTER GHE
+0x84   0x0414  #CYRILLIC CAPITAL LETTER DE
+0x85   0x0415  #CYRILLIC CAPITAL LETTER IE
+0x86   0x0416  #CYRILLIC CAPITAL LETTER ZHE
+0x87   0x0417  #CYRILLIC CAPITAL LETTER ZE
+0x88   0x0418  #CYRILLIC CAPITAL LETTER I
+0x89   0x0419  #CYRILLIC CAPITAL LETTER SHORT I
+0x8a   0x041a  #CYRILLIC CAPITAL LETTER KA
+0x8b   0x041b  #CYRILLIC CAPITAL LETTER EL
+0x8c   0x041c  #CYRILLIC CAPITAL LETTER EM
+0x8d   0x041d  #CYRILLIC CAPITAL LETTER EN
+0x8e   0x041e  #CYRILLIC CAPITAL LETTER O
+0x8f   0x041f  #CYRILLIC CAPITAL LETTER PE
+0x90   0x0420  #CYRILLIC CAPITAL LETTER ER
+0x91   0x0421  #CYRILLIC CAPITAL LETTER ES
+0x92   0x0422  #CYRILLIC CAPITAL LETTER TE
+0x93   0x0423  #CYRILLIC CAPITAL LETTER U
+0x94   0x0424  #CYRILLIC CAPITAL LETTER EF
+0x95   0x0425  #CYRILLIC CAPITAL LETTER HA
+0x96   0x0426  #CYRILLIC CAPITAL LETTER TSE
+0x97   0x0427  #CYRILLIC CAPITAL LETTER CHE
+0x98   0x0428  #CYRILLIC CAPITAL LETTER SHA
+0x99   0x0429  #CYRILLIC CAPITAL LETTER SHCHA
+0x9a   0x042a  #CYRILLIC CAPITAL LETTER HARD SIGN
+0x9b   0x042b  #CYRILLIC CAPITAL LETTER YERU
+0x9c   0x042c  #CYRILLIC CAPITAL LETTER SOFT SIGN
+0x9d   0x042d  #CYRILLIC CAPITAL LETTER E
+0x9e   0x042e  #CYRILLIC CAPITAL LETTER YU
+0x9f   0x042f  #CYRILLIC CAPITAL LETTER YA
+0xa0   0x0430  #CYRILLIC SMALL LETTER A
+0xa1   0x0431  #CYRILLIC SMALL LETTER BE
+0xa2   0x0432  #CYRILLIC SMALL LETTER VE
+0xa3   0x0433  #CYRILLIC SMALL LETTER GHE
+0xa4   0x0434  #CYRILLIC SMALL LETTER DE
+0xa5   0x0435  #CYRILLIC SMALL LETTER IE
+0xa6   0x0436  #CYRILLIC SMALL LETTER ZHE
+0xa7   0x0437  #CYRILLIC SMALL LETTER ZE
+0xa8   0x0438  #CYRILLIC SMALL LETTER I
+0xa9   0x0439  #CYRILLIC SMALL LETTER SHORT I
+0xaa   0x043a  #CYRILLIC SMALL LETTER KA
+0xab   0x043b  #CYRILLIC SMALL LETTER EL
+0xac   0x043c  #CYRILLIC SMALL LETTER EM
+0xad   0x043d  #CYRILLIC SMALL LETTER EN
+0xae   0x043e  #CYRILLIC SMALL LETTER O
+0xaf   0x043f  #CYRILLIC SMALL LETTER PE
+0xb0   0x2591  #LIGHT SHADE
+0xb1   0x2592  #MEDIUM SHADE
+0xb2   0x2593  #DARK SHADE
+0xb3   0x2502  #BOX DRAWINGS LIGHT VERTICAL
+0xb4   0x2524  #BOX DRAWINGS LIGHT VERTICAL AND LEFT
+0xb5   0x2561  #BOX DRAWINGS VERTICAL SINGLE AND LEFT DOUBLE
+0xb6   0x2562  #BOX DRAWINGS VERTICAL DOUBLE AND LEFT SINGLE
+0xb7   0x2556  #BOX DRAWINGS DOWN DOUBLE AND LEFT SINGLE
+0xb8   0x2555  #BOX DRAWINGS DOWN SINGLE AND LEFT DOUBLE
+0xb9   0x2563  #BOX DRAWINGS DOUBLE VERTICAL AND LEFT
+0xba   0x2551  #BOX DRAWINGS DOUBLE VERTICAL
+0xbb   0x2557  #BOX DRAWINGS DOUBLE DOWN AND LEFT
+0xbc   0x255d  #BOX DRAWINGS DOUBLE UP AND LEFT
+0xbd   0x255c  #BOX DRAWINGS UP DOUBLE AND LEFT SINGLE
+0xbe   0x255b  #BOX DRAWINGS UP SINGLE AND LEFT DOUBLE
+0xbf   0x2510  #BOX DRAWINGS LIGHT DOWN AND LEFT
+0xc0   0x2514  #BOX DRAWINGS LIGHT UP AND RIGHT
+0xc1   0x2534  #BOX DRAWINGS LIGHT UP AND HORIZONTAL
+0xc2   0x252c  #BOX DRAWINGS LIGHT DOWN AND HORIZONTAL
+0xc3   0x251c  #BOX DRAWINGS LIGHT VERTICAL AND RIGHT
+0xc4   0x2500  #BOX DRAWINGS LIGHT HORIZONTAL
+0xc5   0x253c  #BOX DRAWINGS LIGHT VERTICAL AND HORIZONTAL
+0xc6   0x255e  #BOX DRAWINGS VERTICAL SINGLE AND RIGHT DOUBLE
+0xc7   0x255f  #BOX DRAWINGS VERTICAL DOUBLE AND RIGHT SINGLE
+0xc8   0x255a  #BOX DRAWINGS DOUBLE UP AND RIGHT
+0xc9   0x2554  #BOX DRAWINGS DOUBLE DOWN AND RIGHT
+0xca   0x2569  #BOX DRAWINGS DOUBLE UP AND HORIZONTAL
+0xcb   0x2566  #BOX DRAWINGS DOUBLE DOWN AND HORIZONTAL
+0xcc   0x2560  #BOX DRAWINGS DOUBLE VERTICAL AND RIGHT
+0xcd   0x2550  #BOX DRAWINGS DOUBLE HORIZONTAL
+0xce   0x256c  #BOX DRAWINGS DOUBLE VERTICAL AND HORIZONTAL
+0xcf   0x2567  #BOX DRAWINGS UP SINGLE AND HORIZONTAL DOUBLE
+0xd0   0x2568  #BOX DRAWINGS UP DOUBLE AND HORIZONTAL SINGLE
+0xd1   0x2564  #BOX DRAWINGS DOWN SINGLE AND HORIZONTAL DOUBLE
+0xd2   0x2565  #BOX DRAWINGS DOWN DOUBLE AND HORIZONTAL SINGLE
+0xd3   0x2559  #BOX DRAWINGS UP DOUBLE AND RIGHT SINGLE
+0xd4   0x2558  #BOX DRAWINGS UP SINGLE AND RIGHT DOUBLE
+0xd5   0x2552  #BOX DRAWINGS DOWN SINGLE AND RIGHT DOUBLE
+0xd6   0x2553  #BOX DRAWINGS DOWN DOUBLE AND RIGHT SINGLE
+0xd7   0x256b  #BOX DRAWINGS VERTICAL DOUBLE AND HORIZONTAL SINGLE
+0xd8   0x256a  #BOX DRAWINGS VERTICAL SINGLE AND HORIZONTAL DOUBLE
+0xd9   0x2518  #BOX DRAWINGS LIGHT UP AND LEFT
+0xda   0x250c  #BOX DRAWINGS LIGHT DOWN AND RIGHT
+0xdb   0x2588  #FULL BLOCK
+0xdc   0x2584  #LOWER HALF BLOCK
+0xdd   0x258c  #LEFT HALF BLOCK
+0xde   0x2590  #RIGHT HALF BLOCK
+0xdf   0x2580  #UPPER HALF BLOCK
+0xe0   0x0440  #CYRILLIC SMALL LETTER ER
+0xe1   0x0441  #CYRILLIC SMALL LETTER ES
+0xe2   0x0442  #CYRILLIC SMALL LETTER TE
+0xe3   0x0443  #CYRILLIC SMALL LETTER U
+0xe4   0x0444  #CYRILLIC SMALL LETTER EF
+0xe5   0x0445  #CYRILLIC SMALL LETTER HA
+0xe6   0x0446  #CYRILLIC SMALL LETTER TSE
+0xe7   0x0447  #CYRILLIC SMALL LETTER CHE
+0xe8   0x0448  #CYRILLIC SMALL LETTER SHA
+0xe9   0x0449  #CYRILLIC SMALL LETTER SHCHA
+0xea   0x044a  #CYRILLIC SMALL LETTER HARD SIGN
+0xeb   0x044b  #CYRILLIC SMALL LETTER YERU
+0xec   0x044c  #CYRILLIC SMALL LETTER SOFT SIGN
+0xed   0x044d  #CYRILLIC SMALL LETTER E
+0xee   0x044e  #CYRILLIC SMALL LETTER YU
+0xef   0x044f  #CYRILLIC SMALL LETTER YA
+0xf0   0x0401  #CYRILLIC CAPITAL LETTER IO
+0xf1   0x0451  #CYRILLIC SMALL LETTER IO
+0xf2   0x0404  #CYRILLIC CAPITAL LETTER UKRAINIAN IE
+0xf3   0x0454  #CYRILLIC SMALL LETTER UKRAINIAN IE
+0xf4   0x0407  #CYRILLIC CAPITAL LETTER YI
+0xf5   0x0457  #CYRILLIC SMALL LETTER YI
+0xf6   0x040e  #CYRILLIC CAPITAL LETTER SHORT U
+0xf7   0x045e  #CYRILLIC SMALL LETTER SHORT U
+0xf8   0x00b0  #DEGREE SIGN
+0xf9   0x2219  #BULLET OPERATOR
+0xfa   0x00b7  #MIDDLE DOT
+0xfb   0x221a  #SQUARE ROOT
+0xfc   0x2116  #NUMERO SIGN
+0xfd   0x00a4  #CURRENCY SIGN
+0xfe   0x25a0  #BLACK SQUARE
+0xff   0x00a0  #NO-BREAK SPACE
diff --git a/basis/io/encodings/8-bit/CP869.TXT b/basis/io/encodings/8-bit/CP869.TXT
new file mode 100644 (file)
index 0000000..2596280
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp869_DOSGreek2 to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp869_DOSGreek2 code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp869_DOSGreek2 order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0a   0x000a  #LINE FEED
+0x0b   0x000b  #VERTICAL TABULATION
+0x0c   0x000c  #FORM FEED
+0x0d   0x000d  #CARRIAGE RETURN
+0x0e   0x000e  #SHIFT OUT
+0x0f   0x000f  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1a   0x001a  #SUBSTITUTE
+0x1b   0x001b  #ESCAPE
+0x1c   0x001c  #FILE SEPARATOR
+0x1d   0x001d  #GROUP SEPARATOR
+0x1e   0x001e  #RECORD SEPARATOR
+0x1f   0x001f  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x0025  #PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2a   0x002a  #ASTERISK
+0x2b   0x002b  #PLUS SIGN
+0x2c   0x002c  #COMMA
+0x2d   0x002d  #HYPHEN-MINUS
+0x2e   0x002e  #FULL STOP
+0x2f   0x002f  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3a   0x003a  #COLON
+0x3b   0x003b  #SEMICOLON
+0x3c   0x003c  #LESS-THAN SIGN
+0x3d   0x003d  #EQUALS SIGN
+0x3e   0x003e  #GREATER-THAN SIGN
+0x3f   0x003f  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4a   0x004a  #LATIN CAPITAL LETTER J
+0x4b   0x004b  #LATIN CAPITAL LETTER K
+0x4c   0x004c  #LATIN CAPITAL LETTER L
+0x4d   0x004d  #LATIN CAPITAL LETTER M
+0x4e   0x004e  #LATIN CAPITAL LETTER N
+0x4f   0x004f  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5a   0x005a  #LATIN CAPITAL LETTER Z
+0x5b   0x005b  #LEFT SQUARE BRACKET
+0x5c   0x005c  #REVERSE SOLIDUS
+0x5d   0x005d  #RIGHT SQUARE BRACKET
+0x5e   0x005e  #CIRCUMFLEX ACCENT
+0x5f   0x005f  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6a   0x006a  #LATIN SMALL LETTER J
+0x6b   0x006b  #LATIN SMALL LETTER K
+0x6c   0x006c  #LATIN SMALL LETTER L
+0x6d   0x006d  #LATIN SMALL LETTER M
+0x6e   0x006e  #LATIN SMALL LETTER N
+0x6f   0x006f  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7a   0x007a  #LATIN SMALL LETTER Z
+0x7b   0x007b  #LEFT CURLY BRACKET
+0x7c   0x007c  #VERTICAL LINE
+0x7d   0x007d  #RIGHT CURLY BRACKET
+0x7e   0x007e  #TILDE
+0x7f   0x007f  #DELETE
+0x80           #UNDEFINED
+0x81           #UNDEFINED
+0x82           #UNDEFINED
+0x83           #UNDEFINED
+0x84           #UNDEFINED
+0x85           #UNDEFINED
+0x86   0x0386  #GREEK CAPITAL LETTER ALPHA WITH TONOS
+0x87           #UNDEFINED
+0x88   0x00b7  #MIDDLE DOT
+0x89   0x00ac  #NOT SIGN
+0x8a   0x00a6  #BROKEN BAR
+0x8b   0x2018  #LEFT SINGLE QUOTATION MARK
+0x8c   0x2019  #RIGHT SINGLE QUOTATION MARK
+0x8d   0x0388  #GREEK CAPITAL LETTER EPSILON WITH TONOS
+0x8e   0x2015  #HORIZONTAL BAR
+0x8f   0x0389  #GREEK CAPITAL LETTER ETA WITH TONOS
+0x90   0x038a  #GREEK CAPITAL LETTER IOTA WITH TONOS
+0x91   0x03aa  #GREEK CAPITAL LETTER IOTA WITH DIALYTIKA
+0x92   0x038c  #GREEK CAPITAL LETTER OMICRON WITH TONOS
+0x93           #UNDEFINED
+0x94           #UNDEFINED
+0x95   0x038e  #GREEK CAPITAL LETTER UPSILON WITH TONOS
+0x96   0x03ab  #GREEK CAPITAL LETTER UPSILON WITH DIALYTIKA
+0x97   0x00a9  #COPYRIGHT SIGN
+0x98   0x038f  #GREEK CAPITAL LETTER OMEGA WITH TONOS
+0x99   0x00b2  #SUPERSCRIPT TWO
+0x9a   0x00b3  #SUPERSCRIPT THREE
+0x9b   0x03ac  #GREEK SMALL LETTER ALPHA WITH TONOS
+0x9c   0x00a3  #POUND SIGN
+0x9d   0x03ad  #GREEK SMALL LETTER EPSILON WITH TONOS
+0x9e   0x03ae  #GREEK SMALL LETTER ETA WITH TONOS
+0x9f   0x03af  #GREEK SMALL LETTER IOTA WITH TONOS
+0xa0   0x03ca  #GREEK SMALL LETTER IOTA WITH DIALYTIKA
+0xa1   0x0390  #GREEK SMALL LETTER IOTA WITH DIALYTIKA AND TONOS
+0xa2   0x03cc  #GREEK SMALL LETTER OMICRON WITH TONOS
+0xa3   0x03cd  #GREEK SMALL LETTER UPSILON WITH TONOS
+0xa4   0x0391  #GREEK CAPITAL LETTER ALPHA
+0xa5   0x0392  #GREEK CAPITAL LETTER BETA
+0xa6   0x0393  #GREEK CAPITAL LETTER GAMMA
+0xa7   0x0394  #GREEK CAPITAL LETTER DELTA
+0xa8   0x0395  #GREEK CAPITAL LETTER EPSILON
+0xa9   0x0396  #GREEK CAPITAL LETTER ZETA
+0xaa   0x0397  #GREEK CAPITAL LETTER ETA
+0xab   0x00bd  #VULGAR FRACTION ONE HALF
+0xac   0x0398  #GREEK CAPITAL LETTER THETA
+0xad   0x0399  #GREEK CAPITAL LETTER IOTA
+0xae   0x00ab  #LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xaf   0x00bb  #RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xb0   0x2591  #LIGHT SHADE
+0xb1   0x2592  #MEDIUM SHADE
+0xb2   0x2593  #DARK SHADE
+0xb3   0x2502  #BOX DRAWINGS LIGHT VERTICAL
+0xb4   0x2524  #BOX DRAWINGS LIGHT VERTICAL AND LEFT
+0xb5   0x039a  #GREEK CAPITAL LETTER KAPPA
+0xb6   0x039b  #GREEK CAPITAL LETTER LAMDA
+0xb7   0x039c  #GREEK CAPITAL LETTER MU
+0xb8   0x039d  #GREEK CAPITAL LETTER NU
+0xb9   0x2563  #BOX DRAWINGS DOUBLE VERTICAL AND LEFT
+0xba   0x2551  #BOX DRAWINGS DOUBLE VERTICAL
+0xbb   0x2557  #BOX DRAWINGS DOUBLE DOWN AND LEFT
+0xbc   0x255d  #BOX DRAWINGS DOUBLE UP AND LEFT
+0xbd   0x039e  #GREEK CAPITAL LETTER XI
+0xbe   0x039f  #GREEK CAPITAL LETTER OMICRON
+0xbf   0x2510  #BOX DRAWINGS LIGHT DOWN AND LEFT
+0xc0   0x2514  #BOX DRAWINGS LIGHT UP AND RIGHT
+0xc1   0x2534  #BOX DRAWINGS LIGHT UP AND HORIZONTAL
+0xc2   0x252c  #BOX DRAWINGS LIGHT DOWN AND HORIZONTAL
+0xc3   0x251c  #BOX DRAWINGS LIGHT VERTICAL AND RIGHT
+0xc4   0x2500  #BOX DRAWINGS LIGHT HORIZONTAL
+0xc5   0x253c  #BOX DRAWINGS LIGHT VERTICAL AND HORIZONTAL
+0xc6   0x03a0  #GREEK CAPITAL LETTER PI
+0xc7   0x03a1  #GREEK CAPITAL LETTER RHO
+0xc8   0x255a  #BOX DRAWINGS DOUBLE UP AND RIGHT
+0xc9   0x2554  #BOX DRAWINGS DOUBLE DOWN AND RIGHT
+0xca   0x2569  #BOX DRAWINGS DOUBLE UP AND HORIZONTAL
+0xcb   0x2566  #BOX DRAWINGS DOUBLE DOWN AND HORIZONTAL
+0xcc   0x2560  #BOX DRAWINGS DOUBLE VERTICAL AND RIGHT
+0xcd   0x2550  #BOX DRAWINGS DOUBLE HORIZONTAL
+0xce   0x256c  #BOX DRAWINGS DOUBLE VERTICAL AND HORIZONTAL
+0xcf   0x03a3  #GREEK CAPITAL LETTER SIGMA
+0xd0   0x03a4  #GREEK CAPITAL LETTER TAU
+0xd1   0x03a5  #GREEK CAPITAL LETTER UPSILON
+0xd2   0x03a6  #GREEK CAPITAL LETTER PHI
+0xd3   0x03a7  #GREEK CAPITAL LETTER CHI
+0xd4   0x03a8  #GREEK CAPITAL LETTER PSI
+0xd5   0x03a9  #GREEK CAPITAL LETTER OMEGA
+0xd6   0x03b1  #GREEK SMALL LETTER ALPHA
+0xd7   0x03b2  #GREEK SMALL LETTER BETA
+0xd8   0x03b3  #GREEK SMALL LETTER GAMMA
+0xd9   0x2518  #BOX DRAWINGS LIGHT UP AND LEFT
+0xda   0x250c  #BOX DRAWINGS LIGHT DOWN AND RIGHT
+0xdb   0x2588  #FULL BLOCK
+0xdc   0x2584  #LOWER HALF BLOCK
+0xdd   0x03b4  #GREEK SMALL LETTER DELTA
+0xde   0x03b5  #GREEK SMALL LETTER EPSILON
+0xdf   0x2580  #UPPER HALF BLOCK
+0xe0   0x03b6  #GREEK SMALL LETTER ZETA
+0xe1   0x03b7  #GREEK SMALL LETTER ETA
+0xe2   0x03b8  #GREEK SMALL LETTER THETA
+0xe3   0x03b9  #GREEK SMALL LETTER IOTA
+0xe4   0x03ba  #GREEK SMALL LETTER KAPPA
+0xe5   0x03bb  #GREEK SMALL LETTER LAMDA
+0xe6   0x03bc  #GREEK SMALL LETTER MU
+0xe7   0x03bd  #GREEK SMALL LETTER NU
+0xe8   0x03be  #GREEK SMALL LETTER XI
+0xe9   0x03bf  #GREEK SMALL LETTER OMICRON
+0xea   0x03c0  #GREEK SMALL LETTER PI
+0xeb   0x03c1  #GREEK SMALL LETTER RHO
+0xec   0x03c3  #GREEK SMALL LETTER SIGMA
+0xed   0x03c2  #GREEK SMALL LETTER FINAL SIGMA
+0xee   0x03c4  #GREEK SMALL LETTER TAU
+0xef   0x0384  #GREEK TONOS
+0xf0   0x00ad  #SOFT HYPHEN
+0xf1   0x00b1  #PLUS-MINUS SIGN
+0xf2   0x03c5  #GREEK SMALL LETTER UPSILON
+0xf3   0x03c6  #GREEK SMALL LETTER PHI
+0xf4   0x03c7  #GREEK SMALL LETTER CHI
+0xf5   0x00a7  #SECTION SIGN
+0xf6   0x03c8  #GREEK SMALL LETTER PSI
+0xf7   0x0385  #GREEK DIALYTIKA TONOS
+0xf8   0x00b0  #DEGREE SIGN
+0xf9   0x00a8  #DIAERESIS
+0xfa   0x03c9  #GREEK SMALL LETTER OMEGA
+0xfb   0x03cb  #GREEK SMALL LETTER UPSILON WITH DIALYTIKA
+0xfc   0x03b0  #GREEK SMALL LETTER UPSILON WITH DIALYTIKA AND TONOS
+0xfd   0x03ce  #GREEK SMALL LETTER OMEGA WITH TONOS
+0xfe   0x25a0  #BLACK SQUARE
+0xff   0x00a0  #NO-BREAK SPACE
diff --git a/basis/io/encodings/8-bit/CP874.TXT b/basis/io/encodings/8-bit/CP874.TXT
new file mode 100644 (file)
index 0000000..cbd0cdd
--- /dev/null
@@ -0,0 +1,274 @@
+#
+#    Name:     cp874 to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/15/98
+#
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp874 code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp874 order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0A   0x000A  #LINE FEED
+0x0B   0x000B  #VERTICAL TABULATION
+0x0C   0x000C  #FORM FEED
+0x0D   0x000D  #CARRIAGE RETURN
+0x0E   0x000E  #SHIFT OUT
+0x0F   0x000F  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1A   0x001A  #SUBSTITUTE
+0x1B   0x001B  #ESCAPE
+0x1C   0x001C  #FILE SEPARATOR
+0x1D   0x001D  #GROUP SEPARATOR
+0x1E   0x001E  #RECORD SEPARATOR
+0x1F   0x001F  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x0025  #PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2A   0x002A  #ASTERISK
+0x2B   0x002B  #PLUS SIGN
+0x2C   0x002C  #COMMA
+0x2D   0x002D  #HYPHEN-MINUS
+0x2E   0x002E  #FULL STOP
+0x2F   0x002F  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3A   0x003A  #COLON
+0x3B   0x003B  #SEMICOLON
+0x3C   0x003C  #LESS-THAN SIGN
+0x3D   0x003D  #EQUALS SIGN
+0x3E   0x003E  #GREATER-THAN SIGN
+0x3F   0x003F  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4A   0x004A  #LATIN CAPITAL LETTER J
+0x4B   0x004B  #LATIN CAPITAL LETTER K
+0x4C   0x004C  #LATIN CAPITAL LETTER L
+0x4D   0x004D  #LATIN CAPITAL LETTER M
+0x4E   0x004E  #LATIN CAPITAL LETTER N
+0x4F   0x004F  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5A   0x005A  #LATIN CAPITAL LETTER Z
+0x5B   0x005B  #LEFT SQUARE BRACKET
+0x5C   0x005C  #REVERSE SOLIDUS
+0x5D   0x005D  #RIGHT SQUARE BRACKET
+0x5E   0x005E  #CIRCUMFLEX ACCENT
+0x5F   0x005F  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6A   0x006A  #LATIN SMALL LETTER J
+0x6B   0x006B  #LATIN SMALL LETTER K
+0x6C   0x006C  #LATIN SMALL LETTER L
+0x6D   0x006D  #LATIN SMALL LETTER M
+0x6E   0x006E  #LATIN SMALL LETTER N
+0x6F   0x006F  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7A   0x007A  #LATIN SMALL LETTER Z
+0x7B   0x007B  #LEFT CURLY BRACKET
+0x7C   0x007C  #VERTICAL LINE
+0x7D   0x007D  #RIGHT CURLY BRACKET
+0x7E   0x007E  #TILDE
+0x7F   0x007F  #DELETE
+0x80   0x20AC  #EURO SIGN
+0x81           #UNDEFINED
+0x82           #UNDEFINED
+0x83           #UNDEFINED
+0x84           #UNDEFINED
+0x85   0x2026  #HORIZONTAL ELLIPSIS
+0x86           #UNDEFINED
+0x87           #UNDEFINED
+0x88           #UNDEFINED
+0x89           #UNDEFINED
+0x8A           #UNDEFINED
+0x8B           #UNDEFINED
+0x8C           #UNDEFINED
+0x8D           #UNDEFINED
+0x8E           #UNDEFINED
+0x8F           #UNDEFINED
+0x90           #UNDEFINED
+0x91   0x2018  #LEFT SINGLE QUOTATION MARK
+0x92   0x2019  #RIGHT SINGLE QUOTATION MARK
+0x93   0x201C  #LEFT DOUBLE QUOTATION MARK
+0x94   0x201D  #RIGHT DOUBLE QUOTATION MARK
+0x95   0x2022  #BULLET
+0x96   0x2013  #EN DASH
+0x97   0x2014  #EM DASH
+0x98           #UNDEFINED
+0x99           #UNDEFINED
+0x9A           #UNDEFINED
+0x9B           #UNDEFINED
+0x9C           #UNDEFINED
+0x9D           #UNDEFINED
+0x9E           #UNDEFINED
+0x9F           #UNDEFINED
+0xA0   0x00A0  #NO-BREAK SPACE
+0xA1   0x0E01  #THAI CHARACTER KO KAI
+0xA2   0x0E02  #THAI CHARACTER KHO KHAI
+0xA3   0x0E03  #THAI CHARACTER KHO KHUAT
+0xA4   0x0E04  #THAI CHARACTER KHO KHWAI
+0xA5   0x0E05  #THAI CHARACTER KHO KHON
+0xA6   0x0E06  #THAI CHARACTER KHO RAKHANG
+0xA7   0x0E07  #THAI CHARACTER NGO NGU
+0xA8   0x0E08  #THAI CHARACTER CHO CHAN
+0xA9   0x0E09  #THAI CHARACTER CHO CHING
+0xAA   0x0E0A  #THAI CHARACTER CHO CHANG
+0xAB   0x0E0B  #THAI CHARACTER SO SO
+0xAC   0x0E0C  #THAI CHARACTER CHO CHOE
+0xAD   0x0E0D  #THAI CHARACTER YO YING
+0xAE   0x0E0E  #THAI CHARACTER DO CHADA
+0xAF   0x0E0F  #THAI CHARACTER TO PATAK
+0xB0   0x0E10  #THAI CHARACTER THO THAN
+0xB1   0x0E11  #THAI CHARACTER THO NANGMONTHO
+0xB2   0x0E12  #THAI CHARACTER THO PHUTHAO
+0xB3   0x0E13  #THAI CHARACTER NO NEN
+0xB4   0x0E14  #THAI CHARACTER DO DEK
+0xB5   0x0E15  #THAI CHARACTER TO TAO
+0xB6   0x0E16  #THAI CHARACTER THO THUNG
+0xB7   0x0E17  #THAI CHARACTER THO THAHAN
+0xB8   0x0E18  #THAI CHARACTER THO THONG
+0xB9   0x0E19  #THAI CHARACTER NO NU
+0xBA   0x0E1A  #THAI CHARACTER BO BAIMAI
+0xBB   0x0E1B  #THAI CHARACTER PO PLA
+0xBC   0x0E1C  #THAI CHARACTER PHO PHUNG
+0xBD   0x0E1D  #THAI CHARACTER FO FA
+0xBE   0x0E1E  #THAI CHARACTER PHO PHAN
+0xBF   0x0E1F  #THAI CHARACTER FO FAN
+0xC0   0x0E20  #THAI CHARACTER PHO SAMPHAO
+0xC1   0x0E21  #THAI CHARACTER MO MA
+0xC2   0x0E22  #THAI CHARACTER YO YAK
+0xC3   0x0E23  #THAI CHARACTER RO RUA
+0xC4   0x0E24  #THAI CHARACTER RU
+0xC5   0x0E25  #THAI CHARACTER LO LING
+0xC6   0x0E26  #THAI CHARACTER LU
+0xC7   0x0E27  #THAI CHARACTER WO WAEN
+0xC8   0x0E28  #THAI CHARACTER SO SALA
+0xC9   0x0E29  #THAI CHARACTER SO RUSI
+0xCA   0x0E2A  #THAI CHARACTER SO SUA
+0xCB   0x0E2B  #THAI CHARACTER HO HIP
+0xCC   0x0E2C  #THAI CHARACTER LO CHULA
+0xCD   0x0E2D  #THAI CHARACTER O ANG
+0xCE   0x0E2E  #THAI CHARACTER HO NOKHUK
+0xCF   0x0E2F  #THAI CHARACTER PAIYANNOI
+0xD0   0x0E30  #THAI CHARACTER SARA A
+0xD1   0x0E31  #THAI CHARACTER MAI HAN-AKAT
+0xD2   0x0E32  #THAI CHARACTER SARA AA
+0xD3   0x0E33  #THAI CHARACTER SARA AM
+0xD4   0x0E34  #THAI CHARACTER SARA I
+0xD5   0x0E35  #THAI CHARACTER SARA II
+0xD6   0x0E36  #THAI CHARACTER SARA UE
+0xD7   0x0E37  #THAI CHARACTER SARA UEE
+0xD8   0x0E38  #THAI CHARACTER SARA U
+0xD9   0x0E39  #THAI CHARACTER SARA UU
+0xDA   0x0E3A  #THAI CHARACTER PHINTHU
+0xDB           #UNDEFINED
+0xDC           #UNDEFINED
+0xDD           #UNDEFINED
+0xDE           #UNDEFINED
+0xDF   0x0E3F  #THAI CURRENCY SYMBOL BAHT
+0xE0   0x0E40  #THAI CHARACTER SARA E
+0xE1   0x0E41  #THAI CHARACTER SARA AE
+0xE2   0x0E42  #THAI CHARACTER SARA O
+0xE3   0x0E43  #THAI CHARACTER SARA AI MAIMUAN
+0xE4   0x0E44  #THAI CHARACTER SARA AI MAIMALAI
+0xE5   0x0E45  #THAI CHARACTER LAKKHANGYAO
+0xE6   0x0E46  #THAI CHARACTER MAIYAMOK
+0xE7   0x0E47  #THAI CHARACTER MAITAIKHU
+0xE8   0x0E48  #THAI CHARACTER MAI EK
+0xE9   0x0E49  #THAI CHARACTER MAI THO
+0xEA   0x0E4A  #THAI CHARACTER MAI TRI
+0xEB   0x0E4B  #THAI CHARACTER MAI CHATTAWA
+0xEC   0x0E4C  #THAI CHARACTER THANTHAKHAT
+0xED   0x0E4D  #THAI CHARACTER NIKHAHIT
+0xEE   0x0E4E  #THAI CHARACTER YAMAKKAN
+0xEF   0x0E4F  #THAI CHARACTER FONGMAN
+0xF0   0x0E50  #THAI DIGIT ZERO
+0xF1   0x0E51  #THAI DIGIT ONE
+0xF2   0x0E52  #THAI DIGIT TWO
+0xF3   0x0E53  #THAI DIGIT THREE
+0xF4   0x0E54  #THAI DIGIT FOUR
+0xF5   0x0E55  #THAI DIGIT FIVE
+0xF6   0x0E56  #THAI DIGIT SIX
+0xF7   0x0E57  #THAI DIGIT SEVEN
+0xF8   0x0E58  #THAI DIGIT EIGHT
+0xF9   0x0E59  #THAI DIGIT NINE
+0xFA   0x0E5A  #THAI CHARACTER ANGKHANKHU
+0xFB   0x0E5B  #THAI CHARACTER KHOMUT
+0xFC           #UNDEFINED
+0xFD           #UNDEFINED
+0xFE           #UNDEFINED
+0xFF           #UNDEFINED
diff --git a/basis/io/encodings/8-bit/CP875.TXT b/basis/io/encodings/8-bit/CP875.TXT
new file mode 100644 (file)
index 0000000..ea25a5b
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp875_IBMGreek to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+# 
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp875_IBMGreek code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp875_IBMGreek order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x009C  #CONTROL
+0x05   0x0009  #HORIZONTAL TABULATION
+0x06   0x0086  #CONTROL
+0x07   0x007F  #DELETE
+0x08   0x0097  #CONTROL
+0x09   0x008D  #CONTROL
+0x0A   0x008E  #CONTROL
+0x0B   0x000B  #VERTICAL TABULATION
+0x0C   0x000C  #FORM FEED
+0x0D   0x000D  #CARRIAGE RETURN
+0x0E   0x000E  #SHIFT OUT
+0x0F   0x000F  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x009D  #CONTROL
+0x15   0x0085  #CONTROL
+0x16   0x0008  #BACKSPACE
+0x17   0x0087  #CONTROL
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1A   0x0092  #CONTROL
+0x1B   0x008F  #CONTROL
+0x1C   0x001C  #FILE SEPARATOR
+0x1D   0x001D  #GROUP SEPARATOR
+0x1E   0x001E  #RECORD SEPARATOR
+0x1F   0x001F  #UNIT SEPARATOR
+0x20   0x0080  #CONTROL
+0x21   0x0081  #CONTROL
+0x22   0x0082  #CONTROL
+0x23   0x0083  #CONTROL
+0x24   0x0084  #CONTROL
+0x25   0x000A  #LINE FEED
+0x26   0x0017  #END OF TRANSMISSION BLOCK
+0x27   0x001B  #ESCAPE
+0x28   0x0088  #CONTROL
+0x29   0x0089  #CONTROL
+0x2A   0x008A  #CONTROL
+0x2B   0x008B  #CONTROL
+0x2C   0x008C  #CONTROL
+0x2D   0x0005  #ENQUIRY
+0x2E   0x0006  #ACKNOWLEDGE
+0x2F   0x0007  #BELL
+0x30   0x0090  #CONTROL
+0x31   0x0091  #CONTROL
+0x32   0x0016  #SYNCHRONOUS IDLE
+0x33   0x0093  #CONTROL
+0x34   0x0094  #CONTROL
+0x35   0x0095  #CONTROL
+0x36   0x0096  #CONTROL
+0x37   0x0004  #END OF TRANSMISSION
+0x38   0x0098  #CONTROL
+0x39   0x0099  #CONTROL
+0x3A   0x009A  #CONTROL
+0x3B   0x009B  #CONTROL
+0x3C   0x0014  #DEVICE CONTROL FOUR
+0x3D   0x0015  #NEGATIVE ACKNOWLEDGE
+0x3E   0x009E  #CONTROL
+0x3F   0x001A  #SUBSTITUTE
+0x40   0x0020  #SPACE
+0x41   0x0391  #GREEK CAPITAL LETTER ALPHA
+0x42   0x0392  #GREEK CAPITAL LETTER BETA
+0x43   0x0393  #GREEK CAPITAL LETTER GAMMA
+0x44   0x0394  #GREEK CAPITAL LETTER DELTA
+0x45   0x0395  #GREEK CAPITAL LETTER EPSILON
+0x46   0x0396  #GREEK CAPITAL LETTER ZETA
+0x47   0x0397  #GREEK CAPITAL LETTER ETA
+0x48   0x0398  #GREEK CAPITAL LETTER THETA
+0x49   0x0399  #GREEK CAPITAL LETTER IOTA
+0x4A   0x005B  #LEFT SQUARE BRACKET
+0x4B   0x002E  #FULL STOP
+0x4C   0x003C  #LESS-THAN SIGN
+0x4D   0x0028  #LEFT PARENTHESIS
+0x4E   0x002B  #PLUS SIGN
+0x4F   0x0021  #EXCLAMATION MARK
+0x50   0x0026  #AMPERSAND
+0x51   0x039A  #GREEK CAPITAL LETTER KAPPA
+0x52   0x039B  #GREEK CAPITAL LETTER LAMDA
+0x53   0x039C  #GREEK CAPITAL LETTER MU
+0x54   0x039D  #GREEK CAPITAL LETTER NU
+0x55   0x039E  #GREEK CAPITAL LETTER XI
+0x56   0x039F  #GREEK CAPITAL LETTER OMICRON
+0x57   0x03A0  #GREEK CAPITAL LETTER PI
+0x58   0x03A1  #GREEK CAPITAL LETTER RHO
+0x59   0x03A3  #GREEK CAPITAL LETTER SIGMA
+0x5A   0x005D  #RIGHT SQUARE BRACKET
+0x5B   0x0024  #DOLLAR SIGN
+0x5C   0x002A  #ASTERISK
+0x5D   0x0029  #RIGHT PARENTHESIS
+0x5E   0x003B  #SEMICOLON
+0x5F   0x005E  #CIRCUMFLEX ACCENT
+0x60   0x002D  #HYPHEN-MINUS
+0x61   0x002F  #SOLIDUS
+0x62   0x03A4  #GREEK CAPITAL LETTER TAU
+0x63   0x03A5  #GREEK CAPITAL LETTER UPSILON
+0x64   0x03A6  #GREEK CAPITAL LETTER PHI
+0x65   0x03A7  #GREEK CAPITAL LETTER CHI
+0x66   0x03A8  #GREEK CAPITAL LETTER PSI
+0x67   0x03A9  #GREEK CAPITAL LETTER OMEGA
+0x68   0x03AA  #GREEK CAPITAL LETTER IOTA WITH DIALYTIKA
+0x69   0x03AB  #GREEK CAPITAL LETTER UPSILON WITH DIALYTIKA
+0x6A   0x007C  #VERTICAL LINE
+0x6B   0x002C  #COMMA
+0x6C   0x0025  #PERCENT SIGN
+0x6D   0x005F  #LOW LINE
+0x6E   0x003E  #GREATER-THAN SIGN
+0x6F   0x003F  #QUESTION MARK
+0x70   0x00A8  #DIAERESIS
+0x71   0x0386  #GREEK CAPITAL LETTER ALPHA WITH TONOS
+0x72   0x0388  #GREEK CAPITAL LETTER EPSILON WITH TONOS
+0x73   0x0389  #GREEK CAPITAL LETTER ETA WITH TONOS
+0x74   0x00A0  #NO-BREAK SPACE
+0x75   0x038A  #GREEK CAPITAL LETTER IOTA WITH TONOS
+0x76   0x038C  #GREEK CAPITAL LETTER OMICRON WITH TONOS
+0x77   0x038E  #GREEK CAPITAL LETTER UPSILON WITH TONOS
+0x78   0x038F  #GREEK CAPITAL LETTER OMEGA WITH TONOS
+0x79   0x0060  #GRAVE ACCENT
+0x7A   0x003A  #COLON
+0x7B   0x0023  #NUMBER SIGN
+0x7C   0x0040  #COMMERCIAL AT
+0x7D   0x0027  #APOSTROPHE
+0x7E   0x003D  #EQUALS SIGN
+0x7F   0x0022  #QUOTATION MARK
+0x80   0x0385  #GREEK DIALYTIKA TONOS
+0x81   0x0061  #LATIN SMALL LETTER A
+0x82   0x0062  #LATIN SMALL LETTER B
+0x83   0x0063  #LATIN SMALL LETTER C
+0x84   0x0064  #LATIN SMALL LETTER D
+0x85   0x0065  #LATIN SMALL LETTER E
+0x86   0x0066  #LATIN SMALL LETTER F
+0x87   0x0067  #LATIN SMALL LETTER G
+0x88   0x0068  #LATIN SMALL LETTER H
+0x89   0x0069  #LATIN SMALL LETTER I
+0x8A   0x03B1  #GREEK SMALL LETTER ALPHA
+0x8B   0x03B2  #GREEK SMALL LETTER BETA
+0x8C   0x03B3  #GREEK SMALL LETTER GAMMA
+0x8D   0x03B4  #GREEK SMALL LETTER DELTA
+0x8E   0x03B5  #GREEK SMALL LETTER EPSILON
+0x8F   0x03B6  #GREEK SMALL LETTER ZETA
+0x90   0x00B0  #DEGREE SIGN
+0x91   0x006A  #LATIN SMALL LETTER J
+0x92   0x006B  #LATIN SMALL LETTER K
+0x93   0x006C  #LATIN SMALL LETTER L
+0x94   0x006D  #LATIN SMALL LETTER M
+0x95   0x006E  #LATIN SMALL LETTER N
+0x96   0x006F  #LATIN SMALL LETTER O
+0x97   0x0070  #LATIN SMALL LETTER P
+0x98   0x0071  #LATIN SMALL LETTER Q
+0x99   0x0072  #LATIN SMALL LETTER R
+0x9A   0x03B7  #GREEK SMALL LETTER ETA
+0x9B   0x03B8  #GREEK SMALL LETTER THETA
+0x9C   0x03B9  #GREEK SMALL LETTER IOTA
+0x9D   0x03BA  #GREEK SMALL LETTER KAPPA
+0x9E   0x03BB  #GREEK SMALL LETTER LAMDA
+0x9F   0x03BC  #GREEK SMALL LETTER MU
+0xA0   0x00B4  #ACUTE ACCENT
+0xA1   0x007E  #TILDE
+0xA2   0x0073  #LATIN SMALL LETTER S
+0xA3   0x0074  #LATIN SMALL LETTER T
+0xA4   0x0075  #LATIN SMALL LETTER U
+0xA5   0x0076  #LATIN SMALL LETTER V
+0xA6   0x0077  #LATIN SMALL LETTER W
+0xA7   0x0078  #LATIN SMALL LETTER X
+0xA8   0x0079  #LATIN SMALL LETTER Y
+0xA9   0x007A  #LATIN SMALL LETTER Z
+0xAA   0x03BD  #GREEK SMALL LETTER NU
+0xAB   0x03BE  #GREEK SMALL LETTER XI
+0xAC   0x03BF  #GREEK SMALL LETTER OMICRON
+0xAD   0x03C0  #GREEK SMALL LETTER PI
+0xAE   0x03C1  #GREEK SMALL LETTER RHO
+0xAF   0x03C3  #GREEK SMALL LETTER SIGMA
+0xB0   0x00A3  #POUND SIGN
+0xB1   0x03AC  #GREEK SMALL LETTER ALPHA WITH TONOS
+0xB2   0x03AD  #GREEK SMALL LETTER EPSILON WITH TONOS
+0xB3   0x03AE  #GREEK SMALL LETTER ETA WITH TONOS
+0xB4   0x03CA  #GREEK SMALL LETTER IOTA WITH DIALYTIKA
+0xB5   0x03AF  #GREEK SMALL LETTER IOTA WITH TONOS
+0xB6   0x03CC  #GREEK SMALL LETTER OMICRON WITH TONOS
+0xB7   0x03CD  #GREEK SMALL LETTER UPSILON WITH TONOS
+0xB8   0x03CB  #GREEK SMALL LETTER UPSILON WITH DIALYTIKA
+0xB9   0x03CE  #GREEK SMALL LETTER OMEGA WITH TONOS
+0xBA   0x03C2  #GREEK SMALL LETTER FINAL SIGMA
+0xBB   0x03C4  #GREEK SMALL LETTER TAU
+0xBC   0x03C5  #GREEK SMALL LETTER UPSILON
+0xBD   0x03C6  #GREEK SMALL LETTER PHI
+0xBE   0x03C7  #GREEK SMALL LETTER CHI
+0xBF   0x03C8  #GREEK SMALL LETTER PSI
+0xC0   0x007B  #LEFT CURLY BRACKET
+0xC1   0x0041  #LATIN CAPITAL LETTER A
+0xC2   0x0042  #LATIN CAPITAL LETTER B
+0xC3   0x0043  #LATIN CAPITAL LETTER C
+0xC4   0x0044  #LATIN CAPITAL LETTER D
+0xC5   0x0045  #LATIN CAPITAL LETTER E
+0xC6   0x0046  #LATIN CAPITAL LETTER F
+0xC7   0x0047  #LATIN CAPITAL LETTER G
+0xC8   0x0048  #LATIN CAPITAL LETTER H
+0xC9   0x0049  #LATIN CAPITAL LETTER I
+0xCA   0x00AD  #SOFT HYPHEN
+0xCB   0x03C9  #GREEK SMALL LETTER OMEGA
+0xCC   0x0390  #GREEK SMALL LETTER IOTA WITH DIALYTIKA AND TONOS
+0xCD   0x03B0  #GREEK SMALL LETTER UPSILON WITH DIALYTIKA AND TONOS
+0xCE   0x2018  #LEFT SINGLE QUOTATION MARK
+0xCF   0x2015  #HORIZONTAL BAR
+0xD0   0x007D  #RIGHT CURLY BRACKET
+0xD1   0x004A  #LATIN CAPITAL LETTER J
+0xD2   0x004B  #LATIN CAPITAL LETTER K
+0xD3   0x004C  #LATIN CAPITAL LETTER L
+0xD4   0x004D  #LATIN CAPITAL LETTER M
+0xD5   0x004E  #LATIN CAPITAL LETTER N
+0xD6   0x004F  #LATIN CAPITAL LETTER O
+0xD7   0x0050  #LATIN CAPITAL LETTER P
+0xD8   0x0051  #LATIN CAPITAL LETTER Q
+0xD9   0x0052  #LATIN CAPITAL LETTER R
+0xDA   0x00B1  #PLUS-MINUS SIGN
+0xDB   0x00BD  #VULGAR FRACTION ONE HALF
+0xDC   0x001A  #SUBSTITUTE
+0xDD   0x0387  #GREEK ANO TELEIA
+0xDE   0x2019  #RIGHT SINGLE QUOTATION MARK
+0xDF   0x00A6  #BROKEN BAR
+0xE0   0x005C  #REVERSE SOLIDUS
+0xE1   0x001A  #SUBSTITUTE
+0xE2   0x0053  #LATIN CAPITAL LETTER S
+0xE3   0x0054  #LATIN CAPITAL LETTER T
+0xE4   0x0055  #LATIN CAPITAL LETTER U
+0xE5   0x0056  #LATIN CAPITAL LETTER V
+0xE6   0x0057  #LATIN CAPITAL LETTER W
+0xE7   0x0058  #LATIN CAPITAL LETTER X
+0xE8   0x0059  #LATIN CAPITAL LETTER Y
+0xE9   0x005A  #LATIN CAPITAL LETTER Z
+0xEA   0x00B2  #SUPERSCRIPT TWO
+0xEB   0x00A7  #SECTION SIGN
+0xEC   0x001A  #SUBSTITUTE
+0xED   0x001A  #SUBSTITUTE
+0xEE   0x00AB  #LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xEF   0x00AC  #NOT SIGN
+0xF0   0x0030  #DIGIT ZERO
+0xF1   0x0031  #DIGIT ONE
+0xF2   0x0032  #DIGIT TWO
+0xF3   0x0033  #DIGIT THREE
+0xF4   0x0034  #DIGIT FOUR
+0xF5   0x0035  #DIGIT FIVE
+0xF6   0x0036  #DIGIT SIX
+0xF7   0x0037  #DIGIT SEVEN
+0xF8   0x0038  #DIGIT EIGHT
+0xF9   0x0039  #DIGIT NINE
+0xFA   0x00B3  #SUPERSCRIPT THREE
+0xFB   0x00A9  #COPYRIGHT SIGN
+0xFC   0x001A  #SUBSTITUTE
+0xFD   0x001A  #SUBSTITUTE
+0xFE   0x00BB  #RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xFF   0x009F  #CONTROL
diff --git a/basis/io/encodings/8-bit/CYRILLIC.TXT b/basis/io/encodings/8-bit/CYRILLIC.TXT
new file mode 100644 (file)
index 0000000..a40c91c
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp10007_MacCyrillic to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp10007_MacCyrillic code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp10007_MacCyrillic order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0A   0x000A  #LINE FEED
+0x0B   0x000B  #VERTICAL TABULATION
+0x0C   0x000C  #FORM FEED
+0x0D   0x000D  #CARRIAGE RETURN
+0x0E   0x000E  #SHIFT OUT
+0x0F   0x000F  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1A   0x001A  #SUBSTITUTE
+0x1B   0x001B  #ESCAPE
+0x1C   0x001C  #FILE SEPARATOR
+0x1D   0x001D  #GROUP SEPARATOR
+0x1E   0x001E  #RECORD SEPARATOR
+0x1F   0x001F  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x0025  #PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2A   0x002A  #ASTERISK
+0x2B   0x002B  #PLUS SIGN
+0x2C   0x002C  #COMMA
+0x2D   0x002D  #HYPHEN-MINUS
+0x2E   0x002E  #FULL STOP
+0x2F   0x002F  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3A   0x003A  #COLON
+0x3B   0x003B  #SEMICOLON
+0x3C   0x003C  #LESS-THAN SIGN
+0x3D   0x003D  #EQUALS SIGN
+0x3E   0x003E  #GREATER-THAN SIGN
+0x3F   0x003F  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4A   0x004A  #LATIN CAPITAL LETTER J
+0x4B   0x004B  #LATIN CAPITAL LETTER K
+0x4C   0x004C  #LATIN CAPITAL LETTER L
+0x4D   0x004D  #LATIN CAPITAL LETTER M
+0x4E   0x004E  #LATIN CAPITAL LETTER N
+0x4F   0x004F  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5A   0x005A  #LATIN CAPITAL LETTER Z
+0x5B   0x005B  #LEFT SQUARE BRACKET
+0x5C   0x005C  #REVERSE SOLIDUS
+0x5D   0x005D  #RIGHT SQUARE BRACKET
+0x5E   0x005E  #CIRCUMFLEX ACCENT
+0x5F   0x005F  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6A   0x006A  #LATIN SMALL LETTER J
+0x6B   0x006B  #LATIN SMALL LETTER K
+0x6C   0x006C  #LATIN SMALL LETTER L
+0x6D   0x006D  #LATIN SMALL LETTER M
+0x6E   0x006E  #LATIN SMALL LETTER N
+0x6F   0x006F  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7A   0x007A  #LATIN SMALL LETTER Z
+0x7B   0x007B  #LEFT CURLY BRACKET
+0x7C   0x007C  #VERTICAL LINE
+0x7D   0x007D  #RIGHT CURLY BRACKET
+0x7E   0x007E  #TILDE
+0x7F   0x007F  #DELETE
+0x80   0x0410  #CYRILLIC CAPITAL LETTER A
+0x81   0x0411  #CYRILLIC CAPITAL LETTER BE
+0x82   0x0412  #CYRILLIC CAPITAL LETTER VE
+0x83   0x0413  #CYRILLIC CAPITAL LETTER GHE
+0x84   0x0414  #CYRILLIC CAPITAL LETTER DE
+0x85   0x0415  #CYRILLIC CAPITAL LETTER IE
+0x86   0x0416  #CYRILLIC CAPITAL LETTER ZHE
+0x87   0x0417  #CYRILLIC CAPITAL LETTER ZE
+0x88   0x0418  #CYRILLIC CAPITAL LETTER I
+0x89   0x0419  #CYRILLIC CAPITAL LETTER SHORT I
+0x8A   0x041A  #CYRILLIC CAPITAL LETTER KA
+0x8B   0x041B  #CYRILLIC CAPITAL LETTER EL
+0x8C   0x041C  #CYRILLIC CAPITAL LETTER EM
+0x8D   0x041D  #CYRILLIC CAPITAL LETTER EN
+0x8E   0x041E  #CYRILLIC CAPITAL LETTER O
+0x8F   0x041F  #CYRILLIC CAPITAL LETTER PE
+0x90   0x0420  #CYRILLIC CAPITAL LETTER ER
+0x91   0x0421  #CYRILLIC CAPITAL LETTER ES
+0x92   0x0422  #CYRILLIC CAPITAL LETTER TE
+0x93   0x0423  #CYRILLIC CAPITAL LETTER U
+0x94   0x0424  #CYRILLIC CAPITAL LETTER EF
+0x95   0x0425  #CYRILLIC CAPITAL LETTER HA
+0x96   0x0426  #CYRILLIC CAPITAL LETTER TSE
+0x97   0x0427  #CYRILLIC CAPITAL LETTER CHE
+0x98   0x0428  #CYRILLIC CAPITAL LETTER SHA
+0x99   0x0429  #CYRILLIC CAPITAL LETTER SHCHA
+0x9A   0x042A  #CYRILLIC CAPITAL LETTER HARD SIGN
+0x9B   0x042B  #CYRILLIC CAPITAL LETTER YERU
+0x9C   0x042C  #CYRILLIC CAPITAL LETTER SOFT SIGN
+0x9D   0x042D  #CYRILLIC CAPITAL LETTER E
+0x9E   0x042E  #CYRILLIC CAPITAL LETTER YU
+0x9F   0x042F  #CYRILLIC CAPITAL LETTER YA
+0xA0   0x2020  #DAGGER
+0xA1   0x00B0  #DEGREE SIGN
+0xA2   0x00A2  #CENT SIGN
+0xA3   0x00A3  #POUND SIGN
+0xA4   0x00A7  #SECTION SIGN
+0xA5   0x2022  #BULLET
+0xA6   0x00B6  #PILCROW SIGN
+0xA7   0x0406  #CYRILLIC CAPITAL LETTER BYELORUSSIAN-UKRAINIAN I
+0xA8   0x00AE  #REGISTERED SIGN
+0xA9   0x00A9  #COPYRIGHT SIGN
+0xAA   0x2122  #TRADE MARK SIGN
+0xAB   0x0402  #CYRILLIC CAPITAL LETTER DJE
+0xAC   0x0452  #CYRILLIC SMALL LETTER DJE
+0xAD   0x2260  #NOT EQUAL TO
+0xAE   0x0403  #CYRILLIC CAPITAL LETTER GJE
+0xAF   0x0453  #CYRILLIC SMALL LETTER GJE
+0xB0   0x221E  #INFINITY
+0xB1   0x00B1  #PLUS-MINUS SIGN
+0xB2   0x2264  #LESS-THAN OR EQUAL TO
+0xB3   0x2265  #GREATER-THAN OR EQUAL TO
+0xB4   0x0456  #CYRILLIC SMALL LETTER BYELORUSSIAN-UKRAINIAN I
+0xB5   0x00B5  #MICRO SIGN
+0xB6   0x2202  #PARTIAL DIFFERENTIAL
+0xB7   0x0408  #CYRILLIC CAPITAL LETTER JE
+0xB8   0x0404  #CYRILLIC CAPITAL LETTER UKRAINIAN IE
+0xB9   0x0454  #CYRILLIC SMALL LETTER UKRAINIAN IE
+0xBA   0x0407  #CYRILLIC CAPITAL LETTER YI
+0xBB   0x0457  #CYRILLIC SMALL LETTER YI
+0xBC   0x0409  #CYRILLIC CAPITAL LETTER LJE
+0xBD   0x0459  #CYRILLIC SMALL LETTER LJE
+0xBE   0x040A  #CYRILLIC CAPITAL LETTER NJE
+0xBF   0x045A  #CYRILLIC SMALL LETTER NJE
+0xC0   0x0458  #CYRILLIC SMALL LETTER JE
+0xC1   0x0405  #CYRILLIC CAPITAL LETTER DZE
+0xC2   0x00AC  #NOT SIGN
+0xC3   0x221A  #SQUARE ROOT
+0xC4   0x0192  #LATIN SMALL LETTER F WITH HOOK
+0xC5   0x2248  #ALMOST EQUAL TO
+0xC6   0x2206  #INCREMENT
+0xC7   0x00AB  #LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xC8   0x00BB  #RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xC9   0x2026  #HORIZONTAL ELLIPSIS
+0xCA   0x00A0  #NO-BREAK SPACE
+0xCB   0x040B  #CYRILLIC CAPITAL LETTER TSHE
+0xCC   0x045B  #CYRILLIC SMALL LETTER TSHE
+0xCD   0x040C  #CYRILLIC CAPITAL LETTER KJE
+0xCE   0x045C  #CYRILLIC SMALL LETTER KJE
+0xCF   0x0455  #CYRILLIC SMALL LETTER DZE
+0xD0   0x2013  #EN DASH
+0xD1   0x2014  #EM DASH
+0xD2   0x201C  #LEFT DOUBLE QUOTATION MARK
+0xD3   0x201D  #RIGHT DOUBLE QUOTATION MARK
+0xD4   0x2018  #LEFT SINGLE QUOTATION MARK
+0xD5   0x2019  #RIGHT SINGLE QUOTATION MARK
+0xD6   0x00F7  #DIVISION SIGN
+0xD7   0x201E  #DOUBLE LOW-9 QUOTATION MARK
+0xD8   0x040E  #CYRILLIC CAPITAL LETTER SHORT U
+0xD9   0x045E  #CYRILLIC SMALL LETTER SHORT U
+0xDA   0x040F  #CYRILLIC CAPITAL LETTER DZHE
+0xDB   0x045F  #CYRILLIC SMALL LETTER DZHE
+0xDC   0x2116  #NUMERO SIGN
+0xDD   0x0401  #CYRILLIC CAPITAL LETTER IO
+0xDE   0x0451  #CYRILLIC SMALL LETTER IO
+0xDF   0x044F  #CYRILLIC SMALL LETTER YA
+0xE0   0x0430  #CYRILLIC SMALL LETTER A
+0xE1   0x0431  #CYRILLIC SMALL LETTER BE
+0xE2   0x0432  #CYRILLIC SMALL LETTER VE
+0xE3   0x0433  #CYRILLIC SMALL LETTER GHE
+0xE4   0x0434  #CYRILLIC SMALL LETTER DE
+0xE5   0x0435  #CYRILLIC SMALL LETTER IE
+0xE6   0x0436  #CYRILLIC SMALL LETTER ZHE
+0xE7   0x0437  #CYRILLIC SMALL LETTER ZE
+0xE8   0x0438  #CYRILLIC SMALL LETTER I
+0xE9   0x0439  #CYRILLIC SMALL LETTER SHORT I
+0xEA   0x043A  #CYRILLIC SMALL LETTER KA
+0xEB   0x043B  #CYRILLIC SMALL LETTER EL
+0xEC   0x043C  #CYRILLIC SMALL LETTER EM
+0xED   0x043D  #CYRILLIC SMALL LETTER EN
+0xEE   0x043E  #CYRILLIC SMALL LETTER O
+0xEF   0x043F  #CYRILLIC SMALL LETTER PE
+0xF0   0x0440  #CYRILLIC SMALL LETTER ER
+0xF1   0x0441  #CYRILLIC SMALL LETTER ES
+0xF2   0x0442  #CYRILLIC SMALL LETTER TE
+0xF3   0x0443  #CYRILLIC SMALL LETTER U
+0xF4   0x0444  #CYRILLIC SMALL LETTER EF
+0xF5   0x0445  #CYRILLIC SMALL LETTER HA
+0xF6   0x0446  #CYRILLIC SMALL LETTER TSE
+0xF7   0x0447  #CYRILLIC SMALL LETTER CHE
+0xF8   0x0448  #CYRILLIC SMALL LETTER SHA
+0xF9   0x0449  #CYRILLIC SMALL LETTER SHCHA
+0xFA   0x044A  #CYRILLIC SMALL LETTER HARD SIGN
+0xFB   0x044B  #CYRILLIC SMALL LETTER YERU
+0xFC   0x044C  #CYRILLIC SMALL LETTER SOFT SIGN
+0xFD   0x044D  #CYRILLIC SMALL LETTER E
+0xFE   0x044E  #CYRILLIC SMALL LETTER YU
+0xFF   0x00A4  #CURRENCY SIGN
diff --git a/basis/io/encodings/8-bit/GREEK.TXT b/basis/io/encodings/8-bit/GREEK.TXT
new file mode 100644 (file)
index 0000000..8241b66
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp10006_MacGreek to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp10006_MacGreek code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp10006_MacGreek order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0A   0x000A  #LINE FEED
+0x0B   0x000B  #VERTICAL TABULATION
+0x0C   0x000C  #FORM FEED
+0x0D   0x000D  #CARRIAGE RETURN
+0x0E   0x000E  #SHIFT OUT
+0x0F   0x000F  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1A   0x001A  #SUBSTITUTE
+0x1B   0x001B  #ESCAPE
+0x1C   0x001C  #FILE SEPARATOR
+0x1D   0x001D  #GROUP SEPARATOR
+0x1E   0x001E  #RECORD SEPARATOR
+0x1F   0x001F  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x0025  #PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2A   0x002A  #ASTERISK
+0x2B   0x002B  #PLUS SIGN
+0x2C   0x002C  #COMMA
+0x2D   0x002D  #HYPHEN-MINUS
+0x2E   0x002E  #FULL STOP
+0x2F   0x002F  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3A   0x003A  #COLON
+0x3B   0x003B  #SEMICOLON
+0x3C   0x003C  #LESS-THAN SIGN
+0x3D   0x003D  #EQUALS SIGN
+0x3E   0x003E  #GREATER-THAN SIGN
+0x3F   0x003F  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4A   0x004A  #LATIN CAPITAL LETTER J
+0x4B   0x004B  #LATIN CAPITAL LETTER K
+0x4C   0x004C  #LATIN CAPITAL LETTER L
+0x4D   0x004D  #LATIN CAPITAL LETTER M
+0x4E   0x004E  #LATIN CAPITAL LETTER N
+0x4F   0x004F  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5A   0x005A  #LATIN CAPITAL LETTER Z
+0x5B   0x005B  #LEFT SQUARE BRACKET
+0x5C   0x005C  #REVERSE SOLIDUS
+0x5D   0x005D  #RIGHT SQUARE BRACKET
+0x5E   0x005E  #CIRCUMFLEX ACCENT
+0x5F   0x005F  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6A   0x006A  #LATIN SMALL LETTER J
+0x6B   0x006B  #LATIN SMALL LETTER K
+0x6C   0x006C  #LATIN SMALL LETTER L
+0x6D   0x006D  #LATIN SMALL LETTER M
+0x6E   0x006E  #LATIN SMALL LETTER N
+0x6F   0x006F  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7A   0x007A  #LATIN SMALL LETTER Z
+0x7B   0x007B  #LEFT CURLY BRACKET
+0x7C   0x007C  #VERTICAL LINE
+0x7D   0x007D  #RIGHT CURLY BRACKET
+0x7E   0x007E  #TILDE
+0x7F   0x007F  #DELETE
+0x80   0x00C4  #LATIN CAPITAL LETTER A WITH DIAERESIS
+0x81   0x00B9  #SUPERSCRIPT ONE
+0x82   0x00B2  #SUPERSCRIPT TWO
+0x83   0x00C9  #LATIN CAPITAL LETTER E WITH ACUTE
+0x84   0x00B3  #SUPERSCRIPT THREE
+0x85   0x00D6  #LATIN CAPITAL LETTER O WITH DIAERESIS
+0x86   0x00DC  #LATIN CAPITAL LETTER U WITH DIAERESIS
+0x87   0x0385  #GREEK DIALYTIKA TONOS
+0x88   0x00E0  #LATIN SMALL LETTER A WITH GRAVE
+0x89   0x00E2  #LATIN SMALL LETTER A WITH CIRCUMFLEX
+0x8A   0x00E4  #LATIN SMALL LETTER A WITH DIAERESIS
+0x8B   0x0384  #GREEK TONOS
+0x8C   0x00A8  #DIAERESIS
+0x8D   0x00E7  #LATIN SMALL LETTER C WITH CEDILLA
+0x8E   0x00E9  #LATIN SMALL LETTER E WITH ACUTE
+0x8F   0x00E8  #LATIN SMALL LETTER E WITH GRAVE
+0x90   0x00EA  #LATIN SMALL LETTER E WITH CIRCUMFLEX
+0x91   0x00EB  #LATIN SMALL LETTER E WITH DIAERESIS
+0x92   0x00A3  #POUND SIGN
+0x93   0x2122  #TRADE MARK SIGN
+0x94   0x00EE  #LATIN SMALL LETTER I WITH CIRCUMFLEX
+0x95   0x00EF  #LATIN SMALL LETTER I WITH DIAERESIS
+0x96   0x2022  #BULLET
+0x97   0x00BD  #VULGAR FRACTION ONE HALF
+0x98   0x2030  #PER MILLE SIGN
+0x99   0x00F4  #LATIN SMALL LETTER O WITH CIRCUMFLEX
+0x9A   0x00F6  #LATIN SMALL LETTER O WITH DIAERESIS
+0x9B   0x00A6  #BROKEN BAR
+0x9C   0x00AD  #SOFT HYPHEN
+0x9D   0x00F9  #LATIN SMALL LETTER U WITH GRAVE
+0x9E   0x00FB  #LATIN SMALL LETTER U WITH CIRCUMFLEX
+0x9F   0x00FC  #LATIN SMALL LETTER U WITH DIAERESIS
+0xA0   0x2020  #DAGGER
+0xA1   0x0393  #GREEK CAPITAL LETTER GAMMA
+0xA2   0x0394  #GREEK CAPITAL LETTER DELTA
+0xA3   0x0398  #GREEK CAPITAL LETTER THETA
+0xA4   0x039B  #GREEK CAPITAL LETTER LAMBDA
+0xA5   0x039E  #GREEK CAPITAL LETTER XI
+0xA6   0x03A0  #GREEK CAPITAL LETTER PI
+0xA7   0x00DF  #LATIN SMALL LETTER SHARP S
+0xA8   0x00AE  #REGISTERED SIGN
+0xA9   0x00A9  #COPYRIGHT SIGN
+0xAA   0x03A3  #GREEK CAPITAL LETTER SIGMA
+0xAB   0x03AA  #GREEK CAPITAL LETTER IOTA WITH DIALYTIKA
+0xAC   0x00A7  #SECTION SIGN
+0xAD   0x2260  #NOT EQUAL TO
+0xAE   0x00B0  #DEGREE SIGN
+0xAF   0x0387  #GREEK ANO TELEIA
+0xB0   0x0391  #GREEK CAPITAL LETTER ALPHA
+0xB1   0x00B1  #PLUS-MINUS SIGN
+0xB2   0x2264  #LESS-THAN OR EQUAL TO
+0xB3   0x2265  #GREATER-THAN OR EQUAL TO
+0xB4   0x00A5  #YEN SIGN
+0xB5   0x0392  #GREEK CAPITAL LETTER BETA
+0xB6   0x0395  #GREEK CAPITAL LETTER EPSILON
+0xB7   0x0396  #GREEK CAPITAL LETTER ZETA
+0xB8   0x0397  #GREEK CAPITAL LETTER ETA
+0xB9   0x0399  #GREEK CAPITAL LETTER IOTA
+0xBA   0x039A  #GREEK CAPITAL LETTER KAPPA
+0xBB   0x039C  #GREEK CAPITAL LETTER MU
+0xBC   0x03A6  #GREEK CAPITAL LETTER PHI
+0xBD   0x03AB  #GREEK CAPITAL LETTER UPSILON WITH DIALYTIKA
+0xBE   0x03A8  #GREEK CAPITAL LETTER PSI
+0xBF   0x03A9  #GREEK CAPITAL LETTER OMEGA
+0xC0   0x03AC  #GREEK SMALL LETTER ALPHA WITH TONOS
+0xC1   0x039D  #GREEK CAPITAL LETTER NU
+0xC2   0x00AC  #NOT SIGN
+0xC3   0x039F  #GREEK CAPITAL LETTER OMICRON
+0xC4   0x03A1  #GREEK CAPITAL LETTER RHO
+0xC5   0x2248  #ALMOST EQUAL TO
+0xC6   0x03A4  #GREEK CAPITAL LETTER TAU
+0xC7   0x00AB  #LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xC8   0x00BB  #RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xC9   0x2026  #HORIZONTAL ELLIPSIS
+0xCA   0x00A0  #NO-BREAK SPACE
+0xCB   0x03A5  #GREEK CAPITAL LETTER UPSILON
+0xCC   0x03A7  #GREEK CAPITAL LETTER CHI
+0xCD   0x0386  #GREEK CAPITAL LETTER ALPHA WITH TONOS
+0xCE   0x0388  #GREEK CAPITAL LETTER EPSILON WITH TONOS
+0xCF   0x0153  #LATIN SMALL LIGATURE OE
+0xD0   0x2013  #EN DASH
+0xD1   0x2015  #HORIZONTAL BAR
+0xD2   0x201C  #LEFT DOUBLE QUOTATION MARK
+0xD3   0x201D  #RIGHT DOUBLE QUOTATION MARK
+0xD4   0x2018  #LEFT SINGLE QUOTATION MARK
+0xD5   0x2019  #RIGHT SINGLE QUOTATION MARK
+0xD6   0x00F7  #DIVISION SIGN
+0xD7   0x0389  #GREEK CAPITAL LETTER ETA WITH TONOS
+0xD8   0x038A  #GREEK CAPITAL LETTER IOTA WITH TONOS
+0xD9   0x038C  #GREEK CAPITAL LETTER OMICRON WITH TONOS
+0xDA   0x038E  #GREEK CAPITAL LETTER UPSILON WITH TONOS
+0xDB   0x03AD  #GREEK SMALL LETTER EPSILON WITH TONOS
+0xDC   0x03AE  #GREEK SMALL LETTER ETA WITH TONOS
+0xDD   0x03AF  #GREEK SMALL LETTER IOTA WITH TONOS
+0xDE   0x03CC  #GREEK SMALL LETTER OMICRON WITH TONOS
+0xDF   0x038F  #GREEK CAPITAL LETTER OMEGA WITH TONOS
+0xE0   0x03CD  #GREEK SMALL LETTER UPSILON WITH TONOS
+0xE1   0x03B1  #GREEK SMALL LETTER ALPHA
+0xE2   0x03B2  #GREEK SMALL LETTER BETA
+0xE3   0x03C8  #GREEK SMALL LETTER PSI
+0xE4   0x03B4  #GREEK SMALL LETTER DELTA
+0xE5   0x03B5  #GREEK SMALL LETTER EPSILON
+0xE6   0x03C6  #GREEK SMALL LETTER PHI
+0xE7   0x03B3  #GREEK SMALL LETTER GAMMA
+0xE8   0x03B7  #GREEK SMALL LETTER ETA
+0xE9   0x03B9  #GREEK SMALL LETTER IOTA
+0xEA   0x03BE  #GREEK SMALL LETTER XI
+0xEB   0x03BA  #GREEK SMALL LETTER KAPPA
+0xEC   0x03BB  #GREEK SMALL LETTER LAMBDA
+0xED   0x03BC  #GREEK SMALL LETTER MU
+0xEE   0x03BD  #GREEK SMALL LETTER NU
+0xEF   0x03BF  #GREEK SMALL LETTER OMICRON
+0xF0   0x03C0  #GREEK SMALL LETTER PI
+0xF1   0x03CE  #GREEK SMALL LETTER OMEGA WITH TONOS
+0xF2   0x03C1  #GREEK SMALL LETTER RHO
+0xF3   0x03C3  #GREEK SMALL LETTER SIGMA
+0xF4   0x03C4  #GREEK SMALL LETTER TAU
+0xF5   0x03B8  #GREEK SMALL LETTER THETA
+0xF6   0x03C9  #GREEK SMALL LETTER OMEGA
+0xF7   0x03C2  #GREEK SMALL LETTER FINAL SIGMA
+0xF8   0x03C7  #GREEK SMALL LETTER CHI
+0xF9   0x03C5  #GREEK SMALL LETTER UPSILON
+0xFA   0x03B6  #GREEK SMALL LETTER ZETA
+0xFB   0x03CA  #GREEK SMALL LETTER IOTA WITH DIALYTIKA
+0xFC   0x03CB  #GREEK SMALL LETTER UPSILON WITH DIALYTIKA
+0xFD   0x0390  #GREEK SMALL LETTER IOTA WITH DIALYTIKA AND TONOS
+0xFE   0x03B0  #GREEK SMALL LETTER UPSILON WITH DIALYTIKA AND TONOS
+0xFF           #UNDEFINED
diff --git a/basis/io/encodings/8-bit/ICELAND.TXT b/basis/io/encodings/8-bit/ICELAND.TXT
new file mode 100644 (file)
index 0000000..b55304b
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp10079_MacIcelandic to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp10079_MacIcelandic code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp10079_MacIcelandic order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0A   0x000A  #LINE FEED
+0x0B   0x000B  #VERTICAL TABULATION
+0x0C   0x000C  #FORM FEED
+0x0D   0x000D  #CARRIAGE RETURN
+0x0E   0x000E  #SHIFT OUT
+0x0F   0x000F  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1A   0x001A  #SUBSTITUTE
+0x1B   0x001B  #ESCAPE
+0x1C   0x001C  #FILE SEPARATOR
+0x1D   0x001D  #GROUP SEPARATOR
+0x1E   0x001E  #RECORD SEPARATOR
+0x1F   0x001F  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x0025  #PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2A   0x002A  #ASTERISK
+0x2B   0x002B  #PLUS SIGN
+0x2C   0x002C  #COMMA
+0x2D   0x002D  #HYPHEN-MINUS
+0x2E   0x002E  #FULL STOP
+0x2F   0x002F  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3A   0x003A  #COLON
+0x3B   0x003B  #SEMICOLON
+0x3C   0x003C  #LESS-THAN SIGN
+0x3D   0x003D  #EQUALS SIGN
+0x3E   0x003E  #GREATER-THAN SIGN
+0x3F   0x003F  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4A   0x004A  #LATIN CAPITAL LETTER J
+0x4B   0x004B  #LATIN CAPITAL LETTER K
+0x4C   0x004C  #LATIN CAPITAL LETTER L
+0x4D   0x004D  #LATIN CAPITAL LETTER M
+0x4E   0x004E  #LATIN CAPITAL LETTER N
+0x4F   0x004F  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5A   0x005A  #LATIN CAPITAL LETTER Z
+0x5B   0x005B  #LEFT SQUARE BRACKET
+0x5C   0x005C  #REVERSE SOLIDUS
+0x5D   0x005D  #RIGHT SQUARE BRACKET
+0x5E   0x005E  #CIRCUMFLEX ACCENT
+0x5F   0x005F  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6A   0x006A  #LATIN SMALL LETTER J
+0x6B   0x006B  #LATIN SMALL LETTER K
+0x6C   0x006C  #LATIN SMALL LETTER L
+0x6D   0x006D  #LATIN SMALL LETTER M
+0x6E   0x006E  #LATIN SMALL LETTER N
+0x6F   0x006F  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7A   0x007A  #LATIN SMALL LETTER Z
+0x7B   0x007B  #LEFT CURLY BRACKET
+0x7C   0x007C  #VERTICAL LINE
+0x7D   0x007D  #RIGHT CURLY BRACKET
+0x7E   0x007E  #TILDE
+0x7F   0x007F  #DELETE
+0x80   0x00C4  #LATIN CAPITAL LETTER A WITH DIAERESIS
+0x81   0x00C5  #LATIN CAPITAL LETTER A WITH RING ABOVE
+0x82   0x00C7  #LATIN CAPITAL LETTER C WITH CEDILLA
+0x83   0x00C9  #LATIN CAPITAL LETTER E WITH ACUTE
+0x84   0x00D1  #LATIN CAPITAL LETTER N WITH TILDE
+0x85   0x00D6  #LATIN CAPITAL LETTER O WITH DIAERESIS
+0x86   0x00DC  #LATIN CAPITAL LETTER U WITH DIAERESIS
+0x87   0x00E1  #LATIN SMALL LETTER A WITH ACUTE
+0x88   0x00E0  #LATIN SMALL LETTER A WITH GRAVE
+0x89   0x00E2  #LATIN SMALL LETTER A WITH CIRCUMFLEX
+0x8A   0x00E4  #LATIN SMALL LETTER A WITH DIAERESIS
+0x8B   0x00E3  #LATIN SMALL LETTER A WITH TILDE
+0x8C   0x00E5  #LATIN SMALL LETTER A WITH RING ABOVE
+0x8D   0x00E7  #LATIN SMALL LETTER C WITH CEDILLA
+0x8E   0x00E9  #LATIN SMALL LETTER E WITH ACUTE
+0x8F   0x00E8  #LATIN SMALL LETTER E WITH GRAVE
+0x90   0x00EA  #LATIN SMALL LETTER E WITH CIRCUMFLEX
+0x91   0x00EB  #LATIN SMALL LETTER E WITH DIAERESIS
+0x92   0x00ED  #LATIN SMALL LETTER I WITH ACUTE
+0x93   0x00EC  #LATIN SMALL LETTER I WITH GRAVE
+0x94   0x00EE  #LATIN SMALL LETTER I WITH CIRCUMFLEX
+0x95   0x00EF  #LATIN SMALL LETTER I WITH DIAERESIS
+0x96   0x00F1  #LATIN SMALL LETTER N WITH TILDE
+0x97   0x00F3  #LATIN SMALL LETTER O WITH ACUTE
+0x98   0x00F2  #LATIN SMALL LETTER O WITH GRAVE
+0x99   0x00F4  #LATIN SMALL LETTER O WITH CIRCUMFLEX
+0x9A   0x00F6  #LATIN SMALL LETTER O WITH DIAERESIS
+0x9B   0x00F5  #LATIN SMALL LETTER O WITH TILDE
+0x9C   0x00FA  #LATIN SMALL LETTER U WITH ACUTE
+0x9D   0x00F9  #LATIN SMALL LETTER U WITH GRAVE
+0x9E   0x00FB  #LATIN SMALL LETTER U WITH CIRCUMFLEX
+0x9F   0x00FC  #LATIN SMALL LETTER U WITH DIAERESIS
+0xA0   0x00DD  #LATIN CAPITAL LETTER Y WITH ACUTE
+0xA1   0x00B0  #DEGREE SIGN
+0xA2   0x00A2  #CENT SIGN
+0xA3   0x00A3  #POUND SIGN
+0xA4   0x00A7  #SECTION SIGN
+0xA5   0x2022  #BULLET
+0xA6   0x00B6  #PILCROW SIGN
+0xA7   0x00DF  #LATIN SMALL LETTER SHARP S
+0xA8   0x00AE  #REGISTERED SIGN
+0xA9   0x00A9  #COPYRIGHT SIGN
+0xAA   0x2122  #TRADE MARK SIGN
+0xAB   0x00B4  #ACUTE ACCENT
+0xAC   0x00A8  #DIAERESIS
+0xAD   0x2260  #NOT EQUAL TO
+0xAE   0x00C6  #LATIN CAPITAL LIGATURE AE
+0xAF   0x00D8  #LATIN CAPITAL LETTER O WITH STROKE
+0xB0   0x221E  #INFINITY
+0xB1   0x00B1  #PLUS-MINUS SIGN
+0xB2   0x2264  #LESS-THAN OR EQUAL TO
+0xB3   0x2265  #GREATER-THAN OR EQUAL TO
+0xB4   0x00A5  #YEN SIGN
+0xB5   0x00B5  #MICRO SIGN
+0xB6   0x2202  #PARTIAL DIFFERENTIAL
+0xB7   0x2211  #N-ARY SUMMATION
+0xB8   0x220F  #N-ARY PRODUCT
+0xB9   0x03C0  #GREEK SMALL LETTER PI
+0xBA   0x222B  #INTEGRAL
+0xBB   0x00AA  #FEMININE ORDINAL INDICATOR
+0xBC   0x00BA  #MASCULINE ORDINAL INDICATOR
+0xBD   0x2126  #OHM SIGN
+0xBE   0x00E6  #LATIN SMALL LIGATURE AE
+0xBF   0x00F8  #LATIN SMALL LETTER O WITH STROKE
+0xC0   0x00BF  #INVERTED QUESTION MARK
+0xC1   0x00A1  #INVERTED EXCLAMATION MARK
+0xC2   0x00AC  #NOT SIGN
+0xC3   0x221A  #SQUARE ROOT
+0xC4   0x0192  #LATIN SMALL LETTER F WITH HOOK
+0xC5   0x2248  #ALMOST EQUAL TO
+0xC6   0x2206  #INCREMENT
+0xC7   0x00AB  #LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xC8   0x00BB  #RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xC9   0x2026  #HORIZONTAL ELLIPSIS
+0xCA   0x00A0  #NO-BREAK SPACE
+0xCB   0x00C0  #LATIN CAPITAL LETTER A WITH GRAVE
+0xCC   0x00C3  #LATIN CAPITAL LETTER A WITH TILDE
+0xCD   0x00D5  #LATIN CAPITAL LETTER O WITH TILDE
+0xCE   0x0152  #LATIN CAPITAL LIGATURE OE
+0xCF   0x0153  #LATIN SMALL LIGATURE OE
+0xD0   0x2013  #EN DASH
+0xD1   0x2014  #EM DASH
+0xD2   0x201C  #LEFT DOUBLE QUOTATION MARK
+0xD3   0x201D  #RIGHT DOUBLE QUOTATION MARK
+0xD4   0x2018  #LEFT SINGLE QUOTATION MARK
+0xD5   0x2019  #RIGHT SINGLE QUOTATION MARK
+0xD6   0x00F7  #DIVISION SIGN
+0xD7   0x25CA  #LOZENGE
+0xD8   0x00FF  #LATIN SMALL LETTER Y WITH DIAERESIS
+0xD9   0x0178  #LATIN CAPITAL LETTER Y WITH DIAERESIS
+0xDA   0x2044  #FRACTION SLASH
+0xDB   0x00A4  #CURRENCY SIGN
+0xDC   0x00D0  #LATIN CAPITAL LETTER ETH
+0xDD   0x00F0  #LATIN SMALL LETTER ETH
+0xDE   0x00DE  #LATIN CAPITAL LETTER THORN
+0xDF   0x00FE  #LATIN SMALL LETTER THORN
+0xE0   0x00FD  #LATIN SMALL LETTER Y WITH ACUTE
+0xE1   0x00B7  #MIDDLE DOT
+0xE2   0x201A  #SINGLE LOW-9 QUOTATION MARK
+0xE3   0x201E  #DOUBLE LOW-9 QUOTATION MARK
+0xE4   0x2030  #PER MILLE SIGN
+0xE5   0x00C2  #LATIN CAPITAL LETTER A WITH CIRCUMFLEX
+0xE6   0x00CA  #LATIN CAPITAL LETTER E WITH CIRCUMFLEX
+0xE7   0x00C1  #LATIN CAPITAL LETTER A WITH ACUTE
+0xE8   0x00CB  #LATIN CAPITAL LETTER E WITH DIAERESIS
+0xE9   0x00C8  #LATIN CAPITAL LETTER E WITH GRAVE
+0xEA   0x00CD  #LATIN CAPITAL LETTER I WITH ACUTE
+0xEB   0x00CE  #LATIN CAPITAL LETTER I WITH CIRCUMFLEX
+0xEC   0x00CF  #LATIN CAPITAL LETTER I WITH DIAERESIS
+0xED   0x00CC  #LATIN CAPITAL LETTER I WITH GRAVE
+0xEE   0x00D3  #LATIN CAPITAL LETTER O WITH ACUTE
+0xEF   0x00D4  #LATIN CAPITAL LETTER O WITH CIRCUMFLEX
+0xF0           #UNDEFINED
+0xF1   0x00D2  #LATIN CAPITAL LETTER O WITH GRAVE
+0xF2   0x00DA  #LATIN CAPITAL LETTER U WITH ACUTE
+0xF3   0x00DB  #LATIN CAPITAL LETTER U WITH CIRCUMFLEX
+0xF4   0x00D9  #LATIN CAPITAL LETTER U WITH GRAVE
+0xF5   0x0131  #LATIN SMALL LETTER DOTLESS I
+0xF6   0x02C6  #MODIFIER LETTER CIRCUMFLEX ACCENT
+0xF7   0x02DC  #SMALL TILDE
+0xF8   0x00AF  #MACRON
+0xF9   0x02D8  #BREVE
+0xFA   0x02D9  #DOT ABOVE
+0xFB   0x02DA  #RING ABOVE
+0xFC   0x00B8  #CEDILLA
+0xFD   0x02DD  #DOUBLE ACUTE ACCENT
+0xFE   0x02DB  #OGONEK
+0xFF   0x02C7  #CARON
diff --git a/basis/io/encodings/8-bit/LATIN2.TXT b/basis/io/encodings/8-bit/LATIN2.TXT
new file mode 100644 (file)
index 0000000..90a6c0d
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp10029_MacLatin2 to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp10029_MacLatin2 code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp10029_MacLatin2 order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0A   0x000A  #LINE FEED
+0x0B   0x000B  #VERTICAL TABULATION
+0x0C   0x000C  #FORM FEED
+0x0D   0x000D  #CARRIAGE RETURN
+0x0E   0x000E  #SHIFT OUT
+0x0F   0x000F  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1A   0x001A  #SUBSTITUTE
+0x1B   0x001B  #ESCAPE
+0x1C   0x001C  #FILE SEPARATOR
+0x1D   0x001D  #GROUP SEPARATOR
+0x1E   0x001E  #RECORD SEPARATOR
+0x1F   0x001F  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x0025  #PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2A   0x002A  #ASTERISK
+0x2B   0x002B  #PLUS SIGN
+0x2C   0x002C  #COMMA
+0x2D   0x002D  #HYPHEN-MINUS
+0x2E   0x002E  #FULL STOP
+0x2F   0x002F  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3A   0x003A  #COLON
+0x3B   0x003B  #SEMICOLON
+0x3C   0x003C  #LESS-THAN SIGN
+0x3D   0x003D  #EQUALS SIGN
+0x3E   0x003E  #GREATER-THAN SIGN
+0x3F   0x003F  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4A   0x004A  #LATIN CAPITAL LETTER J
+0x4B   0x004B  #LATIN CAPITAL LETTER K
+0x4C   0x004C  #LATIN CAPITAL LETTER L
+0x4D   0x004D  #LATIN CAPITAL LETTER M
+0x4E   0x004E  #LATIN CAPITAL LETTER N
+0x4F   0x004F  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5A   0x005A  #LATIN CAPITAL LETTER Z
+0x5B   0x005B  #LEFT SQUARE BRACKET
+0x5C   0x005C  #REVERSE SOLIDUS
+0x5D   0x005D  #RIGHT SQUARE BRACKET
+0x5E   0x005E  #CIRCUMFLEX ACCENT
+0x5F   0x005F  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6A   0x006A  #LATIN SMALL LETTER J
+0x6B   0x006B  #LATIN SMALL LETTER K
+0x6C   0x006C  #LATIN SMALL LETTER L
+0x6D   0x006D  #LATIN SMALL LETTER M
+0x6E   0x006E  #LATIN SMALL LETTER N
+0x6F   0x006F  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7A   0x007A  #LATIN SMALL LETTER Z
+0x7B   0x007B  #LEFT CURLY BRACKET
+0x7C   0x007C  #VERTICAL LINE
+0x7D   0x007D  #RIGHT CURLY BRACKET
+0x7E   0x007E  #TILDE
+0x7F   0x007F  #DELETE
+0x80   0x00C4  #LATIN CAPITAL LETTER A WITH DIAERESIS
+0x81   0x0100  #LATIN CAPITAL LETTER A WITH MACRON
+0x82   0x0101  #LATIN SMALL LETTER A WITH MACRON
+0x83   0x00C9  #LATIN CAPITAL LETTER E WITH ACUTE
+0x84   0x0104  #LATIN CAPITAL LETTER A WITH OGONEK
+0x85   0x00D6  #LATIN CAPITAL LETTER O WITH DIAERESIS
+0x86   0x00DC  #LATIN CAPITAL LETTER U WITH DIAERESIS
+0x87   0x00E1  #LATIN SMALL LETTER A WITH ACUTE
+0x88   0x0105  #LATIN SMALL LETTER A WITH OGONEK
+0x89   0x010C  #LATIN CAPITAL LETTER C WITH CARON
+0x8A   0x00E4  #LATIN SMALL LETTER A WITH DIAERESIS
+0x8B   0x010D  #LATIN SMALL LETTER C WITH CARON
+0x8C   0x0106  #LATIN CAPITAL LETTER C WITH ACUTE
+0x8D   0x0107  #LATIN SMALL LETTER C WITH ACUTE
+0x8E   0x00E9  #LATIN SMALL LETTER E WITH ACUTE
+0x8F   0x0179  #LATIN CAPITAL LETTER Z WITH ACUTE
+0x90   0x017A  #LATIN SMALL LETTER Z WITH ACUTE
+0x91   0x010E  #LATIN CAPITAL LETTER D WITH CARON
+0x92   0x00ED  #LATIN SMALL LETTER I WITH ACUTE
+0x93   0x010F  #LATIN SMALL LETTER D WITH CARON
+0x94   0x0112  #LATIN CAPITAL LETTER E WITH MACRON
+0x95   0x0113  #LATIN SMALL LETTER E WITH MACRON
+0x96   0x0116  #LATIN CAPITAL LETTER E WITH DOT ABOVE
+0x97   0x00F3  #LATIN SMALL LETTER O WITH ACUTE
+0x98   0x0117  #LATIN SMALL LETTER E WITH DOT ABOVE
+0x99   0x00F4  #LATIN SMALL LETTER O WITH CIRCUMFLEX
+0x9A   0x00F6  #LATIN SMALL LETTER O WITH DIAERESIS
+0x9B   0x00F5  #LATIN SMALL LETTER O WITH TILDE
+0x9C   0x00FA  #LATIN SMALL LETTER U WITH ACUTE
+0x9D   0x011A  #LATIN CAPITAL LETTER E WITH CARON
+0x9E   0x011B  #LATIN SMALL LETTER E WITH CARON
+0x9F   0x00FC  #LATIN SMALL LETTER U WITH DIAERESIS
+0xA0   0x2020  #DAGGER
+0xA1   0x00B0  #DEGREE SIGN
+0xA2   0x0118  #LATIN CAPITAL LETTER E WITH OGONEK
+0xA3   0x00A3  #POUND SIGN
+0xA4   0x00A7  #SECTION SIGN
+0xA5   0x2022  #BULLET
+0xA6   0x00B6  #PILCROW SIGN
+0xA7   0x00DF  #LATIN SMALL LETTER SHARP S
+0xA8   0x00AE  #REGISTERED SIGN
+0xA9   0x00A9  #COPYRIGHT SIGN
+0xAA   0x2122  #TRADE MARK SIGN
+0xAB   0x0119  #LATIN SMALL LETTER E WITH OGONEK
+0xAC   0x00A8  #DIAERESIS
+0xAD   0x2260  #NOT EQUAL TO
+0xAE   0x0123  #LATIN SMALL LETTER G WITH CEDILLA
+0xAF   0x012E  #LATIN CAPITAL LETTER I WITH OGONEK
+0xB0   0x012F  #LATIN SMALL LETTER I WITH OGONEK
+0xB1   0x012A  #LATIN CAPITAL LETTER I WITH MACRON
+0xB2   0x2264  #LESS-THAN OR EQUAL TO
+0xB3   0x2265  #GREATER-THAN OR EQUAL TO
+0xB4   0x012B  #LATIN SMALL LETTER I WITH MACRON
+0xB5   0x0136  #LATIN CAPITAL LETTER K WITH CEDILLA
+0xB6   0x2202  #PARTIAL DIFFERENTIAL
+0xB7   0x2211  #N-ARY SUMMATION
+0xB8   0x0142  #LATIN SMALL LETTER L WITH STROKE
+0xB9   0x013B  #LATIN CAPITAL LETTER L WITH CEDILLA
+0xBA   0x013C  #LATIN SMALL LETTER L WITH CEDILLA
+0xBB   0x013D  #LATIN CAPITAL LETTER L WITH CARON
+0xBC   0x013E  #LATIN SMALL LETTER L WITH CARON
+0xBD   0x0139  #LATIN CAPITAL LETTER L WITH ACUTE
+0xBE   0x013A  #LATIN SMALL LETTER L WITH ACUTE
+0xBF   0x0145  #LATIN CAPITAL LETTER N WITH CEDILLA
+0xC0   0x0146  #LATIN SMALL LETTER N WITH CEDILLA
+0xC1   0x0143  #LATIN CAPITAL LETTER N WITH ACUTE
+0xC2   0x00AC  #NOT SIGN
+0xC3   0x221A  #SQUARE ROOT
+0xC4   0x0144  #LATIN SMALL LETTER N WITH ACUTE
+0xC5   0x0147  #LATIN CAPITAL LETTER N WITH CARON
+0xC6   0x2206  #INCREMENT
+0xC7   0x00AB  #LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xC8   0x00BB  #RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xC9   0x2026  #HORIZONTAL ELLIPSIS
+0xCA   0x00A0  #NO-BREAK SPACE
+0xCB   0x0148  #LATIN SMALL LETTER N WITH CARON
+0xCC   0x0150  #LATIN CAPITAL LETTER O WITH DOUBLE ACUTE
+0xCD   0x00D5  #LATIN CAPITAL LETTER O WITH TILDE
+0xCE   0x0151  #LATIN SMALL LETTER O WITH DOUBLE ACUTE
+0xCF   0x014C  #LATIN CAPITAL LETTER O WITH MACRON
+0xD0   0x2013  #EN DASH
+0xD1   0x2014  #EM DASH
+0xD2   0x201C  #LEFT DOUBLE QUOTATION MARK
+0xD3   0x201D  #RIGHT DOUBLE QUOTATION MARK
+0xD4   0x2018  #LEFT SINGLE QUOTATION MARK
+0xD5   0x2019  #RIGHT SINGLE QUOTATION MARK
+0xD6   0x00F7  #DIVISION SIGN
+0xD7   0x25CA  #LOZENGE
+0xD8   0x014D  #LATIN SMALL LETTER O WITH MACRON
+0xD9   0x0154  #LATIN CAPITAL LETTER R WITH ACUTE
+0xDA   0x0155  #LATIN SMALL LETTER R WITH ACUTE
+0xDB   0x0158  #LATIN CAPITAL LETTER R WITH CARON
+0xDC   0x2039  #SINGLE LEFT-POINTING ANGLE QUOTATION MARK
+0xDD   0x203A  #SINGLE RIGHT-POINTING ANGLE QUOTATION MARK
+0xDE   0x0159  #LATIN SMALL LETTER R WITH CARON
+0xDF   0x0156  #LATIN CAPITAL LETTER R WITH CEDILLA
+0xE0   0x0157  #LATIN SMALL LETTER R WITH CEDILLA
+0xE1   0x0160  #LATIN CAPITAL LETTER S WITH CARON
+0xE2   0x201A  #SINGLE LOW-9 QUOTATION MARK
+0xE3   0x201E  #DOUBLE LOW-9 QUOTATION MARK
+0xE4   0x0161  #LATIN SMALL LETTER S WITH CARON
+0xE5   0x015A  #LATIN CAPITAL LETTER S WITH ACUTE
+0xE6   0x015B  #LATIN SMALL LETTER S WITH ACUTE
+0xE7   0x00C1  #LATIN CAPITAL LETTER A WITH ACUTE
+0xE8   0x0164  #LATIN CAPITAL LETTER T WITH CARON
+0xE9   0x0165  #LATIN SMALL LETTER T WITH CARON
+0xEA   0x00CD  #LATIN CAPITAL LETTER I WITH ACUTE
+0xEB   0x017D  #LATIN CAPITAL LETTER Z WITH CARON
+0xEC   0x017E  #LATIN SMALL LETTER Z WITH CARON
+0xED   0x016A  #LATIN CAPITAL LETTER U WITH MACRON
+0xEE   0x00D3  #LATIN CAPITAL LETTER O WITH ACUTE
+0xEF   0x00D4  #LATIN CAPITAL LETTER O WITH CIRCUMFLEX
+0xF0   0x016B  #LATIN SMALL LETTER U WITH MACRON
+0xF1   0x016E  #LATIN CAPITAL LETTER U WITH RING ABOVE
+0xF2   0x00DA  #LATIN CAPITAL LETTER U WITH ACUTE
+0xF3   0x016F  #LATIN SMALL LETTER U WITH RING ABOVE
+0xF4   0x0170  #LATIN CAPITAL LETTER U WITH DOUBLE ACUTE
+0xF5   0x0171  #LATIN SMALL LETTER U WITH DOUBLE ACUTE
+0xF6   0x0172  #LATIN CAPITAL LETTER U WITH OGONEK
+0xF7   0x0173  #LATIN SMALL LETTER U WITH OGONEK
+0xF8   0x00DD  #LATIN CAPITAL LETTER Y WITH ACUTE
+0xF9   0x00FD  #LATIN SMALL LETTER Y WITH ACUTE
+0xFA   0x0137  #LATIN SMALL LETTER K WITH CEDILLA
+0xFB   0x017B  #LATIN CAPITAL LETTER Z WITH DOT ABOVE
+0xFC   0x0141  #LATIN CAPITAL LETTER L WITH STROKE
+0xFD   0x017C  #LATIN SMALL LETTER Z WITH DOT ABOVE
+0xFE   0x0122  #LATIN CAPITAL LETTER G WITH CEDILLA
+0xFF   0x02C7  #CARON
diff --git a/basis/io/encodings/8-bit/TURKISH.TXT b/basis/io/encodings/8-bit/TURKISH.TXT
new file mode 100644 (file)
index 0000000..fb12683
--- /dev/null
@@ -0,0 +1,273 @@
+#
+#    Name:     cp10081_MacTurkish to Unicode table
+#    Unicode version: 2.0
+#    Table version: 2.00
+#    Table format:  Format A
+#    Date:          04/24/96
+#    Contact: Shawn.Steele@microsoft.com
+#                   
+#    General notes: none
+#
+#    Format: Three tab-separated columns
+#        Column #1 is the cp10081_MacTurkish code (in hex)
+#        Column #2 is the Unicode (in hex as 0xXXXX)
+#        Column #3 is the Unicode name (follows a comment sign, '#')
+#
+#    The entries are in cp10081_MacTurkish order
+#
+0x00   0x0000  #NULL
+0x01   0x0001  #START OF HEADING
+0x02   0x0002  #START OF TEXT
+0x03   0x0003  #END OF TEXT
+0x04   0x0004  #END OF TRANSMISSION
+0x05   0x0005  #ENQUIRY
+0x06   0x0006  #ACKNOWLEDGE
+0x07   0x0007  #BELL
+0x08   0x0008  #BACKSPACE
+0x09   0x0009  #HORIZONTAL TABULATION
+0x0A   0x000A  #LINE FEED
+0x0B   0x000B  #VERTICAL TABULATION
+0x0C   0x000C  #FORM FEED
+0x0D   0x000D  #CARRIAGE RETURN
+0x0E   0x000E  #SHIFT OUT
+0x0F   0x000F  #SHIFT IN
+0x10   0x0010  #DATA LINK ESCAPE
+0x11   0x0011  #DEVICE CONTROL ONE
+0x12   0x0012  #DEVICE CONTROL TWO
+0x13   0x0013  #DEVICE CONTROL THREE
+0x14   0x0014  #DEVICE CONTROL FOUR
+0x15   0x0015  #NEGATIVE ACKNOWLEDGE
+0x16   0x0016  #SYNCHRONOUS IDLE
+0x17   0x0017  #END OF TRANSMISSION BLOCK
+0x18   0x0018  #CANCEL
+0x19   0x0019  #END OF MEDIUM
+0x1A   0x001A  #SUBSTITUTE
+0x1B   0x001B  #ESCAPE
+0x1C   0x001C  #FILE SEPARATOR
+0x1D   0x001D  #GROUP SEPARATOR
+0x1E   0x001E  #RECORD SEPARATOR
+0x1F   0x001F  #UNIT SEPARATOR
+0x20   0x0020  #SPACE
+0x21   0x0021  #EXCLAMATION MARK
+0x22   0x0022  #QUOTATION MARK
+0x23   0x0023  #NUMBER SIGN
+0x24   0x0024  #DOLLAR SIGN
+0x25   0x0025  #PERCENT SIGN
+0x26   0x0026  #AMPERSAND
+0x27   0x0027  #APOSTROPHE
+0x28   0x0028  #LEFT PARENTHESIS
+0x29   0x0029  #RIGHT PARENTHESIS
+0x2A   0x002A  #ASTERISK
+0x2B   0x002B  #PLUS SIGN
+0x2C   0x002C  #COMMA
+0x2D   0x002D  #HYPHEN-MINUS
+0x2E   0x002E  #FULL STOP
+0x2F   0x002F  #SOLIDUS
+0x30   0x0030  #DIGIT ZERO
+0x31   0x0031  #DIGIT ONE
+0x32   0x0032  #DIGIT TWO
+0x33   0x0033  #DIGIT THREE
+0x34   0x0034  #DIGIT FOUR
+0x35   0x0035  #DIGIT FIVE
+0x36   0x0036  #DIGIT SIX
+0x37   0x0037  #DIGIT SEVEN
+0x38   0x0038  #DIGIT EIGHT
+0x39   0x0039  #DIGIT NINE
+0x3A   0x003A  #COLON
+0x3B   0x003B  #SEMICOLON
+0x3C   0x003C  #LESS-THAN SIGN
+0x3D   0x003D  #EQUALS SIGN
+0x3E   0x003E  #GREATER-THAN SIGN
+0x3F   0x003F  #QUESTION MARK
+0x40   0x0040  #COMMERCIAL AT
+0x41   0x0041  #LATIN CAPITAL LETTER A
+0x42   0x0042  #LATIN CAPITAL LETTER B
+0x43   0x0043  #LATIN CAPITAL LETTER C
+0x44   0x0044  #LATIN CAPITAL LETTER D
+0x45   0x0045  #LATIN CAPITAL LETTER E
+0x46   0x0046  #LATIN CAPITAL LETTER F
+0x47   0x0047  #LATIN CAPITAL LETTER G
+0x48   0x0048  #LATIN CAPITAL LETTER H
+0x49   0x0049  #LATIN CAPITAL LETTER I
+0x4A   0x004A  #LATIN CAPITAL LETTER J
+0x4B   0x004B  #LATIN CAPITAL LETTER K
+0x4C   0x004C  #LATIN CAPITAL LETTER L
+0x4D   0x004D  #LATIN CAPITAL LETTER M
+0x4E   0x004E  #LATIN CAPITAL LETTER N
+0x4F   0x004F  #LATIN CAPITAL LETTER O
+0x50   0x0050  #LATIN CAPITAL LETTER P
+0x51   0x0051  #LATIN CAPITAL LETTER Q
+0x52   0x0052  #LATIN CAPITAL LETTER R
+0x53   0x0053  #LATIN CAPITAL LETTER S
+0x54   0x0054  #LATIN CAPITAL LETTER T
+0x55   0x0055  #LATIN CAPITAL LETTER U
+0x56   0x0056  #LATIN CAPITAL LETTER V
+0x57   0x0057  #LATIN CAPITAL LETTER W
+0x58   0x0058  #LATIN CAPITAL LETTER X
+0x59   0x0059  #LATIN CAPITAL LETTER Y
+0x5A   0x005A  #LATIN CAPITAL LETTER Z
+0x5B   0x005B  #LEFT SQUARE BRACKET
+0x5C   0x005C  #REVERSE SOLIDUS
+0x5D   0x005D  #RIGHT SQUARE BRACKET
+0x5E   0x005E  #CIRCUMFLEX ACCENT
+0x5F   0x005F  #LOW LINE
+0x60   0x0060  #GRAVE ACCENT
+0x61   0x0061  #LATIN SMALL LETTER A
+0x62   0x0062  #LATIN SMALL LETTER B
+0x63   0x0063  #LATIN SMALL LETTER C
+0x64   0x0064  #LATIN SMALL LETTER D
+0x65   0x0065  #LATIN SMALL LETTER E
+0x66   0x0066  #LATIN SMALL LETTER F
+0x67   0x0067  #LATIN SMALL LETTER G
+0x68   0x0068  #LATIN SMALL LETTER H
+0x69   0x0069  #LATIN SMALL LETTER I
+0x6A   0x006A  #LATIN SMALL LETTER J
+0x6B   0x006B  #LATIN SMALL LETTER K
+0x6C   0x006C  #LATIN SMALL LETTER L
+0x6D   0x006D  #LATIN SMALL LETTER M
+0x6E   0x006E  #LATIN SMALL LETTER N
+0x6F   0x006F  #LATIN SMALL LETTER O
+0x70   0x0070  #LATIN SMALL LETTER P
+0x71   0x0071  #LATIN SMALL LETTER Q
+0x72   0x0072  #LATIN SMALL LETTER R
+0x73   0x0073  #LATIN SMALL LETTER S
+0x74   0x0074  #LATIN SMALL LETTER T
+0x75   0x0075  #LATIN SMALL LETTER U
+0x76   0x0076  #LATIN SMALL LETTER V
+0x77   0x0077  #LATIN SMALL LETTER W
+0x78   0x0078  #LATIN SMALL LETTER X
+0x79   0x0079  #LATIN SMALL LETTER Y
+0x7A   0x007A  #LATIN SMALL LETTER Z
+0x7B   0x007B  #LEFT CURLY BRACKET
+0x7C   0x007C  #VERTICAL LINE
+0x7D   0x007D  #RIGHT CURLY BRACKET
+0x7E   0x007E  #TILDE
+0x7F   0x007F  #DELETE
+0x80   0x00C4  #LATIN CAPITAL LETTER A WITH DIAERESIS
+0x81   0x00C5  #LATIN CAPITAL LETTER A WITH RING ABOVE
+0x82   0x00C7  #LATIN CAPITAL LETTER C WITH CEDILLA
+0x83   0x00C9  #LATIN CAPITAL LETTER E WITH ACUTE
+0x84   0x00D1  #LATIN CAPITAL LETTER N WITH TILDE
+0x85   0x00D6  #LATIN CAPITAL LETTER O WITH DIAERESIS
+0x86   0x00DC  #LATIN CAPITAL LETTER U WITH DIAERESIS
+0x87   0x00E1  #LATIN SMALL LETTER A WITH ACUTE
+0x88   0x00E0  #LATIN SMALL LETTER A WITH GRAVE
+0x89   0x00E2  #LATIN SMALL LETTER A WITH CIRCUMFLEX
+0x8A   0x00E4  #LATIN SMALL LETTER A WITH DIAERESIS
+0x8B   0x00E3  #LATIN SMALL LETTER A WITH TILDE
+0x8C   0x00E5  #LATIN SMALL LETTER A WITH RING ABOVE
+0x8D   0x00E7  #LATIN SMALL LETTER C WITH CEDILLA
+0x8E   0x00E9  #LATIN SMALL LETTER E WITH ACUTE
+0x8F   0x00E8  #LATIN SMALL LETTER E WITH GRAVE
+0x90   0x00EA  #LATIN SMALL LETTER E WITH CIRCUMFLEX
+0x91   0x00EB  #LATIN SMALL LETTER E WITH DIAERESIS
+0x92   0x00ED  #LATIN SMALL LETTER I WITH ACUTE
+0x93   0x00EC  #LATIN SMALL LETTER I WITH GRAVE
+0x94   0x00EE  #LATIN SMALL LETTER I WITH CIRCUMFLEX
+0x95   0x00EF  #LATIN SMALL LETTER I WITH DIAERESIS
+0x96   0x00F1  #LATIN SMALL LETTER N WITH TILDE
+0x97   0x00F3  #LATIN SMALL LETTER O WITH ACUTE
+0x98   0x00F2  #LATIN SMALL LETTER O WITH GRAVE
+0x99   0x00F4  #LATIN SMALL LETTER O WITH CIRCUMFLEX
+0x9A   0x00F6  #LATIN SMALL LETTER O WITH DIAERESIS
+0x9B   0x00F5  #LATIN SMALL LETTER O WITH TILDE
+0x9C   0x00FA  #LATIN SMALL LETTER U WITH ACUTE
+0x9D   0x00F9  #LATIN SMALL LETTER U WITH GRAVE
+0x9E   0x00FB  #LATIN SMALL LETTER U WITH CIRCUMFLEX
+0x9F   0x00FC  #LATIN SMALL LETTER U WITH DIAERESIS
+0xA0   0x2020  #DAGGER
+0xA1   0x00B0  #DEGREE SIGN
+0xA2   0x00A2  #CENT SIGN
+0xA3   0x00A3  #POUND SIGN
+0xA4   0x00A7  #SECTION SIGN
+0xA5   0x2022  #BULLET
+0xA6   0x00B6  #PILCROW SIGN
+0xA7   0x00DF  #LATIN SMALL LETTER SHARP S
+0xA8   0x00AE  #REGISTERED SIGN
+0xA9   0x00A9  #COPYRIGHT SIGN
+0xAA   0x2122  #TRADE MARK SIGN
+0xAB   0x00B4  #ACUTE ACCENT
+0xAC   0x00A8  #DIAERESIS
+0xAD   0x2260  #NOT EQUAL TO
+0xAE   0x00C6  #LATIN CAPITAL LIGATURE AE
+0xAF   0x00D8  #LATIN CAPITAL LETTER O WITH STROKE
+0xB0   0x221E  #INFINITY
+0xB1   0x00B1  #PLUS-MINUS SIGN
+0xB2   0x2264  #LESS-THAN OR EQUAL TO
+0xB3   0x2265  #GREATER-THAN OR EQUAL TO
+0xB4   0x00A5  #YEN SIGN
+0xB5   0x00B5  #MICRO SIGN
+0xB6   0x2202  #PARTIAL DIFFERENTIAL
+0xB7   0x2211  #N-ARY SUMMATION
+0xB8   0x220F  #N-ARY PRODUCT
+0xB9   0x03C0  #GREEK SMALL LETTER PI
+0xBA   0x222B  #INTEGRAL
+0xBB   0x00AA  #FEMININE ORDINAL INDICATOR
+0xBC   0x00BA  #MASCULINE ORDINAL INDICATOR
+0xBD   0x2126  #OHM SIGN
+0xBE   0x00E6  #LATIN SMALL LIGATURE AE
+0xBF   0x00F8  #LATIN SMALL LETTER O WITH STROKE
+0xC0   0x00BF  #INVERTED QUESTION MARK
+0xC1   0x00A1  #INVERTED EXCLAMATION MARK
+0xC2   0x00AC  #NOT SIGN
+0xC3   0x221A  #SQUARE ROOT
+0xC4   0x0192  #LATIN SMALL LETTER F WITH HOOK
+0xC5   0x2248  #ALMOST EQUAL TO
+0xC6   0x2206  #INCREMENT
+0xC7   0x00AB  #LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xC8   0x00BB  #RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
+0xC9   0x2026  #HORIZONTAL ELLIPSIS
+0xCA   0x00A0  #NO-BREAK SPACE
+0xCB   0x00C0  #LATIN CAPITAL LETTER A WITH GRAVE
+0xCC   0x00C3  #LATIN CAPITAL LETTER A WITH TILDE
+0xCD   0x00D5  #LATIN CAPITAL LETTER O WITH TILDE
+0xCE   0x0152  #LATIN CAPITAL LIGATURE OE
+0xCF   0x0153  #LATIN SMALL LIGATURE OE
+0xD0   0x2013  #EN DASH
+0xD1   0x2014  #EM DASH
+0xD2   0x201C  #LEFT DOUBLE QUOTATION MARK
+0xD3   0x201D  #RIGHT DOUBLE QUOTATION MARK
+0xD4   0x2018  #LEFT SINGLE QUOTATION MARK
+0xD5   0x2019  #RIGHT SINGLE QUOTATION MARK
+0xD6   0x00F7  #DIVISION SIGN
+0xD7   0x25CA  #LOZENGE
+0xD8   0x00FF  #LATIN SMALL LETTER Y WITH DIAERESIS
+0xD9   0x0178  #LATIN CAPITAL LETTER Y WITH DIAERESIS
+0xDA   0x011E  #LATIN CAPITAL LETTER G WITH BREVE
+0xDB   0x011F  #LATIN SMALL LETTER G WITH BREVE
+0xDC   0x0130  #LATIN CAPITAL LETTER I WITH DOT ABOVE
+0xDD   0x0131  #LATIN SMALL LETTER DOTLESS I
+0xDE   0x015E  #LATIN CAPITAL LETTER S WITH CEDILLA
+0xDF   0x015F  #LATIN SMALL LETTER S WITH CEDILLA
+0xE0   0x2021  #DOUBLE DAGGER
+0xE1   0x00B7  #MIDDLE DOT
+0xE2   0x201A  #SINGLE LOW-9 QUOTATION MARK
+0xE3   0x201E  #DOUBLE LOW-9 QUOTATION MARK
+0xE4   0x2030  #PER MILLE SIGN
+0xE5   0x00C2  #LATIN CAPITAL LETTER A WITH CIRCUMFLEX
+0xE6   0x00CA  #LATIN CAPITAL LETTER E WITH CIRCUMFLEX
+0xE7   0x00C1  #LATIN CAPITAL LETTER A WITH ACUTE
+0xE8   0x00CB  #LATIN CAPITAL LETTER E WITH DIAERESIS
+0xE9   0x00C8  #LATIN CAPITAL LETTER E WITH GRAVE
+0xEA   0x00CD  #LATIN CAPITAL LETTER I WITH ACUTE
+0xEB   0x00CE  #LATIN CAPITAL LETTER I WITH CIRCUMFLEX
+0xEC   0x00CF  #LATIN CAPITAL LETTER I WITH DIAERESIS
+0xED   0x00CC  #LATIN CAPITAL LETTER I WITH GRAVE
+0xEE   0x00D3  #LATIN CAPITAL LETTER O WITH ACUTE
+0xEF   0x00D4  #LATIN CAPITAL LETTER O WITH CIRCUMFLEX
+0xF0           #UNDEFINED
+0xF1   0x00D2  #LATIN CAPITAL LETTER O WITH GRAVE
+0xF2   0x00DA  #LATIN CAPITAL LETTER U WITH ACUTE
+0xF3   0x00DB  #LATIN CAPITAL LETTER U WITH CIRCUMFLEX
+0xF4   0x00D9  #LATIN CAPITAL LETTER U WITH GRAVE
+0xF5           #UNDEFINED
+0xF6   0x02C6  #MODIFIER LETTER CIRCUMFLEX ACCENT
+0xF7   0x02DC  #SMALL TILDE
+0xF8   0x00AF  #MACRON
+0xF9   0x02D8  #BREVE
+0xFA   0x02D9  #DOT ABOVE
+0xFB   0x02DA  #RING ABOVE
+0xFC   0x00B8  #CEDILLA
+0xFD   0x02DD  #DOUBLE ACUTE ACCENT
+0xFE   0x02DB  #OGONEK
+0xFF   0x02C7  #CARON
diff --git a/basis/io/encodings/8-bit/arabic/arabic-docs.factor b/basis/io/encodings/8-bit/arabic/arabic-docs.factor
deleted file mode 100644 (file)
index 245085d..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.arabic
-
-HELP: latin/arabic
-{ $var-description "This is the ISO-8859-6 encoding, also called Latin/Arabic. It is an 8-bit superset of ASCII and provides the characters necessary for Arabic, though not other languages which use Arabic script." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.arabic" "Arabic encoding"
-"The " { $vocab-link "io.encodings.8-bit.arabic" } " vocabulary provides the " { $link latin/arabic } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.arabic"
diff --git a/basis/io/encodings/8-bit/arabic/arabic.factor b/basis/io/encodings/8-bit/arabic/arabic.factor
deleted file mode 100644 (file)
index 5a80921..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.arabic
-
-8-BIT: latin/arabic ISO_8859-6:1987 8859-6
diff --git a/basis/io/encodings/8-bit/arabic/authors.txt b/basis/io/encodings/8-bit/arabic/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/cp437/authors.txt b/basis/io/encodings/8-bit/cp437/authors.txt
deleted file mode 100644 (file)
index 8e1955f..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Alexander Ilin
diff --git a/basis/io/encodings/8-bit/cp437/cp437-docs.factor b/basis/io/encodings/8-bit/cp437/cp437-docs.factor
deleted file mode 100644 (file)
index b9a1b25..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2016 Alexander Ilin.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.cp437
-
-HELP: cp437
-{ $var-description "This is the IBM437 encoding, also called CP437. It is an 8-bit superset of ASCII and provides the original DOS character set with the box-drawing characters used to draw windows and frames on the text terminals back in the day." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.cp437" "CP437 encoding"
-"The " { $vocab-link "io.encodings.8-bit.cp437" } " vocabulary provides the " { $link cp437 } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.cp437"
diff --git a/basis/io/encodings/8-bit/cp437/cp437.factor b/basis/io/encodings/8-bit/cp437/cp437.factor
deleted file mode 100644 (file)
index 5c56001..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2016 Alexander Ilin.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.cp437
-
-8-BIT: cp437 IBM437 CP437
diff --git a/basis/io/encodings/8-bit/cyrillic/authors.txt b/basis/io/encodings/8-bit/cyrillic/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/cyrillic/cyrillic-docs.factor b/basis/io/encodings/8-bit/cyrillic/cyrillic-docs.factor
deleted file mode 100644 (file)
index 6524faa..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.cyrillic
-
-HELP: latin/cyrillic
-{ $var-description "This is the ISO-8859-5 encoding, also called Latin/Cyrillic. It is an 8-bit superset of ASCII and provides the characters necessary for most languages which use Cyrilic, including Russian, Macedonian, Belarusian, Bulgarian, Serbian, and Ukrainian. KOI8-R is used much more commonly." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.cyrillic" "Cyrillic encoding"
-"The " { $vocab-link "io.encodings.8-bit.cyrillic" } " vocabulary provides the " { $link latin/cyrillic } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.cyrillic"
diff --git a/basis/io/encodings/8-bit/cyrillic/cyrillic.factor b/basis/io/encodings/8-bit/cyrillic/cyrillic.factor
deleted file mode 100644 (file)
index 13cfbc0..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.cyrillic
-
-8-BIT: latin/cyrillic ISO_8859-5:1988 8859-5
diff --git a/basis/io/encodings/8-bit/ebcdic/authors.txt b/basis/io/encodings/8-bit/ebcdic/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/ebcdic/ebcdic-docs.factor b/basis/io/encodings/8-bit/ebcdic/ebcdic-docs.factor
deleted file mode 100644 (file)
index d2dd101..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.ebcdic
-
-HELP: ebcdic
-{ $var-description "EBCDIC is an 8-bit legacy encoding designed for IBM mainframes like System/360 in the 1960s. It has since fallen into disuse. It contains large unallocated regions, and the version included here (code page 37) contains auxiliary characters in this region for English- and Portugese-speaking countries." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.ebcdic" "EBCDIC encoding"
-"The " { $vocab-link "io.encodings.8-bit.ebcdic" } " vocabulary provides the " { $link ebcdic } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.ebcdic"
diff --git a/basis/io/encodings/8-bit/ebcdic/ebcdic.factor b/basis/io/encodings/8-bit/ebcdic/ebcdic.factor
deleted file mode 100644 (file)
index fd8f29c..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.ebcdic
-
-8-BIT: ebcdic IBM037 CP037
diff --git a/basis/io/encodings/8-bit/greek/authors.txt b/basis/io/encodings/8-bit/greek/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/greek/greek-docs.factor b/basis/io/encodings/8-bit/greek/greek-docs.factor
deleted file mode 100644 (file)
index fb44698..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.greek
-
-HELP: latin/greek
-{ $description "This is the ISO-8859-7 encoding, also called Latin/Greek. It is an 8-bit superset of ASCII and provides the characters necessary for Greek written in modern monotonic orthography, or ancient Greek without accent marks." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.greek" "Greek encoding"
-"The " { $vocab-link "io.encodings.8-bit.greek" } " vocabulary provides the " { $link latin/greek } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.greek"
diff --git a/basis/io/encodings/8-bit/greek/greek.factor b/basis/io/encodings/8-bit/greek/greek.factor
deleted file mode 100644 (file)
index 98eb09a..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.greek
-
-8-BIT: latin/greek ISO_8859-7:1987 8859-7
diff --git a/basis/io/encodings/8-bit/hebrew/authors.txt b/basis/io/encodings/8-bit/hebrew/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/hebrew/hebrew-docs.factor b/basis/io/encodings/8-bit/hebrew/hebrew-docs.factor
deleted file mode 100644 (file)
index 43433e2..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.hebrew
-
-HELP: latin/hebrew
-{ $var-description "This is the ISO-8859-8 encoding, also called Latin/Hebrew. It is an 8-bit superset of ASCII and provides the characters necessary for modern Hebrew without explicit vowels. Generally, this is interpreted in logical order, making it ISO-8859-8-I, technically." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.hebrew" "Hebrew encoding"
-"The " { $vocab-link "io.encodings.8-bit.hebrew" } " vocabulary provides the " { $link latin/hebrew } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.hebrew"
diff --git a/basis/io/encodings/8-bit/hebrew/hebrew.factor b/basis/io/encodings/8-bit/hebrew/hebrew.factor
deleted file mode 100644 (file)
index 6619f64..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.hebrew
-
-8-BIT: latin/hebrew ISO_8859-8:1988 8859-8
diff --git a/basis/io/encodings/8-bit/koi8-r/authors.txt b/basis/io/encodings/8-bit/koi8-r/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/koi8-r/koi8-r-docs.factor b/basis/io/encodings/8-bit/koi8-r/koi8-r-docs.factor
deleted file mode 100644 (file)
index d63d377..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.koi8-r
-
-HELP: koi8-r
-{ $var-description "KOI8-R is an 8-bit superset of ASCII which encodes the Cyrillic alphabet, as used in Russian and Bulgarian. Characters are in such an order that, if the eight bit is stripped, text is still interpretable as ASCII. Block-building characters also exist." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.koi8-r" "KOI8-R encoding"
-"The " { $vocab-link "io.encodings.8-bit.koi8-r" } " vocabulary provides the " { $link koi8-r } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.koi8-r"
diff --git a/basis/io/encodings/8-bit/koi8-r/koi8-r.factor b/basis/io/encodings/8-bit/koi8-r/koi8-r.factor
deleted file mode 100644 (file)
index 6203fbd..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.koi8-r
-
-8-BIT: koi8-r KOI8-R KOI8-R
diff --git a/basis/io/encodings/8-bit/latin1/authors.txt b/basis/io/encodings/8-bit/latin1/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/latin1/latin1-docs.factor b/basis/io/encodings/8-bit/latin1/latin1-docs.factor
deleted file mode 100644 (file)
index a5c9bd7..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.latin1
-
-HELP: latin1
-{ $var-description "This is the ISO-8859-1 encoding, also called Latin-1: Western European. It is an 8-bit superset of ASCII which is the default for a mimetype starting with 'text' and provides the characters necessary for most western European languages." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.latin1" "Latin1 encoding"
-"The " { $vocab-link "io.encodings.8-bit.latin1" } " vocabulary provides the " { $link latin1 } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.latin1"
diff --git a/basis/io/encodings/8-bit/latin1/latin1.factor b/basis/io/encodings/8-bit/latin1/latin1.factor
deleted file mode 100644 (file)
index 17a2941..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.latin1
-
-8-BIT: latin1 ISO_8859-1:1987 8859-1
diff --git a/basis/io/encodings/8-bit/latin10/authors.txt b/basis/io/encodings/8-bit/latin10/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/latin10/latin10-docs.factor b/basis/io/encodings/8-bit/latin10/latin10-docs.factor
deleted file mode 100644 (file)
index da06009..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.latin10
-
-HELP: latin10
-{ $var-description "This is the ISO-8859-16 encoding, also called Latin-10: South-Eastern European. It is an 8-bit superset of ASCII." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.latin10" "Latin10 encoding"
-"The " { $vocab-link "io.encodings.8-bit.latin10" } " vocabulary provides the " { $link latin10 } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.latin10"
diff --git a/basis/io/encodings/8-bit/latin10/latin10.factor b/basis/io/encodings/8-bit/latin10/latin10.factor
deleted file mode 100644 (file)
index 86831d4..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.latin10
-
-8-BIT: latin10 ISO-8859-16 8859-16
diff --git a/basis/io/encodings/8-bit/latin2/authors.txt b/basis/io/encodings/8-bit/latin2/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/latin2/latin2-docs.factor b/basis/io/encodings/8-bit/latin2/latin2-docs.factor
deleted file mode 100644 (file)
index 7b7e2ce..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.latin2
-
-HELP: latin2
-{ $var-description "This is the ISO-8859-2 encoding, also called Latin-2: Eastern European. It is an 8-bit superset of ASCII and provides the characters necessary for most eastern European languages." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.latin2" "Latin2 encoding"
-"The " { $vocab-link "io.encodings.8-bit.latin2" } " vocabulary provides the " { $link latin2 } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.latin2"
diff --git a/basis/io/encodings/8-bit/latin2/latin2.factor b/basis/io/encodings/8-bit/latin2/latin2.factor
deleted file mode 100644 (file)
index 52ecc64..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.latin2
-
-8-BIT: latin2 ISO_8859-2:1987 8859-2
diff --git a/basis/io/encodings/8-bit/latin3/authors.txt b/basis/io/encodings/8-bit/latin3/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/latin3/latin3-docs.factor b/basis/io/encodings/8-bit/latin3/latin3-docs.factor
deleted file mode 100644 (file)
index ea99693..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.latin3
-
-HELP: latin3
-{ $var-description "This is the ISO-8859-3 encoding, also called Latin-3: South European. It is an 8-bit superset of ASCII and provides the characters necessary for Turkish, Maltese and Esperanto." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.latin3" "Latin3 encoding"
-"The " { $vocab-link "io.encodings.8-bit.latin3" } " vocabulary provides the " { $link latin3 } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.latin3"
diff --git a/basis/io/encodings/8-bit/latin3/latin3.factor b/basis/io/encodings/8-bit/latin3/latin3.factor
deleted file mode 100644 (file)
index a9a6333..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.latin3
-
-8-BIT: latin3 ISO_8859-3:1988 8859-3
diff --git a/basis/io/encodings/8-bit/latin4/authors.txt b/basis/io/encodings/8-bit/latin4/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/latin4/latin4-docs.factor b/basis/io/encodings/8-bit/latin4/latin4-docs.factor
deleted file mode 100644 (file)
index 7d69bd9..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.latin4
-
-HELP: latin4
-{ $description "This is the ISO-8859-4 encoding, also called Latin-4: North European. It is an 8-bit superset of ASCII and provides the characters necessary for Latvian, Lithuanian, Estonian, Greenlandic and Sami." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.latin4" "Latin4 encoding"
-"The " { $vocab-link "io.encodings.8-bit.latin4" } " vocabulary provides the " { $link latin4 } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.latin4"
diff --git a/basis/io/encodings/8-bit/latin4/latin4.factor b/basis/io/encodings/8-bit/latin4/latin4.factor
deleted file mode 100644 (file)
index ab5df96..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.latin4
-
-8-BIT: latin4 ISO_8859-4:1988 8859-4
diff --git a/basis/io/encodings/8-bit/latin5/authors.txt b/basis/io/encodings/8-bit/latin5/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/latin5/latin5-docs.factor b/basis/io/encodings/8-bit/latin5/latin5-docs.factor
deleted file mode 100644 (file)
index 6afba4b..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.latin5
-
-HELP: latin5
-{ $var-description "This is the ISO-8859-9 encoding, also called Latin-5: Turkish. It is an 8-bit superset of ASCII and provides the characters necessary for Turkish, similar to Latin-1 but replacing the spots used for Icelandic with characters used in Turkish." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.latin5" "Latin5 encoding"
-"The " { $vocab-link "io.encodings.8-bit.latin5" } " vocabulary provides the " { $link latin5 } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.latin5"
diff --git a/basis/io/encodings/8-bit/latin5/latin5.factor b/basis/io/encodings/8-bit/latin5/latin5.factor
deleted file mode 100644 (file)
index 502c10f..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.latin5
-
-8-BIT: latin5 ISO_8859-9:1989 8859-9
diff --git a/basis/io/encodings/8-bit/latin6/authors.txt b/basis/io/encodings/8-bit/latin6/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/latin6/latin6-docs.factor b/basis/io/encodings/8-bit/latin6/latin6-docs.factor
deleted file mode 100644 (file)
index 2f470ff..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.latin6
-
-HELP: latin6
-{ $var-description "This is the ISO-8859-10 encoding, also called Latin-6: Nordic. It is an 8-bit superset of ASCII containing the same characters as Latin-4, but rearranged to be of better use to nordic languages." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.latin6" "Latin6 encoding"
-"The " { $vocab-link "io.encodings.8-bit.latin6" } " vocabulary provides the " { $link latin6 } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.latin6"
diff --git a/basis/io/encodings/8-bit/latin6/latin6.factor b/basis/io/encodings/8-bit/latin6/latin6.factor
deleted file mode 100644 (file)
index 72f3e72..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.latin6
-
-8-BIT: latin6 ISO-8859-10 8859-10
diff --git a/basis/io/encodings/8-bit/latin7/authors.txt b/basis/io/encodings/8-bit/latin7/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/latin7/latin7-docs.factor b/basis/io/encodings/8-bit/latin7/latin7-docs.factor
deleted file mode 100644 (file)
index 8144702..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.latin7
-
-HELP: latin7
-{ $var-description "This is the ISO-8859-13 encoding, also called Latin-7: Baltic Rim. It is an 8-bit superset of ASCII containing all characters necessary to represent Baltic Rim languages, as previous character sets were incomplete." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.latin7" "Latin7 encoding"
-"The " { $vocab-link "io.encodings.8-bit.latin7" } " vocabulary provides the " { $link latin7 } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.latin7"
diff --git a/basis/io/encodings/8-bit/latin7/latin7.factor b/basis/io/encodings/8-bit/latin7/latin7.factor
deleted file mode 100644 (file)
index 862daae..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.latin7
-
-8-BIT: latin7 ISO-8859-13 8859-13
diff --git a/basis/io/encodings/8-bit/latin8/authors.txt b/basis/io/encodings/8-bit/latin8/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/latin8/latin8-docs.factor b/basis/io/encodings/8-bit/latin8/latin8-docs.factor
deleted file mode 100644 (file)
index ce1fea6..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.latin8
-
-HELP: latin8
-{ $var-description "This is the ISO-8859-14 encoding, also called Latin-8: Celtic. It is an 8-bit superset of ASCII designed for Celtic languages like Gaelic and Breton." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.latin8" "Latin8 encoding"
-"The " { $vocab-link "io.encodings.8-bit.latin8" } " vocabulary provides the " { $link latin8 } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.latin8"
diff --git a/basis/io/encodings/8-bit/latin8/latin8.factor b/basis/io/encodings/8-bit/latin8/latin8.factor
deleted file mode 100644 (file)
index e925737..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.latin8
-
-8-BIT: latin8 ISO-8859-14 8859-14
diff --git a/basis/io/encodings/8-bit/latin9/authors.txt b/basis/io/encodings/8-bit/latin9/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/latin9/latin9-docs.factor b/basis/io/encodings/8-bit/latin9/latin9-docs.factor
deleted file mode 100644 (file)
index ffb1928..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.latin9
-
-HELP: latin9
-{ $var-description "This is the ISO-8859-15 encoding, also called Latin-9 and unofficially as Latin-0. It is an 8-bit superset of ASCII designed as a modification of Latin-1, removing little-used characters in favor of the Euro symbol and other characters." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.latin9" "Latin9 encoding"
-"The " { $vocab-link "io.encodings.8-bit.latin9" } " vocabulary provides the " { $link latin9 } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.latin9"
diff --git a/basis/io/encodings/8-bit/latin9/latin9.factor b/basis/io/encodings/8-bit/latin9/latin9.factor
deleted file mode 100644 (file)
index b55ecb3..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.latin9
-
-8-BIT: latin9 ISO-8859-15 8859-15
diff --git a/basis/io/encodings/8-bit/mac-roman/authors.txt b/basis/io/encodings/8-bit/mac-roman/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/mac-roman/mac-roman-docs.factor b/basis/io/encodings/8-bit/mac-roman/mac-roman-docs.factor
deleted file mode 100644 (file)
index 1fd061a..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.mac-roman
-
-HELP: mac-roman
-{ $var-description "Mac Roman is an 8-bit superset of ASCII which was the standard encoding on Mac OS prior to version 10. It is incompatible with Latin-1 in all but a few places and ASCII, and it is suitable for encoding many Western European languages." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.mac-roman" "Mac Roman encoding"
-"The " { $vocab-link "io.encodings.8-bit.mac-roman" } " vocabulary provides the " { $link mac-roman } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.mac-roman"
diff --git a/basis/io/encodings/8-bit/mac-roman/mac-roman.factor b/basis/io/encodings/8-bit/mac-roman/mac-roman.factor
deleted file mode 100644 (file)
index 0b70765..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.mac-roman
-
-8-BIT: mac-roman macintosh ROMAN
diff --git a/basis/io/encodings/8-bit/thai/authors.txt b/basis/io/encodings/8-bit/thai/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/thai/thai-docs.factor b/basis/io/encodings/8-bit/thai/thai-docs.factor
deleted file mode 100644 (file)
index 0796bbe..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.thai
-
-HELP: latin/thai
-{ $var-description "This is the ISO-8859-11 encoding, also called Latin/Thai. It is an 8-bit superset of ASCII containing the characters necessary to represent Thai. It is basically identical to TIS-620." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.thai" "Thai encoding"
-"The " { $vocab-link "io.encodings.8-bit.thai" } " vocabulary provides the " { $link latin/thai } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.thai"
diff --git a/basis/io/encodings/8-bit/thai/thai.factor b/basis/io/encodings/8-bit/thai/thai.factor
deleted file mode 100644 (file)
index 8d119f6..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.thai
-
-8-BIT: latin/thai TIS-620 8859-11
diff --git a/basis/io/encodings/8-bit/windows-1250/authors.txt b/basis/io/encodings/8-bit/windows-1250/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/windows-1250/windows-1250.factor b/basis/io/encodings/8-bit/windows-1250/windows-1250.factor
deleted file mode 100644 (file)
index 745ebe4..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.windows-1250
-
-8-BIT: windows-1250 windows-1250 CP1250
diff --git a/basis/io/encodings/8-bit/windows-1251/authors.txt b/basis/io/encodings/8-bit/windows-1251/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/windows-1251/windows-1251.factor b/basis/io/encodings/8-bit/windows-1251/windows-1251.factor
deleted file mode 100644 (file)
index 3c50d3c..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.windows-1251
-
-8-BIT: windows-1251 windows-1251 CP1251
diff --git a/basis/io/encodings/8-bit/windows-1252/authors.txt b/basis/io/encodings/8-bit/windows-1252/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/windows-1252/windows-1252-docs.factor b/basis/io/encodings/8-bit/windows-1252/windows-1252-docs.factor
deleted file mode 100644 (file)
index ed5e480..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: help.markup help.syntax ;
-IN: io.encodings.8-bit.windows-1252
-
-HELP: windows-1252
-{ $var-description "Windows 1252 is an 8-bit superset of ASCII which is closely related to Latin-1. Control characters in the 0x80 to 0x9F range are replaced with printable characters such as the Euro symbol." }
-{ $see-also "encodings-introduction" } ;
-
-ARTICLE: "io.encodings.8-bit.windows-1252" "Windows 1252 encoding"
-"The " { $vocab-link "io.encodings.8-bit.windows-1252" } " vocabulary provides the " { $link windows-1252 } " encoding." ;
-
-ABOUT: "io.encodings.8-bit.windows-1252"
diff --git a/basis/io/encodings/8-bit/windows-1252/windows-1252.factor b/basis/io/encodings/8-bit/windows-1252/windows-1252.factor
deleted file mode 100644 (file)
index ddcc4df..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.windows-1252
-
-8-BIT: windows-1252 windows-1252 CP1252
diff --git a/basis/io/encodings/8-bit/windows-1253/authors.txt b/basis/io/encodings/8-bit/windows-1253/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/windows-1253/windows-1253.factor b/basis/io/encodings/8-bit/windows-1253/windows-1253.factor
deleted file mode 100644 (file)
index ba335be..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.windows-1253
-
-8-BIT: windows-1253 windows-1253 CP1253
diff --git a/basis/io/encodings/8-bit/windows-1254/authors.txt b/basis/io/encodings/8-bit/windows-1254/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/windows-1254/windows-1254.factor b/basis/io/encodings/8-bit/windows-1254/windows-1254.factor
deleted file mode 100644 (file)
index 982d21a..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.windows-1254
-
-8-BIT: windows-1254 windows-1254 CP1254
diff --git a/basis/io/encodings/8-bit/windows-1255/authors.txt b/basis/io/encodings/8-bit/windows-1255/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/windows-1255/windows-1255.factor b/basis/io/encodings/8-bit/windows-1255/windows-1255.factor
deleted file mode 100644 (file)
index 952e5fe..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.windows-1255
-
-8-BIT: windows-1255 windows-1255 CP1255
diff --git a/basis/io/encodings/8-bit/windows-1256/authors.txt b/basis/io/encodings/8-bit/windows-1256/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/windows-1256/windows-1256.factor b/basis/io/encodings/8-bit/windows-1256/windows-1256.factor
deleted file mode 100644 (file)
index 303d25c..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.windows-1256
-
-8-BIT: windows-1256 windows-1256 CP1256
diff --git a/basis/io/encodings/8-bit/windows-1257/authors.txt b/basis/io/encodings/8-bit/windows-1257/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/windows-1257/windows-1257.factor b/basis/io/encodings/8-bit/windows-1257/windows-1257.factor
deleted file mode 100644 (file)
index 80b21e8..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.windows-1257
-
-8-BIT: windows-1257 windows-1257 CP1257
diff --git a/basis/io/encodings/8-bit/windows-1258/authors.txt b/basis/io/encodings/8-bit/windows-1258/authors.txt
deleted file mode 100644 (file)
index 7c1b2f2..0000000
+++ /dev/null
@@ -1 +0,0 @@
-Doug Coleman
diff --git a/basis/io/encodings/8-bit/windows-1258/windows-1258.factor b/basis/io/encodings/8-bit/windows-1258/windows-1258.factor
deleted file mode 100644 (file)
index 1c7bf63..0000000
+++ /dev/null
@@ -1,6 +0,0 @@
-! Copyright (C) 2009 Doug Coleman.
-! See http://factorcode.org/license.txt for BSD license.
-USING: io.encodings.8-bit ;
-IN: io.encodings.8-bit.windows-1258
-
-8-BIT: windows-1258 windows-1258 CP1258
index b22233524f7c55444dad08a2201a501cf6512881..9d1fb96f77a09af2cccadb07950d52c671b8e2e1 100644 (file)
@@ -2,12 +2,12 @@
 ! See http://factorcode.org/license.txt for BSD license.
 USING: accessors alien alien.c-types alien.data alien.enums
 alien.strings assocs byte-arrays classes.struct combinators
-combinators.short-circuit destructors fry io io.backend io.binary
-io.buffers io.encodings.8-bit.latin1 io.encodings.utf8 io.files
-io.pathnames io.ports io.sockets io.sockets.secure io.timeouts kernel
-libc locals math math.functions math.order math.parser memoize
-namespaces openssl openssl.libcrypto openssl.libssl random sequences
-sets splitting unicode ;
+combinators.short-circuit destructors fry io io.backend
+io.binary io.buffers io.encodings.8-bit io.encodings.utf8
+io.files io.pathnames io.ports io.sockets io.sockets.secure
+io.timeouts kernel libc locals math math.functions math.order
+math.parser memoize namespaces openssl openssl.libcrypto
+openssl.libssl random sequences sets splitting unicode ;
 IN: io.sockets.secure.openssl
 
 GENERIC: ssl-method ( symbol -- method )
index 508df24c44b7ddeb8277bad443ff5a21b5780074..59a7530c1f47426be43f4471599087fb9ab6d838 100644 (file)
@@ -1,4 +1,4 @@
-USING: destructors io io.encodings io.encodings.8-bit.latin1
+USING: destructors io io.encodings io.encodings.8-bit
 io.encodings.ascii io.encodings.binary io.encodings.string
 io.encodings.utf8 io.files io.pipes io.streams.byte-array
 io.streams.duplex io.streams.limited io.streams.string kernel
index d9d8385195622e348e225edfc92fa7ca32c15d1b..2e51891fbbffced1f4ab2a6eb8fdca2839874d83 100644 (file)
@@ -1,7 +1,7 @@
 ! Copyright (C) 2009 Daniel Ehrenberg
 ! See http://factorcode.org/license.txt for BSD license.
 USING: tools.test quoted-printable io.encodings.string
-sequences splitting kernel io.encodings.8-bit.latin2 ;
+sequences splitting kernel io.encodings.8-bit ;
 IN: quoted-printable.tests
 
 { "José was the
index fb005d2a4683b9aae04bfd13274641b542998653..2527dd5a1736638916f565104752411bc4147e4e 100644 (file)
@@ -1,4 +1,4 @@
-USING: io.encodings.string kernel io.encodings.8-bit.latin7 ;
+USING: io.encodings.string kernel io.encodings.8-bit ;
 IN: tools.deploy.test.4
 
 : deploy-test-4 ( -- )
index 010e74b9b33bac212e3db490d2d97580029f50fd..6149910a558694dceafe79d33d76227e8bdfb81a 100644 (file)
@@ -1,5 +1,4 @@
-USING: xml xml.data xml.traversal tools.test accessors kernel
-io.encodings.8-bit.latin5 ;
+USING: xml xml.data xml.traversal tools.test accessors kernel ;
 
 [ "\u000131" ] [ "vocab:xml/tests/latin5.xml" file>xml children>string ] unit-test
 [ "\u0000e9" ] [ "vocab:xml/tests/latin1.xml" file>xml children>string ] unit-test
index 4546fbf99f3d8c283eb513291a21ba3985e2485e..dda7aafd5858d5a4d9bc79184d72b03f46e7d8ba 100644 (file)
@@ -1,6 +1,6 @@
 USING: alien.strings alien.c-types alien.data tools.test
 kernel libc io.encodings.utf8 io.encodings.utf16 io.encodings.utf16n
-io.encodings.ascii alien io.encodings.string io.encodings.8-bit.latin1 ;
+io.encodings.ascii alien io.encodings.string io.encodings.8-bit ;
 
 { "\u0000ff" }
 [ "\u0000ff" latin1 string>alien latin1 alien>string ]
index 196dc815c3d4053c404790acb4e703958a4ffa5d..ba880b1b329fff07c620adbb2432e9f1eceeab24 100644 (file)
@@ -1,6 +1,6 @@
 USING: alien alien.c-types alien.data arrays classes.struct
 compiler.units continuations destructors fry generic.single io
-io.backend io.directories io.encodings io.encodings.8-bit.latin1
+io.backend io.directories io.encodings io.encodings.8-bit
 io.encodings.ascii io.encodings.binary io.encodings.string
 io.encodings.utf16 io.encodings.utf8 io.files io.files.private
 io.pathnames kernel locals make math sequences
index 62c905ee9f1f7faafd9e1190702dcd13cc34b10d..567523eb7f3c6120fde497f7e93e1639c3e365b2 100644 (file)
@@ -1,8 +1,7 @@
 ! Copyright (C) 2009 Doug Coleman.
 ! See http://factorcode.org/license.txt for BSD license.
 USING: combinators combinators.smart csv io.encodings.8-bit
-math.parser memoize sequences kernel unicode money
-io.encodings.8-bit.latin1 ;
+kernel math.parser memoize money sequences unicode ;
 IN: geobytes
 
 ! GeoBytes is not free software.
index b92938edeeb7d04f4213891d8c89c35a07bf1cdb..4d37f6f9a2b570e741ec060a1073994467ba7945 100644 (file)
@@ -1,6 +1,6 @@
 USING: accessors arrays assocs continuations formatting graphviz
 graphviz.notation graphviz.render graphviz.render.private
-images.loader.private io.directories io.encodings.8-bit.latin1
+images.loader.private io.directories io.encodings.8-bit
 io.encodings.ascii io.encodings.utf8 io.files io.launcher kernel
 locals make math math.combinatorics math.parser namespaces
 sequences sequences.extras sets splitting system tools.test ;
index 582d20a536aa19f5761c151c8a78249d56257605..230bcb0ed86d64b1c8e300c36ca7dcd0ab66019f 100644 (file)
@@ -1,7 +1,7 @@
 ! Copyright (C) 2012 Alex Vondrak.
 ! See http://factorcode.org/license.txt for BSD license.
 USING: graphviz help.markup help.syntax images.viewer
-io.encodings.8-bit.latin1 io.encodings.utf8 io.launcher kernel
+io.encodings.8-bit io.encodings.utf8 io.launcher kernel
 strings ;
 IN: graphviz.render
 
index f2d3779a7658e0345762af3afba7755ec3bb2f55..2b96d8a4418e963348dd58d6e60049e5dd5d6bb5 100644 (file)
@@ -2,7 +2,7 @@
 ! See http://factorcode.org/license.txt for BSD license.
 USING: calendar combinators compiler.units continuations
 graphviz.dot images.viewer io.backend io.directories
-io.encodings.8-bit.latin1 io.encodings.utf8 io.files
+io.encodings.8-bit io.encodings.utf8 io.files
 io.files.temp io.files.unique io.launcher io.standard-paths
 kernel locals make namespaces sequences summary system threads
 unicode vocabs webbrowser words ;
index 2ac2326e3296c5c85f2ebf38aa2c70bda5fdfe49..ee514bc9dcbc71b7fd07239a44e1d678c7ed75c8 100644 (file)
@@ -3,9 +3,8 @@
 USING: accessors alien.c-types alien.data arrays byte-arrays
 combinators compression.run-length fry grouping images
 images.loader images.normalization io io.binary
-io.encodings.8-bit.latin1 io.encodings.string kernel math
-math.bitwise sequences specialized-arrays summary
-io.streams.throwing ;
+io.encodings.8-bit io.encodings.string io.streams.throwing
+kernel math math.bitwise sequences specialized-arrays summary ;
 QUALIFIED-WITH: bitstreams b
 SPECIALIZED-ARRAYS: uint ushort ;
 IN: images.bitmap
index d40ce1f838595b2f1d25f64b58eed07302620265..eff32f4736bd89b4113f8c33d6e8414217b9bf2d 100644 (file)
@@ -1,10 +1,11 @@
 ! Copyright (C) 2009 Doug Coleman.
 ! See http://factorcode.org/license.txt for BSD license.
-USING: accessors arrays assocs checksums checksums.crc32 combinators
-compression.inflate fry grouping images images.loader io io.binary
-io.encodings.8-bit.latin1 io.encodings.ascii io.encodings.binary
-io.encodings.string io.streams.byte-array io.streams.throwing kernel
-locals math math.bitwise math.functions sequences sorting splitting ;
+USING: accessors arrays assocs checksums checksums.crc32
+combinators compression.inflate fry grouping images
+images.loader io io.binary io.encodings.8-bit io.encodings.ascii
+io.encodings.binary io.encodings.string io.streams.byte-array
+io.streams.throwing kernel locals math math.bitwise
+math.functions sequences sorting ;
 QUALIFIED: bitstreams
 IN: images.png
 
index 6a5e02abf620406a1c8c8ef06fe08aa32fd0abc5..61e4a4ff41ade5e7b26f983dbac08fb41b636475 100644 (file)
@@ -1,7 +1,6 @@
 ! Copyright (C) 2010 Joe Groff.
 ! See http://factorcode.org/license.txt for BSD license.
-USING: byte-arrays io.encodings.8-bit.koi8-r
-io.encodings.8-bit.latin1 io.encodings.binary
+USING: byte-arrays io.encodings.8-bit io.encodings.binary
 io.encodings.detect io.encodings.utf16 io.encodings.utf32
 io.encodings.utf8 namespaces tools.test ;
 
index d3528e21a36b0a063708ec33d82093460f702208..370100d9d5f02f9ae3de88328d9e6b7ef2336504 100644 (file)
@@ -1,7 +1,7 @@
 ! Copyright (C) 2010 Joe Groff.
 ! See http://factorcode.org/license.txt for BSD license.
 USING: accessors byte-arrays combinators continuations fry io
-io.encodings io.encodings.8-bit.latin1 io.encodings.ascii
+io.encodings io.encodings.8-bit io.encodings.ascii
 io.encodings.binary io.encodings.iana io.encodings.string
 io.encodings.utf16 io.encodings.utf32 io.encodings.utf8
 io.files io.streams.string kernel literals math namespaces