Übersicht über den Standard

Der Unicode-Standard mit 65536 möglichen Zeichen ist der aktuell umfassendste Zeichensatzstandard. Nachfolgende Tabelle enthält die Aufzählung der Sprachzeichensätze und ihrer Adressierung im Unicodestandard in hexadezimaler und numerischer Form.
Bisher gibt es keine True-Type-Schrift (ttf), die den gesamten Unicode-Zeichensatz enthält. An nästen kommt True-Type-Datei Arial Unicode MS von The Monotype Corporation (z.B. in MS Office 2000 enthalten - OFFICE1.CAB) mit einer Dateigröße von 23.566 KByte, welche allerdings noch reichlich Lücken aufweist.

Bitte beachten: Das Anzeigen der Zeichen funktioniert nur, wenn auch die passende unicodefähige Schriftdatei auf dem Computer-System installiert ist. Je nach Zeichenzahl kann die Anzeige entsprechend lange dauern, da die Seite mit den Unicode-Zeichen per JavaScript erstellt wird.

Sprache - Zeichensatzname Unicode-hexcode Unicode-numerisch Zeichen
C0 Controls and Basic Latin U+0000 - U+007F (0-127)
C1 Controls and Latin-1 Supplement U+0080 - U+00FF (128-255)
Latin Extended-A U+0100 - U+017F (256-383)
Latin Extended-B U+0180 - U+024F (384-591)
IPA Extensions U+0250 - U+02AF (592-687)
Spacing Modifier Letters U+02B0 - U+02FF (688-767)
Combining Diacritical Marks U+0300 - U+036F (768-879)
Greek U+0370 - U+03FF (880-1023)
Cyrillic U+0400 - U+04FF (1024-1279)
Armenian U+0530 - U+058F (1328-1423)
Hebrew U+0590 - U+05FF (1424-1535)
Arabic U+0600 - U+06FF (1536-1791)
Syriac U+0700 - U+074F (1792-1871)
Thaana U+0780 - U+07BF (1920-1983)
Devanagari U+0900 - U+097F (2304-2431)
Bengali U+0980 - U+09FF (2432-2559)
Gurmukhi U+0A00 - U+0A7F (2560-2687)
Gujarati U+0A80 - U+0AFF (2688-2815)
Oriya U+0B00 - U+0B7F (2816-2943)
Tamil U+0B80 - U+0BFF (2944-3071)
Telugu U+0C00 - U+0C7F (3072-3199)
Kannada U+0C80 - U+0CFF (3200-3327)
Malayalam U+0D00 - U+0D7F (3328-3455)
Sinhala U+0D80 - U+0DFF (3456-3583)
Thai U+0E00 - U+0E7F (3584-3711)
Lao U+0E80 - U+0EFF (3712-3839)
Tibetan U+0F00 - U+0FBF (3840-4031)
Myanmar U+1000 - U+109F (4096-4255)
Georgian U+10A0 - U+10FF (4256-4351)
Hangul Jamo U+1100 - U+11FF (4352-4607)
Ethiopic U+1200 - U+137F (4608-4991)
Cherokee U+13A0 - U+13FF (5024-5119)
Unified Canadian Aboriginal Syllabics U+1400 - U+167F (5120-5759)
Ogham U+1680 - U+169F (5760-5791)
Runic U+16A0 - U+16FF (5792-5887)
Khmer U+1780 - U+17FF (6016-6143)
Mongolian U+1800 - U+18AF (6144-6319)
Latin Extended Additional U+1E00 - U+1EFF (7680-7935)
Greek Extended U+1F00 - U+1FFF (7936-8191)
General Punctuation U+2000 - U+206F (8192-8303)
Superscripts and Subscripts U+2070 - U+209F (8304-8351)
Currency Symbols U+20A0 - U+20CF (8352-8399)
Combining Diacritical Marks for Symbols U+20D0 - U+20FF (8400-8447)
Letterlike Symbols U+2100 - U+214F (8448-8527)
Number Forms U+2150 - U+218F (8528-8591)
Arrows U+2190 - U+21FF (8592-8703)
Mathematical Operators U+2200 - U+22FF (8704-8959)
Miscellaneous Technical U+2300 - U+23FF (8960-9215)
Control Pictures U+2400 - U+243F (9216-9279)
Optical Character Recognition U+2440 - U+245F (9280-9311)
Enclosed Alphanumerics U+2460 - U+24FF (9312-9471)
Box Drawing U+2500 - U+257F (9472-9599)
Block Elements U+2580 - U+259F (9600-9631)
Geometric Shapes U+25A0 - U+25FF (9632-9727)
Miscellaneous Symbols U+2600 - U+26FF (9728-9983)
Dingbats U+2700 - U+27BF (9984-10175)
Braille Patterns U+2800 - U+28FF (10240-10495)
CJK Radicals Supplement U+2E80 - U+2EFF (11904-12031)
KangXi Radicals U+2F00 - U+2FDF (12032-12255)
Ideographic Description characters U+2FF0 - U+2FFF (12272-12287)
CJK Symbols and Punctuation U+3000 - U+303F (12288-12351)
Hiragana U+3040 - U+309F (12352-12447)
Katakana U+30A0 - U+30FF (12448-12543)
Bopomofo U+3100 - U+312F (12544-12591)
Hangul Compatibility Jamo U+3130 - U+318F (12592-12687)
Kanbun U+3190 - U+319F (12688-12703)
Bopomofo Extended U+31A0 - U+32BF (12704-12735)
Enclosed CJK Letters and Months U+3200 - U+32FF (12800-13055)
CJK Compatibility U+3300 - U+33FF (13056-13311)
CJK Unified Ideographs Extension A U+3400 - U+4DB5 (13312-19893)
CJK Unified Ideographs U+4E00 - U+9FFF (19968-40959)
Yi Syllables U+A000 - U+A48F (40960-42127)
Yi Radicals U+A490 - U+A4CF (42128-42191)
Hangul Syllables U+AC00 - U+D7A3 (44032-55203)
Private Use Area    
CJK Compatibility Ideographs U+F900 - U+FAFF (63744-64255)
Alphabetic Presentation Forms U+FB00 - U+FB4F (64256-64335)
Arabic Presentation Forms-A U+FB50 - U+FDFF (64336-65023)
Combining Half Marks U+FE20 - U+FE2F (65056-65071)
CJK Compatibility Forms U+FE30 - U+FE4F (65072-65103)
Small Form Variants U+FE50 - U+FE6F (65104-65135)
Arabic Presentation Forms-B U+FE70 - U+FEFF (65136-65279)
Halfwidth and Fullwidth Forms U+FF00 - U+FFEF (65280-65519)
Specials U+FEFF, U+FFF0 - U+FFFF (65279, 65520-65535)

Weiterführendes und Vertiefendes:
Quelle: www.alanwood.net/unicode/unicode_samples_utf8.html Bitte beachten: Keine Haftung für Inhalte fremder Internetseiten.

© 2002