Webseiten-Werkzeuge

Benutzer-Werkzeuge


Asiatische Zeichensätze (Unicode)

Anforderung

In vielen exportorientieten Branchen, wie etwa bei den Autozulieferern, kommt relativ schnell die Anforderung, Dokumente für Niederlassungen, Handelspartner oder Vorlieferanten im asiatischen Raum zu erstellen. Die Nutzung entsprechender Alphabete wie etwa Chinesisch, Japanisch oder Koreanisch ist erforderlich.

Das stellt auch insofern eine Herausforderung dar, als die Druckausgabe auf in Europa gekauften und installierten Druckern erfolgen soll, die meist über die erforderlichen Schriften nicht verfügen, oder deren Aufrüstung mit entsprechenden Kosten (z.B. für Flash-Speicher oder Lizenzen) verbunden ist.



Realisierung

Mit der Einführung der Schriften-Bibliothek in print2forms stehen inzwischen eine Reihe von Schriften zur Verfügung, deren Zeichenumfang deutlich über das hinausgeht, was die üblichen Drucker ab Werk mit sich bringen.

Bestandteil der Bibliothek sind eine ganze Reihe von Schriften mit 3.000 bis 5.000 Zeichen, die den Sprachraum Europa abdecken. Hier wird neben Griechisch und Kyrillisch auch Armenisch und Georgisch unterstützt. 1)

Für den asiatischen Sprachraum sind Schriften mit 10.000 bis über 30.000 Zeichen in die Bibliothek aufgenommen worden, die neben einfachem Chinesisch auch Japanisch, Koreanisch und Thai unterstützen.

Schrift Einsatzgebiet
Noto Sans SC Cantonese (Simplified script)
Gan Chinese
Hakka Chinese (Simplified script)
Literary Chinese (Simplified script)
Min Nan Chinese (Simplified script)
Simplified Chinese
Wu Chinese
Xiang Chinese
Zhuang (Simplified script)
Japanese (Kanji, Hiragana, Katakana)
Latin (Simplified script)
Gothic A1 Korean
Japanese (Kanji, Hiragana, Katakana)
Latin
Kanit Thai
Latin


Damit diese Schriften für asiatische Alphabete eingesetzt werden können, muss der Drucker zwingend die Nutzung von Unicode und die Übertragung von Text in der Kodierung UTF-8 unter­stützen. Das ist auf PCL-4- und älteren PCL-5-Druckern (vor 2010) nicht immer der Fall.

Ab dem print2forms-Installer Build 289 sind das Administra­tions­programm des print2forms-Servers und alle intern verwendeten XML-Dateien auf die Kodierung mit Unicode umgestellt worden. Von daher können jetzt auch die asiatischen Zeichen eingeben und gespeichert werden.

Die Eingabe dieser Zeichen ist oft nicht ganz einfach, weil europäische Tastaturen genutzt werden und die Eingabetreiber für asiatische Zeichen nicht installiert sind. Als Behelfs­mass­nahme kann das kleine Hilfsprogramm Zeichentabelle im Ordner 'Windows Zubehör' genutzt werden.

Damit die asiatischen Zeichen auch wirklich druckbar sind, muss im Textfeld oder Textblockfeld immer der Zeichensatz Unicode mit der Kodierung UTF-8 ausgewählt werden.

Werden asiatische Zeichen nicht als Textkonstante genutzt, sondern aus dem Druckdatenstrom entnommen, ist aktuell in der Definition des Vergleichsmusters in der Textauswahl keine einfache Selektion der asiatischen Zeichen möglich. Sie müssen in der Regel mit dem Punkt (beliebiges Zeichen, also, wie im Beispiel zu sehen, mit (.*)) aufgesammelt werden. Zeichenklassen funktionieren in diesem Zusammenhang nicht. 2)

Auszug aus einer entsprechenden Ablaufverfolgung:


Hinweise

  • Damit asiatische Zeichen (oder allgemeiner Unicode-Zeichen) überhaupt aus den Druckdaten extrahiert werden können, muss in den Druckdaten der Zeichensatz Unicode (Sequenz <esc>(18N) ausgewählt und die Kodierung UTF-8 (Sequenz <esc>&t1008P) aktivert werden. 3)
  • Die Nutzung weiterer asiatischer Sprachen, z.B. Vietnamesich, ist durchaus realisierbar. Es besteht in der Schriften-Bibliothek die Möglichkeit, sogenannte Firmenschriften nachzuladen, die dann die gewünschten Zeichen enthalten können. Das hat allerdings seine Grenzen, wenn die fragliche Schrift mehr als ca. 13.000 Zeichen enthält, oder wenn Zeichen ausserhalb des Unicode-Bereichs von 16-Bit (Basic Multilingual Plane) genutzt werden müssen.
  • Die Verwendung von Unicode ist in print2forms-Installer mit einer Build-Nummer unter 290 noch etwas limitiert. Insbesondere die Handhabung von Unicode in den Druckdaten ist noch inkonsistent. Es wird in jedem Fall empfohlen, auf eine aktuelle Version zu wechseln.
  • Wird asiatischer Text rechtsbündig oder zentiert gedruckt, oder wird als Stil Invers verwendet, gibt es eine Ein­schränkung zu beachten. Da die PCL-Drucker in aller Regel im HP-GL-Modus kein Unicode unterstützen, übersetzt print2forms in diesem Fall die Unicodes mit Hilfe eines selbstdefinierten Zeichensatzes in 8-Bit-Codes. Durch technische Gründe ist diese Übersetzung aber letztlich auf 223 Zeichen begrenzt. Von daher dürfen in einem Textfeld nie mehr als 223 verschiedene Zeichen zum Einsatz kommen - ein eher theoretischer Fall.
  • Die drei Blöcke in der ersten Abbildung zeigen unterschiedliche Varianten des Gedichts Iroha, der chinesische Text darunter lautet 'Allgemeine chinesische Standardzeichentabelle', die drei weiteren Sätze sind Übersetzungen des ersten Satzes des ersten Artikels der Allgemeinen Erklärung der Menschenrechte der Vereinten Nationen: 'Alle Menschen sind frei und gleich an Würde und Rechten geboren.'.


1)
Schriften mit abweichender Schreibrichtung (z.B. Hebräisch oder Arabisch) werden in print2forms grundsätzlich nicht unterstützt. Schriften mit unterschiedlichen, kontextabhängigen Glyphen für den gleichen Buchstaben lassen sich nur drucken, wenn die konkrete Glyphe vom druckenden System korrekt angesprochen wird.

2)
Eine Erweiterung der regulären Ausdrücke etwa in der Form der PERL-RegEx sind für print2forms auch in der Zukunft nicht angedacht. Sollte es im Einzelfall Probleme mit den regulären Ausdrücken geben, sprechen Sie uns bitte direkt an.

3)
Das ist z.B. bei Ausdrucken mit Unicode aus SAP heraus gewährleistet.

print2forms/tips/tip82.txt · Zuletzt geändert: 2021-03-12 17:55 (Externe Bearbeitung)