===== Asiatische Zeichensätze (Unicode) ===== ==== Anforderung ==== In vielen exportorientieten Branchen, wie etwa bei den Autozulieferern, kommt relativ schnell die Anforderung, Dokumente für Niederlassungen, Handelspartner oder Vorlieferanten im asiatischen Raum zu erstellen. Die Nutzung entsprechender Alphabete wie etwa **Chinesisch**, **Japanisch** oder **Koreanisch** ist erforderlich. Das stellt auch insofern eine Herausforderung dar, als die Druckausgabe auf in Europa gekauften und installierten Druckern erfolgen soll, die meist über die erforderlichen Schriften nicht verfügen, oder deren Aufrüstung mit entsprechenden Kosten (z.B. für Flash-Speicher oder Lizenzen) verbunden ist. \\ \\ {{print2forms:tips:0082-2.png}} \\ \\ ==== Realisierung ==== Mit der Einführung der **Schriften-Bibliothek** in (p2f) stehen inzwischen eine Reihe von Schriften zur Verfügung, deren Zeichenumfang deutlich über das hinausgeht, was die üblichen Drucker ab Werk mit sich bringen. Bestandteil der Bibliothek sind eine ganze Reihe von Schriften mit 3.000 bis 5.000 Zeichen, die den Sprachraum Europa abdecken. Hier wird neben **Griechisch** und **Kyrillisch** auch **Armenisch** und **Georgisch** unterstützt. ((Schriften mit abweichender Schreibrichtung (z.B. **Hebräisch** oder **Arabisch**) werden in (p2f) grundsätzlich nicht unterstützt. Schriften mit unterschiedlichen, kontextabhängigen [[https://de.wikipedia.org/wiki/Glyphe|Glyphen]] für den gleichen Buchstaben lassen sich nur drucken, wenn die konkrete Glyphe vom druckenden System korrekt angesprochen wird.\\ \\ )) Für den asiatischen Sprachraum sind Schriften mit 10.000 bis über 30.000 Zeichen in die Bibliothek aufgenommen worden, die neben **einfachem Chinesisch** auch **Japanisch**, **Koreanisch** und **Thai** unterstützen. \\ \\ ^ Schrift ^ Einsatzgebiet ^ | Noto Sans SC | Cantonese (Simplified script)\\ Gan Chinese\\ Hakka Chinese (Simplified script)\\ Literary Chinese (Simplified script)\\ Min Nan Chinese (Simplified script)\\ Simplified Chinese\\ Wu Chinese\\ Xiang Chinese\\ Zhuang (Simplified script)\\ Japanese (Kanji, Hiragana, Katakana)\\ Latin (Simplified script) | | Gothic A1 | Korean\\ Japanese (Kanji, Hiragana, Katakana)\\ Latin | | Kanit | Thai\\ Latin | \\ Damit diese Schriften für asiatische Alphabete eingesetzt werden können, muss der Drucker zwingend die Nutzung von Unicode und die Übertragung von Text in der Kodierung **UTF-8** unter(-)stützen. Das ist auf %%PCL%%-4- und älteren %%PCL%%-5-Druckern (vor 2010) nicht immer der Fall. {{print2forms:tips:0082-1.png }}Ab dem (p2f)-Installer Build 289 sind das Administra(-)tions(-)programm des (p2f)-Servers und alle intern verwendeten XML-Dateien auf die Kodierung mit **Unicode** umgestellt worden. Von daher können jetzt auch die asiatischen Zeichen eingeben und gespeichert werden.\\ \\ Die Eingabe dieser Zeichen ist oft nicht ganz einfach, weil europäische Tastaturen genutzt werden und die Eingabetreiber für asiatische Zeichen nicht installiert sind. Als Behelfs(-)mass(-)nahme kann das kleine Hilfsprogramm **Zeichentabelle** im Ordner 'Windows Zubehör' genutzt werden. Damit die asiatischen Zeichen auch wirklich druckbar sind, muss im Textfeld oder Textblockfeld immer der Zeichensatz Unicode mit der Kodierung UTF-8 ausgewählt werden. Werden asiatische Zeichen nicht als Textkonstante genutzt, sondern aus dem Druckdatenstrom entnommen, ist aktuell in der Definition des **Vergleichsmusters** in der Textauswahl keine einfache Selektion der asiatischen Zeichen möglich. Sie müssen in der Regel mit dem Punkt (beliebiges Zeichen, also, wie im Beispiel zu sehen, mit ''(.*)'') aufgesammelt werden. Zeichenklassen funktionieren in diesem Zusammenhang nicht. ((Eine Erweiterung der regulären Ausdrücke etwa in der Form der PERL-RegEx sind für (p2f) auch in der Zukunft nicht angedacht. Sollte es im Einzelfall Probleme mit den regulären Ausdrücken geben, sprechen Sie uns bitte direkt an.\\ \\ )) Auszug aus einer entsprechenden Ablaufverfolgung: \\ {{print2forms:tips:0082-3.png}} \\ \\ ==== Hinweise ==== * Damit asiatische Zeichen (oder allgemeiner Unicode-Zeichen) überhaupt aus den Druckdaten extrahiert werden können, muss in den Druckdaten der Zeichensatz Unicode (Sequenz ''(18N'') ausgewählt und die Kodierung UTF-8 (Sequenz ''&t1008P'') aktivert werden. ((Das ist z.B. bei Ausdrucken mit Unicode aus **SAP** heraus gewährleistet.\\ \\ )) * Die Nutzung weiterer asiatischer Sprachen, z.B. Vietnamesich, ist durchaus realisierbar. Es besteht in der Schriften-Bibliothek die Möglichkeit, sogenannte [[print2forms:schriften:firmenschrift|Firmenschriften]] nachzuladen, die dann die gewünschten Zeichen enthalten können. Das hat allerdings seine Grenzen, wenn die fragliche Schrift mehr als ca. 13.000 Zeichen enthält, oder wenn Zeichen ausserhalb des Unicode-Bereichs von 16-Bit ([[https://en.wikipedia.org/wiki/Plane_(Unicode)#Basic_Multilingual_Plane|Basic Multilingual Plane]]) genutzt werden müssen. * Die Verwendung von Unicode ist in (p2f)-Installer mit einer Build-Nummer unter 290 noch etwas limitiert. Insbesondere die Handhabung von Unicode in den Druckdaten ist noch inkonsistent. Es wird in jedem Fall empfohlen, auf eine aktuelle Version zu wechseln. * Wird asiatischer Text rechtsbündig oder zentiert gedruckt, oder wird als Stil Invers verwendet, gibt es eine Ein(-)schränkung zu beachten. Da die %%PCL%%-Drucker in aller Regel im HP-GL-Modus kein Unicode unterstützen, übersetzt (p2f) in diesem Fall die Unicodes mit Hilfe eines selbstdefinierten Zeichensatzes in 8-Bit-Codes. Durch technische Gründe ist diese Übersetzung aber letztlich auf 223 Zeichen begrenzt. Von daher dürfen in einem Textfeld nie mehr als 223 verschiedene Zeichen zum Einsatz kommen - ein eher theoretischer Fall. * Die drei Blöcke in der ersten Abbildung zeigen unterschiedliche Varianten des Gedichts [[https://de.wikipedia.org/wiki/Iroha|Iroha]], der chinesische Text darunter lautet 'Allgemeine chinesische Standardzeichentabelle', die drei weiteren Sätze sind Übersetzungen des ersten Satzes des ersten Artikels der Allgemeinen Erklärung der Menschenrechte der Vereinten Nationen: 'Alle Menschen sind frei und gleich an Würde und Rechten geboren.'. \\