Unicode und Charset

Startseite  Vorherige Seite  Nächste Seite

 

n2pdf verfügt über eine Unicode-Unterstützung (http://en.wikipedia.org/wiki/Unicode). Diese Unterstützung ist standardmäßig aktiviert und kann bei Bedarf über die Option N2PDFOPTION_SYSTEM_UNICODE_MODE deaktiviert werden.

 

Unicode stellt die Basis zur inhaltlichen Verarbeitung von Texten in verschiedenen Sprachen zur Verfügung. So ist es z. B. möglich, das bei Funktionsaufrufen von n2pdf Texte in verschiedenen Sprachen übergeben werden können.

 

112

Unicode stellt nur die inhaltliche Verarbeitung von Texten in verschiedenen Sprachen zur Verfügung. Die visuelle Darstellung dieser Texte hängt dabei von anderen Techniken des jeweiligen Mediums, wie z. B. Font-Embedding oder CID-Fonts, ab.

 

 

Darüber hinaus stellt Unicode auch die Möglichkeit zur Verfügung, dass PDF-Dateien auf Systemen erstellt werden, deren "native Sprache" (Codepage: http://en.wikipedia.org/wiki/Codepage) nicht mit dem Inhalt der PDF-Datei übereinstimmt. So ist es z. B. möglich, dass auf einem Rechner mit einer Codepage 1252 (Latin) auch eine Datei für die Codepage 932 (Japanese) erstellt wird. Voraussetzung ist allerdings, dass die Unterstützung für die jeweilige Sprache installiert ist und alle technischen Voraussetzungen (z. B. notwendige Schriftarten) für die Erstellung der PDF-Datei gegeben sind.

 

112

Zur Zeit werden nur Schriften mit "links-nach-rechts" (LTR (left-to-right)) Ausrichtung unterstützt. Die Darstellung von arabischer oder hebräischer Schrift (RTL (right-to-left)) ist also nicht möglich.

 

In Verbindung mit Unicode ist besonders die Einstellung N2PDFOPTION_PDF_CID_FONT_MODE zu beachten. Über diese Einstellung wird maßgeblich die visuelle Darstellung der Unicode-Inhalte im PDF-Dokument beeinflusst. Sie sollten daher die Beschreibung des Parameters unter "PDF-Einstellungen" lesen.

 

 

Unicode-Einschränkungen

Passwörter: Benutzer- (User) und Besitzer-Passwörter (Owner) für die PDF-Datei dürfen keine Unicode-Zeichen enthalten. Auch ein evtl. gesetztes Passwort für das Packen der erstellten PDF-Datei darf keine Unicode-Zeichen enthalten.

 

Dateiname der PDF-Datei: Soll die erstellte PDF-Datei nach der Erstellung als ZIP-File gepackt werden, dann darf der Dateiname keine Unicode-Zeichen enthalten. Dies ist eine Einschränkung die durch das Zip-Dateiformat gegeben ist. Soll die PDF-Datei allerdings nicht gepackt werden, so darf der Dateiname Unicode-Zeichen enthalten.

 

Vorlagen: Bei der Definition von Vorlagen zur Textformatierung dürfen keine Unicode-Zeichen in der Bezeichnung der Vorlage verwendet werden. Bei einer Vorlage können keine Schriftarten verwendet werden, die Unicode-Zeichen im Namen haben.

 

Verlinkung von Dateien: Werden Dateianhänge als Dateien auf einem Laufwerk abgelegt und als Verlinkung in die PDF-Datei eingefügt, so dürfen die Dateinamen (inkl. Verzeichnis) keine Unicode-Zeichen enthalten. Bei der Einbettung oder dem Import von Anhängen können Unicode-Zeichen benutzt werden.

 

Aktivierung der Unicode-Unterstützung

Call N2PDFSetOption ( JobID, N2PDFOPTION_SYSTEM_UNICODE_MODE, N2PDFVALUE_TRUE, "" )

 

 

Codepage und Character Set (Charset)

Mit aktivierter Unicode-Unterstützung wird bei der Erstellung der PDF-Datei das zur aktuellen Codepage (http://www.microsoft.com/globaldev/reference/WinCP.mspx) gehörende "Character Set" (http://en.wikipedia.org/wiki/Character_set) als Vorgabe eingestellt (z. B. bei Codepage 1251 (kyrillisch) wird Character Set 204 aktiviert). Der PDF-Datei liegt also immer das Character Set zu Grunde, das zum Zeitpunkt der Erstellung der PDF-Datei auf dem Rechner aktiviert ist.

 

Codepage vom Betriebssystem

zugeordnetes Character Set

1250 (Central Europe)

EASTEUROPE_CHARSET (238)

1252 (Latin I)

DEFAULT_CHARSET (1)

1251 (Cyrillic)

RUSSIAN_CHARSET (204)

1253 (Greek)

GREEK_CHARSET (161)

1254 (Turkish)

TURKISH_CHARSET (162)

1257 (Baltic)

BALTIC_CHARSET (186)

1258 (Vietnam)

VIETNAMESE_CHARSET (163)

874 (Thai)

THAI_CHARSET (222)

932 (Japanese Shitf-JIS)

SHIFTJIS_CHARSET (128)

936 (Simplified Chinese)

GB2312_CHARSET (134)

950 (Traditional Chinese Big5)

CHINESEBIG5_CHARSET (136)

949 (Korean)

HANGEUL_CHARSET (129)

 

Sie müssen nur dann eine Anpassung vornehmen, wenn sie für ein anderes Character Set eine PDF-Datei erstellen, das nicht auf dem aktuellen Character Set des Rechners basiert. Dies ist z. B. dann notwendig, wenn sie auf einem englischen Betriebssystem eine PDF-Datei mit chinesischen Inhalten erstellen wollen. In diesem Fall müssen Sie gezielt das Character Set der PDF-Datei ändern. Mit dem folgenden Aufruf können Sie das Character Set ändern (möglichst früh nach N2PDFInit).

 

Call N2PDFSetOption ( JobID, N2PDFOPTION_PDF_CHARSET,  134, "" )        

 

Weitere Informationen zum Thema CharSets finden Sie im Abschnitt PDF-Einstellungen.