Konvertierung von HTML Inhalten mit n2pdf 5.0

Wussten Sie schon, dass man mit der neusten Version von n2pdf HTML-Inhalte ganz einfach konvertieren kann?

Fast jedes größere Unternehmen steht vor der Herausforderung, Dokumente archivieren zu müssen. Dabei stehen sie über kurz oder lang irgendwann vor der Frage: Wie kann man Dokumente und vor allem E-Mails optimal archivieren?

Die meisten Unternehmen setzen Groupware ein, um Arbeitsprozesse zu erleichtern. Groupware wie IBM Notes (Client-Software) oder IBM Domino (serverseitig) ist dafür gedacht, die Kommunikation zu vereinfachen und wird auch oft dafür eingesetzt, die Dokumentenspeicherung möglichst einfach zu organisieren. Auf den ersten Blick reicht eine solche vereinfachte Dokumentenspeicherung aus. Bis Unternehmen an den Punkt kommen, wo sie die Dokumente dauerhaft archivieren müssen und nach einer vollständigen Archivierungslösung suchen.

Da heutzutage alle Dokumente und E-Mails revisionssicher aufbewahrt werden müssen, bietet sich eine elektronische Archivierung an. Alle wirtschaftlich relevanten Unterlagen müssen bis zu 10 Jahre archiviert werden (in einer rechtssicheren, revisionssicheren Form). Wichtig für eine solche elektronische Langzeitarchivierung ist:

  1. Dass die Archivierung in einem einheitlichen sowie unveränderlichen Format durchgeführt wird.
  2. Dass alle Funktionalitäten und Verknüpfungen der Originaldokumente erhalten bleiben, unabhängig davon wann oder womit ich das Dokument später einmal öffnen will (TIFF und PDF/A haben sich hier als Formate durchgesetzt).

Bisher hat es sich bewährt die Archivierung in IBM Notes mit spezialisiert Tools wie n2pdf oder webPDF vorzunehmen. Dabei ist n2pdf auf die Inhalte von Notes spezialisiert und kann diese (automatisiert) in Formate umwandeln, die den Ansprüchen an eine Langzeitarchivierung entsprechen. Dabei werden Dokumente, Notes-Mails und Anhänge jeglicher Art in die PDF/A-Norm (ISO 19005) umgewandelt und archiviert. Mit einer solchen Software ist es mit relativ geringem Aufwand möglich, ein Gateway zu einem Langzeitarchiv zu schaffen.

Archivierung von E-Mails mit komplexen Inhalten und Anhängen:

Die Archivierung von Notes-E-Mails und -Datenbanken unter IBM Notes hat sich auch hinsichtlich der wichtigsten Archivierungsanforderungen bewährt. Aber wie sieht es mit komplexen HTML Inhalten aus? Um E-Mails optimal archivieren zu können braucht man ein Tool, das jegliche Mailinhalte bestens verarbeiten kann, also auch komplexe Notes-Inhalte und Anhänge. Als Softwarelösungen, die kontinuierlich verbessert und angepasst werden, wurde mit der optimierten Version von n2pdf 5.0 eine Möglichkeit geschaffen, externe Inhalte sauberer darzustellen. Dabei geht es um die Konvertierung von HTML-Inhalten.

HTML-Inhalte sind in MIME basierten E-Mails üblich und spielen bei der Bewältigung von E-Mail-Archivierung eine Rolle, die man mit der Softwarelösung n2pdf bestens umsetzen kann. In diesem Fall wurde eine konkrete Verbesserung vorgenommen, die wirklich außerordentlich hilfreich ist. Es geht um die Funktion zur Verarbeitung von HTML Inhalten die in MIME (Multipurpose Internet Mail Extension) basierten E-Mails vorkommen.

n2pdf: Notes Dokumente mit MIME Inhalt verarbeiten

Bei Notes-Dokumente, die auf MIME-Inhalten basieren, musste man bis dato die Inhalte zunächst in Notes RichText-Inhalte konvertieren. Dafür war es üblich, dass man die betreffenden Notes-Dokumente im Notes-Client öffnen und speichern musste. Durch diesen Arbeitsschritt wurden die Inhalte in RichText konvertiert. Wurde dies nicht durchgeführt, konnte es passieren, dass die Dokumente aufgrund bestimmter Formatierungen unsauber dargestellt wurden.

Inzwischen verfügt n2pdf über ein Mittel, diesen Zwischenschritt zu übergehen. Es gibt nun eine automatische Möglichkeit, welche die Konvertierung der HTML-Inhalte zu RichText übernimmt. Zusätzlich kann man steuern, wie die Inhalte konvertiert werden sollen. Man kann also festlegen, ob externe Inhalte, wie z.B. bei einem Newsletter, geladen werden sollen. Man kann auf Wunsch auch einen Dateinamen definieren, der beim Export verwendet werden soll. Mehr zu den Auswahlparametern von n2pdf für die Konvertierung von MIME Inhalten finden Sie in der n2pdf Dokumentation.

Zusammenfassung: Komplexe HTML-Strukturen in Notes verarbeiten

Die Lösung für eine saubere Archivierung mit Notes: Mit der aktuellen n2pdf Version ist es möglich, sogenannte „Mime Parts“, also Dokumente die MIME-Inhalte haben, zu verarbeiten. Diese können sowohl bei einzelnen Notes-Dokumenten, als auch bei einzelnen RichText-Feldern vorkommen. Darüber hinaus ist es möglich, Einfluss auf die Art der Verarbeitung zu nehmen. Bei Dokumenten, die über das Internet empfangen werden, ist es in der Regel so, dass der Inhalt der Dokumente als HTML-Code in den MIME-Inhalten abgelegt wird. Für die anschließend notwendige Umwandlung von diesen HTML-Inhalten in RichText-Inhalte, ist n2pdf jetzt noch einmal komfortabler geworden. Durch eine direkte Möglichkeit der Konvertierung (läuft automatisch ohne Zwischenschritt) werden die HTML Inhalte zu RichText und werden so sauber dargestellt.

Wenn wir Ihr Interesse geweckt haben die aktuelle Version von n2pdf zu testen, um auch die Funktion der Konvertierung von HTML-Inhalten kennenzulernen, bieten wir unverbindlich unsere kostenlose Demo von n2pdf 5.0 zum Test an.