Datenblatt

Adaptive Redaction: Structural and Document Sanitization

Was ist Sanitization?Unter Sanitization versteht man das Bereinigen oder Säubern von Dateien von gefährlichen versteckten Inhalten. Dies können aktive Inhalte (beispielsweise Malware) oder Informationen (wie versteckte Dokumenteigenschaften) sein. Schädlicher Code kann ein unsichtbares, bösartiges Skript auf einer ansonsten legitimen Webseite sein oder eingebettet in einem Dokument versteckt. Zur...
Blog

Neu: OCR Scannen von Bildern in E-Mails

Optische Zeichenerkennung (OCR) als Technologie dient dazu, Text innerhalb von Grafiken zu ermitteln und diesen zu entschlüsseln. Während es für das menschliche Auge kein Problem darstellt, Text zu erkennen (auch über Kopf oder auf die Seite gedreht), ist es rechenintensiv, dies r maschinell zu tun. Inzwischen gibt es jedoch neue Algorithmen, die mit schräg verlaufendem (abgewinkeltem Text) fertig werden und mehrere Sprachen gleichzeitig verarbeiten können.