Dateivorbereitung

Unsere internen Lokalisierungsengineers optimieren Ihre Dateien, damit mehrsprachige Inhalte einfacher zu handhaben sind. Sie profitieren zudem von der besseren Nutzung Ihrer Translation Memories, sparen Zeit und beschleunigen den Übersetzungsprozess.

Bessere Qualität

Visuelle Verbesserung der übersetzten Inhalte durch professionelle Vorbereitung.

Zeit und Geld sparen

Ihre Dateien werden optimiert, damit Translation Memories besser genutzt werden können.

Sprachexperten benötigen Ihren Content in editierbarer Form, um damit arbeiten zu können. Auch wenn die computerunterstützte Übersetzung (CAT) in den letzten 20 Jahren erhebliche Fortschritte gemacht hat, wird nach wie vor das scharfe Auge eines Experten benötigt, um zu beurteilen, ob eine Datei verarbeitet werden kann oder nicht. Selbst die fortschrittlichsten Softwareprogramme benötigen nach wie vor menschliches Eingreifen.

Die meisten Dateiformate sind problemlos, aber es gibt auch Ausnahmen. Dazu zählen:

  • Extrahieren von Text aus Bildern oder Desktop-Publishing-Software
  • Entfernen von unnötigen Zeilenumbrüchen und Leerzeichen, die das Arbeiten mit Ihrem Content schwierig gestalten
  • Bereinigen von PDF-Dateien nach der Verarbeitung mit optischer Zeichenerkennung (OCR)
  • Filtern von irrelevanten Inhalten in Excel-Dateien
  • Erstellen von Tag-Einstellungen (.ini-Dateien) für .xml-Dateien und ähnliche Dateitypen

Textextraktion

Zu den Dateiformaten, bei denen oftmals Text extrahiert werden muss, gehören InDesign (.indd), QuarkXPress (.qxp), PDF (.pdf), Adobe Photoshop (.psd) und PowerPoint (.ppt). Engineers prüfen Ihren Content auf nicht-editierbare Inhalte und extrahieren diese in ein editierbares Format (z. B. in Microsoft Word, im LanguageWire Editor oder für andere CAT-Tools). Wenn der Text übersetzt, Korrektur gelesen oder auf andere Weise sprachlich bearbeitet wurde, wird er wieder in Ihr Dokument eingefügt. Dabei wird Wert darauf gelegt, dass er optisch dem Ausgangstext so weit wie möglich gleicht.

Die Textextraktion unterteilt sich normalerweise in zwei Kategorien: Konvertierung oder Extraktion. Einige Beispiele:

Konvertierung

  • Umwandlung von PDF-Dateien in Microsoft Word-Dateien mit editierbarem Text
  • Umwandlung von Text in gerasterten Bildern in ein editierbares Format
  • Umwandlung von QuarkXPress-Dateien in InDesign-Dateien

Extraktion

  • Extrahieren von Text aus Adobe Illustrator (.ai)-Dateien
  • Extrahieren von Text aus Layern (InDesign, AutoCAD usw.)

Optische Zeichenerkennung (OCR)

OCR ist der Prozess der Umwandlung von elektronisch verfügbarem Text in ein editierbares Format. Dieses Verfahren wird in der Übersetzungswelt häufig verwendet. Ohne OCR könnten wir keine exakten Analysen und somit Kostenvoranschläge erstellen.

OCR-Konvertierungen sehen auf den ersten Blick tadellos aus. Wenn man diese Dateien näher untersucht, erkennt man allerdings Formatierungen, die niemals von einer menschlichen Hand eingefügt worden wären. Diese Formatierungen können den Übersetzungsprozess erheblich beeinträchtigen, die Lieferzeit für Übersetzung verlängern und die Gesamtkosten des Übersetzungsprojekts in die Höhe treiben.

Unsere internen Engineers bereiten den Content vor und optimieren Ihre Dateien, damit Translation Memories besser genutzt und der Content schneller veröffentlicht werden kann.

Kurz gesagt

  • Vorbereitung von Content für die Verarbeitung in CAT-Tools durch Sprachexperten
  • Extrahieren von Text aus Bildern oder Desktop-Publishing-Software
  • Entfernen von unnötigen Zeilenumbrüchen und Leerzeichen
  • Bereinigung von PDF-Dateien nach der Verarbeitung mit optischer Zeichenerkennung (OCR)
  • Filtern von irrelevanten Inhalten in Excel-Dateien
  • Erstellen von Tag-Einstellungen (.ini-Dateien) für .xml-Dateien und ähnliche Dateitypen.
Dateivorbereitung

Bereit Ihre globale Zielgruppe zu erreichen?

Sprechen Sie die richtige Sprache: Nutzen Sie leistungsstarke Technologie für die Zusammenarbeit mit einer Fülle von Experten. Setzen Sie sich mit dem LanguageWire Team in Verbindung oder starten Sie direkt.