Dit indhold skal være i et editerbart format, før vores sprogspecialister kan arbejde med det. Og selvom oversættelsesværktøjer (CAT) har gjort store fremskridt i løbet af de seneste 20 år, er der stadig brug for en ekspert til at vurdere, om en fil kan bearbejdes. Selv med de mest avancerede softwareprogrammer, der er tilgængelige i dag, er der stadig brug for menneskelig indblanding.
Som udgangspunkt er de fleste filformater editerbare, men af og til skal der en hjælpende hånd til. Det kan være:
- Udtrækning af tekst fra billeder eller DTP-software
- Fjernelse af unødvendige linjeskift og mellemrum, der kan gøre det besværligt at arbejde med dit indhold.
- Oprydning i PDF-filer efter OCR-bearbejdning (optisk tegngenkendelse)
- Filtrering af irrelevant indhold i Excel-filer
- Generering af tag-indstillinger i (.ini) filer til .xml og tilsvarende filtyper
Tekstudtræk
Filformater, hvor det kan være nødvendigt at trække tekst ud, ombefatter InDesign (.indd), QuarkXPress (.qxp), PDF-dokumenter (.pdf), Adobe Photoshop (.psd) og PowerPoint (.ppt). Vores dygtige engineers gennemgår dit "ikke-editerbare" indhold og ændrer det til et editerbart format (f.eks. i Microsoft Word, LanguageWire Editor eller andre oversættelsesværktøjer). Når teksten er blevet oversat, korrekturlæst osv., indsættes den derpå igen i dit dokument, så det visuelt er så tæt på det oprindelige indhold som overhovedet muligt.
Arbejdet med tekstudtrækning falder typisk ind under en af to kategorier: konvertering eller udtrækning. Her kan du se nogle almindelige eksempler på begge:
Konvertering
- Konvertering af PDF-filer til Microsoft Word-filer med editerbar tekst
- Ændring af tekst i rasteriserede billeder til editerbar tekst
- Konvertering af QuarkXPress-filer til InDesign
Udtrækning
- Udtrækning af tekst fra Adobe Illustrator-filer (.ai)
- Udtrækning af tekst fra lag (InDesign, AutoCad osv.)
Optisk tegngenkendelse (OCR)
OCR er en proces, hvor elektronisk tekst konverteres til et editerbart format. Det bruges ofte i oversættelsesbranchen. Uden OCR kan vi ikke levere præcise analyser og dermed pristilbud.
OCR-konvertering ser visuelt flot ud. Men hvis du kradser lidt i overfladen, er det tydeligt, at vi har at gøre med formatering, som ingen mennesker kunne have fundet på. Det kan påvirke oversættelsesarbejdet, forlænge leveringstiden på oversættelsen og øge den samlede udgift til projektet.
Vores interne engineers kan rydde op i indholdet og optimere dine filer, så du bedre kan udnytte din oversættelseshukommelse og forkorte din time-to-market.
Kort og godt
- Forberedelse af filer, så sprogspecialister kan arbejde med dem i deres oversættelsesværktøj
- Udtrækning af tekst fra billeder eller DTP-software
- Fjernelse af unødvendige linjeskift og mellemrum
- Oprydning i PDF-filer efter OCR-bearbejdning (optisk tegngenkendelse)
- Filtrering af irrelevant indhold i Excel-filer
- Generering af tag-indstillinger i (.ini) filer til .xml og tilsvarende filtyper