Autotext

OCR, Skanning, XML

Våra tjänster  

Skanning av tryckt material

Vi skannar allt tryckt material såsom böcker, artiklar, tidningar, tidskrifter, domar, lagtext, manualer, broschyrer, ekonomisk information osv. Det kan vara nytt eller gammalt. Tryckt eller maskinskrivet.

OCR

AutoText använder program för den automatiska överföringen från papper till digital text. I processen skapas en del fel och för att ringa in dessa använder vi oss av automatisk felmönsterkontroll och korrekturläsning. Som ett sista steg är det alltid en medarbetare som går igenom texten för att försäkra sig om dess kvalitet. För oss är kvaliteten det absolut viktigaste målet.

Materialet vi levererar är nästan felfritt (99,995 %) vilket motsvarar ett tecken per 20 000. Faktum är att vi oftast rättar fler fel i originalet än de vi själva skapar i processen. I flera fall har redan informationsinnehavaren materialet i något digitalt format men det brukar ändå löna sig att skanna in det. Vilken var den senaste versionen som motsvarar trycket? Saknas något i den elektroniska versionen? Gjordes det ändringar precis innan tryck som inte är med?

Tjänster

Vi erbjuder också en del övriga tjänster:

  • Utveckling av DTDer och Style-sheets (CSS, XSL, XSLT)
  • Konsultation och utbildning om elektroniskpublisering, digitalisering och effektivisering av datahentering. 

Datakonvertering

I de fall informationsägaren är säker på att man funnit rätt fil utför vi självklart konverteringar från ett digitalt format till ett annat. Detta kan vara nödvändigt om man t ex tidigare arbetat i ett ombrytningsformat och nu ska byta till ett annat.

   

Vissa format lämpar sig inte till konvertering pga komplexiteten. I dessa fall är det mer ekonomiskt att skanna in texten.

 

Vi konverterar nästan alla filformat till nya format. Många kunder har dessutom egna format som vi konverterar till eller från.

 

Det konverterade digitala formatet levereras kodat och formaterat till kunden. 

 

Ett format – många möjligheter

Den traditionella produktionsprocessen är uppbyggd kring utgivning av boken i ett format, i regel tryckt pappersbok. Man bryter om verket i t ex QuarkXPress, korrekturläser det och utför rättelser. Den digitala filen sänds till tryckeriet som tar ut plåt och trycker boken.

Denna produktionsprocess ger inte några större möjligheter att återanvända det digitala materialet i annan utgivning genom andra format/medier. Det är dessutom stor risk att rättelser som gjorts inte införts i den originala filen som förlaget skickade till pre-press.

Om utgivaren vill använda innehållet i andra sammanhang och i andra format måste man ta hänsyn till att

• filen måste kontrolleras mot trycket så att man säkert vet att rättelser är gjorda

• samma rättelser är gjorda i samtliga filer som används till att producera andra utgivningar.


En källfil – flera utgivningsformat

För AutoText är den centrala ståndpunkten i samtliga tjänster att data ska kunna användas i många olika sammanhang i framtiden, till lägsta möjliga kostnad. I medieneutrala format skiljer man mellan innehåll och layout och man arbetar med en grundfil (källfil) som utgör underlaget till flera utgivningsformat.

Kort sagt handlar det om att:

          

  1. källformatet är en uppmarkerad text där innehållet är indelat i olika element (t ex rubriker, brödtext, tabeller, listor, fotnoter osv) och relationerna mellan elementen är definierade. Ett källformat består uteslutande av struktur på data och har inget med layout att göra.

 

Ett exempel på medieneutralt källformat är XML (eXtensible Markup Language).

XML-uppmärkningen sker med utgångspunkt i en regelsamling, DTD (Document Type Definition). När dokumentet är uppmarkerat i XML görs en kontroll mot regelsamlingen. Denna kontroll kallas parsning eller validering och syftar till att kontrollera att strukturen i dokumentet följer de i DTDn uppsatta reglerna. AutoText utvecklar DTDer för samtliga dokumenttyper och utför konvertering till XML.

   

  1. utgivningsformat är de olika format data blir presenterad i. Kännetecknande för utgivningsformat är att de innehåller layout som gör data läsbart och attraktivt.

 

Exempel på källformat är:

 

  • XML, OEB
  • SGML

 

Från källfilen kan man generera många olika format. Ofta bestämmer typen av data vilket format som framhäver informationen bäst.

 

Exempel på utdata är:

 

  • PDF för tryck och elektronisk distrubution
  • e.bokformat. t ex Microsoft Reader och Mobipocket
  • olika textbehandlingsformat, t ex MS Word
  • olika databasformat, t ex för biblioteks. och ekonomisystem
  • kundens egna format.

 

Med hjälp av makron/program och stilmallar (som styr layouten) kan källformatet konverteras till vilket utgivningsformat som helst och man kan således från ett och samma dokument generera ett flertal olika utgivningsformat.

AutoText utvecklar makron/program och stilmallar som används till att konvertera från XML till olika utgivningsformat. 


Kontakta oss gärna för mer information!