Yak-Yak Logo

Tekstgenkendelse (OCR) - TextBridge

Tricks med TextBridge

Det vigtigste i forbindelse med scanning og tekstgenkendelse er, at brugerne tænker lidt over deres behov først. Det sparer unødvendig ulejlighed.

De fleste, som køber Yak-Yak, anskaffer også hjælp til læsning i form af en scanner med software, som kan genkende tekster (OCR). Selv med en ældre maskine kan brugeren få en side tekst eller mere læst højt minutter efter scanningen startede. Det er ganske ligetil at lære og resultaterne er forbløffende gode - som oftest fejlfri! Hastigheden afgøres af den aktuelle computer og scanner.

Opsætning af scanner

Ved opsætning af en scanner sker det almindeligvis, at TextBridge (OCR programmet) ikke kan finde scanneren. TB fortæller det selv, når du trykker på ikonen med billede af en scanner. Vælg den rette driver i vælgeren, som findes i Apple-menuen øverst til venstre. Prøv igen - det er en Macintosh, så du får normalt en brugbar vejledning om evt. problemer.

De mange forskellige scannere virker ikke ens og nogle foretrækker at bruge en TWAIN driver (vælges i TBs scanner-menu). Nogle scannere foretrækker sammen med TextBridge at bruge en neutral driver ved navn "Works like Apple scan". Den findes på din TB CD-ROM. Ofte må man prøve sig frem. Har du først fundet den rigtige, så husk navnet - det kan ske, at computeren glemmer indstillingen.

indhold

Preview funktionen

I forbindelse med scanninger med TextBridge er det en god ide at bruge preview funktionen for altid at sikre god kvalitet. På den måde kan man med tekst-redskabet også udvælge tekster udenom illustrationer og i den ønskede rækkefølge. Skal der hentes mange sider af en bog ind, kan brugeren slå preview-funktionen fra.

indhold

Hurtig adgang til teksten

Det vigtigste for hurtig scanning af f.eks. en artikel eller et brev er at få teksten til rådighed straks. Det sker via et såkaldt script ("Instant access OCR"), som efter installationen findes i maskinens Æble-menu. Det åbner TextBridge, udfører ordrerne (med eller uden preview) og sender slutresultatet til computerens clipboard (dvs. Skuffen). Den færdige tekst kan derefter sættes ind i Yak-Yak eller i et andet tekstprogram - begge kan også gemme teksten.

indhold

Flydende tekst vigtig

Fordelen ved Instant Access metode er, at den fremstiller flydende ubrudt tekst, som stemmerne kan læse frit op. Instant Access metoden kan også anvendes på mange lagrede præ-scannede sider hentet fra disk - den smider stadig teksterne i Skuffen. Her kan for lidt RAM-hukommelse blive en begrænsning. Tildel TextBridge mere hukommelse i programmets informationsvindue (fra Arkiv-menuen).

indhold

Hurtig adgang - pas på!

Når du bruger Instant Access metoden, er det vigtigt at bemærke, at den efterlader TextBridge aktiv i computerens hukommelse (se i program-menuen øverst til højre). Denne software optager megen plads i maskinen (i hvert fald 10 MB RAM), og den kan forhindre Yak-Yak og/eller stemmerne i at virke optimalt - de bliver kvalt.

Så luk TextBridge efter brugen.

En anden vigtig ting at vide er, at Instant Access kræver, at TextBridge er lukket, før den kan køre.

indhold

Direkte scanning

Hvis brugeren vælger at scanne direkte fra TextBridge (altså udenom Instant Access) ser han en dialog, som beder om en beslutning om formatet, som teksten skal gemmes i. Måske vil han vælge en tekstbehandler for at arbejde videre med tingene der.

Yak-Yak kan kun læse rene tekstfiler fra programmer som "Tekst og Lyd" (gratis), Simple Text (gratis), BBEdit Lite (gratis) eller filer "gemt som tekst" fra et tekstbehandlingsprogram (ClarisWorks, AppleWorks etc). Alle tekstbehandlere kan dette. BBEdit er klart det bedste, fordi det er lynhurtigt og kan tage meget store mængder tekst.

Anbring de nye gemte dokumenter i en skribent-mappe, som bruges af Yak-Yak. Mange vælger at oprette er særligt kontor til læsning af scannede tekster.

indhold

Hårde linieskift - pas på!

Hvis man vælger "WYSIWIG text" i scannerens dialog får man hårde linieskift for enden af hver linie i sin tekst. Det svarer til, at der et slået på "retur-knappen" på tastaturet efter hver linie. Hvis man gemmer som ASCII, så får man både en margin og hårde linieskift. Det samme gælder for flere gemme-formater i kendte tekstbehandlingsprogrammer.

Undgå dette!

Disse hårde linieskift generer den syntetiske stemme, fordi den så ikke kan læse teksten op korrekt med syntaks og intonation.

Hvis tekster er gemt som WYSIWIG, så kan det strålende BBEdit 4.1 Lite program uden videre fjerne disse linieskift og gemme teksten brugbart. Det sker i menuen "Text" og emnet "Remove Line Breaks" - dokumentet bliver renset, linierne folder og oplæsningsproblemerne er løst.

Tekst-programmet BBEdit Lite 4.1 fås her (867 KB at downloade):

ftp://ftp.macresource.com/barebones/bbedit_lite-41.sit

indhold

Mange sider ad gangen

Hvis brugeren vil skrive en lang elektronisk læsebog, skal han scanne mange sider ind og gemme dem først som PICT-filer. TextBridge giver selv filerne fortløbende numre. Vælg "Defer OCR" fra File-menuen. Kald dem Kapitel 1 og afslut når alle siderne er inde (brug evt. Preview). Derefter Kapitel 2 etc etc.

Derefter skal TextBridge omsætte bogen til flydende tekst et kapitel ad gangen - brug "Instant access OCR". Til sidst kan man samle alle kapitlerne (check dem først i Yak-Yak) til en stor fil med et BBEdit redskab, vælg Extensions/Concatenate files, gemme dem som en hel fil, og så skrive læsebogen i Yak-Yak (hos Bibliotekaren).

indhold

Det skal læres

Denne proces skal naturligvis læres - både i TextBridge, BBEdit Lite og Yak-Yak. Det er ikke kompliceret. De fleste elever i YakCentret (også dyslektikere) lærer det grundlæggende på en times tid. Øvelse gør dog mester. Efter få dage er scanning + OCR en rutinesag.

Mere om Scanning af tekst.

Copyright © 1998-2005 Nugurt All Rights Reserved