SimpleOCR - Overtikken? Ik ben niet getikt!

© PXimport

SimpleOCR - Overtikken? Ik ben niet getikt!

Geplaatst: 3 augustus 2021 - 05:09

Aangepast: 14 december 2022 - 10:20

Redactie ID.nl

Ken je dat, een jpg-bestand met een tekst die je graag ziet overgeheveld naar een tekstverwerker of een website? Als je dan niet beschikt over de juiste tooling, komt je dat op handmatig overtypen te staan. Dat hoeft niet, want er is een oplossing in de vorm van een freeware hulpprogramma: SimpleOCR.

De tool SimpleOCR is, zoals de naam al doet vermoeden, simpel en doeltreffend. Ga naar de webpagina om het te downloaden en op je pc te installeren.

Tekstsoort en taal

Als je SimpleOCR start, dan kun je als eerste de tekstsoort instellen, waarbij je moet kiezen tussen Machine Print en Hand Writing. De eerste optie (tekst afkomstig uit een printer, van een computer of uit een boek) blijft altijd actief. De tweede optie (handschrift) is slechts beperkt houdbaar. Daarna is het slim om meteen aan te geven dat je Nederlandstalig wilt werken (in verband met de spellingchecker), waarna je via een druk op de knop Select doorstart naar het werkvenster van SimpleOCR.

Gaat het om strakke tekst uit een boek of zijn het handgeschreven woorden?

© PXimport

Invoer selecteren

In het werkvenster van SimpleOCR druk je op de knop Add Page om aan te geven dat je een grafische pagina wilt inlezen. Het dialoogvenster Add Source verschijnt vervolgens met vier mogelijkheden: (1) Scanner, (2) File, (3) Batch en (4) InkLink.

De eerste drie opties spreken voor zichzelf, de vierde optie – InkLink – hoort bij een Seiko-apparaatje (voor enkele tientjes te koop op Amazon), waarmee je handgeschreven notities kunt inlezen en overzetten. Is toch even leuk om te weten.

OCR’en en corrigeren

Nu kan het echte werk beginnen. SimpleOCR zal de door jou aangeleverde gegevens ‘inslikken’ en in eerste instantie omzetten naar een zwart-witbitmap. Een klik op de knop Convert to Text zorgt ervoor dat die bitmap wordt omgezet naar letters en woorden. Dat gaat allemaal vrij snel.

Vervolgens wordt de tekst die SimpleOCR (lees: het Nederlandstalige woordenboek) niet kan herkennen in kleur neergezet, waarbij je ter correctie de spellingchecker kunt raadplegen. En als je er met de spellingchecker niet uitkomt, dan kun je de mankerende tekst ook handmatig aanpassen. De bedoeling is natuurlijk de tekst zo netjes mogelijk te maken, voordat je het resultaat wegschrijft als tekstbestand of als Word-document.

We hebben de bitmap laten omzetten naar letters en woorden. Nu nog even de laatste correcties aanbrengen.

© PXimport

Deel dit artikel
Voeg toe aan favorieten
ID.nl logo

ID.nl, onderdeel van Reshift BV, is in 2022 gestart en uitgegroeid tot de meest toonaangevende en complete consumentensite van Nederland. Het doel van ID.nl is om de consument te helpen met alle technologie die hoort bij het dagelijks leven: van smart-health-meters tot e-bikes, van warmtepompen tot zonnepanelen - en alles daar tussenin!

Duidelijk, betrouwbaar en onafhankelijk: ID.nl maakt moeilijke dingen makkelijk.

Contact

ID.nl

Nijverheidsweg 18

2031 CP Haarlem

info@id.nl

Telefoon: 023-5430000