Vraag & Antwoord

Anders (software)

PDF-scans doorzoekbaar maken én verkleinen...

2 antwoorden
  • Beste lezer, Wie weet een programma om kleurenscans doorzoekbaar te maken én tegelijkertijd te verkleinen? Nu houd ik ontzettend grote bestanden over die na OCR eroverheen gehaald te hebben, maar ietsiepietsie kleiner worden. Ik weet dat zo'n programma namelijk bestaat voor de zakelijke markt: IRISpdf (zie http://www.irislink.com/c2-1026-17/iHQC--color-compression-of-text-and-images--More-Efficient-than-Jpeg2000--.aspx). Dat programma draait bij mijn weten alleen op een server. Een citaat: "De intelligente High Quality Compression technology™ van I.R.I.S. is ontwikkeld om standaard kleurenbeelden te converteren naar sterk gecomprimeerde PDF-bestanden met volledig doorzoekbare tekst." Dit is wat ik wil. Al langere tijd scan ik bestanden in PDF-formaat, als het even kan in zwart wit natuurlijk. Echter sommige documenten hebben een grijze achtergrond en moet je daarom met grijswaarden scannen. En soms zelfs in kleur, als het een essentieel bestand betreft. Maar om dat te bewaren levert heel veel moeilijken op, vandaar de vraag. Bij voorbaat dank voor uw reactie. Jelle
  • Een PDF met OCR wordt zelden kleiner omdat de scan (een plaatje) ook gewoon samen de tekst in de PDF blijft opgeslagen. Met de huidige prijzen van harde schijven kan me dat niet boeien. Ik zal je wel uit de droom helpen: een goede OCR herkenning is een illusie. Om de paar zinnen zijn er stukken tekst die niet herkend kunnen worden zonder menselijk ingrijpen. De i wordt vaak als een l gezien enzovoort.. Ik scan nu meer dan 10 jaar professioneel voor archieven en data capture. De enige methode om snel te zoeken is gokken op de PDF herkenning. Waar wij voor gekozen hebben is een combinatie van PDF, goede namen van scan bestanden (een gescande nota heet "datum - nota - kenmerk in woorden") en JPG bestanden. Met name dat laatste is goed door te bladeren zonder het te openen.

Beantwoord deze vraag

Weet jij het antwoord op deze vraag? Registreer of meld je aan met je account

Dit is een gearchiveerde pagina. Antwoorden is niet meer mogelijk.