Anonim

Een van de dingen die me vaak heeft gefrustreerd, is het onvermogen om gemakkelijk tekst uit afbeeldingen en bepaalde PDF-bestanden te kopiëren (bijvoorbeeld die welke zijn gemaakt op basis van gescande documenten). Gelukkig zijn er in de loop van de tijd software-oplossingen ontwikkeld om dit probleem aan te pakken, wat een aanzienlijke tijdwinst mogelijk maakt die anders zou zijn besteed aan het handmatig kopiëren en opnieuw typen van de tekst. In de tip van vandaag ga ik het hebben over een gratis softwaretool met de naam Capture2Text die een OCR-algoritme (Optical Character Recognition) gebruikt waarmee u tekst kunt vastleggen van afbeeldingen en PDF-bestanden.

Installatie en instellingen

Ga om te beginnen naar de SourceForge-pagina van het project en download de nieuwste versie van Capture2Text. De software wordt geleverd als zip-archief en bevat op dat moment geen speciaal installatieprogramma. Pak het archief uit en start het bestand Capture2Text.exe. Hiermee wordt de software gestart en wordt een pictogram in het systeemvak geplaatst:

Eerst moet u de voorkeuren van de software instellen, met name welke sneltoetsen (of snelkoppelingen) u moet gebruiken om het vastleggen te starten en te stoppen:

In mijn geval heb ik ervoor gekozen om de “Windows + q” -toetsen te gebruiken om het vastleggen te starten en de “Enter” om het te stoppen. U kunt deze opties aanpassen aan wat het beste voor u werkt. Houd er rekening mee dat de toets "Windows + s" vaak al wordt gebruikt voor schermopname (bijvoorbeeld door programma's zoals Microsoft One Note).

Op het volgende tabblad kunnen OCR-opties worden geconfigureerd, inclusief de invoertaal (momenteel worden zeven talen ondersteund) en of voorbewerking van OCR moet worden gebruikt om de nauwkeurigheid te verbeteren (sterk aanbevolen). Ten slotte kunt u op het tabblad Uitvoer onder andere kiezen of u de vastgelegde tekst op het klembord wilt opslaan of een afzonderlijk pop-upvenster wilt openen.

De software gebruiken

Nadat de software is geïnstalleerd en geconfigureerd, kunt u deze gaan gebruiken via de sneltoetscombinatie voor het starten van vastleggen. Selecteer met uw muis het gebied op de afbeelding dat de tekst bevat die u wilt vastleggen. Om de opname te stoppen, drukt u op de sneltoets die u hebt gekozen om de opname te stoppen. De tekst wordt vervolgens naar het klembord, een pop-upvenster of beide gekopieerd. Een voorbeeld hiervan is hieronder te zien.

Uit mijn snelle testen van de tool met afbeeldingen, heb ik vastgesteld dat de nauwkeurigheid behoorlijk is. Vanzelfsprekend zijn er beperkingen aan tools zoals deze en OCR in het algemeen. Sterk gewijzigde tekst (zeer cursief, cursief of modern) werkt bijvoorbeeld niet zo goed, en soms helemaal niet. In sommige gevallen helpt het ook om de afmetingen van het opnamevak enigszins aan te passen of met de zoom op de afbeelding zelf te spelen om een ​​nauwkeuriger resultaat te krijgen.

Bij het vastleggen van tekst uit gescande PDF-documenten is de nauwkeurigheid in orde, met enkele laatste aanpassingen die over het algemeen nog steeds nodig zijn op de vastgelegde uitvoer (afhankelijk van de kwaliteit van de eerste scan). Ik heb ook gemerkt dat het een paar seconden langer kan duren om de software te verwerken, vooral wanneer gevraagd wordt om grote hoeveelheden tekst te converteren.

Dat gezegd hebbende, over het algemeen denk ik dat de tool goed werkt, vooral omdat het vrij beschikbaar is - ik moedig je aan om het uit te proberen.

Addendum 16/11/2015:

Als een andere optie, voor degenen die Google-accounts hebben, is het ook mogelijk om de OCR-mogelijkheden van Google te gebruiken door een bestand naar uw Google Drive te uploaden (meer details vindt u hier). Verder is er ook een OCR-plug-in beschikbaar voor Google Chrome-gebruikers genaamd Copyfish, die je misschien ook wilt bekijken.

Hoe tekst van afbeeldingen vast te leggen met ocr-software