Agurtu blogaren irakurle guztiei!
Ordenagailuan lan egiten dutenek (ez du jotzen, baina funtzionatzen du) uste dut testu bidezko aitorpena burutzea. Beno, adibidez, liburuko zatia eskaneatu duzu eta orain zati hau itsatsi behar duzu zure dokumentuan. Eskaneatutako dokumentua argazki bat da, eta testua behar dugu. Horretarako, programa bereziak eta lineako zerbitzuak behar ditugu argazkien testua aitortzeko.
Aitortzeko programei buruz, aurreko mezuetan idatzi dut:
- Eskaneatu testua eta aitorpena FineReader (ordaindutako programa);
- FineAlder analogikoa - CuneiForm (doako programa) lan egin.
Artikulu berean testu-onarpenerako lineako zerbitzuak lantzea nahi nuke. Azken finean, azkar testua 1-2 argazki behar badituzu - ez da zentzurik programa ugari instalatzearekin ...
Garrantzitsua da! Onarpenaren kalitatea (akatsen kopurua, irakurgarritasuna, etab.) Oso jatorrizko irudiaren kalitatearen menpe dago. Hori dela eta, eskaneatzen denean (argazkiak, etab.), Hautatu kalitatea ahalik eta altua. Kasu gehienetan, 300-400 dpi kalitatea nahikoa izango da (irudiaren kalitatea zehazten duen parametroa da dpi). Ia eskaner guztien ezarpenetan parametroa normalean adierazten da.
Lineako zerbitzuak
Zerbitzuen lana erakusteko, nire artikulu baten pantaila-argazkia egin nuen. Pantaila-argazki hau zerbitzu guztietan igo egingo da, eta azpian deskribatzen da.
1) //www.ocrconvert.com/
Zerbitzu hau oso atsegina delako gustatzen zait. Gunea ingelesa bada ere, errusieraz ere ondo funtzionatzen du. Ez duzu erregistratu beharrik. Onarpena hasteko, 3 urrats egin behar dituzu:
- igo zure irudia;
- Irudian dagoen testuaren hizkuntza aukeratu;
- sakatu hasierako ezagutza botoia.
Formatua euskarria: PDF, GIF, BMP, JPEG.
Emaitza behean agertzen da irudian. Esan behar dut testua ondo ezagutzen dutela. Gainera, oso azkar - literalki 5-10 segundo itxaron nuen.
2) //www.i2ocr.com/
Zerbitzu honek aurrekoarekin bat egiten du. Hemen fitxategia deskargatu behar duzu, aintzatespenaren hizkuntza aukeratu eta egin klik testu botoian. Zerbitzua oso azkar funtzionatzen du: 5-6 segundo. orri bat.
Onartutako formatuak: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.
Lineako zerbitzu honen emaitza askoz ere erosoagoa da: berehala ikusten dituzu bi leihoak - lehenengoan aitorpena, bigarrenean, jatorrizko irudia. Hori dela eta, erraza da editatzen ari zaren aldaketak egitea. Zerbitzuan izena ematea, gainera, ez da beharrezkoa.
3) //www.newocr.com/
Zerbitzu hau hainbat modutan bakarra da. Lehenik eta behin, "modan" formatua DJVU onartzen du (bide batez, formatuen zerrenda osoa: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). Bigarrenik, irudian testu-eremuen hautapena onartzen du. Hau oso erabilgarria da irudian testu-eremuak ez ezik, baina ez duzu aintzat hartu beharrik.
Onarpenaren kalitatea batez bestekoaren gainetik dago, ez dago erregistratzeko beharra.
4) //www.free-ocr.com/
Aitortzeko zerbitzu oso erraza: irudi bat igo, hizkuntza zehaztu, sartu captcha (bide batez, artikulu honetako zerbitzu bakarra egin behar duzu) eta sakatu botoia irudia testuan itzultzeko. Egia esan dena!
Onartutako formatuak: PDF, JPG, GIF, TIFF, BMP.
Onarpenaren emaitza ertaina da. Akatsak daude, baina ez asko. Hala ere, jatorrizko pantaila-argazkia kalitatea handiagoa izango balitz, akatsen gutxiago izango litzateke.
PS
Hori da gaur egun. Testu-aitorpenerako zerbitzu interesgarrienak ezagutzen badituzu - partekatu iruzkinak, eskertuko dizut. Baldintza bakarra: desiragarria da izena ematea eta zerbitzua doan.
Ongietorria!