2020 m. balandžio 16 d., ketvirtadienis

Teksto atpažinimas - OCR


Nemokami variantai:

Online:
https://www.onlineocr.net/
https://github.com/naptha/tesseract.js#tesseractjs
https://www.gdpicture.com/solutions/ocr-sdk/
Microsoft OneNote- (Copy Text from Picture )
Google Drive - Upload .pdf or img and open 'As Document'.


Mokamos:
https://finereaderonline.com/en-us/Tasks


Pavyzdys naudojant tesseract, išvestis į terminalo langą out, norint išsaugoti į failą, rašomas 'file.txt'

$ tesseract '/home/sup/Pictures/Screenshot from 2019-01-31 17-25-22.png' stdout

Resolution 0 dpi. Using 70 instead.
Estimating resolution as 147
SIANDIEN = DARBODIENA —SAVAITGALIS