ОЦР су они за оптичко препознавање знакова или на шпанском такође познати као оптичко препознавање знакова. ОЦР је софтвер који омогућава препознавање текста, стварајући његову слику како би га трансформисао у низ знакова, а затим их сачувао у датом формату који се може користити у тим програмима за уређивање текста. Другим речима, захваљујући овој новој технологији, било која врста текста или документа, укључујући ПДФ датотеке, скенирани папир или чак слике преузете са дигиталних фотоапарата, може се претворити у податке како би се имала могућност уређивања.
Овај софтвер ради на следећи начин, прво анализира сваки део слике датог документа; дистрибуирати страницу у комадима као што су табеле, слике, текстуални блокови, између осталог; тада се редови дистрибуирају речима да би касније постали ликови; а пошто су знакови већ назначени, софтвер врши поређење са групом слика узорка. Ово напредује према низу хипотеза о томе шта је сваки лик; и на основу ових хипотеза анализира различите варијанте разбијања линија у речи и речи у знакове. И након великог броја анализа и обраде хипотеза, програм коначно представља већ препознати и трансформисани текст у новом формату.
Треба напоменути да данас постоји низ програма које тржиште рачунара нуди на основу ОЦР-а, попут ОмниПаге, Аббии Фине Реадер или РЕАДирис. ИИ који имају способност, не само да анализирају и препознају текст као такав, већ препознају и формат и стил, али уз одређена ограничења, захтевајући тако да се текст након анализе анализира како би се извршила прилагођавања која су захтевају.