OCR – OPTİK KARAKTER TANIMA TEKNOLOJİSİ NEDİR?

Kaan Özgür Gülenyüz 6.1k Görüntüleme
3 Dk Okuma

     Optik karakter tanıma teknolojisi, İngilizcesi “optical character recognition” olup, genellikle teknik metinlerde OCR kısaltmasıyla kullanılır. Teknoloji, pratikte el ile yazılmış, daktilo ile yazılmış veya bilgisayar çıktısı olan metinlerin, tarayıcılar yardımıyla taranıp, dijital ortama aktarılmasına dayanır.


 

     OCR teknolojisinin tarihçesi, eski zamanlara, 1914'lere varır. Öyle ki, Emanuel Goldberg, harfleri tanıyıp onları standart telgraf kodlarına dönüştüren bir makine tasarlamıştır. Aynı zamanlarda, Edmund Fournier d'Albe de bir “optofon” tasarlamıştır. Optofon, bir sayfanın üzerinde dolaştırdığınızda önceden tanımladığınız harfleri veya harf dizilerini gördüğü zaman sizi uyaran bir araçtır. Daha sonra ilkel OCR teknolojileri, şablon eşleştirme sistemleri olarak kullanılmıştır. 1949 yılında, Amerika'da ilk “yazıdan sese” teknolojisi geliştirilmiştir. Aslında bu da OCR teknolojisinin geri çevrilmiş bir uygulamasıdır. 1950 yılında David H. Shepard adlı bir şifreleme uzmanı, İngiliz alfabesinin 23 harfini, mors kodlarını, müzik notalarını tanımlayabilen ve basılı sayfaları sesli olarak okuyabilen bir cihaz geliştirmiştir. Shepard daha sonra Intelligent Machines Research Corporation adlı OCR teknolojisi şirketini kurmuştur. Bu şirket, ilk ticari OCR sistemlerini üreten şirket olmuştur.

     Shepard’ın sistemleri IBM gibi büyük şirketler tarafından lisanslanmış ve ticaret alanında büyük rağbet görmüştür. Amerikan Posta Servisi kurumu da bu teknolojiyi kullanan kurumlardan biridir.


     OCR teknolojisi, körlerin de imdadına koşmuştur. Ray Kurzweil tarafından 1974’te kurulan Kurzweil Bilgisayar Ürünleri şirketi, körler için bir sistem geliştirdi. Sistem, günümüzde kullanılan tipte bir tarayıcıdan ve yazıyı sese dönüştürme teknolojisinden ibaretti. Bu sistem körlere büyük kolaylıklar sağlamaktaydı. Sistem daha sonra büyük makale veritabanına sahip LexisNexis şirketi tarafından kullanılmıştır. 2 yıl sonra da Kurzweil şirketini Xerox’a satmıştır. Şirket şu an Nuance İletişim Teknolojileri şirketinin elinde bulunmaktadır.


OCR Yazılımları

     Günümüzde OCR teknolojisi cebimize kadar girmiş bulunmakta. Öyle ki akıllı telefonlarda bulunan bazı programlar, fotoğrafını çektiğiniz belgeleri otomatik olarak dijital ortama aktarıp, PDF gibi yaygın formatlara dönüştürebiliyorlar.


 

     OCR yazılımları, tarayıcı üzerinden taradığınız bir sayfadaki karakterleri, kendinde önceden tanımlanmış olarak karakter tablolarındaki karakterlerle karşılaştırıp, taradığı karaktere en çok benzeyen karakteri seçer. Seçtiği karakterleri, taradığı formata uygun biçimde yerleştirir. Bu sayede taradığınız metin, dijital ortama aktarılmış olur.

     WebOCR & ÇevrimiçiOCR diye anılan hizmetler de günümüzde yaygındır. Bu sistemlerde taradığınız belgeleri yükleyip, çevrimiçi sunucularda karakter tanıma işlemi gerçekleştirip, sonucu size aktarırlar.

     Ayrıca bazı sistemlere üye olurken gördüğünüz CAPTCHA teknolojisi de, OCR teknolojisinin bir ürünüdür. O minik resimlerdeki karakterler OCR teknolojisi ile okunamamakta, bu sayede işlemi gerçekleştiren kişinin insan olduğundan emin olunmaktadır.

Bu İçeriği Paylaşın
2 Yorum
  • Eyyy teknoloji seni geliştirene de sana da hayranım, hayatımı çoook kolaylaştırıyorsun. Yok asosyal yapıyormuş da yok tembelleştiriyormuş da kullanmayı bilemeyene, kendisi üzerinde hakimiyeti olmayana verir bu zararları… Dozunda ve gerektiği yerde kullanıldığında teknoloji mükemmel.

Bir yanıt yazın Yanıtı iptal et

Exit mobile version