OCR (Optical Character Recognition - Optik Karakter Tanıma), taranmış kağıt evraklar, PDF dosyalar veya dijital kamerayla çekilen resimler gibi belge türlerinin düzenlenebilir ve aranabilir verilere dönüştürülmesine olanak sağlayan bir teknolojidir. OCR, resimlerdeki harfleri seçip ayırarak harflerden kelimeleri ve kelimelerden de cümleleri oluşturur.
Read Content OCR aksiyonu ile resimler içerisinde yer alan metinleri okuyabilirsiniz. Bu özellik genelde Dokümantasyon Yönetimi yapan şirketlerin kesmiş oldukları faturaları ya da belgeleri okuyarak metin formatına dönüştürmek için kullanmış olduğu bir özelliktir. Bu özellik sayesinde tüm belgelerden anahtar kelimeleri içeren belgeler filtrelenir ve istenilen belgelere kolaylıkla ulaşılabilir.
Read Content (OCR) aksiyonu özellikleri:
Value Area: Okunacak olan metnin hangi alana gönderileceği seçilir.
Remove Lines: Okunacak olan resimde çizgiler var ve bu çizgiler kaldırılmak istenirse Remove Lines özelliği “Yes” olarak seçilmelidir. Seçili olma durumlarında satır bazlı yapılan tarama işlemlerinde çizgilerin olup olmadığını her bir satır için tek tek kontrol edeceğinden metin okuma hızı yavaşlayacaktır.
OCR Mapping: Belge üzerinde mapping yaparak istenilen satır veya istenilen bir bilgiyi içeren alan okunmak istenirse OCR Mapping alanı kullanılmalıdır. Tüm belgeyi değil sadece istenilen bilgileri form sayfasına aktarır. + butonuna basılarak birden fazla mapping işlemi gerçekleştirilebilir. Type alanından iki farklı seçim yapılabilir. Field alan bazlı, row ise satır bazlı işlem gerçekleştirir. Örnek kullanımına dokümanda yer verilmiştir.
Örnek Kullanımı:
Bir fiş üzerinden yer alan bütün yazıların okunması ve ilgili form alanına bu metin değerinin gönderilmesi istenmektedir. Bunun için öncelikle Form sayfasına bir metin kutusu ve bir buton eklenir.
Metin Oku(OCR) butonunun içerisine Read Content(OCR) aksiyonu eklenir. Aksiyon ve detayları aşağıdaki gibidir.
Value Area alanında form sayfasına eklenmiş olan metin kutusu seçilir. Fiş üzerinde yer alan çizgi satırlarının kaldırılması ve metin kutusuna gönderilmemesi için Remove Lines özelliği “Yes” olarak seçilmiştir.
Aksiyon kaydedildikten sonra client ekranına geçiş yapılır.
Client görünümü
Metin Oku butonuna tıklandığında okunacak olan belgenin seçimi için dosya seçim ekranı açılır ve buradan okunacak olan dosya seçilir.
Bu örnek için seçim yapmış olduğumuz fiş örneği aşağıdaki gibidir.
Çekilen ya da taranmış olan fişlerin kalitesi ne kadar iyiyse sonuç o kadar iyi çıkacaktır. Kullanılacak olan resimlerin minimum 300DPi değerine sahip olması gerekmektedir.
Dosya seçim alanından ilgili resim seçildikten sonra metin kutusuna fiş içerisinde yer alan bütün metin değerleri satır satır eklenecektir.
Bir resim üzerindeki yer alan bütün metinler okundu ve ilgili alana gönderildi.
Örnek Kullanımı 2(OCR Mapping):
Bir fiş üzerinde yer alan bütün bilgileri değil sadece istenilen satırı veya istenilen bilginin geçtiği satır alınmak istenirse Mapping işlemi yapılır.
Bu örnek için fiş üzerinde yer alan Fatura No, Fatura Tarihi, Toplam ve Alınan değerleri ilgili form sayfasındaki alanlara gönderme işlemi yapılacaktır.
Örnek bir form tasarımı yapalım.
Metin Oku(OCR) Mapping butonuna Read Content(OCR) aksiyonu verilmelidir. Aksiyon kullanımı ve detayları aşağıdaki gibidir
.
Read Content(OCR) aksiyonu detayları
Type: Yapılacak işlem için bu sütundan tür seçilmelidir.
Row: Taranan ilk satırın bilgisini ilgili alana aktarmak için kullanılır.
Field: Value alanına yazılan değeri içeren ilk bulduğu satırı ilgili alana aktarmak için kullanılır.
Field: Resim üzerinde okunan satırın form sayfasında hangi alana basılacağının seçimi yapılır.
Value: Row seçimlerinde buraya istenilen satırın sıra numarası yazılmalıdır.
Field seçimlerinde aranılan kelime değeri yazılmalıdır.
Bu örnek için Fiş üzerinde okunan ilk satırın tamamı Cari alanına basılacaktır. İçerisinde TOPLAM yazısı bulunan ilk satırın tamamı Toplam alanına basılacaktır. İçerisinde ALINAN yazısı geçen ilk satırın tamamı Alinan alanına basılacaktır. İçerisinde TOPLAM yazısı geçen ilk satırın tamamı Toplam2 alanına basılacaktır.
Client ekranına geçiş yapılır ve Read Content(OCR) butonuna basılarak ilgili resim dosyası seçilir. Seçim yapıldıktan sonra form alanları eşleştiği bilgiler ile dolacaktır.
Client görünümü