OCR (Optical Character Recognition - Optik Karakter Tanıma)
OCR (Optical Character Recognition - Optik Karakter Tanıma), taranmış kağıt evraklar, PDF dosyalar veya dijital kamerayla çekilen resimler gibi belge türlerinin düzenlenebilir ve aranabilir verilere dönüştürülmesine olanak sağlayan bir teknolojidir. OCR, resimlerdeki harfleri seçip ayırarak harflerden kelimeleri ve kelimelerden de cümleleri oluşturur.
OCR'nin Çalışma Mantığı
OCR yazılımları kağıt vb. üzerindeki siyah noktalar topluluğunu yani harfleri, rakamları, sembolleri vb. algılayabilecek ve okuyabilecek bir yapıya sahiptirler. Her kelimeyi ayrı tutarak ve sayfayı satırlara bölerek analiz eder. Analiz sırasında harflerin yapısal karakterleri, yükseklikleri ve genişlikleri değerlendirilir. Programın kendi bilgi deposu, her bir karakter için tanımlanmış çeşitli parametrelerle doludur. Algılanan pikseller bu parametrelerden birisine uygun ise, harfin ortaya çıkması mümkün hale gelir.
Resim dosyalarının ve tarayıcının kaliteli olması OCR yazılımlarının metin tarama hatalarını çok düşük seviyeye indirir.
Xpoda Platformunda OCR Kullanımı
Xpoda Platformunda OCR özelliği için 3 farklı kullanım şekli vardır.
1) Read Content (OCR)
Bu yöntem ile seçilen resim içindeki bütün metinler aksiyonda seçilen ilgili alan içerisine aktarılır.( Full OCR)
2) Read Content (OCR) Mapping
Bu yöntem ile resim içinde belirli alanlar veya satırlar işaretlenerek sadece - ilgili satırdaki bilgi veya sadece verilen değerle eşleşen satırdaki bilgi- alınıp ilgili alanlara aktarılır.
İstenilen form alanına 1.satırda okunan metin bilgisini ya da dilediğiniz satırdaki bilgiyi getirebilirsiniz. Bir diğer özelliği sayesinde aradığınız kelimeyi içeren bir değerin satır bilgisini istenilen alana aktarabilirsiniz. Örneğin Tutar kelimesi geçen bir satırın okunması gibi...
3) OCR Template ile Okuma
Bu yöntem ile örnek bir belge üzerindeki belirli alanlar ve varsa grid satırları işaretlenerek form içerisindeki ilgili alanlara aktarılır.
Template okumada template’in otomatik tespit edilebilmesi için o belgeye özel bir değer belirlenmelidir.
Faturaya özel değeri belirlemek için template üzerine eklenen Add Item alanlarında type değeri static seçilmelidir.
Static seçim sonrası Item üzerinde Search değeri görünecektir. Bu Search alanına gireceğiniz değerin Firma Adı,Sicil No, Fatura numarası gibi o belgeye ait özel ve değişmeyecek bir değerin olması gerekmektedir.
Not: Belirlenen search değerinde client diline göre Türkçe İngilizce Karakter farklılıklarına dikkat edilmelidir.
Xpoda Mobil Uygulaması ve Web ortamlarda OCR kullanılabilmektedir.
Client üzerinde hazır butonlarda yer alan "OCR Template" seçeneği ile kendi templatelerinizi oluşturarak ilgili verilerinizi tablolara aktarabilirsiniz.
OCR kullanımı için geliştirilmiş "Read Content (OCR)" ve "Read Content Template" aksiyonları ile ilgili verilerinizi form üzerindeki alanlara aktarabilirsiniz.
Template Hazırlama
Kullanımı için Client ekranına geçiş yapılarak hazır butonlardan OCR Template butonuna tıklanır.
Create OCR Template Ekranı
Select File: Veri aktarılmak istenilen fatura seçilir. Bu seçimlerde dosyanızın uzantısının .jpg, .png, .jpeg, .gif, .bmp, .tif seçeneklerinden biri olması gerekmektedir.
Add Item: Eklemiş olduğunuz resimde yer alan değerleri form sayfanızdaki alanlar ile eşleştirmek için, eşleştirme yapılacak olan alan kadar Item eklenmelidir.
Delete Item: Eklemiş olduğunuz Itemları silmek için kullanılır.
Template List: Daha önce sisteme kaydetmiş olduğunuz Templateleri bu açılır kutu içerisinde görüntüleyebilirsiniz. Kullanmış olduğunuz farklı fatura yapıları için bir kere tanımla yapmanız yeterli olacaktır.
Template Name: Yeni bir template oluşturulmak istenilirse bu alandan Template’nize isim vermeniz gerecektir.
Save: Yapılan işlemlerin kaydedilmesi için kullanılır.
Delete: Tasarlanmış olunan Template yapısını silmek için kullanılır.
Preview: Yapılan tasarımın sonuçlarının ön izlemesini gösterir.
Remove Line: Seçilen resimde çizgiler mevcutsa çizgilerin silinmesi için kullanılır.
Mapping: Üzerinde çalışılan değer ile form sayfanızda yer alan alanlar için eşleştirmelerin yapıldığı yerdir. Burada gelen değer ilgili form sayfasında hangi değere gönderilecekse, eşleştirmeleri işlemleri gerçekleştirilir.
Item Type: Gelen değerlerin türlerinin seçimi için kullanılır.
Static: Bir fatura yapınızda değişmeyecek bir alan varsa type değerinden static seçilmelidir.
Static seçim sonrası Item üzerinde Search değeri görünecektir. Bu Search alanına gireceğiniz değerin Sicil No, Fatura numarası gibi o faturaya ait özel bir ifade geçiyorsa bu ifadenin yazılması gerekmektedir.
Field: Seçim yapılan değerlerin ilgili form sayfasındaki alanlara dolması isteniyorsa bu alandan Field türünün seçilmesi gerekmektedir.
Row: Fatura içerisinde satır satır tekrar eden değerler geçiliyorsa Item Type değeri Row olarak seçilmelidir.
Replace Value: Fatura içerisinde yer alan bir değerin farklı bir değer ile değiştirilmesi isteniyorsa Replace Value alanı kullanılır. Örneğin fatura tarihi 19.04.2022 şeklinde tutulsun sayılar arasındaki nokta değerlerini çizgi ile değiştirmek istiyorsanız Replace Value alanını kullanabilirsiniz.
Add Replace Value: Her bir yeni özellik için Add Replace Value alanından yeni bir seçenek eklenmelidir.
Row Space: Item Type alanından Row seçildiğinde bu satırlar arasındaki mesafe yazılır.
Örnek Kullanımı:
Bu örnekte Mikro Yazılım’dan gelen fatura bilgilerinde yer alan bazı verileri, tasarlanmış olduğumuz form sayfasına aktarılması sağlayacağız.
Bunun için öncelikle OCR adında bir form sayfası ve form alanlarını oluşturuyoruz.
OCR Form Sayfası
Fatura Tarihi : Mikro faturasından gelecek olan tarih bilgisi bu alana eklenecek.
Fatura Numarası: Mikro faturasında yer alan fatura numara değeri bu alana eklenecek..
Grid: Fatura içerisinde yer alan satır kayıtlarının alınması için grid içerisine son olarak 4 tane alan ekliyoruz.
OCR Form sayfamızın görüntüsü
Şimdi gelelim OCR düzenlemelerinin yapılmasına..
Öncelikle Client ekranına gidiyoruz ve hazır butonlarda yer alan OCR butonuna tıklıyoruz.
Yeni bir fatura eklemek istediğimiz için açılan Create OCR Template alanından Select File butona tıklıyoruz. Daha sonra açılan ekrandan Mikro faturasını seçiyoruz.
Select File Button
Dosya seçimini yaptıktan sonra Add Item butonu ile alanlarımızı ekliyoruz.
Itemları ekledikçe tasarım alanınıza mavi alanların geldiğini görebilirsiniz.
Şimdi mavi alanları sürükle bırak yöntemi ile istemiş olduğumuz alanların üzerine yerleştiriyoruz. Taşıma işleminin yapılabilmesi için öncelikle mavi alanlara bir kere sol click yapılması ardından sürükleme işleminin yapılması gerekmektedir.
İlk alanı yerleştirmede Mikro faturasını diğer faturalardan ayıran Unique bir değer olarak Sicil Numarası bilgisini kullanacağız. O yüzden değerin yazıldığı alanı Item içerisine alıyoruz.
Item Type alanını Static olarak değiştirdiğimiz takdirde mavi alanımızın üzerine bir Search Value ifadesi gelecektir. Bu alan içerisine de Sicil numaramızı yazıyoruz.
Add New Item diyerek yeni bir alan oluşturuyoruz ve bu oluşturulan alanı Fatura Tarihi alanına sürükleyip bırakıyoruz. Fatura Tarihi bilgisi form sayfamızda yer alan Fatura Tarihi alanına gideceği için yukarıda yer alan Mapping alanından Fatura Tarihi alanını getiriyoruz, Item Type alanından ise Field değerini seçiyoruz.
Fatura Tarihinde yer alan çizgi değerlerini kullanmak istemiyorsak, sol üst köşede yer alan Replace Value değerini farklı bir karakter ile değiştirmek için kullanabiliriz..
Bir örnek üzerinde gösterelim. Daha önce kaydetmiş olduğunuz Replace değerleri açılır kutudan görüntüleyebilir. Yeni bir özellik için yanındaki artı butonunu kullanabilirsiniz. Biz bu örnek için artı butonunu kullanıyoruz.
Açılan pencerede aranan değer alanına “-“ yazıp, değişecek alana “.” Karakterini koyarak kaydediyoruz.
Bu işlemi gerçekleştirdikten sonra açılır kutu içerisinde – ifadesinin geldiğini görebilirsiniz.
Bunu dilediğiniz alanlar için kullanabilirsiniz. Kullanmak istediğiniz alanlar için öncelikle alana tıklamanız ardından bu açılır kutu içerisinden seçim yapmanız gerekecektir.
Yapılan işlemlerin aynısı Fatura Numarası içinde gerçekleştiriyoruz.
Şimdi gelelim Grid içerisine eklemek istediğimiz satırları eklemeye..
Öncelikle Add Item diyerek kullanmış olduğumuz Grid alanı kadar Item ekliyoruz.
Eklemiş olduğumuz mavi alanları satır ve sütunları tam kaplayacak şekilde düzenliyoruz.
Önemli: Kullanmış olduğunuz evrakta boş satırlar olsa bile mutlaka boş satırları da seçmeniz gerekmektedir. Bunun sebebi bir faturada 5 kayıt varken bir diğer faturada 20 kayıt yer alabilir. Satırların gelebileceği maximum yere kadar seçim işleminin uzatılması gerekmektedir.
Seçimler yapıldıktan sonra her bir Item için Mapping ve Item Type alanının seçilmesi gerekmektedir.
Öncelikle düzenleme yapmak istediğiniz Item’a tıklanır ardından Mapping ve Item alanları düzenlenir. Satır bazlı kayıt alındığı için Type alanı Row olarak değiştirilmeli, Mapping alanında yer alan değerlerden Gridde yer alan ilgili alanlar seçilmelidir.
Tüm sütunlar için bu işlemler gerçekleştirildikten sonra yukarıda yer alan Template Name alanına bir isim girilir yanında yer alan Save butonuna tıklanarak Template kaydedilir.
Başarıyla kaydedildi mesajı görüldükten sonra artık templateniz kullanıma hazır.
Son halini görüntülemek isterseniz Template List alanından son eklemiş olduğunuz Template’i bulabilir, preview butonuna basarak ön izleme ekranını açabilirsiniz.
Kaydedilen temanın kullanımı için aksiyonlar sekmesinde yer alan Read Content(OCR) aksiyonu kullanılmalıdır.