Fotoğrafı Metne Çeviren Program (Tesseract Ocr)

Bu yazımda küçük bir uygulama geliştireceğiz. Amacımız fotoğraftaki bir yazıyı metne çevirmek olacaktır. Bu işleme ise OCR (Optical Character Recognition – Optik Karakter Tanıma) diyoruz. Uygulamamızı açık kaynak kodlu Tesseract kütüphanesini kullanarak yapacağız.

Tesseract kütüphanesi açık kaynak kodlu, Hewlett-Packard – HP tarafından geliştirilmiş ücretsiz bir kütüphanedir. Tesseract hakkında daha geniş bilgiyi bu adreste bulabilirsiniz.

Uygulamamıza geçelim

Bir Windows Form App projesi açıp ekrana birer adet Buton, TextBox ve PictureBox nesnelerini ekliyoruz.  Nesnelerin özellikleri şöyle:

// Buton
Name = “btnDosyaSec”;
Text = “Dosya Seç”;

// PictureBox
Name = “pbFoto”;

// TextBox
Name = “txtMetin”;

Ekran görüntümüz şu şekilde olacaktır.

Projemize Tesseract kütüphanesini NuGet üzerinden yükleyelim. Bunun için Tools > NuGet Package Manager > Package Manager Console ekranına aşağıdaki komutunu yazalım.

Türkçe dil paketlerini buraya tıklayarak indirebilirsiniz.

Şimdi btnDosyaSec click eventine aşağıdaki gibi kodlarımızı yazıyoruz. Yorum satırı olarak kodlar hakkında kısa bilgiler eklenmiştir.

using alanına Tesseract kütüphanesini referans ediniz.

Örnek projeyi burada inceleyebilirsiniz.

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir