C#版Tesseract庫(kù)的使用技巧
上一篇介紹了Tesseract庫(kù)的使用(OCR庫(kù)Tesseract初探),文末提到了Tesseract是用c/c++開(kāi)發(fā)的,也有C#的開(kāi)源版本,本篇介紹一下如何使用C#版的Tesseract。
C#版本源碼下載地址:https://github.com/charlesw/tesseract
其實(shí)在vs中可以直接用NuGet工具進(jìn)行下載:
打開(kāi)nuget,搜索tesseract,點(diǎn)安裝即可。

源碼是vs2015編譯的,需要安裝vs2015以上版本。
打開(kāi)項(xiàng)目后如:

我們?cè)偬砑右粋€(gè)winform項(xiàng)目,畫(huà)界面如:

實(shí)現(xiàn)點(diǎn)擊“選擇需要識(shí)別的圖片”,打開(kāi)一張圖片,調(diào)用算法并顯示結(jié)果。比較簡(jiǎn)單。源碼如下:
using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Windows.Forms;
using Tesseract;
namespace TesseractDemo
{
public partial class Form1 : Form
{
public Form1()
{
InitializeComponent();
}
//選圖片并調(diào)用ocr識(shí)別方法
private void btnRec_Click(object sender, EventArgs e)
{
//openFileDialog1.Filter = "";
if (openFileDialog1.ShowDialog() == DialogResult.OK)
{
var imgPath = openFileDialog1.FileName;
pictureBox1.Image=Image.FromFile(imgPath);
string strResult = ImageToText(imgPath);
if (string.IsNullOrEmpty(strResult))
{
txtResult.Text = "無(wú)法識(shí)別";
}
else
{
txtResult.Text = strResult;
}
}
}
//調(diào)用tesseract實(shí)現(xiàn)OCR識(shí)別
public string ImageToText(string imgPath)
{
using (var engine = new TesseractEngine("tessdata", "eng", EngineMode.Default))
{
using (var img = Pix.LoadFromFile(imgPath))
{
using (var page = engine.Process(img))
{
return page.GetText();
}
}
}
}
}
}
有一點(diǎn)要注意的是,tesseract的識(shí)別語(yǔ)言包要自己下載后包含到項(xiàng)目里面,并設(shè)置為始終復(fù)制,或者直接把這個(gè)文件包放到運(yùn)行程序目錄(bin\debug)下:

eng是英文字符的意思,要識(shí)別其他語(yǔ)言字符,需要自己下載:
Tesseract hasunicode (UTF-8) support, and canrecognize more than 100 languages"out of the box".
這個(gè)庫(kù)支持100種語(yǔ)言的識(shí)別
字庫(kù)下載地址為:https://github.com/tesseract-ocr/tessdata
用OpencvSharp先降噪再調(diào)OCR識(shí)別:
//用opencv進(jìn)行降噪處理再ocr識(shí)別
private void button3_Click(object sender, EventArgs e)
{
//從網(wǎng)上讀取一張圖片
string imgUrl = "https://service.cheshi.com/user/validate/validatev3.php";
MemoryStream ms = ReadImgFromWeb(imgUrl);
Image img = Image.FromStream(ms);
pictureBox1.Image = img;
//降噪
Mat simg = Mat.FromStream(ms, ImreadModes.Grayscale);
Cv2.ImShow("Input Image", simg);
//閾值操作 閾值參數(shù)可以用一些可視化工具來(lái)調(diào)試得到
Mat ThresholdImg = simg.Threshold(29, 255, ThresholdTypes.Binary);
Cv2.ImShow("Threshold", ThresholdImg);
Cv2.ImWrite("d:\\img.png", ThresholdImg);
textBox1.Text= ImageToText("d:\\img.png");
}
/// <summary>
/// 從網(wǎng)上讀取一張圖片
/// </summary>
/// <param name="Url"></param>
public MemoryStream ReadImgFromWeb(string Url)
{
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(Url);
request.Credentials = CredentialCache.DefaultCredentials; // 添加授權(quán)證書(shū)
request.UserAgent = "Microsoft Internet Explorer";
WebResponse response = request.GetResponse();
Stream s = response.GetResponseStream();
byte[] data = new byte[1024];
int length = 0;
MemoryStream ms = new MemoryStream();
while ((length = s.Read(data, 0, data.Length)) > 0)
{
ms.Write(data, 0, length);
}
ms.Seek(0, SeekOrigin.Begin);
//pictureBox1.Image = Image.FromStream(ms);
return ms;
}
請(qǐng)自行用NuGet程序下載opencvsharp3.0庫(kù),參考https://www.cnblogs.com/tuyile006/p/10819570.html
另外專門(mén)有篇文章介紹中文識(shí)別:Tesseract-OCR識(shí)別中文與訓(xùn)練字庫(kù)實(shí)例
以上就是C#版Tesseract庫(kù)的使用技巧的詳細(xì)內(nèi)容,更多關(guān)于C# Tesseract庫(kù)的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
C#身份證識(shí)別相關(guān)技術(shù)功能詳解
這篇文章主要介紹了C#身份證識(shí)別相關(guān)技術(shù)詳解,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-07-07
利用微軟com組件mstscax.dll實(shí)現(xiàn)window7遠(yuǎn)程桌面功能
利用微軟提供的com組件mstscax.dll實(shí)現(xiàn)類似window遠(yuǎn)程桌面功能,大家參考使用吧2013-12-12
WPF實(shí)現(xiàn)自帶觸控鍵盤(pán)的文本框
這篇文章實(shí)現(xiàn)了WPF自帶觸控鍵盤(pán)的文本框,文中通過(guò)示例代碼介紹的非常詳細(xì)。對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2022-10-10
unity3D實(shí)現(xiàn)攝像機(jī)抖動(dòng)特效
這篇文章主要為大家詳細(xì)介紹了unity3D實(shí)現(xiàn)攝像機(jī)抖動(dòng)特效,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2020-01-01
淺析C#?AsyncLocal如何實(shí)現(xiàn)Thread間傳值
這篇文章主要是來(lái)和大家一起討論一下C#?AsyncLocal如何實(shí)現(xiàn)Thread間傳值,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2024-01-01
.net實(shí)現(xiàn)裁剪網(wǎng)站上傳圖片的方法
這篇文章主要介紹了.net實(shí)現(xiàn)裁剪網(wǎng)站上傳圖片的方法,比較實(shí)用的功能,需要的朋友可以參考下2014-07-07

