C#實(shí)現(xiàn)圖片文字識(shí)別PaddleOCRSharp
當(dāng)前位置:點(diǎn)晴教程→知識(shí)管理交流
→『 技術(shù)文檔交流 』
這幾年的AI的發(fā)展,使得文字識(shí)別難度大大降低、精度大大的提高。百度飛漿就是一個(gè)非常好的AI框架,而且是開(kāi)源的。 我們利用百度飛漿就能快速簡(jiǎn)單的實(shí)現(xiàn)文字識(shí)別功能,幾行代碼就可以集成。 其中百度飛漿的PaddleOCR,就是專(zhuān)門(mén)針對(duì)文本識(shí)別的開(kāi)發(fā)套件,包含的功能有:文本失敗、文本檢測(cè)、表格識(shí)別,支持中英文數(shù)字組合的識(shí)別、豎排、長(zhǎng)文本識(shí)別,而且還針對(duì)小圖做了優(yōu)化,大大提升準(zhǔn)確率。 下面我們一起來(lái)看看,如何使用百度飛漿實(shí)現(xiàn)文字識(shí)別: 一、新建項(xiàng)目 新建一個(gè)控制臺(tái)項(xiàng)目。 二、安裝依賴(lài)包 通過(guò)NuGet,安裝依賴(lài)包:PaddleOCRSharp。 PaddleOCRSharp是Github的開(kāi)源項(xiàng)目,是基于百度飛漿C++代碼封裝的.Net類(lèi)庫(kù),其中支持PaddleOCR版本是release2.5。如果大家需要最新版本,或者其他模型,也可以自行封裝。 項(xiàng)目地址:https://github.com/raoyutian/PaddleOCRSharp 安裝依賴(lài)后,我們就可以看到很多dll庫(kù)。 三、編寫(xiě)識(shí)別代碼 識(shí)別圖片的文字,并打印,代碼如下: using PaddleOCRSharp; PaddleOCREngine engine; //中英文模型V3模型 OCRModelConfig config = null; //OCR參數(shù) OCRParameter oCRParameter = new OCRParameter(); oCRParameter.cpu_math_library_num_threads = 6;//預(yù)測(cè)并發(fā)線(xiàn)程數(shù) oCRParameter.enable_mkldnn = true;//是否使用mkldnn模型 oCRParameter.cls = false; //是否執(zhí)行文字方向分類(lèi) oCRParameter.use_angle_cls = false;//是否開(kāi)啟方向檢測(cè) oCRParameter.det_db_score_mode = true;//是否使用多段線(xiàn),即文字區(qū)域是用多段線(xiàn)還是用矩形, oCRParameter.det_db_unclip_ratio = 1.6f; oCRParameter.max_side_len = 2000;//初始化OCR引擎 engine = new PaddleOCREngine(config, oCRParameter); var imagebyte = File.ReadAllBytes("1.png"); OCRResult ocrResult = engine.DetectText(imagebyte); Console.WriteLine(ocrResult.Text); 四、執(zhí)行效果如下 識(shí)別速度、效果還是非常好的。 該文章在 2023/9/4 12:34:14 編輯過(guò) |
關(guān)鍵字查詢(xún)
相關(guān)文章
正在查詢(xún)... |