1、引用PaddleOCRSarp
2、初始化
private OCRStructureResult _ocrResult = new OCRStructureResult(); private PaddleOCREngine _ocrEngine
private void OcrInit() { Task.Run(() => { OCRModelConfig config = new OCRModelConfig(); string root = System.IO.Path.GetDirectoryName(System.Windows.Forms.Application.ExecutablePath); string modelPathroot = root + @"\inference"; config.det_infer = modelPathroot + @"\ch_PP-OCRv3_det_infer"; config.cls_infer = modelPathroot + @"\ch_ppocr_mobile_v2.0_cls_infer"; config.rec_infer = modelPathroot + @"\ch_PP-OCRv3_rec_infer"; config.keys = modelPathroot + @"\ppocr_keys.txt"; _ocrEngine = new PaddleOCREngine(config, new OCRParameter()); }); }
3、图片识别,具体图片的来源可以截图、可以本地图片,获得方式方法暂不做过多陈述,直接说识别代码
_ocrResult = _ocrEngine.DetectStructure(image);
识别方法有多个重载
OCRStructureResult DetectStructure(Image image); 返回了表格行数、列数、单元格列表,包括文本块、位置信息 OCRResult DetectText(Image image);//普通的文本块和位置信息 OCRResult DetectText(string imagefile); OCRResult DetectText(byte[] imagebyte); OCRResult DetectTextBase64(string imagebase64);
以上方法适用于很多场景,可以自行选择
比如返回了表格信息,可以识别之后直接转Excel文件
比如可以根据位置,直接标注文字内容位置并翻译等
留下您的脚步
最近评论