技术思绪摘录旅行笔记
PaddleOCRSarp是一个基于百度飞桨PaddleOCR的C++代码修改并封装的.NET的OCR工具类库。包含文本识别、文本检测、表格识别功能。

1、引用PaddleOCRSarp

2、初始化

private OCRStructureResult _ocrResult = new OCRStructureResult();
private PaddleOCREngine _ocrEngine
        private void OcrInit()
        {
            Task.Run(() =>
            {
                OCRModelConfig config = new OCRModelConfig();
                string root = System.IO.Path.GetDirectoryName(System.Windows.Forms.Application.ExecutablePath);

                string modelPathroot = root + @"\inference";
                config.det_infer = modelPathroot + @"\ch_PP-OCRv3_det_infer";
                config.cls_infer = modelPathroot + @"\ch_ppocr_mobile_v2.0_cls_infer";
                config.rec_infer = modelPathroot + @"\ch_PP-OCRv3_rec_infer";
                config.keys = modelPathroot + @"\ppocr_keys.txt";
                _ocrEngine = new PaddleOCREngine(config, new OCRParameter());
            });
        }

3、图片识别,具体图片的来源可以截图、可以本地图片,获得方式方法暂不做过多陈述,直接说识别代码

  _ocrResult = _ocrEngine.DetectStructure(image);

识别方法有多个重载

OCRStructureResult DetectStructure(Image image); 返回了表格行数、列数、单元格列表,包括文本块、位置信息
OCRResult DetectText(Image image);//普通的文本块和位置信息
OCRResult DetectText(string imagefile);
OCRResult DetectText(byte[] imagebyte);
OCRResult DetectTextBase64(string imagebase64);

以上方法适用于很多场景,可以自行选择

比如返回了表格信息,可以识别之后直接转Excel文件

比如可以根据位置,直接标注文字内容位置并翻译等

image.png

image.png

CarsonIT 微信扫码关注公众号 策略、创意、技术

留下您的脚步

 

最近评论

查看更多>>

站点统计

总文章数:275 总分类数:18 总评论数:88 总浏览数:156.42万

精选推荐

阅读排行

友情打赏

请打开您的微信,扫一扫