1、引用PaddleOCRSarp
2、初始化
private OCRStructureResult _ocrResult = new OCRStructureResult(); private PaddleOCREngine _ocrEngine
private void OcrInit()
{
Task.Run(() =>
{
OCRModelConfig config = new OCRModelConfig();
string root = System.IO.Path.GetDirectoryName(System.Windows.Forms.Application.ExecutablePath);
string modelPathroot = root + @"\inference";
config.det_infer = modelPathroot + @"\ch_PP-OCRv3_det_infer";
config.cls_infer = modelPathroot + @"\ch_ppocr_mobile_v2.0_cls_infer";
config.rec_infer = modelPathroot + @"\ch_PP-OCRv3_rec_infer";
config.keys = modelPathroot + @"\ppocr_keys.txt";
_ocrEngine = new PaddleOCREngine(config, new OCRParameter());
});
}3、图片识别,具体图片的来源可以截图、可以本地图片,获得方式方法暂不做过多陈述,直接说识别代码
_ocrResult = _ocrEngine.DetectStructure(image);
识别方法有多个重载
OCRStructureResult DetectStructure(Image image); 返回了表格行数、列数、单元格列表,包括文本块、位置信息 OCRResult DetectText(Image image);//普通的文本块和位置信息 OCRResult DetectText(string imagefile); OCRResult DetectText(byte[] imagebyte); OCRResult DetectTextBase64(string imagebase64);
以上方法适用于很多场景,可以自行选择
比如返回了表格信息,可以识别之后直接转Excel文件
比如可以根据位置,直接标注文字内容位置并翻译等


川公网安备 51010702003150号
留下您的脚步
最近评论