CarsonIT

CarsonIT

技术思绪摘录旅行笔记

.NET 利用PaddleOCRSharp实现OCR文字识别原创声明

PaddleOCRSarp是一个基于百度飞桨PaddleOCR的C++代码修改并封装的.NET的OCR工具类库。包含文本识别、文本检测、表格识别功能。

1、引用PaddleOCRSarp

2、初始化

private OCRStructureResult _ocrResult = new OCRStructureResult();
private PaddleOCREngine _ocrEngine

        private void OcrInit()
        {
            Task.Run(() =>
            {
                OCRModelConfig config = new OCRModelConfig();
                string root = System.IO.Path.GetDirectoryName(System.Windows.Forms.Application.ExecutablePath);

                string modelPathroot = root + @"\inference";
                config.det_infer = modelPathroot + @"\ch_PP-OCRv3_det_infer";
                config.cls_infer = modelPathroot + @"\ch_ppocr_mobile_v2.0_cls_infer";
                config.rec_infer = modelPathroot + @"\ch_PP-OCRv3_rec_infer";
                config.keys = modelPathroot + @"\ppocr_keys.txt";
                _ocrEngine = new PaddleOCREngine(config, new OCRParameter());
            });
        }

3、图片识别，具体图片的来源可以截图、可以本地图片，获得方式方法暂不做过多陈述，直接说识别代码

  _ocrResult = _ocrEngine.DetectStructure(image);

识别方法有多个重载

OCRStructureResult DetectStructure(Image image); 返回了表格行数、列数、单元格列表，包括文本块、位置信息
OCRResult DetectText(Image image);//普通的文本块和位置信息
OCRResult DetectText(string imagefile);
OCRResult DetectText(byte[] imagebyte);
OCRResult DetectTextBase64(string imagebase64);

以上方法适用于很多场景，可以自行选择

比如返回了表格信息，可以识别之后直接转Excel文件

比如可以根据位置，直接标注文字内容位置并翻译等

CarsonIT 微信扫码关注公众号策略、创意、技术

上一篇下一篇

留下您的脚步

最近评论

查看更多>>

站点统计

总文章数：285 总分类数：18 总评论数：93 总浏览数：256.85万

精选推荐

阅读排行

IPhone环境，Fiddler如何配置进行抓包

IPhone环境，Fiddler如何配置进行抓包

Fiddler是一个http协议调试代理工具，它能够记录并检查所有你的电脑和互联网之间的http通讯，设置断点，查看所有的“进出”Fiddler的数据（指cookie,html,js,css等文件）。 Fiddler 要比其他的网络调试器要更加简单，因为它不仅仅暴露http通讯还提供了一个用户友好的格式。这篇文章分享一下如何使用电脑抓取手机上的数据包。

给你的二维码加个图标吧-213kb

给你的二维码加个图标吧-213kb

平时需要将自己的博客或者文章分享出去，就生成二维码，需要有点逼格，得加个logo，但是每次都去找在线网站生成，又很麻烦，于是乎

侧颜杀（第三波）

侧颜杀（第三波）

The Chainsmokers & Coldplay - Something Just Like This ( cover by J.Fla )

Nobody

Nobody

一位舞蹈演员Logan发表的自己的新歌《Nobody》，表示真的好听，一个舞蹈演员竟然把歌唱唱成这样～人也好美。

七、Electron 之自定义顶部菜单

七、Electron 之自定义顶部菜单

Electron一个使用HTML、CSS和JavaScript开发桌面应用程序的框架。Electron可以生成在Windows、macOS和Linux上运行的应用程序，借助Electron可以把我们的web端应用直接移植到桌面端而无需再次开发，这样我们可以使用同一套代码在不同平台上运行应用，极大的缩短了开发时间。

记一次阿坝之旅

记一次阿坝之旅

一直向往蓝天白云，一直向往原生态，川西阿坝是个不错的选择，终于这次在清明假期，来一趟说走就走的旅行，去看看雪。

mobiscroll使用心得

mobiscroll使用心得

mobiscroll是国外一个前端框架，功能强大且丰富，多种语言和多种皮肤可选择，功能在大多电商项目中非常的实用，由于皮肤可选择性强，所以基本上是开箱即用。

Winfrom 程序只能运行一个实例

Winfrom 程序只能运行一个实例

很多时候我们需要我们的程序只运行一个，比如微信这种，再次双击图标，不会开新的实例，而是把已经运行的显示出来，这篇文章记录我们如何实现以及我们实现过程中遇到的问题。

.NET下对MongoDb的认识和使用

.NET下对MongoDb的认识和使用

MongoDB 是由C++语言编写的，是一个基于分布式文件存储的开源数据库系统。在高负载的情况下，添加更多的节点，可以保证服务器性能。MongoDB 旨在为WEB应用提供可扩展的高性能数据存储解决方案。MongoDB 将数据存储为一个文档，数据结构由键值(key=>value)对组成。MongoDB 文档类似于 JSON 对象。字段值可以包含其他文档，数组及文档数组。

唐人街探案1 医院片段

唐人街探案1 医院片段

唐人街探案:医院混战这段,堪称全剧亮点之一,惊险又搞笑!音乐是正经音乐，但是这里却很搞笑的样子。

四、Electron 之进程中可以直接调用H5的API，比如拖拽

四、Electron 之进程中可以直接调用H5的API，比如拖拽

Electron一个使用HTML、CSS和JavaScript开发桌面应用程序的框架。Electron可以生成在Windows、macOS和Linux上运行的应用程序，借助Electron可以把我们的web端应用直接移植到桌面端而无需再次开发，这样我们可以使用同一套代码在不同平台上运行应用，极大的缩短了开发时间。

利用WinRAR自解压功能打包exe文件

利用WinRAR自解压功能打包exe文件

WinRAR是我们电脑上常用的解压缩软件，功能强大，体积小巧，我们平时用的最多的就是压缩成zip和rar文件，实际上还支持很多种格式，今天说一下exe格式

.NET 利用WebSocket-Sharp实现Socket通信(WS协议)

.NET 利用WebSocket-Sharp实现Socket通信(WS协议)

有这样一种场景，我希望服务端来通知客户端，而且要及时，所以确定了最好是使用WS协议，比如炒股界面数据更新、虚拟货币交易所数据更新，要求流量低而且快速及时，请求一次，一旦连接上，可一直通讯。

公众号求关注js插件

公众号求关注js插件

根据多个项目需求，这个小功能有必要封装一个js插件，需要地方随时引入使用即可

微信朋友圈九宫格图片切割工具-143kb

微信朋友圈九宫格图片切割工具-143kb

发个朋友，图片不够九张咋个办？挑一张好看的，切成9张，一样的发朋友圈，但是用PS由很繁琐，于是乎

SQLSERVER批量更新数据创建时间

SQLSERVER批量更新数据创建时间

SQLServer中批量处理一张表中的数据，本文将以实际遇到的一个需求为例，学习一下其中的几个函数。

原来不止我一个人遇到了这个问题

原来不止我一个人遇到了这个问题

今天写一个效果，其中用到Canvas，但是总有一个4像素在其中作怪，实在不知道啥原因，最后一搜索，发现有人和我一样，这里做个记录。

数据的表示（原码、反码、补码、移码）

数据的表示（原码、反码、补码、移码）

这是一篇非常神奇，并且知识点丰富的文章，让你知道计算机是如何让1+1=2的，如何让1-1=0的，了解计算机底层，能帮助我们了解我们写的代码，到底消耗了多少性能，知己知彼百战百胜嘛。

微信支付的优雅

微信支付的优雅

微信支付是集成在微信客户端的支付功能，用户可以通过手机完成快速的支付流程。微信支付以绑定银行卡的快捷支付为基础，向用户提供安全、快捷、高效的支付服务。自2017年11月23日起，微信支付服务功能在中国铁路客户服务中心12306网站上线运行。

.NET Core 使用本地自签证书实现HTTPS协议

.NET Core 使用本地自签证书实现HTTPS协议

现在要想让你测试的站点支持HTTPS，VS在创建项目的时候，可以直接勾选HTTPS选项，用自带证书，可以实现SSL加密。但是今天解决的问题，如果我项目创建的时候没勾选，我之前不支持HTTPS，现在我要让他支持该如何处理？

疫情数据关注工具-支持全平台版本(12月15停止更新，一个时代的结束)

疫情数据关注工具-支持全平台版本(12月15停止更新，一个时代的结束)

疫情形式严峻，我十分关心每天的疫情动态，但是我发现无论是百度的疫情动态，还是腾讯的动态，数据都不完整，而且腾讯的风险地区更新不及时，导致经常看到错误数据。

《灵笼》白月魁壁纸

《灵笼》白月魁壁纸

国漫《灵笼》特别篇播出，作为第一季的大结局剧情，灵笼在最后一话的特别篇中终于把地面神秘人物白月魁的身份信息给揭露了出来，原来之前马克队长猜得没有错，当时在下到地面采集物资的时候，看到的女子其实就是白月魁小队，她们是生活在地面的人类，但是从本质而言，似乎已经和人类有所区别。

.NET WebApi配置Swagger详细教程

.NET WebApi配置Swagger详细教程

Swagger可以根据xml文件生成api接口文档，前后端节约沟通时间，减少对接成本，是一个非常好的解决方案；本文主要记录一下，Vs2019从0开始，搭建一个WebApi最终利用Swagger看到相关接口，并解决Swagger汉化的问题，解决Swagger在.net Webapi中控制器名称标注问题。

Resharper 2021.3.2-VS2022可用的扩展插件

Resharper 2021.3.2-VS2022可用的扩展插件

ReSharper是一个JetBrains公司出品的著名的代码生成工具。其能帮助Microsoft Visual Studio成为一个更佳的IDE，它包括一系列丰富的能大大增加C#和Visual Basic .net开发者生产力的特征。使用ReSharper，你可以进行深度代码分析，智能代码协助，实时错误代码高亮显示，解决方案范围内代码分析，快速代码更正，一步完成代码格式化和清理，业界领先的自动代码重构，高级的集成单元测试方案，和强大的解决方案内导航和搜索。实质上，ReSharper特征可用于C#，VB.NET，XML，ASP.NET，XAML，和构建脚本。ReSharper还为C#和VB.NET提供了增强的交叉语言功能，它使开发者可以有效的控制.net混合项目。

Hangfire任务调度从入门到实践

Hangfire任务调度从入门到实践

Hangfire是一个任务调度的组件，自带面板，可以操作正在运作的任务，可以看到执行情况，而且使用起来简单，Hangfire不受特定.NET应用程序类型的限制，只要是.NET Framework 4.5以上，Newtonsoft.Json library ≥ 5.0.1，有一个mysql或者mssql数据库即可。而且最新的支持.NET Core,这篇文章主要记录一下如何在.NET Core 3.1中用mysql来帮助Hangfire实现持久化。

EFcore+MySql 数据迁移的时候，怎么给表结构加注释？

EFcore+MySql 数据迁移的时候，怎么给表结构加注释？

Microsoft.EntityFrameworkCore是一个非常不错的设计，当一套系统里面出现太多的SQL，其实已经不合理了，所以EF让开发者不再接触SQL，而是直接以对象形式操作数据库，EF来负责Sql代码生成和执行，通常在开发中，有根据数据表结构来生成实体的，也有根据实体生成数据库的，就是所谓的DbFirst和CodeFirst，这篇文章主要说一下CodeFirst的应用，用的是MySql数据库。

可能是最简单的控制台输出二维码

可能是最简单的控制台输出二维码

二维码使用场景很广泛，最近遇到需要在控制台输出二维码，但是其中遇到一些问题，导致代码正常，但是显示确不正常，本文给出的代码已经完全解决了这些问题，而且非常简洁。

m3u8视频下载器3.8.1

m3u8视频下载器3.8.1

之所以推荐这个下载器，不光是因为他能下载大多数场景下的m3u8的视频，主要是还支持http接口进行新增任务。

.NET5 WebApi 实现JWT及其验证实战

.NET5 WebApi 实现JWT及其验证实战

Json web token (JWT), 是为了在网络应用环境间传递声明而执行的一种基于JSON的开放标准（(RFC 7519).该token被设计为紧凑且安全的，特别适用于分布式站点的单点登录（SSO）场景。JWT的声明一般被用来在身份提供者和服务提供者间传递被认证的用户身份信息，以便于从资源服务器获取资源，也可以增加一些额外的其它业务逻辑所必须的声明信息，该token也可直接被用于认证，也可被加密。本文只是举个例子，可以这么整，如果要用于生产环境，可能得再封装一下，注释都加的齐全，没用过的可以看看。

阿里云对象存储OSS使用STS临时授权给Browser.js

阿里云对象存储OSS使用STS临时授权给Browser.js

阿里云对象存储OSS（Object Storage Service）是阿里云提供的海量、安全、低成本、高可靠的云存储服务。其数据设计持久性不低于99.9999999999%（12个9），服务可用性（或业务连续性）不低于99.995%。OSS具有与平台无关的RESTful API接口，您可以在任何应用、任何时间、任何地点存储和访问任意类型的数据。如果你的应用场景仅仅是网站上传个图片、视频这些，那么阿里云OSS和七牛云的作用是一样的。

Visual Studio生成注释的插件GhostDoc，支持2022

Visual Studio生成注释的插件GhostDoc，支持2022

GhostDoc为Visual Studio中的C#代码编辑器安装了一个新的命令。在编辑源文件时，只需将光标置于要添加文档的方法或属性内部，然后通过热键（默认为Ctrl+Shift+D）或右键菜单中的Document this菜单项调用命令，GhostDoc就会插入一段XML格式的注释。你也许会想到在方法或属性前面键入"///"时的类似效果，但是后者只能创建一段空的注释构造，而GhostDoc则能够生成大部分实用的注释。

百度网盘客户端Cheat Engine破解限速方法

百度网盘客户端Cheat Engine破解限速方法

百度网盘的网速128kb，是正常速度，解除限速的方法比较多，主要是充VIP，今天介绍另外一种

百度网盘简易下载助手网速拉满小插件

百度网盘简易下载助手网速拉满小插件

这个插件可以实现百度网盘全速的下载，缺点是每次只能下载一个文件，非常好用

C# 对比两个实体类指定字段是否被修改并得出修改记录

C# 对比两个实体类指定字段是否被修改并得出修改记录

需求来源：一条数据被编辑之后，日志要记录下改动了什么项，从什么改成什么了，还得可以指定某些字段，比如用户表，只要改了用户名，就记录一下日志，业务可以根据是否有修改来发送通知啊或者启用禁用啊这些操作。

Postman的一个小技巧 Pre-request Script的使用

Postman的一个小技巧 Pre-request Script的使用

Postman一款非常流行的API调试工具。其实，开发人员用的更多。因为测试人员做接口测试会有更多选择，例如Jmeter、soapUI等。不过，对于开发过程中去调试接口，Postman确实足够的简单方便，而且功能强大。

MongoDb 4.2.7 配置复制（副本集replSet）实现主从同步（Windows）

MongoDb 4.2.7 配置复制（副本集replSet）实现主从同步（Windows）

MongoDB在4.0之后，增加了事务，说明Mongodb生态越来越丰富，将来肯定可以满足更多的应用场景，在用了事务之后，操作数据的时候报错，提示实例需要是副本集，这篇文章就说一下，什么是副本集，能干啥？

利用PinYinConverter实现汉字转拼音，支持多音字

利用PinYinConverter实现汉字转拼音，支持多音字

汉字转拼音的需求不多，但是遇到了再去写，稍显麻烦，索性写一个辅助类放着，这里利用了Microsoft.International.Converters.PinYinConverter类库，多音字则以多种组合的方式返回给开发者。

NPOI导出Excel，包含一个或者多个sheet表

NPOI导出Excel，包含一个或者多个sheet表

NPOI是指构建在POI 3.x版本之上的一个程序，NPOI可以在没有安装Office的情况下对Word或Excel文档进行读写操作。NPOI是一个开源的C#读写Excel、WORD等微软OLE2组件文档的项目。他导出的文件和你电脑右键创建的office文件一样原生，不会提示格式不符，重要的是不依赖office组件。

倩女幽魂套图

倩女幽魂套图

倩女幽魂套图，收藏了，这个工作室画的很好，惊艳，美观

没有一种工作是不委屈的

没有一种工作是不委屈的

毕业季也是就业季，今年我国有765万高校毕业生将走出校园，步入职场，数据显示目前已有一半人找到了工作。没找到的那一半中，有些人并非能力不行，而是不愿“将就”，总想一步到位找到一份心满意足的工作；找到的那一半也没有“万事大吉”，有些人因为无法调整好自己的心态而郁郁寡欢……

友情打赏

请打开您的微信,扫一扫

开源中国

CSDN社区

技术博客

microsoft .net

博客园

© 1994-2025 yangshaofeng. All Rights Reserved.
蜀ICP备16016433号-1
川公网安备 51010702003150号