今天为大家介绍一个神奇的功能判断文字。将文字作为判断条件,满足条件则执行动作,不满足条件则执行另一个动作。 举例说明如果当前屏幕识别到制动精灵,则点击制动精灵,没有识别到,则左滑屏幕继续识别。点击添加执行动作,进入动作列表,选择文字相关里的判断文字, 这里输入用于判断的文字。制动精灵过滤条件,选择指定区域,这样识别速度更快,更加精准。框选一个大致的区域,选勾确定, 关闭输入键盘。可以看到下方有两个执行条件满足执行和条件不满足执行。在条件 满足执行中添加一个。点击文字动作,输入制动精灵,点击右上角确定。在条件不满足执行中添加一个。模拟左滑屏幕动作, 继续在条件不满足执行中添加一组判断文字,并点击动作用于判断的文字, 用于条件满足后点击的文字。 点击右上角保存。选择一个快捷执行方式,不明白的同 同学可以参考。前期视频新手必学第五课快捷操作,返回到需要执行动作的屏幕,见证奇迹的时刻, 挑战成功。识别与执行速度非常快。在后续的教程中还会介绍更多神奇好玩的功能。
粉丝288获赞467

大家好,我是酷昂文仔,那么这期视频的话来讲一下这个文字识别的教程。 其实我在按键精灵的第二十八期视频就已经提到过了文字识别,但是那一期视频的话是利用了按键精灵自身的图片识别机制来实现的,所以他充其量只能算是一个找图功能的强化版, 所以这一期视频的话,我就要用按键精灵来连接上百度 ocr, 给你们带来一个真正的文字识别教程。 首先给你们介绍一下百度 ocrocr 就是光学字符识别的意思,而百度 ocr 就是百度提供的一系列文字识别的云端接口,他这个接口是不受任何平台限制的,就是说不管你用的是什么编程语言,你 也不用关心他接口背后的实现逻辑,只要你能够调通他的接口,然后获取到他的返回值就可以了。要使用百度 ocr 服务,首先要创建一个应用,直接百度搜索百度 ocr, 然后点击第一个进他的官网 左上角,这里找到开放能力文字识别,然后有一个通用文字识别,进来之后首先要点立即使用,然后点击创建应用, 这里要输入应用名称,然后接口选择和这个文字识别报名,不用管它应用归属,这里选择个人,然后输入相应的应用描述,点立即创建就可以了。 创建好之后再回到这个界面做一个个人的实名认证,这里我已经认证完了,所以他在提示我完成企业认证,但是我这个是 自己私人调用的接口,所以不需要做这个企业认证了。然后点这里领取免费资源服务类型,这里如果你们还没有领的话,应该会看到一个通用场景 ocr, 因为我这里已经领取过了,所以这里就没有了。 你们找到通用场景 o c r, 然后直接全部勾选,然后零元领取就可以了。然后再回到这个界面, 领完之后就可以看到这些 a p i。 我用的是这个通用文字识别高精度版,每个月可以免费调用一千次,如果算上标准版的话,每个月就可以免费调用两千次。如果还是不够的话,可以再试一下这个网络图片文字识别, 如果还是不够的话,你甚至可以去看一下腾讯和阿里的 o c r, 然后挨个白嫖。最后点击管理应用进来获取你的 api k, 还有这个 ck 调用接口的时候要用到的。上面这些准备步骤都做完之后,接下来就要看接口文档了,我们回到这个页面,点击技术文档,他进来默认就是通用文字识别,高精度版,正好是我们要找的文档。 首先接口描述你们自己看,然后在线调试,这个也不用看了,现在都已经是二零二一年了,他不可能给你一个 vbs 的调试视力的。然后请求说明,这里就要认真看了。 首先这个请求方法,它是一个 pose 的方法,这个是它的请求地址,然后是需要设置的 u i l 参数,请求头以及请求体参数。这些东西如果你看过我上一期视频的话,其实你心里应该已经有数了。先看 u i l 参数,它需要的是一个 asses to, 这个 assess token 它就相当于是一个通行证,证明你是被授权过,可以调用这个接口的。但是这个东西我们现在没有,它需要通过 api key 和 secret key 来获取。这两个东西我们刚才在这里已经拿到了,所以我们接下来就打开这个文档,看一下这个 assess token 怎么获取。 他这里也写的非常清楚,只要向这个地址发送请求,而且在 url 上面带上这三个参数就可以了。 那接下来就开始写代码,我这里把获取 ss token 的步骤分装成一个子程序,然后再一开始进来就调用它。 在这个子程序内部首先要配置我们的 a p i key 和 secret key, 我这里为了录视频,就把这两个 key 放在了一个 i n i 配置文件里面去读取。关于这个 i n i 配置文件的读, 我以前也有一些视频来专门讲过的,我这里就不再重复讲了。两个变量配置好之后,接下来就是发请求获取 ss token, 文档这里写了是建议用 pose 的请求,那我们就听他的 发起 pose 的请求,上一期视频也讲过,首先第一步创建一个 http 三点零对象,然后打开一个 pose 的请求,这个接口地址就是文档里面写的这个接口地址, 然后在 uil 上面拼接三个参数,第一个参数他是一个固定的字符串,就是这个东西,那既然他不是变量的话,那就直接把它写死在这个 uil 上面就可以了。 第二个参数名是 client id, 然后它的值就是我们获取的 api key。 第三个参数是 client secret, 对应的参数值是 secret key, 把参数都拼在 url 后面, 然后发送请求,然后获取他的返回值,我自己把他的返回值打印出来调试一下, 好,可以看到确实有东西返回来,但是他比较长啊,这里看的话很麻烦,我们可以直接在这个文档里面去看他的返回值是什么格式的,他这里有一个返回值的视力,其实就是一个追审对象。至于怎么解析这个追审对象,我上一期视频也讲过了, 首先要引入一个 vbs 文件,然后在实地画一个对象,然后这个对象里面有一个抵扣的方法,他可以解析服务器返回来的这个追绳制服串。 再来看一下这个追审对象,它里面一共有六个属性,但是按照文档所说的,他这里其实就两个属性是有用的,其他参数的话暂时用不上,不用管他。但是在我看来的话,其实只有这个 s token 是有用的。至于这个有效期的话,它返回值固定就是这个单位是秒,你换算一下这个时间的话,其实它就是三十天,这个值是固定的,拿不拿都无所谓。通常来说,我们只需要拿到这个 ss token, 然后把它保存下来,后面三十天之内就不需要再调这个接口获取它了。 毕竟网络请求的话,他有时候速度会比较慢慢,而且还消耗贷款和流量,可以直接从配置文件里面拿是比较好的。我这里就不保存了,直接打印一下,然后把它保存到一个变量里就行了,调试一下 好,可以看到 ss token 被打印出来没有问题,最后按照惯例请求结束了,加上这两行代码。好,现在我们拿到了 ss token, 就可以回到这个文档,继续看请求题的参数。第一个 参数它可以是图片文件的贝斯六十四编码,也可以是网络图片的 url, 也可以是 pdf 文件的贝斯六十四编码。这三个里面三选一, 前面两个我都会做演示,第三个 pdf 我就不演示了,其实跟第一个是一样的,然后第二个参数是 pdf 页码,这里我们不演示 pdf, 所以就不需要这个参数。第三个参数是要识别的语言,默认是中音混合,已经完全满足我们的需求了,所以这个参数也不用传了。 后面还有什么检测图片朝向,是否输出段落信息,以及输出这个可信度的,这些参数我们通通都不需要,换而言之,我们只需要传第一个参数就行了。这里我先用图片 url 来做演示,这种情况他只是用 于网络上的图片,比如说我的个人网站里面有一个收款二维码的图片,我就拿这个图片来做例子。首先还是创建一个子程序网络图片 ocr, 然后再获取完 ss token 之后就可以调用它了。 然后根据文档要写一个 pose 的请求,请求地址从文档复制过来,然后拼接上它的 uil 参数。 ss token, 它的值就是我们刚才所拿到的这个 assess token。 同样按照文档的要求,我们要设置一个请求头,这个我在上一期视频也讲过了,直接用 set request head 命令设置它的请求头, 其实这里就是设置它的编码类型,然后设置请求提参数,它的参数名是 u i l, 对应的参数值就是这个网络 图片的地址,然后获取他的返回值,打印一下调试 返回的结果,里面出现了推荐使用微信支付的字眼,说明这个文字识别是没有问题的。那么现在有一个问题就是如果他不是网络图片,他只是在我电脑本地的一张图片的话,那他就没有 url。 比如说我先把这个图片另存为, 然后转到底盘跟目录,这个时候就要用到这个,因为与参数这个参数对应的是图片文件的贝斯六十四编码。按键精灵显然没有能力把图片文件转成贝斯六十四编码, 所以我就在网上找到了这一段代码,它其实也是一些 b b s 的命令,我们感谢这个路上一坨翔提供的 代码,它这个函数的话转换成倍是六十四是没有问题的。但是如果要对接百度 o c r 的话,就还需要做一些修改,我直接把它拿过来做了一些修改,然后再加了注视, 然后再大概给你们讲一下这个函数到底是一个什么逻辑。首先这个方法唯一需要的参数就是这个文件路径 函数内部,首先他创建了一个 microsoft 叉 m l 断对象,这个对象可以访问和操作叉 m l 文档,然后再用漏的叉 m l 方法导入指定的字符串, 这个 dat 就是整个叉 m l 文档的跟结点。然后再创建了一个 file system object 对象,这个对象可以操作磁盘文件夹或者文本文件。这里创建这个对象的目的就是要利用他的 file existence 方法来判断这个文件是否 真实存在。其实这个 file s s 命令在按键精灵的文档里面就有,它就是一个标准的 v b s 命令。当然不要忘记我之前讲过的按键精灵里面有一个文件插件,它这里本身也自带一个判断文件是否存在的方法, 你们也可以尝试一下用这个方法,如果这个文件存在的话,就创建一个 a d o d b stream 对象,这个对象之前讲过,他可以存取二进制的数据或者文本流,然后 type 为一的话,就表示他是一个二进制的数据, 然后再用他的 load from fire 方法去加载这个图片文件的数据。我之前讲云角本的时候讲过一个与之相对应的方法,叫做 safe to fire, 当时是用这个方法来下载图片的,就是把接口请求回来的文件流转成 本地文件,那现在他刚好就反过来把本地文件转换成文件牛,就是 load from fire, 然后再回到这个叉 m l 文档,这个 document element 就是它的跟节点,设置它的节点数据类型为倍六十四,然后再把刚才加载的数据写进去, 然后再重新创建一个对象,导入这个叉 m l 文档,当他的状态值大于二,也就是说载入完成之后就去获取他的对特节点, 因为他是根据节点名称去获取的,节点名称可能会有重复,所以他获取出来的就是一个数组。但是因为我们知道他只有一个对的节点,所以我们直接取下标零获取他的第一项就可以了, 然后再取他的 test 的属性,这样就可以得到这个文件的 base 六十四编码了。他原来写的代码是 it 下面的第零项,其实 这个 it 写不写都无所谓,按键精灵的文档里面也可以直接搜索到这个 it 属性,你们可以自己去看一下,然后他这里原来的代码还去除了换行符。我自己试了一下,这个换行符的话,他是不会影响到百度文字识别的,所以我也把这行命令去掉了。 接下来就是这个百度 ocr 文档里面最坑的地方了,按照文档上面写的,在贝斯六十四编码之后,还需要进行 url incode, 但是这里的话不能照做。然后他第二个坑的地方就是在贝斯六十四编码之后,还要把制服串里面的加号替换成 百分号二 b, 也就是说这个贝斯六十四字符串它只有里面的加号要做 u i n 扣的,所以我这里也自己加了一行命令,就是替换这个字符串的,那如果 文件不存在的话,就把它设置为空字符串,最后给这个函数设置返回值,就是给一个跟函数同名的变量负值就可以了。 好,接下来调用一下这个函数,看一下他能不能正常运作,这个图片的路径是不是底盘下面的微信收款二维码点 p n g, 把它打印出来 调试一下,在调试界面的话,看不到他打印出来的是什么东西啊?这个可能是按键精灵的一个 bug, 其实他是有的,我们退出这个调试界面就可以看到了,可能是因为这个字符串太长了,在调试界面看不到,退出来之后就可以看到了,他就是这么一大串东西, 说明这个函数他是能正常运作的。现在被六十四拿到之后呢,还是要调百度 o c r 的 接口去获取这个识别的结果,我这里也把它包装成一个子程序,本地图片 ocr。 前面的步骤就不用再解释了吧。创建对象,然后这个地址的话,也是复制文档的 url 参数,还是这个 ss token, 然后设置请求头,然后设置请求题的参数,他的参数名字叫 emage, 他的值就是这个函数的返回值,把它粘贴过来发送, 然后获取他的返回值,打印出来,最后调用一下这个子程序,调试一下。 好,可以看到结果。推荐使用微信支付,说明这个识别没有问题,我自己就尝试一下把这个结果提取出来。首先还是用 deco 的方法去解析,然后取这个对象里面的一个 vers 为啥属性。这个纸取出来之后可以看到他是一个数组,我这里图片里面只有一行文字,所以他这个数组里面也只有一项。但是如果你要识别的这个图片它里面有多行文字的话,没有一行文字,这个数组里面就会多一个对象,所以我们事先是不知道这个数组里面有多少个对象的。 那么针对这种长度不固定的书组要去便利他。我之前也说过了,直接用 uban 的命令获取他的最大可用下标,然后写一个 for 循环,然后逐个对象取出来,再取他下面的 worse 属性调试一下。 好,推荐使用微信支付,这样就可以把他的文字识别结果提取出来了。好,再回到文件路径这里,这个路径现在是写死的,我要怎么把它改成变量呢?答案还是在 在按键精灵的文件插件里面有一个 select fire 方法,它可以弹出一个对话框,让用户自己选择文件,它的返回值就是用户选择文件的文件路径。那我这里就再写一个子程序, 第一步就是弹窗,让用户选择文件,并且获取到他的文件的全路径,然后再把这个文件转换成倍六十四编码,然后把本地图片 ocr 的这个请求复制上来,再把这个文件路径替换成变量,然后再改成调用这个子程序 调试一下。好,现在脚本弹出了一个窗口,我这里选择这个微信收款二维码,点 png 识别结果推荐使用微信支付,结果是正确, 但是现在还面临着这样一个问题,如果是要做游戏脚本的话,通常来说我们既没有图片的 url, 也没有图片的存放路径,这要怎么识别呢?这个时候就要出动按键静音的颜色。插件增强版有一个 print screen 命令, 他可以实现屏幕范围截图的功能,参数就是截屏范围的左上角和右下角坐标,根据文档描述的话,这个命令截取的图片他只会保存在内存里。还好我晶晶火眼一眼就看出来了,这个函数他其实还有一个隐藏参数, 直接百度搜索按键精灵 print screen 出来。第一个就是这个命令的文档,上面清晰的写着还有一个参数五,就是你要保存的文件路径,也就是说其实这个命令他是可以把 截取的图片保存成文件呢。那我这里还是创建一个子程序区域截图 ocr, 我这里就设置截图的区域是左上角零零,然后宽是一千像素,高一百像素。截图直接保存到底盘跟目录下面 ocr 测试截图点 bmp 这个图片格式你们可以自己设置,根据百度 o c r 的文档, j p g p n g b n p 格式它都是支持的,但是要注意大小。 bmp 文件一般来说体积都比较大,它这里上线是不超过四 n, 如果你截图的区域很大的话,就要留意一下, 他不仅限制了你文件体积的大小,而且还限制了你图片像素的大小,最少是十五,最大是四零九六像素。保存截图之后,直接把下面的这个请求复制上来。 区域截图的保存路径是斜死的,所以下面这里转倍是六十四的时候,这个路径也可以一起斜死。 这个坐标你们也可以根据实际情况改成这个游戏窗口的相对坐标,这些我在以前的视频里面也已经提到过了,这个文件路径其实也可以搞成动态的,这里时间关系我就不搞太复杂了。最后调用一下这个子程序调试一下, 好可以看到他识别的结果,这一次我截图的范围他就涵盖了有多行文字,我们看一下这个截图, 他大概就是上面代码上面的这一个区域,然后第一行识别的 o c r 调试按键精灵就是这个窗口标题,然后第二行识别的新建打开保存退出,调试就是这一排 按钮,然后普通原文件搜索子程序,从结果来看的话,这个识别大致上是没有问题的。 ok, 那么这期视频就先到这里,谢谢大家。

好啊,大家好,我是小德,然后这节课我们说说一个,就是这个 panda 的一个免智库啊,识别文字的啊,怎么用啊?然后这个资源呢,回头会放到全文件里面,有需要的自己下载就好了。 首先我们下载好了就先解压出来,对吧?然后文件有点大啊, 好,解压出来是这么一个文件夹,我们打开, 哎,再点进来,点进来这里面有很多东西啊,然后我们什么都不需要去动它啊,什么都不需要去动,然后只需要运行一个这个 w e b 的这个文件啊, e x e 啊,互缀的这个文件啊,应用程序我们双击,然后双击好了之后,等他这里会提示 啊,如果我们第一次使用有些系统啊,他会提示联网的一个功能啊,这个要勾选一下啊,就是点一下允许访问。 好,这里我们看他这里提示什么,服务器已开始运行,对吧?然后这里有各种方式啊,你可以自己对接啊,也可以就是直接用我们啊,插件里面直接对接。好的啊,一个命令。 好,这个如果提示什么呢啊?就是缺少什么什么库文件啊,你可以运行这个微软常用的这个运行库啊, 双击打开,然后下,根据下一步,下一步啊,根据他的提示进行操作啊,把这些东西安装一下,基本上是都能用的啊, 这里因为我以前已经装过了,所以说我就不安装了。然后如果提示缺少库啊,你就运行这个啊,就 ok 了。这个是我们本地啊,本地可以直接用,比如说我们用模拟器,我们直接搭建到本地就好了啊,只需要开这么一个窗口,哎,也可以最小化的啊。 还有一种方式就是搭建到我们服务器里面去啊,使用方式也一样,就是直接把这个压缩包,哎,直接解压到服务器里面,随便哪个位置都可以,然后也是打开运行这个文件,如果提示啊 缺少什么库,你也是啊,直接用那个什么呢?也是直接用这个微软常用的啊运行库,然后安装一下啊,就可以使用了。 好,那个如果服务器里面啊,我们搭建好了那个对接的这个 ip 地址啊,就是我们服务器公网 ip 地址,然后特别注意的就是幺九八幺幺这个端口需要开通,哎,需要开一下啊, 如果不会开端端口的话,呃,就看一下那个热更新的是怎么开的啊?好,这里我们只说本地啊,本地我们对接就是直接用那个什么呢 啊?我们用这个右键打开网络共享中心,或者在那个,在那个 控制面板里面,对吧?也可以找到我们那个网络网络和共享中心,对吧?这两种方式都一样啊, 然后我们就是不管是无线网还是这有线呢,我们点一下这个链接的东西啊,它会提示一个链接状态,对吧?然后我们看一下一个详细信息,详细信息这里有一个 ip 地址啊,就是 i p v 四的,就最前面有个 i i p v 四是本地的一个 i p 地址,那就是 幺九二点幺六八点零点啊,我这边是,呃,这个啊,幺零二,然后你自己肯定是看你自己的啊,然后我们对接的话就是按这个 ip 地址对接就 好的。嗯, 好,那么现在呢,我们看一下这里有几个啊?有一二三四四个关于敏字库的一个命令啊,我们来看一下,第一个是我们初始化啊,初始化就是我们刚刚讲到的啊,我先把它这个代码复制一下啊, 第一个初始化啊,我们可以放到开头,对吧?然后刚刚我的是一一九二点一六八点零点幺零二,对吧?然后这里我们就填自己的 ip 地址啊,就好了,如果是服务器里面呢,就写公服务器公网 ip 的地址。 然后这个是旋转方向啊,第二个参数是旋转方向,旋转方向,如果我们是这种识 这种竖屏的东西啊,我们就不用旋转啊,直接改成零,如果我们就是那种横屏的游戏,你看自己情况,对吧?他是顺时针的一个旋转方向啊,一般我们只用零和二百七啊, 然后旋转方向,零和二百七,他返回的坐标我里面是已经内置了啊,就是返回的是真实的一个坐标,就是我们抓抓里面截图出来是什么坐标,他就是返回什么坐标啊,不用我们自己哎,再计算了啊。 嗯,像那个九十度还有一百八这两种啊,一般是用不到的啊,然后如果你非得用到这这种那个旋转方向的话啊,你就自己算一下吧。 然后最后一个参数是匹配模式啊,跟我们刚刚啊讲过那个什么元素的啊,对吧? 元素他也有匹配模式啊,就是完全匹配和模糊匹配啊,也是也是一样的啊,参数唯一就是模糊匹配我们的内容啊,参数不唯一我们就是完全匹配啊,一般我们用一比较好啊,因为他免知库识别出来不可能是 百分百是正确的,他有时候可能会有一个字错了啊,或者什么,对吧? 好,那么现在他后面有三个命令啊,一个是返,返回所有内容, 返回所有内容,他的他的参数啊,只有一个范围,对吧? 如果你是全屏,那就四个零啊, 然后返回的结果是一个三维的一个数组, 就是每一行是一个什么?是一个二位数组,然后二位数组的第一个参数是制服串, 它是一个文本,我们识别到的文本的一个名字,然后第二个参数就是一个数主了,对吧?返回中心的坐标啊, x 和 y, 然后第三个参数又是一个数组,他是什么?返回的是范围,就我们这个文字,哎,这个文本的整个的一个范围啊,左上角和右下角的坐标,对吧?然后有几个他就有几个文字,他就有几行。 这个命令一般是用不到啊,就是比如,比如说有特殊情况的啊,需要特殊操作的,你可以就是返回用这个命令,然后把 操作一下,什么就这里面的一些数据啊,提出来来进行自己的操操作就好了。 这个是返回所有内容啊,然后我们常用的就只有两个啊,一个是识别返回文本,就是识别文字,哎,看看这个范围内啊,到底是什么文字,对吧?这个是识别用的啊,还有一个就是找字啊,我们要找什么字 哎?范围加上我们要找的制,然后返回一个坐标,我们可以通过这个坐标进行一个点击的操作,对吧? 敏智库早治呢?返回的是数主啊,如果成功他是返回数主啊,如果失败他就返回这个布尔兹的啊, fast 对吧? 识别,识别它返回的是什么?识别它返回的是文本哎,制服串类型的一个文本而失败呢?也是同样啊,返回 fast, 那么接下来我们就使用一下这个识别的啊,来看一下识别的,只需要给他一个范围就好了, 然后前面我们可以加个输出看一下识别出来的内容是什么啊?然后我们先截个屏 啊,比如说我们选中一个内部存储的一个范围啊,我们加一个调试输出看一下, 哎,他返回的是什么啊?丢实物啊,我们来看一下返回的是内部存储啊四个字,因为我们这个选选中的一个范围啊,只有这么大 啊,一般我们不需要选择太大的啊,太大的话他有可能啊,会干什么?然后现在我们比如说我们选择三个啊,内部存储,还有文件分析器,还有什么东西的,我们选择 这么大的一个范围,然后再重新识别,然后再点调试 来,我没点到啊, 哎,怎么调试不了了? 好了,我们继续一下啊,刚刚调试不了,重启了一下, 然后刚刚选的范围是内部存储,还有那个文件分析器的,按一个位置 就这个范围,我们有时候选择太大,他有可能会获取不到啊, 那我们可以多获取几次啊,然后现在他这个返回的是三个,三个内容啊,一个是文件分析器,还有一个是发现可清理文件,还有一个什么内部存储,对吧?然后他识别的每一个内容啊,他都会 来用这个竖杠隔开啊,后面应该还有一个内容叫空啊, 哎,如果是空的,他有时候也会加进来,没有关系,我们只要排除掉啊,就可以了。 嗯,如果是多个文字啊,它会用竖杠隔开啊,这是我们这个返回文字的一个命令啊, 如果是小范围,他只返回一个,对吧?那多个内容竖杠隔开的,这个是我们常见的一个识别啊,然后还有一个就是我们早字,哎,早字的话是还又多了一个参数啊, 他返回的是什么?返回的是一个数组,比如说我们定一个啊,临时,哎,临时用来接收我们早自的返回值。 比如说我们随便选一个范围啊,我们先截张图, 一般我们正常使用不需要截这么大。那我们只需要大概的啊,比如说这块区域来选中一下啊,然后复制一下它的一个范围,然后比如说我们找字,找字我们可以把全称打进来,也可以打一半啊,比如说我们之前 内部,对吧?内部存储的内部,因为我们使用的是什么啊,说实话的时候使用的是模糊匹配,对吧?然后我们就可以调试一下看看 啊,我忘了加输出了啊,没有加输出,然后这里我们就可以判断一下啊,如果临时等于真的, 我们就输出一下他的坐标零十一,还有零十二,那么我们也可以直接就是点击这个位置啊, 哎,直接点击这个位置也是可以的啊,比如说我们直接调试 啊,这一次他没有找到啊,但是我们可以循环找, 我们先打全程看 啊,幺九九二四零,对吧?幺九九二四零,然后我们看一下它中心的位置,是不是啊? 幺九九二四零,哎,在这个唇的啊,这个地方,对吧?哎,大概的话是它的一个中心的一个位置,因为是根据它的一个返回值啊,来确定的 啊。那么我们啊把后面两个字啊去掉啊,就我们再试一下啊,这个模糊的啊,到底怎么回事?

大家好,欢迎使用咖啡控精灵,今天主要讲 api 函数,使用第十六个 ocr 文字识别类,嗯,先来看一下这个类下面的函数,主要是有两个函数,他俩的功能话就是都是识别图片文字,呃,先来看第一个函数,因为是太子的,呃,这个函数的话里面参数主要是传两种, 第一种是这个引媒界对象,引媒界对象的话我们可以通过前面这个引媒界类,呃,里面的两函数来构造这个对象, 第一种的话就是 log url, 就是加载网络图片的,第二个是瑞德 pass, 就是读取本地的一个图片,呃,这两种方式构建一个移民对象,然后传传入到我们这个韩式里面 啊。第二种的话就是图片的贝斯刘斯粉串,就是我们可以直接截取图片粘接到粘贴到我们的这个编辑器上, 这个我们来演示一下。呃,首先来演示这个,呃,通过这个本地图片的这个就是构建一个隐蔽对象, 嗯,我的本地的话是这个 a 文件,在下面有一个 a 点二 gpg 这个图片,然后里面的话主要是一段文字 啊。首先我们来看第一行就是通过一名叫点瑞的,然后传入一个路径脱掉一个这个一面镜对象, 呃,第二行第二行这个梅西太子的这个函数来识识别这个图片的文字,我给你返回。呃,这两函数的话,他就是所有的防御区都是一个死撑旅行的,就是我们识别的文字内容跟这个太子的接受 一下,最后我要把它打印到我们这个控制台上 来执行一下,他识别的话就是如果问题多的话是要稍等一会, 这样的话就是识别出来,可以对比一下,这就是我们这个识别的文字,我们再来演示一下。第二种就是传入这个贝斯刘斯字母串,直接粘贴图片这种, 这样的话我们就直接粘贴一个图片就行。 嗯,这里有一段新闻可以直接截取这个图, 比如说这是这个, 然后首先是我们通过这个函数传播这个我们要识别的图片,是他也是这个的话,就是反正就是直接探测内容了,就是我们获取的文本内容, 这个可以删除,然后识别出来之后,我们把它打印到这个控制栏上,点击执行, 这个就是我们这个识别的内容。 接下来我们来讲这个第二函数,第二函数的话也是识别图片文字,呃,他是直接可以创一个这个本地的一个图片助进。呃,上面的话我们就是需要先构造一个没对象咱的视频,然后这个话就是不需要再构造对象,用起来是更方便一点。 我们还以这个刚才我们这张图片为例,本 ta 下面这个 a 点是 pg, 呃,首先创联一个路径,然后把这个路径当个参数穿到我们这个 amy test pass 这个函数下面,然后最后打印出我们的文本内容,点击执行, 这就是我们最后识别出来的文本内容。本节课内容就到这里,感谢大家观看。

oh dear jump 各位同学大家好,我是风琴 y 学习 i work 期的课程第一章开发准备第一节,开发优势, 我们来看一下 iok 的功能和优势,这里呢,我就简单的为大家介绍一下。我们先看第一点开发语言, iok 的自动化开发语言为 g s, 版本为 e s。 五、 开发环境为自然的 id 开发环境,非常方便你学习和开发。第二点,运行系统, 当我们把我们的自动化开发完毕以后,我们进行打包,支持安卓系统运行,支持苹果系统运行,支持 windows 系统运行。 当然了,我们的 windows 系统运行呢,已经在规划当中,苹果系统呢,马上开发完成。我们来看第三点, 运行环境,这里指的是安卓,当然也包含了苹果系统。我们先来看安卓系统,安卓系统呢,支持 rot 模式,支持免 rot 模式。注意,免 rot 模式不是无障碍模式,你可以把它理解为代理激活模式, 支持 usb 线控,支持免开发者模式,你可以把它理解为建筑模式。我们不需要打开任何的一个开发者啊,权限 支持无障碍模式,支持硬件模式啊这几种我们来看苹果系统。苹果系统呢,支持越野模式,支持 usb 线控,支持硬件模式 这几种我们来看第四点,目标定位。目标定位呢,支持 open c v 的一个涂色,比如说多点比色找图区域,多点找色啊等等。 open c 位 offer 啊,也支持什么?跨分辨率找制节点空间查找,你可以把它理解为元素空间查找。支持 ii 多模型训练 扩展呢,有 ulov 五训练,百度 oser 训练这两种,方便你训练自己的一个模型。我们看第五点,自助扩展。如果你会 其他语言,你可以用 java 啊,开发一个 a p k 插件啊进行调用。如果你会 c 加加,可以开发 s o 插件进行调用。 如果你不会其他语言,你只会 g s, 那你就可以用 g s 呢进行二次加密开发插件。 我们看第六点 ui 界面。 ui 界面呢,目前已经支持了无脑拖拽啊,设计非常方便的。这样呢,我们就在开发 ui 界面的时候,我们可以降低我们的一个啊时间成本, 几分钟就好了。如果你会这个 h 五,那你可以用 h 五开发。如果你会按着延伸的这个 u i 界面,你就可以用 按住延伸啊来进行开发,开发你自己的一个漂亮美观的一个界面。我们看最后一个第七点平台服务, alk 呢, 他为开发者呢提供了很多的一个啊扩展服务,比如说啊 id in 当中呢,已经睿智的有投屏,可以远程调试开发进行投屏, 也为你提供 t t b 开发助手。 如果你要打包呢,为你提供了代码了一个加密 ipk 的一个加固 啊,如果你要出售给别人呢,为你提供了卡门验证服务,热更新的一个服务。 如果你要开发云机脚本,比如说你要在云机当中远程进行调试开发 啊,为你提供了远程调试功能,如果大批量呢,支持了网页的一个云控。好,本节课呢,就讲到这里,再见。

开图、识字、小程序、接物都需要文字识别技术后,实现了对文的手写、文字表格、文字图片再自动识别。以往耗费一小时的文字表格录入工作,现在 需一分钟,极大提升了稳定电子化的效率,降低文字录入的时间和 人力成本,且大幅度提升了信息录入要准确率。评论区留言可获取文字识别免费测试资源。

拍图识字小程序接入百度 osl 文字识别接口后,实现了对文档、手写文字表格、文字图片的自动识别。以往耗费一小时的文字表格录入仅需一分钟,极大提升了文档电子化的效率, 降低文字录入的时间和人力成本,且大幅度提升了信息录入的准确率。获取接口文档可在评论区留言。

现在呢为大家演示两点高配 v 七点零软件欧西亚功能。首先呢要开启欧西亚的,建议先开启自动揪片,好,他会自动矫正方向。然后呢我们这个时候呢,他框选好之后,我们直接点欧西亚就可以了, 因为这一个是发票啊, 还有这边的盖章,还有这边盖章的啊,他肯定是会出现异常,然后呢这边有打孔的,这个可能也会是有乱码啊,那现在呢,我们来看一下他的这个效果。 好,这就是整张发票。好,这一个呢是可以编辑的,那这个二维码他就是一张图片。 那这些打孔的也有这一边呢,因为他是他是竖向的,竖向的文字, 所以说呢出来肯定是乱码的啊,我们来看一下这边的这个文字的方向是不一样的,所以说这边肯定会乱码, 因为我们的默认的方向是就是横向的啊,那有一部分呢,他肯定也是会出现错误的啊,比如说厦门城创电子,他这里呢写的是厦门掌创电子啊,那我这边是可以改的。 好,因为呢来看一下这个字,这个发票上面打印出来这个字呢,他分析的不是特别清楚,这个单识别成长也是情有可原的, 那就大概是这样的,那这还有这个章,这章也是眉毛识别出来的。 好,那这是把上面装的这个数字都弄出来了,好,那就大概是这样子。

大家好,欢迎来到三金课堂,这里是软件大全系列,本节将演示傻丫头卡拉字幕精灵整体中文永久版的安装教程。傻丫头字幕精灵是一款专业的视频字幕制作软件,它支持目前流行的大部分视频编辑软件, 如会声会影 fremy, 下面我们看一下他怎么安装。首先我们找到这款软件的安装包,并且把它下载解压出来,打开安装包,双击安装文件,开始安装,可以看到这款软件已经是破解版的,之后不需要再激活了, 选择下一步,我接受协议选择下一步,然后选择一个安装目录,我们选择地盘继续选择下一步。安装好的可以看 已经安装完成了,点击完成,那么现在可以开始使用这个软件了,我们打开来看一下, 点击这个帮助。关于可以看到这个已经是破解版的,可以永久使用了,我们新建一个项目看一下,这里可以制作字幕,然后导入其他软件。 请大家关注我的公众号,三金课堂,回复傻丫头,获取此款软件,本次课程到此结束,谢谢大家。

ox 客户端在接入百度大脑彩票识别技术后,实现了将用户手中的纸质彩票快速转化成电子记录的功能,很大程度上缩版了用户对讲时和对中奖号码的时间, 同时还可支持生成电子购票记录,不仅方便用户随时查看照单打号,还能让用户再次便捷呢购买相同号码的彩票,使用户体验得到显著提升。了解接口吊用详情可在评论区留言。