Python文字截圖識別OCR工具實例解析
一、簡介
你一定用過那種“OCR神器”,可以把圖片中的文字提取出來,極大的提高工作效率。
今天,我們就來做一款實時截圖識別的小工具。顧名思義,運行程序時,可以實時把你截出來的圖片中的文字識別出來。
二、模塊
import keyboard # 用于監(jiān)控鍵盤按下,觸發(fā)事件(pip install keyboard)import timefrom aip import AipOcr # 調(diào)用百度接口(pip install baidu-aip)from PIL import ImageGrab # 用于保存屏幕截圖
三、獲取百度應(yīng)用接口
AI開放平臺文檔中心
https://ai.baidu.com/ai-doc
查看python語言的SDK文檔
點擊右上角(控制臺),登錄自己的百度賬號,創(chuàng)建“文字識別”的應(yīng)用
四、代碼實現(xiàn)
#! /usr/bin/env python3# -*- coding:utf-8 -*-# Author : MaYi# Blog : http://www.cnblogs.com/mayi0312/# Date : 2020-03-02# Name : test_ocr# Software : PyCharm# Note : 用Python開發(fā)截圖識別OCR小工具import keyboard # 用于監(jiān)控鍵盤按下,觸發(fā)事件(pip install keyboard)import timefrom aip import AipOcr # 調(diào)用百度接口(pip install baidu-aip)from PIL import ImageGrab # 用于保存屏幕截圖# 百度識別接口配置信息APP_ID = ’你的App ID’API_KEY = ’你的API Key’SECRET_KEY = ’你的Secret Key’while True: # 1、利用QQ截圖到剪貼板 # 輸入鍵盤的觸發(fā)事件 keyboard.wait(hotkey='ctrl+alt+a') keyboard.wait(hotkey='enter') time.sleep(0.1) # 2、保存截圖 image = ImageGrab.grabclipboard() image.save('screen.png') # 3、利用百度API識別截圖中的文字 client = AipOcr(APP_ID, API_KEY, SECRET_KEY) with open('screen.png', ’rb’) as f: image = f.read() # 調(diào)用百度API通用文字識別(高精度版),提取圖片中的內(nèi)容 text = client.basicAccurate(image) result = text['words_result'] for i in result: print(i['words']) # 我是分隔線 print('-' * 50)
運行結(jié)果預(yù)覽:
五、總結(jié)
1)等待用戶截圖
2)保存截圖到當前目錄
3)識別截圖中的文本
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. 如何使用Python的Pandas庫繪制折線圖2. 基于javaweb+jsp實現(xiàn)企業(yè)財務(wù)記賬管理系統(tǒng)3. php中yii框架實例用法4. HTML實現(xiàn)title 屬性換行小技巧5. 父div高度不能自適應(yīng)子div高度的解決方案6. ASP替換、保存遠程圖片實現(xiàn)代碼7. PHP中Session會話的使用和分析8. SSM框架整合之Spring+SpringMVC+MyBatis實踐步驟9. 三道java新手入門面試題,通往自由的道路--鎖+Volatile10. 網(wǎng)頁中img圖片使用css實現(xiàn)等比例自動縮放不變形(代碼已測試)
