2021-11-22 22:40:38|已瀏覽:373次
你一定用過那種“OCR神器”,可以把圖片中的文字提取出來,極大的提高工作效率。
今天,我們就來做一款實時截圖識別的小工具。顧名思義,運行程序時,可以實時的把你截出來的圖片中的文字識別出來。
下次,當(dāng)你想要復(fù)制“百度文庫”中的內(nèi)容時,不妨試試這個程序。
源碼解析
1)等待用戶截圖import keyboard # 利用截圖軟件(Snipaste)截圖到剪貼板 # 輸入鍵盤的觸發(fā)事件 keyboard.wait(hotkey="f1") keyboard.wait(hotkey="ctrl+c") time.sleep(0.1)順便安利一波Snipaste,
必備效率神器
3)修改pytesseract.py文件,將tesseract_cmd指向Tesseract-OCR的tesseract.exe的絕對路徑
import pytesseract from PIL import Image # 法一:利用pytesseract模塊 # 參數(shù)一:圖片 # 參數(shù)二:簡體中文 text = pytesseract.image_to_string(Image.open("screen.png"), lang='chi_sim') print(text)
來看看效果:import pytesseract
from aip import AipOcr
from PIL import ImageGrab
# 法二:利用百度API
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
# 讀取圖片
with open("screen.png", 'rb') as f:
image = f.read()
# 調(diào)用百度API通用文字識別(高精度版),提取圖片中的內(nèi)容
text = client.basicAccurate(image)
result = text["words_result"]
for i in result:
print(i["words"])
結(jié)果如文章首圖:我的總結(jié)
1)等待用戶截圖2)保存截圖到當(dāng)前目錄3)識別截圖中的文本
其中識別截圖文本,有兩種方法:1)利用 pytesseract 模塊
2)利用百度API接口
本文由培訓(xùn)無憂網(wǎng)千鋒教育專屬課程顧問整理發(fā)布,希望能夠?qū)ο雽W(xué)習(xí)Python開發(fā)培訓(xùn)的同學(xué)有所幫助。更多Python開發(fā)培訓(xùn)課程歡迎關(guān)注培訓(xùn)無憂網(wǎng)Python開發(fā)培訓(xùn)頻道或添加老師微信:15033336050
注:尊重原創(chuàng)文章,轉(zhuǎn)載請注明出處和鏈接 http://elsolbar.com/news-id-4530.html 違者必究!部分文章來源于網(wǎng)絡(luò)由培訓(xùn)無憂網(wǎng)編輯部人員整理發(fā)布,內(nèi)容真實性請自行核實或聯(lián)系我們,了解更多相關(guān)資訊請關(guān)注python培訓(xùn)頻道查看更多,了解相關(guān)專業(yè)課程信息您可在線咨詢也可免費申請試課。關(guān)注官方微信了解更多:150 3333 6050