aardio 文档

tesseract 库模块帮助文档

tesseract 成员列表 #

开源OCR引擎Tesseract

tesseract.ocr() #

创建Tesseract OCR组件的BaseAPI对象

返回对象:tesseractOcrObject

liblept 成员列表 #

liblept.pixDestroy({addr pix=}) #

释放像素数据占用的内存

liblept.pixRead(图像文件路径) #

参数应使用完整路径,返回像素首地址

libtesseract 成员列表 #

libtesseract.TessDeleteIntArray(整数数组指针地址) #

释放tesseract分配的内存

libtesseract.TessDeleteText(文本指针地址) #

释放tesseract分配的内存

libtesseract.TessDeleteTextArray(文本数组指针地址) #

释放tesseract分配的内存

libtesseract.TessVersion() #

组件版本

tesseractOcrObject 成员列表 #

tesseractOcrObject.clear() #

清除图像数据

tesseractOcrObject.delete() #

删除对象

tesseractOcrObject.end() #

重置对象

tesseractOcrObject.getBoolVariable(name) #

获取变量布尔值

tesseractOcrObject.getDoubleVariable(name) #

获取变量浮点值

tesseractOcrObject.getIntVariable(name) #

获取变量整数值

tesseractOcrObject.getStringVariable(name) #

获取变量文本值

tesseractOcrObject.getText() #

返回文本

tesseractOcrObject.getUnicodeText() #

返回Unicode文本

tesseractOcrObject.init(lang,datapath,oem,configs) #

初始化样本语言包,成功返回0,
如果样本语言包不存在,aardio将会自动下载,注意语言包与引擎的版本必须一致(3.02)不然会报错,
除参数@1以外,其他参数都可以省略
可选使用datapath指定tessdata所在目录,默认为~\lib\tesseract.res\

tesseractOcrObject.initLangMod(lang,datapath) #

初始化样本语言包
可选使用datapath指定tessdata所在目录,默认为~\lib\tesseract.res\

tesseractOcrObject.printVariablesToFile(filename) #

输出变量到文件

tesseractOcrObject.processPages(filename,retryConfig,timeoutMillisec) #

识别图像,返回文本,
除参数@1指定图像路径以外,其他参数可省略

tesseractOcrObject.processPagesUnicode(filename,retryConfig,timeoutMillisec) #

识别图像,返回Unicode文本,
除参数@1指定图像路径以外,其他参数可省略

tesseractOcrObject.readConfigFile(filename) #

读取配置文件

tesseractOcrObject.readDebugConfigFile(filename) #

读取调试配置文件

tesseractOcrObject.recognize() #

识别图像,成功返回0

tesseractOcrObject.recognizeForChopTest(etextMonitor) #

识别图像,成功返回0

tesseractOcrObject.setDebugVariable(name,value) #

设置调试变量

tesseractOcrObject.setImage(imagedata,width,height,bytesPerPixel,bytesPerLine) #

设置图像

tesseractOcrObject.setImage2(pix) #

设置像素数据,参数为内存地址

tesseractOcrObject.setInputName(name) #

设置输入名

tesseractOcrObject.setOutputName(filename) #

设置输出名

tesseractOcrObject.setRectangle(left,top,width,height) #

设置区块

tesseractOcrObject.setSourceResolution(ppi) #

设置分辨率

tesseractOcrObject.setVariable(name,value) #

设置变量

自动完成常量

_TESS_OEM_CUBE_ONLY=1
_TESS_OEM_DEFAULT=3
_TESS_OEM_TESSERACT_CUBE_COMBINED=2
_TESS_OEM_TESSERACT_ONLY=0

Markdown 格式