aardio 文档

tesseract 库模块帮助文档

tesseract 成员列表

开源OCR引擎Tesseract

tesseract.ocr()

创建Tesseract OCR组件的BaseAPI对象

返回对象:tesseractOcrObject

liblept 成员列表

liblept.pixDestroy({addr pix=})

释放像素数据占用的内存

liblept.pixRead(图像文件路径)

参数应使用完整路径,返回像素首地址

libtesseract 成员列表

libtesseract.TessDeleteIntArray(整数数组指针地址)

释放tesseract分配的内存

libtesseract.TessDeleteText(文本指针地址)

释放tesseract分配的内存

libtesseract.TessDeleteTextArray(文本数组指针地址)

释放tesseract分配的内存

libtesseract.TessVersion()

组件版本

tesseractOcrObject 成员列表

tesseractOcrObject.clear()

清除图像数据

tesseractOcrObject.delete()

删除对象

tesseractOcrObject.end()

重置对象

tesseractOcrObject.getBoolVariable(name)

获取变量布尔值

tesseractOcrObject.getDoubleVariable(name)

获取变量浮点值

tesseractOcrObject.getIntVariable(name)

获取变量整数值

tesseractOcrObject.getStringVariable(name)

获取变量文本值

tesseractOcrObject.getText()

返回文本

tesseractOcrObject.getUnicodeText()

返回Unicode文本

tesseractOcrObject.init(lang,datapath,oem,configs)

初始化样本语言包,成功返回0,
如果样本语言包不存在,aardio将会自动下载,注意语言包与引擎的版本必须一致(3.02)不然会报错,
除参数@1以外,其他参数都可以省略
可选使用datapath指定tessdata所在目录,默认为~\lib\tesseract.res\

tesseractOcrObject.initLangMod(lang,datapath)

初始化样本语言包
可选使用datapath指定tessdata所在目录,默认为~\lib\tesseract.res\

tesseractOcrObject.printVariablesToFile(filename)

输出变量到文件

tesseractOcrObject.processPages(filename,retryConfig,timeoutMillisec)

识别图像,返回文本,
除参数@1指定图像路径以外,其他参数可省略

tesseractOcrObject.processPagesUnicode(filename,retryConfig,timeoutMillisec)

识别图像,返回Unicode文本,
除参数@1指定图像路径以外,其他参数可省略

tesseractOcrObject.readConfigFile(filename)

读取配置文件

tesseractOcrObject.readDebugConfigFile(filename)

读取调试配置文件

tesseractOcrObject.recognize()

识别图像,成功返回0

tesseractOcrObject.recognizeForChopTest(etextMonitor)

识别图像,成功返回0

tesseractOcrObject.setDebugVariable(name,value)

设置调试变量

tesseractOcrObject.setImage(imagedata,width,height,bytesPerPixel,bytesPerLine)

设置图像

tesseractOcrObject.setImage2(pix)

设置像素数据,参数为内存地址

tesseractOcrObject.setInputName(name)

设置输入名

tesseractOcrObject.setOutputName(filename)

设置输出名

tesseractOcrObject.setRectangle(left,top,width,height)

设置区块

tesseractOcrObject.setSourceResolution(ppi)

设置分辨率

tesseractOcrObject.setVariable(name,value)

设置变量

自动完成常量

_TESS_OEM_CUBE_ONLY=1
_TESS_OEM_DEFAULT=3
_TESS_OEM_TESSERACT_CUBE_COMBINED=2
_TESS_OEM_TESSERACT_ONLY=0

Markdown 格式