aardio 文档
tesseract 库模块帮助文档
tesseract 成员列表 #
开源OCR引擎Tesseract
tesseract.ocr() #
创建Tesseract OCR组件的BaseAPI对象
返回对象:tesseractOcrObject
liblept 成员列表 #
liblept.pixDestroy({addr pix=}) #
释放像素数据占用的内存
liblept.pixRead(图像文件路径) #
参数应使用完整路径,返回像素首地址
libtesseract 成员列表 #
libtesseract.TessDeleteIntArray(整数数组指针地址) #
释放tesseract分配的内存
libtesseract.TessDeleteText(文本指针地址) #
释放tesseract分配的内存
libtesseract.TessDeleteTextArray(文本数组指针地址) #
释放tesseract分配的内存
libtesseract.TessVersion() #
组件版本
tesseractOcrObject 成员列表 #
tesseractOcrObject.clear() #
清除图像数据
tesseractOcrObject.delete() #
删除对象
tesseractOcrObject.end() #
重置对象
tesseractOcrObject.getBoolVariable(name) #
获取变量布尔值
tesseractOcrObject.getDoubleVariable(name) #
获取变量浮点值
tesseractOcrObject.getIntVariable(name) #
获取变量整数值
tesseractOcrObject.getStringVariable(name) #
获取变量文本值
tesseractOcrObject.getText() #
返回文本
tesseractOcrObject.getUnicodeText() #
返回Unicode文本
tesseractOcrObject.init(lang,datapath,oem,configs) #
初始化样本语言包,成功返回0,
如果样本语言包不存在,aardio将会自动下载,注意语言包与引擎的版本必须一致(3.02)不然会报错,
除参数@1以外,其他参数都可以省略
可选使用datapath指定tessdata所在目录,默认为~\lib\tesseract.res\
tesseractOcrObject.initLangMod(lang,datapath) #
初始化样本语言包
可选使用datapath指定tessdata所在目录,默认为~\lib\tesseract.res\
tesseractOcrObject.printVariablesToFile(filename) #
输出变量到文件
tesseractOcrObject.processPages(filename,retryConfig,timeoutMillisec) #
识别图像,返回文本,
除参数@1指定图像路径以外,其他参数可省略
tesseractOcrObject.processPagesUnicode(filename,retryConfig,timeoutMillisec) #
识别图像,返回Unicode文本,
除参数@1指定图像路径以外,其他参数可省略
tesseractOcrObject.readConfigFile(filename) #
读取配置文件
tesseractOcrObject.readDebugConfigFile(filename) #
读取调试配置文件
tesseractOcrObject.recognize() #
识别图像,成功返回0
tesseractOcrObject.recognizeForChopTest(etextMonitor) #
识别图像,成功返回0
tesseractOcrObject.setDebugVariable(name,value) #
设置调试变量
tesseractOcrObject.setImage(imagedata,width,height,bytesPerPixel,bytesPerLine) #
设置图像
tesseractOcrObject.setImage2(pix) #
设置像素数据,参数为内存地址
tesseractOcrObject.setInputName(name) #
设置输入名
tesseractOcrObject.setOutputName(filename) #
设置输出名
tesseractOcrObject.setRectangle(left,top,width,height) #
设置区块
tesseractOcrObject.setSourceResolution(ppi) #
设置分辨率
tesseractOcrObject.setVariable(name,value) #
设置变量
自动完成常量
_TESS_OEM_CUBE_ONLY=1
_TESS_OEM_DEFAULT=3
_TESS_OEM_TESSERACT_CUBE_COMBINED=2
_TESS_OEM_TESSERACT_ONLY=0
Markdown 格式