aardio 文档

aardio 范例: PDF 转文本

import console;
import inet.http;//导入 inet.http 则 fsys.pdfium 支持网络 PDF
import fsys.pdfium;

//打开 PDF 文件
var pdf = fsys.pdfium("https://www.w3.org/WAI/ER/tests/xhtml/testfiles/resources/pdf/dummy.pdf");

//遍历 PDF 所有页面并获取文本,可选用参数 @1 指定开始页面,可选用参数 @2 指定结束页面
for pageNum,textContent in pdf.eachPageText(){
    //只有包含文本内容的 PDF 页才能提取到文本,有些 PDF 页只有图像而文本为空。
    console.log(textContent)
}

console.pause();
Markdown 格式