aardio 文档

string.chunker 库模块帮助文档

string 成员列表 #

string.chunker #

文本分块器,用于 RAG 知识库

string.chunker() #

返回对象:chunkerObject

string.chunker(config) #

创建分块器实例

返回对象:chunkerObject

chunkerObject 成员列表 #

chunkerObject.aardio(code,filePath) #

aardio 代码分块
code: 代码内容
filePath: 可选,文件路径
返回分块数组

chunkerObject.auto(text,filePath) #

自动识别类型并分块
根据文件扩展名或内容特征自动选择分块策略

chunkerObject.markdown(text,filePath) #

Markdown 文档分块
text: 文档内容
filePath: 可选,文件路径
返回分块数组

chunkerObject.maxSize #

最大块大小(字符数),默认 1500

chunkerObject.minSize #

最小块大小(字符数),默认 100

chunkerObject.overlap #

块间重叠字符数,默认 100

Markdown 格式