aardio 文档
string.chunker 库模块帮助文档
string 成员列表 #
string.chunker #
文本分块器,用于 RAG 知识库
string.chunker() #
返回对象:chunkerObject
string.chunker(config) #
创建分块器实例
返回对象:chunkerObject
chunkerObject 成员列表 #
chunkerObject.aardio(code,filePath) #
aardio 代码分块
code: 代码内容
filePath: 可选,文件路径
返回分块数组
chunkerObject.auto(text,filePath) #
自动识别类型并分块
根据文件扩展名或内容特征自动选择分块策略
chunkerObject.markdown(text,filePath) #
Markdown 文档分块
text: 文档内容
filePath: 可选,文件路径
返回分块数组
chunkerObject.maxSize #
最大块大小(字符数),默认 1500
chunkerObject.minSize #
最小块大小(字符数),默认 100
chunkerObject.overlap #
块间重叠字符数,默认 100
Markdown 格式