aardio 文档

ustring 库模块帮助文档

ustring 成员列表 #

UTF-16 字符串(ustring)函数库。
用于操作 UTF-16 编码的 Unicode 字符串。
aardio 字符串默认为 UTF-8 编码。
aardio 字符串包含在单引号内并在尾部加小写 u 标记可创建 UTF-16 字符串(ustring)。

ustring.breakAny('字符串'u,'查找字符集'u) #

查找字符集中任意字符开始的字符串。
参数 @2 默认为空白字符。

ustring.charCodeAt(字符串,位置) #

返回指定位置字符的 Unicode 码点( char's code point )。
位置按字符计数(无论字符占用几个字节,需要 4 字节编码的字符计数仍然为 1 )。

此函数功能与 string.charCodeAt 函数相同,
区别是 ustring.charCodeAt 可以兼容 UTF-16 / UTF-8 编码的字符串参数。
而 string.charCodeAt 仅支持 UTF-8 编码的字符串参数。

ustring.cspan('字符串'u,"字符补集") #

查找字符补集组成的开始标记长度。
即所有不在指定字符集中的字符所占字节长度。

ustring.eachIndexOf('字符串'u,'查找文本'u) #

for i,j in ustring.eachIndexOf(str,'/*查找文本*/'u){

}

ustring.format('%s'u,) #

格式化字符串

ustring.fromCharCode() #

使用1个或多个 Unicode 码点转换为 UTF-16 字符串(ustring)。
参数可以指定 1 个或多个 Unicode 码点( char's code point ),也可以直接指定一个包含多个码点的数组参数。
支持大于 0x10000 的码点。

ustring.indexAny('字符串'u,'查找字符集'u) #

查找字符集中任意字符出现位置。

ustring.indexOf('字符串'u,'查找文本'u,开始索引) #

查找匹配文本,成功返回开始与结束字符位置。
不支持模式语法。

ustring.isPrintable(字符串) #

参数 @1 指定的 UTF-16 或 UTF-8 字符串包含的所有字符是否都是可打印文本。
可打印文本指的是可作为文本输出,且输出时占位。
如果包含其他二进制字符或零宽字符则返回 false。

如果可以确定输入字符串是 UTF-8 编码则改用 string.escape 检测(对其返回值取反)会更快。

ustring.isPrintableChar(字符代码) #

参数 @1 是否表示可打印的字符代码(字节码或 Unicode 码点)。

ustring.isSpace(字符代码) #

参数 @1 是否空白字符代码(字节码或 Unicode 码点)。
如果仅检测 ASCII 空白字符,可使用模式匹配表达式 %s 检测。

ustring.lastIndexAny('字符串'u,'查找字符集'u) #

自后向前查找字符集中任意字符出现位置。

ustring.lastIndexOf('字符串'u,'查找文本'u) #

在字符串尾部查找匹配文本。
不支持模式语法。

ustring.left(str,n) #

从字符串左侧截取 n 个字符
按字符计数,汉字为一个字符。

ustring.len('字符串'u) #

计算文本字符串的字符数。
如果字符串内包含文本终止符'\u0000',则计数到该字节前停止。

ustring.reverse('字符串'u) #

反转字符串

ustring.right(str,n ) #

从字符串右侧截取 n 个字符
按字符计数,汉字为一个字符。

ustring.slice(str,i,j ) #

从字符串中截取位置 i 开始的字符串。
如果 i 为负数则从右侧倒数计数,
按字符计数,汉字为一个字符。

ustring.span('字符串'u,'查找字符集'u) #

返回字符串开始在指定字符集中的字符所占字节长度

ustring.split('字符串'u,'分隔符'u,拆分次数) #

拆分为数组。
分隔符为可选参数,默认为空白字符。
拆分次数为可选参数,负数指定最后拆分次数,其他分组保持不变。

ustring.toCharCodes(字符串,开始位置,结束位置) #

返回一个数组,包含每个字符的 Unicode 码点( char's code points )。
Unicode 代理对字符转换为大于 0x10000 的 Unicode 码点。
参数@1如果未标记为UTF16编码,会自动转换为 UTF-16 字符串(ustring)@2
其他参数可省略。

开始位置、结束位置按 UTF16 编码字符计数(每字符占2个字节)。
可以使用负数表示尾部倒计数字符位置

ustring.tokenize('字符串'u,"任意个分隔符") #

for(tok in ustring.tokenize(,'/*分隔符,默认为空白字符*/'u)){
    console.log( tok );
}

ustring.trim('字符串'u,"字符集") #

清除头尾在指定字符集中的字符。
参数 @2 可选,默认为空白字符。

ustring.trimleft('字符串'u,"字符集") #

清除头部在指定字符集中的字符。
参数 @2 可选,默认为空白字符。

ustring.trimright('字符串'u,"字符集") #

清除尾部在指定字符集中的字符。
参数 @2 可选,默认为空白字符。

ustring.unpackCharCodes(字符串,开始位置,结束位置) #

返回每个字符的 Unicode 码点( char's code point )。
参数 @1 如果未标记为 UTF16 编码,会自动转换为 UTF-16 字符串(ustring)。
其他参数可省略

开始位置、结束位置按 UTF16 编码字符计数(每字符占2个字节)
参数 @2,@3 可以使用负数表示尾部倒计数字符位置

Markdown 格式