admin管理员组文章数量:1122850
ChatGPT 按 token 计费,当你把一段长文本发送给它时,你如何计算该文本消耗了多少 token?
在非流式访问的情况下,ChatGPT 的回复信息中包含有 token 消耗数量。但是在流式访问的情况下,回复信息里没有 token 数量,因此必须自己计算。下面是 Javascript 中使用GPT-3-Encoder 来计算文本的 token 数量的方法。
计算token数量
-
首先安装该库
npm install gpt-3-encoder
-
计算
下面是计算的示例代码:
const {encode, decode} = require('gpt-3-encoder')
const str = 'This is an example sentence to try encoding out on!'
const encoded = encode(str)
console.log('Token number: ', encoded.length)
上面代码运行结果为:
Token number: 11
基本上,一个简单的英文单词是一个token,一个复杂的英文单词可能包含了2~4个token,一个中文字符是1~3
个token。
显示token化详细结果
在上面的代码后面加上以下代码,就可以打印出token的详细结果:
for(let token of encoded){
console.log({token, string: decode([token])})
}
结果:
{ token: 1212, string: 'This' }
{ token: 318, string: ' is' }
{ token: 281, string: ' an' }
{ token: 1672, string: ' example' }
{ token: 6827, string: ' sentence' }
{ token: 284, string: ' to' }
{ token: 1949, string: ' try' }
{ token: 21004, string: ' encoding' }
{ token: 503, string: ' out' }
{ token: 319, string: ' on' }
{ token: 0, string: '!' }
一个实现例子
版权声明:本文标题:【ChatGPT】怎样计算文本token数量? 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.betaflare.com/biancheng/1726313859a1071681.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论