Techne
Venture
Anthropocene
Blog
Products
Subscribe
Search
Toggle Theme
EN
Chat
Tokenization (分词)
AI
LLM
模型架构
Tokenization (分词)
订阅后可继续阅读剩余内容
立即订阅
注意力机制 (Attention)
Previous Page
预训练 (Pretraining)
Next Page
On this page
什么是 Token?
常见的分词算法
BPE (Byte Pair Encoding)
Byte-level BPE
词表大小 (Vocabulary Size)
Tokenization 的坑