| GPT-4o 的新 tokenizer 词库污染严重 OpenAI • Xs0ul • 2024 年 5 月 15 日 • 最后回复来自 Xs0ul | 3 |
| 有了解 fast tokenizer 的老哥吗?怎么将 baichuan2-13b 的 tokenizer 转成 fast tokenizer? 问与答 • Auston • 2024 年 4 月 23 日 • 最后回复来自 1311317 | 1 |
| chatgpt token 计算方式 OpenAI • WorldWideWeb • 2023 年 4 月 9 日 • 最后回复来自 HimeHina | 2 |
| Elasticsearch 检索多语种混合文档 Elasticsearch • herosbd1 • 2021 年 11 月 27 日 |
| marked.js 表格前面必须要有空行才能渲染,如何破 问与答 • balabalaguguji • 2021 年 7 月 15 日 |
| django 集成 ElasticSearch 7.10 出现错误,执行 Python manage.py rebuild_index 创建索引时候出现的,有大佬知道如何解决吗? Python • wudigaga • 2020 年 11 月 14 日 • 最后回复来自 smart9527 | 1 |
| ES 中对 不规则的产品编号 该如何进行分词呢? 程序员 • eziooooo • 2019 年 10 月 17 日 • 最后回复来自 zbinlin | 2 |
| ElasticSearch 中的 Tokenizer "pattern" 配置,有没有办法定义多个 pattern? 程序员 • CivAx • 2019 年 1 月 31 日 |
| xunsearch 太多字段搜索起来特别慢,该怎么设计配置文件 程序员 • alwayshere • 2017 年 11 月 23 日 • 最后回复来自 dobelee | 1 |