文本分词器 — 使用指南

此工具有什么功能

文本分词器将文本拆分为 token（词、字符或行），并显示每个 token 的出现频次。选择模式、粘贴文本即可获得计数和按频次排序的频度表。可复制为逗号或换行分隔的 token，或复制频度表，或将计数发送到统计计算器进行进一步分析。

频度按出现次数统计，并按次数降序排序。所有计算均在浏览器内完成，不向任何服务器发送数据。

输入「hello world hello」在词模式下：token 为 hello, world, hello；频度为 hello (2), world (1)。

常见问题

支持哪些 token 模式？

三种：词（按空格分隔）、字符（每个字符）、行（按换行分隔）。

能否在统计计算器中分析频度？

可以。使用「在统计中分析」按钮将计数发送到统计计算器。

有无输入大小限制？

有。最大 512KB（约 51.2 万字符）。超出会报错。

我的文本会离开设备吗？

不会。所有分词均在浏览器内完成，不会发送到任何服务器。