此工具有什么功能
正则表达式清洗器使用正则表达式删除或替换文本。输入正则模式并选择删除匹配或替换为自定义文本。应用前会校验模式;无效正则显示行内错误。默认全局标志,处理所有匹配。适用于清理数据、去除不需要的字符或批量文本转换。
如何使用
- 输入文本 — 粘贴或输入要处理的文本。
- 输入模式 — 输入正则表达式(如
\d+表示数字,\s+表示空白)。 - 替换(可选) — 留空则删除匹配,或输入替换文本。
- 设置标志 — 按需切换全局(g)、不区分大小写(i)等。
- 应用 — 点击运行。结果显示;无效模式显示错误。
工作原理
模式在使用前通过 new RegExp() 校验。无效时显示行内错误且不执行替换。有效时使用带所选标志的 String.prototype.replace()。默认全局(g)标志,一次替换所有出现。结果显示并可复制。所有处理在客户端完成。
所有计算均在您的浏览器中完成。不会向任何服务器发送数据。
使用场景与示例
- 清理数据 — 移除多余空格、换行或特殊字符。
- 提取 — 使用捕获组提取和替换(如重排日期格式)。
- 规范化 — 替换变体(如多个空格 → 单个空格)。
- 去除标记 — 移除 HTML 标签或其他标记。
- CSV 清理 — 修复分隔符或转义序列。
示例
- 模式
\s+,替换→ 将多个空格合并为一个。 - 模式
\d{3}-\d{3}-\d{4},替换[REDACTED]→ 隐藏电话号码。 - 模式
[^\w\s],替换为空 → 移除所有标点。
限制与已知约束
- 先校验模式 — 无效正则显示错误;不尝试替换。
- ReDoS — 极复杂模式可能导致缓慢执行;避免灾难性回溯。
- 单次替换 — 一次替换操作;链式替换需多次运行。
- JavaScript 正则 — 使用 JS 正则风格;部分 PCRE 功能可能不同。