为什么要在网页上混淆邮箱?
垃圾邮件机器人持续抓取网页上的邮箱地址。HTML 中一个简单的 mailto:[email protected] 在被索引后数小时内就会成为垃圾邮件列表的目标。混淆使地址难以被简单的抓取器解析,同时对真实访客保持可访问性。
本工具的方法
- HTML 实体 — 每个字符变为
&#NN;。浏览器正常渲染;许多抓取器会跳过。 - 反转 + CSS — 字符串以
direction: rtl倒序存储在 DOM 中。人类正常阅读;简单的正则抓取器看到的是乱码。 - Base64 + JS 解码器 — 地址经 Base64 编码,页面加载时由一个小型内联脚本解码。不执行 JavaScript 的抓取器永远看不到明文。
- ROT13 — 每个字母偏移 13 位。知道方法的人一目了然,对简单匹配器不可见。
- [at] / [dot] — 人类可读形式:
contact [at] example [dot] com。易于复制和阅读,对正则表达式不可见。
如何选择方法?
- 如果希望地址保持可点击:HTML 实体或 Base64 + JS。
- 如果希望可见但不可点击:反转 + CSS 或 [at]/[dot]。
- 如果关心禁用 JavaScript 的访客:避免 Base64。
- 如果关心 SEO:所有方法对搜索引擎的邮箱提取器都不可见,这正是目的所在。
局限性
现代高级抓取器会执行 JavaScript 并识别实体编码。将混淆视为减少垃圾邮件量的手段,而非完整防御。对于关键邮箱,请将混淆与联系表单及全匹配过滤器结合使用。完全在浏览器中运行——您的邮箱永远不会被记录。
Tiny Online Tools






