本文旨在解决网站上whatsapp点击聊天按钮的手机号码被机器人抓取的问题。通过介绍一种简单有效的技术,即在服务器端(php)对手机号码进行base64编码,并在客户端(javascript)进行解码,动态构建whatsapp链接。这种方法能有效隐藏html源码中的敏感信息,阻止多数非高级爬虫的直接抓取,从而提升用户隐私保护。
在分类信息网站或其他需要用户通过WhatsApp联系的场景中,开发者通常会直接将用户的电话号码嵌入到WhatsApp点击聊天链接的href属性中。例如:
More Details
这种做法虽然方便,但存在严重的安全隐私隐患。当电话号码直接暴露在HTML源码中时,恶意机器人或爬虫可以轻易地通过解析页面来抓取这些敏感信息,导致用户数据泄露、垃圾信息骚扰甚至更严重的网络攻击。网站管理员可能会在Google Analytics中观察到大量非人类行为的点击,这通常是机器人进行数据抓取的迹象。
为了有效防止机器人直接从HTML源码中抓取电话号码,我们可以采用一种简单但有效的混淆技术:在服务器端对电话号码进行Base64编码,然后将其存储在一个非href属性中(例如data-*属性),最后在客户端使用JavaScript对其进行解码并动态构建WhatsApp链接。
首先,在生成HTML时,使用PHP的base64_encode()函数对电话号码进行编码。我们将编码后的字符串存储在自定义的data-*属性中,而不是直接放在href属性里。href属性可以暂时设置为#!或javascript:void(0);,以防止在JavaScript加载前点击无效。
"
target="_blank"
rel="noopener noreferrer"
href="#!">
More Details
代码解释:
接下来,在页面加载完成后,使用JavaScript来查找所有包含data-wakey属性的链接元素。然后,取出data-wakey属性的值,使用atob()函数对其进行Base64解码,最后将解码后的电话号码拼接到WhatsApp链接中,并动态设置到href属性。
代码解释:
经过上述PHP处理后,浏览器接收到的HTML源码将是:
More Details
此时,电话号码+212612345678已经被编码为KzIxMjYxMjM0NTY3OA==,无法直接识别。只有当JavaScript执行后,href属性才会被动态填充为正确的WhatsApp链接。
对于需要更高安全级别的场景,可以考虑结合以下方法:
通过在服务器端进行Base64编码并在客户端使用JavaScript解码动态构建WhatsApp链接,我们为网站上的电话号码提供了一层有效的保护。这种方法简单易行,能有效抵御多数非高级爬虫的直接抓取,从而提升用户隐私保护。虽然它并非万无一失,但作为第一道防线,对于提升网站的整体安全性具有积极意义。在实际应用中,开发者应根据具体需求和安全级别,权衡利弊并考虑结合其他安全措施。