本文介绍一种无需读取文件内容、仅依赖浏览器提供的 file 对象元数据(如 size、type、name)进行轻量级重复文件识别的方法,适用于表单中多个 `` 场景,兼顾实用性与性能。
在 Web 表单中处理多文件上传时,用户可能从不同路径选择同名文件(如 report.pdf),甚至重复选择同一物理文件。由于浏览器出于安全限制,File API 不暴露文件路径、inode、UUID 或内容哈希,也无法直接获取唯一标识符(如 SHA-256),因此无法 100% 精确判定两个 File 对象是否指向同一底层文件。
但实践中,我们可通过组合多个高区分度的只读属性进行概率性去重判断:size(字节大小)、type(MIME 类型)、name(文件名)三者联合匹配,可显著降低误判率。虽然理论上存在不同文件恰好 size/type/name 完全一致的极端情况(碰撞概率极低,尤其当 size > 0 且 type 非空时),但在多数业务场景(如文档上传、图片管理)中已足够可靠。
以下是一个完整、可运行的示例,实现跨多个 元素的文件列表合并与重复检测:
? 关键说明与注意事项:

综上,该方案以零内容加载为前提,在浏览器能力边界内实现了高效、可维护的重复文件识别,是现代文件上传流程中值得采纳的务实策略。