直接存中文会乱码,因sessionStorage只认UTF-8字节流而JS字符串为UTF-16,需用encodeURIComponent(JSON.stringify(value))存、decodeURIComponent()配合JSON.parse()读取。
直接用 sessionStorage.setItem() 存中文,读出来是乱码,不是浏览器 bug,而是你没处理编码——sessionStorage 只认 UTF-8 字节流,但原生 API 不自动编码,中文字符会以平台默认编码(如 GBK)被错误解释。
Chrome、Firefox 等现代浏览器的 sessionStorage 底层按 UTF-8 存储,但 JavaScript 字符串本身是 UTF-16。当你传入中文字符串,比如 "你好",如果未显式编码就塞进去,某些旧版 WebView 或特定环境(如 Electron 早期版本)可能把 UTF-16 码元误当作 Latin-1 处理,导致取值时出现 "ä½ å¥½" 这类乱码。
更常见的情况是:你存了中文,读出来看似正常,但后续传给后端或拼接 URL 时出错——因为没统一编码逻辑,隐性问题更难排查。
这是最稳妥、兼容性最好(IE9+)、且不依赖第三方库的做法。核心思路:把任意 JS 值(含中文、对象、数组)先序列化为字符串,再用 encodeURIComponent() 转义成纯 ASCII 安
全字符串,存入 sessionStorage;读取时反向解码 + JSON.parse() 还原。
encodeURIComponent() 保证所有非 ASCII 字符(包括中文、emoji、特殊符号)都转为 %xx 格式,彻底避开编码歧义JSON.stringify(),否则无法安全存储对象/数组;单纯对字符串用 encodeURIComponent() 也行,但扩展性差encodeURI() —— 它不编码 / ? : @ & = + $ , #,在存复杂结构时会破坏 JSON 格式const setSessionItem = (key, value) => {
try {
const encoded = encodeURIComponent(JSON.stringify(value));
sessionStorage.setItem(key, encoded);
} catch (e) {
console.error('sessionStorage set failed:', e);
}
};
const getSessionItem = (key) => {
try {
const item = sessionStorage.getItem(key);
if (!item) return null;
return JSON.parse(decodeURIComponent(item));
} catch (e) {
console.error('sessionStorage get failed:', e);
return null;
}
};
// 使用示例
setSessionItem('user', { name: '张三', city: '深圳' });
console.log(getSessionItem('user')); // { name: '张三', city: '深圳' }
典型错误:URIError: malformed URI sequence,说明存进去的内容被截断、损坏,或压根没用 encodeURIComponent 编码过。
setItem() —— 比如某次手动调用 sessionStorage.setItem('x', '中文'),后续又用 decodeURIComponent() 去读,必然报错sessionStorage 被禁用或隔离,写入静默失败storage 事件回调里直接调用 decodeURIComponent():事件中的 newValue 是原始字符串,若之前没编码,这里解码就会崩try/catch,对失败项返回 null 或原始字符串(不推荐长期用)有人试过用 escape()(已废弃)、btoa(unescape(encodeURIComponent()))、甚至 Base64 编码,这些都多余且易出错。
escape() 对 Unicode 支持极差,escape('你好') 输出 '%u4F60%u597D',而 unescape() 在现代浏览器中已被移除TextEncoder / TextDecoder:虽然更底层,但 IE 完全不支持,且要额外处理 Uint8Array,增加复杂度,没必要真正需要关注的是:你是否统一了所有写入路径的编码方式。一个项目里混用原生存、encodeURIComponent 存、JSON.stringify 直存,比编码本身更容易引发乱码。