Java项目中文乱码的根本原因是编码配置不统一,需确保源文件、编译器、JVM、IDE、终端五者编码均为UTF-8:1. IDEA中设置Global/Project/Properties编码为UTF-8并勾选转义;2. Maven配置maven-compiler-plugin的encoding为UTF-8;3. JVM启动时加-Dfile.encoding=UTF-8;4. 终端需设为UTF-8(如Windows执行chcp 65001)。
Java项目中出现中文乱码,根本原因通常是编码配置不统一。关键不是“改一个地方”,而是确保源文件编码、编译器编码、运行时JVM编码、IDE编码、控制台/终端编码五者一致(推荐统一为UTF-8)。
这是最常被忽略的一环。IDE默认可能用系统编码(如Windows的GBK),导致.java文件保存时就已乱码。
即使IDE用了UTF-8,Maven默认可能按平台编码编译,导致class文件里字符串字面量出错。
org.apache.maven.plugins maven-compiler-plugin3.11.0 8 8 UTF-8
注意: 是关键,它告诉javac用UTF-8读取源文件。
Java程序运行时,String.getBytes()、new String(byte[])等操作依赖JVM启动参数-Dfile.encoding。不指定则取操作系统默认值(Windows常为GBK)。
java -Dfile.encoding=UTF-8 -jar app.jar
-Dfile.encoding=UTF-8
server.tomcat.uri-encoding=UTF-8(仅对HTTP请求参数有效,不影响JVM全局)
即使代码全UTF-8,Windows命令行(cmd)默认是GBK,打印中文仍显示为乱码。
chcp 65001 切换为UTF-8(临时生效);或改用Windows Terminal + 设置字体支持Unicodelocale | grep UTF,确保LANG含UTF-8
基本上就这些。核心逻辑很简单:从文件保存→编译→加载→运行→输出,每个环节都走UTF-8,中文就不会丢。漏掉任意一环,都可能在某个阶段突然乱码。