导航
电话
咨询
地图
顶部
在java中,hashmap是一种基于哈希表的map实现,它提供了高效的键值对存储和检索能力。然而,hashmap的设计初衷是为了优化性能,而不是为了维护元素的插入顺序。这意味着当你向hashmap中添加键值对时,它们在内部的存储顺序是不确定的,并且可能会随着哈希冲突的解决或内部扩容而改变。
对于Excel这类结构化数据源,列的顺序通常是固定的且具有业务意义。例如,一个Excel表格可能有“姓名”、“年龄”、“城市”三列,如果使用HashMap存储每一行数据,那么读取后,Map中键值对的顺序可能是“年龄”->“姓名”->“城市”,而非原始的“姓名”->“年龄”->“城市”。当需要将这些数据写回Excel或进行依赖列顺序的进一步处理时,这种顺序的丢失就会成为一个严重的问题。
为了解决HashMap不保留插入顺序的问题,Java提供了两种特殊的Map实现:
考虑到我们的目标是保留Excel中“从左到右”的原始列顺序,LinkedHashMap是最佳选择。
下面我们将修改原始代码,将每一行数据的存储容器从HashMap替换为LinkedHashMap,以确保列顺序的保留。
import org.apache.poi.ss.usermodel.*; import java.util.*; import java.util.stream.Collectors; public class ExcelDataReader { /** * 从Excel工作表中读取数据,并将其存储为List>。 * 每个Map代表一行数据,键为列标题,值为单元格内容。 * 使用LinkedHashMap确保列的顺序与Excel中一致。 * * @param sheet 要读取的Excel工作表对象。 * @return 包含所有行数据的List,每行数据是一个LinkedHashMap。 * 如果工作表为空,则返回一个空列表。 */ public static List> readExcelSheet(Sheet sheet) { Iterator rows = sheet.iterator(); // 检查工作表是否为空 if (!rows.hasNext()) { return Collections.emptyList(); } // 读取表头(第一行)以获取列名和它们的顺序 Row headerRow = rows.next(); List columnHeaders = new ArrayList<>(); // 遍历表头单元格,获取所有非空列名 for (Cell cell : headerRow) { String headerValue = cell.getStringCellValue().trim(); // 获取并清理列名 if (!headerValue.isEmpty()) { columnHeaders.add(headerValue); } else { // 如果遇到空列名,认为后续没有有效列,停止读取表头 // 实际应用中可能需要更复杂的逻辑来处理空列名或合并单元格 break; } } List> allRowsData = new ArrayList<>(); // 遍历剩余的行(数据行) while (rows.hasNext()) { Row dataRow = rows.next(); // 使用LinkedHashMap来保证列的插入顺序与表头一致 Map rowDataMap = new LinkedHashMap<>(); // 遍历已识别的列头,按顺序获取对应单元格的值 for (int i = 0; i < columnHeaders.size(); ++i) { String columnName = columnHeaders.get(i); // 获取单元格,如果单元格不存在则创建为空白单元格 Cell cell = dataRow.getCell(i, Row.MissingCellPolicy.CREATE_NULL_AS_BLANK); String cellValue = getCellValueAsString(cell); // 统一处理单元格值 rowDataMap.put(columnName, cellValue); } // 仅添加非空行到结果列表 // 判断行是否为空的逻辑:如果所有值都为空字符串,则认为是空行 if (!rowDataMap.values().stream().allMatch(String::isEmpty)) { allRowsData.add(rowDataMap); } } return allRowsData; } /** * 辅助方法:将单元格内容统一转换为字符串。 * 处理不同类型的单元格,避免toString()直接调用可能带来的问题。 * * @param cell 单元格对象。 * @return 单元格内容的字符串表示。 */ private static String getCellValueAsString(Cell cell) { if (cell == null) { return ""; } switch (cell.getCellType()) { case STRING: return cell.getStringCellValue().trim(); case NUMERIC: if (DateUtil.isCellDateFormatted(cell)) { // 处理日期类型 return cell.getDateCellValue().toString(); // 或者使用SimpleDateFormat格式化 } else { // 处理数字类型,避免科学计数法或精度问题 return String.valueOf(cell.getNumericCellValue()); } case BOOLEAN: return String.valueOf(cell.getBooleanCellValue()); case FORMULA: // 对于公式单元格,尝试获取其计算结果 try { return String.valueOf(cell.getNumericCellValue()); // 假设公式结果为数字 } catch (IllegalStateException e) { try { return cell.getStringCellValue().trim(); // 假设公式结果为字符串 } catch (IllegalStateException ex) { return ""; // 无法获取结果 } } case BLANK: return ""; default: return cell.toString().trim(); // 其他类型直接转字符串 } } // 示例用法 public static void main(String[] args) { // 假设你有一个Excel文件 "example.xlsx" // 这里只是一个模拟,实际使用需要引入Apache POI库并加载Workbook // Workbook workbook = new XSSFWorkbook(new FileInputStream("example.xlsx")); // Sheet sheet = workbook.getSheetAt(0); // 为了演示,我们创建一个模拟的Sheet对象 // 在实际项目中,你需要使用Apache POI加载真实的Excel文件 // 以下代码仅为概念性演示,不能直接运行,需要POI库支持 // 假设 sheet 对象已经通过 Workbook.getSheetAt(0) 或其他方式获得 // 模拟一个简单的Excel工作表 Workbook mockWorkbook = new org.apache.poi.xssf.usermodel.XSSFWorkbook(); Sheet mockSheet = mockWorkbook.createSheet("SampleData"); // 创建表头 Row header = mockSheet.createRow(0); header.createCell(0).setCellValue("column1"); header.createCell(1).setCellValue("column2"); // 创建数据行1 Row row1 = mockSheet.createRow(1); row1.createCell(0).setCellValue("value1"); row1.createCell(1).setCellValue("value2"); // 创建数据行2 Row row2 = mockSheet.createRow(2); row2.createCell(0).setCellValue("value3"); row2.createCell(1).setCellValue("value4"); List> data = readExcelSheet(mockSheet); System.out.println("读取到的数据 (LinkedHashMap 保持顺序):"); for (int i = 0; i < data.size(); i++) { Map rowMap = data.get(i); System.out.println(i + " = " + rowMap); // 验证顺序 rowMap.forEach((key, value) -> System.out.println(" \"" + key + "\" -> " + value)); } // 预期输出: // 0 = {column1=value1, column2=value2} // "column1" -> value1 // "column2" -> value2 // 1 = {column1=value3, column2=value4} // "column1" -> value3 // "column2" -> value4 } }
代码解释:
org.apache.poi poi 5.2.3 org.apache.poi poi-ooxml 5.2.3
通过将存储每行数据的Map实现从HashMap替换为LinkedHashMap,我们可以轻松解决Java读取Excel数据时列顺序混乱的问题。LinkedHashMap能够完美地保留键值对的插入顺序,这对于依赖列顺序的Excel数据处理至关重要。结合对表头列名的有序提取和单元格内容的健壮处理,我们可以构建出高效且准确的Excel数据读取器,为后续的数据操作提供可靠的基础。
# ai # switch # if # 是一个 # 将其 # excel # 排列 # Java # String # 子类 # 构造函数 # 字符串 # 为空 # 不存在 # 键值对 # 加载 # map # 我们可以 # 键值 # 遍历 # excel表格 # apache # 数据处理 # 单元格 # gradle # maven
相关栏目: 【 行业资讯 】 【 网络运营 】 【 GEO优化 】 【 营销推广 】 【 SEO优化 】 【 技术教程 】 【 代码知识 】 【 AI推广 】
相关推荐: Win10系统怎么查看网络连接状态_Windows10网络和共享中心 c++怎么操作redis数据库_c++ hiredis库连接与命令执行【实战】 Windows10电脑怎么设置自动连接WiFi_Win10无线网络属性勾选 c++的位运算怎么用 与、或、异或、移位操作详解【底层知识】 Win11怎么设置ipv4地址_Windows 11固定静态IP地址配置教程【详解】 Win11怎么恢复出厂设置_Win11重置此电脑保留文件方法【详解】 Win11怎么检查TPM2.0模块_Windows11受信任平台模块开启状态查询 Python代码测试策略_质量保障解析【教程】 php怎么下载安装后设置错误日志_phpini log配置教程【汇总】 如何使用Golang实现容器安全扫描_Golang Docker镜像漏洞检测方法 php内存溢出怎么排查_php内存限制调试与优化方法【说明】 c# F# 的 MailboxProcessor 和 C# 的 Actor 模型 Win11怎么设置应用分屏_Windows11贴靠布局Snap Layouts Win11更新后变慢怎么办_Win11系统更新后卡顿优化方案【详解】 Win11怎么关闭键盘按键音_Win11禁用打字声音反馈【教程】 作用域操作符会影响性能吗_php静态调用性能分析【教程】 Win11怎样安装企业微信_Win11安装企业微信教程【步骤】 如何使用Golang处理静态文件缓存_提高页面加载速度 手机php文件怎么变成mp4_安卓苹果打开php转mp4方法【教程】 如何在 ACF 中正确更新嵌套多层的 Group 字段子字段 Python列表推导式与字典推导式教程_简化代码高效写法 Win11开机Logo怎么换_Win11自定义启动画面工具【高级】 Windows如何拦截2345弹窗广告_Windows拦截2345弹窗方法【步骤】 mac怎么查看wifi密码_MAC查看已连接WiFi密码方法【技巧】 Win11怎么恢复旧版开始菜单_通过软件还原Win10风格菜单【详解】 Win11开机自检怎么关闭_跳过Win11开机磁盘扫描修复方法【技巧】 Python网络异常模拟_测试说明【指导】 Python对象比较排序规则_集合使用说明【指导】 Python字符串操作教程_切片拼接与格式化详解 Win10电脑C盘红了怎么清理_Windows10系统盘深度瘦身指南 如何在Golang中使用replace替换模块_指定本地或远程路径 Win11怎么设置夜间模式_Windows11显示设置蓝光过滤强度 Windows10如何删除恢复分区_Win10 Diskpart命令强制删除分区 Dapper的Execute方法的返回值是什么意思 Dapper Execute返回值详解 Windows服务持续崩溃怎样修复_系统服务保护机制解析 MAC怎么用连续互通相机里的“桌上视角”_MAC在视频通话中同时展示人脸和桌面 Win11怎么压缩文件 Win11自带压缩解压功能使用【教程】 Python 中将 ISO 8601 时间戳转换为日期并计算日期差值的完整教程 c++ namespace命名空间用法_c++避免命名冲突 Win11系统更新失败怎么办 Win11系统更新失败解决法【步骤】 MAC怎么在照片中添加水印_MAC自带编辑工具文字水印叠加【方法】 Win11怎么关闭最近使用的文件 Win11快速访问不显示记录【隐私】 c++的STL算法库find怎么用 在容器中查找指定元素【实用教程】 Win11系统更新后黑屏怎么办 Win11更新黑屏修复教程【方法】 如何在Golang中验证模块完整性_Golanggo.sum校验与安全实践 c# 如何深拷贝和浅拷贝 Windows资源管理器总是卡顿或重启怎么办?(修复方法) Win10如何卸载微软拼音输入法 Win10只保留一个输入法【教程】 c++如何用AFL++进行模糊测试 c++ Fuzzing入门【安全】 PHP怎么接收前端传的时间戳_处理时间戳参数转换技巧汇总【指南】
赣ICP备2024031479号