用 HashMap 存书名→作者实现 O(1) 查询,反向查作者→书单则用 computeIfAbsent 初始化列表;TreeSet 用于去重+字典序排序,需注意中文排序需自定义 Comparator;Stream API 替代 for 循环做筛选,注意判空和异常处理。
HashMap 存书名和作者,别用 ArrayList 暴力遍历查一本书的作者,或按作者找所有书——这类操作频次高、要求快,ArrayList 逐个 equals() 对比会随数据量线性变慢。直接用 HashMap 存 "书名" → "作者",get() 是 O(1);若需反向查(作者→书单),就用 HashMap,插入时先 computeIfAbsent() 获取或初始化列表。
常见错误:把整本 Book 对象当 key 放进 HashMap,却没重写 hashCode() 和 equals(),导致 get() 总返回 null。
实操建议:
trim().toLowerCase() 预处理,避免“Java编程思想”和“ java编程思想 ”查不到contains() 或正则匹配Map 初始化一次即可,不用每次 newTreeSet 实现按书名自动排序 + 去重用户输入一批书名,要展示“已录入书单”且按字典序排列,同时过滤重复项——TreeSet 天然满足这两点,比先塞 ArrayList 再 Collections.sort() + 手动去重更简洁。
注意:TreeSet 默认按自然序排序,中文按 Unicode 码点排(“人工智能”会在“算法导论”前,但“Python”会在“数据结构”后),若需真正按拼音排序,得传入自定义 Comparator,比如用 Collator.getInstance(Locale.CHINA)。
实操建议:
TreeSet 却只靠 Book.toString() 排序,应明确指定排序字段(如 book.getTitle())TreeSet 本身不支持快速查找 value,得另配一个 HashMap,二者同步更新TreeSet 非线程安全,别直接包装成 Collections.synchronizedSortedSet() 就完事,迭代时仍可能抛 ConcurrentModificationException
Stream API 做条件筛选,别手写 for 循环比如“查所有作者含‘李’字的书”或“找标题长度大于 10 的计算机类图书”,这类逻辑用传统循环易出边界错、空指针、漏 break。Java 8+ 的 Stream 更声明式、可读性强,且底层做了短路优化(findFirst() 找到就停)。
示例:从 List 中筛选
books.stream()
.filter(book -> book.getAuthor() != null && book.getAuthor().contains("李"))
.filter(book -> "计算机".equals(book.getCategory()))
.map(Book::getTitle)
.collect(Collectors.toList());
常见坑:
stream() 对空集合返回空流,但对 null 集合调用会直接 NullPointerException,务必提前判空filter() 内部若调用可能抛异常的方法(如解析 ISBN),必须用 try-catch 包裹,否则整个流中断当图书条目超过 500 条、需要模糊搜索(如“*算法*”)、支持多字段组合查(作者+年份+分类)、或要求重启后数据不丢——纯内存集合就撑不住了。这时候硬加索引、手写全文匹配,不如直接嵌入 SQLite(用 sqlite-jdbc 驱动)。
一个信号:你开始给 ArrayList 写 fullTextSearch() 方法,并在里面用 Pattern 编译正则——说明该移交数据库了。
轻量接入建议:
CREATE TABLE books (id INTEGER PRIMARY KEY, title TEXT, author TEXT, year INTEGER)
PreparedStatement 防 SQL 注入,尤其书名含单引号时(如《罗密欧与朱丽叶》)
DROP TABLE,否则数据全丢集合类不是万能胶,它解决的是“内存中快速组织与遍历”,不是“持久化与复杂查询”。工具用对地方,代码才不会越写越沉。