本文详解selenium中`invalidselectorexception`异常的成因与修复方法,重点说明选择器类型(如`css_selector`)与查找方法(`find_elements`)的正确搭配,避免因混用`class_name`与复合css语法导致的报错。
在使用Selenium进行网页元素定位时,一个常见错误是混淆定位策略(By.xxx)与实际CSS/HTML语法的语义匹配。例如,代码中试图用 By.CLASS_NAME 传入 .event-widget time 这一复合CSS选择器:
driver.find_element(By.CLASS_NAME, ".event-widget time") # ❌ 错误!
这会直接抛出 selenium.common.exceptions.InvalidSelectorException 异常,原因有二:
✅ 正确写法如下:
from selenium import webdriver
from selenium.webdriver.common.by import By
chrome_driver_path = r"C:\development\chromedriver.exe" # 注意:路径建议加 r 前缀或双反斜杠
driver = webdriver.Chrome(executable_path=chrome_driver_path)
driver.get("https://python.org")
# ✅ 使用 By.CSS_SELECTOR + find_elements()
event_times = driver.find_elements
(By.CSS_SELECTOR, ".event-widget time")
for elem in event_times:
print(elem.text)
driver.quit() # 建议显式关闭浏览器,释放资源? 输出示例(以当前Python官网事件日历为准):
2025-02-05 2025-02-16 2025-02-21 2025-02-25 2025-03-06
⚠️ 注意事项:
掌握定位策略与选择器语法的严格对应关系,是编写健壮自动化脚本的基础。务必根据目标表达式结构,选择正确的 By 枚举值,并匹配单/多元素查找方法。