引用引用第4楼8bd36128于2021-03-18 16:01发表的 :那你前面加个</span>呢,一个前面是<h3>,另一个前面是</span>我不清楚你这个悬赏的区分,未完结就会有个<span></span>显示悬赏金额吧,那你直接re.findall(r'</span>(?:.*)<a href="([^"]+)',s) ,类似这样操作呗
引用引用第2楼8bd36128于2021-03-18 15:15发表的 :你为什么不直接匹配read.php呢……比如这样re.findall(r'<a href="read.php\?([^"]+)',s),匹配出来再加上"read.php?"就行了。另外BeautifulSoup好像能直接查href吧。
引用引用第3楼d6cde0d6于2021-03-18 15:51发表的 :这两个不一样,对应后面的href地址,一个是悬赏完结,一个是悬赏未完结,所以要分开来提取