腾讯新闻作者文章采集
1 min read108 words

腾讯新闻作者文章采集

Business
Technology

想批量抓取某作者腾讯新闻全部文章 URL?超详细爬虫教程,教你分析接口、绕过反爬、导出链接,附完整代码!

打开网页

Chrome 打开https://view.inews.qq.com/u/8QMf2Hxf7IEdvj%2Fd 调整为手机模式.电脑模式获取文章地址有点不太方便

加载全部文章

使用JS脚本,滑动到顶部获取全部文章链接

// 1. 先清除可能存在的同名定时器(避免重复执行) clearInterval(window.scrollTimer); // 2. 设置每3秒执行一次滚动到底部 window.scrollTimer = setInterval(() => { // 滚动到底部(兼容不同页面布局) window.scrollTo(0, document.body.scrollHeight || document.documentElement.scrollHeight); // 可选:控制台打印执行日志,方便确认 console.log('已滚动到底部,时间:', new Date().toLocaleTimeString()); }, 3000); // 3000 毫秒 = 3 秒

获取全部文章ID,处理文章ID数据,

使用JS脚本,处理获取全部数据

Array.from(document.querySelectorAll('#pageWrapper > div:nth-child(1) > div > div[dt-params]')).map(div => { try { return div.getAttribute('dt-params').replace(/'/g, '"'); } catch (e) { return null; } }).filter(id => id);

返回数据

结果如下,“20251219A0018600“就是文章地址,

"article_id=20251219A0018600&article_type=0&questionId=" "article_id=20251219A0018100&article_type=0&questionId="

处理数据,最终结果

复制到文件中, 全局替换

https://news.qq.com/rain/a/
20251219A0018600”

最后可以将文章加到个人知识库IMA

https://ima.qq.com/