December 19, 20251 min read108 words

腾讯新闻作者文章采集

Business

Technology

想批量抓取某作者腾讯新闻全部文章 URL？超详细爬虫教程，教你分析接口、绕过反爬、导出链接，附完整代码！

打开网页

Chrome 打开https://view.inews.qq.com/u/8QMf2Hxf7IEdvj%2Fd 调整为手机模式.电脑模式获取文章地址有点不太方便

加载全部文章

使用JS脚本,滑动到顶部获取全部文章链接

// 1. 先清除可能存在的同名定时器（避免重复执行）
clearInterval(window.scrollTimer);

// 2. 设置每3秒执行一次滚动到底部
window.scrollTimer = setInterval(() => {
  // 滚动到底部（兼容不同页面布局）
  window.scrollTo(0, document.body.scrollHeight || document.documentElement.scrollHeight);
  
  // 可选：控制台打印执行日志，方便确认
  console.log('已滚动到底部，时间：', new Date().toLocaleTimeString());
}, 3000); // 3000 毫秒 = 3 秒

获取全部文章ID,处理文章ID数据,

使用JS脚本,处理获取全部数据

Array.from(document.querySelectorAll('#pageWrapper > div:nth-child(1) > div  > div[dt-params]')).map(div => {
try {
return div.getAttribute('dt-params').replace(/'/g, '"');
} catch (e) { return null; }
}).filter(id => id);

返回数据

结果如下,“20251219A0018600“就是文章地址,

"article_id=20251219A0018600&article_type=0&questionId="
"article_id=20251219A0018100&article_type=0&questionId="

处理数据,最终结果

复制到文件中, 全局替换

“

https://news.qq.com/rain/a/

20251219A0018600”

最后可以将文章加到个人知识库IMA

https://ima.qq.com/