
1 min read108 words
腾讯新闻作者文章采集
Business
Technology
想批量抓取某作者腾讯新闻全部文章 URL?超详细爬虫教程,教你分析接口、绕过反爬、导出链接,附完整代码!
打开网页
Chrome 打开https://view.inews.qq.com/u/8QMf2Hxf7IEdvj%2Fd 调整为手机模式.电脑模式获取文章地址有点不太方便
加载全部文章
使用JS脚本,滑动到顶部获取全部文章链接
// 1. 先清除可能存在的同名定时器(避免重复执行) clearInterval(window.scrollTimer); // 2. 设置每3秒执行一次滚动到底部 window.scrollTimer = setInterval(() => { // 滚动到底部(兼容不同页面布局) window.scrollTo(0, document.body.scrollHeight || document.documentElement.scrollHeight); // 可选:控制台打印执行日志,方便确认 console.log('已滚动到底部,时间:', new Date().toLocaleTimeString()); }, 3000); // 3000 毫秒 = 3 秒
获取全部文章ID,处理文章ID数据,
使用JS脚本,处理获取全部数据
Array.from(document.querySelectorAll('#pageWrapper > div:nth-child(1) > div > div[dt-params]')).map(div => { try { return div.getAttribute('dt-params').replace(/'/g, '"'); } catch (e) { return null; } }).filter(id => id);
返回数据
结果如下,“20251219A0018600“就是文章地址,
"article_id=20251219A0018600&article_type=0&questionId=" "article_id=20251219A0018100&article_type=0&questionId="
处理数据,最终结果
复制到文件中, 全局替换
“
https://news.qq.com/rain/a/
20251219A0018600”