新增推文回复爬虫功能
本次更新新增了推文回复爬虫功能,支持爬取单个推文的回复,或者批量爬取多个推文的回复,但是需要注意有很大的限制:
- 回复量少的情况下,不一定能获取到所有回复(显示回复数量和实际爬取到的回复数量不一样)。
- 回复量多的情况下,只能抓取到几百条回复(经过测试,2500+ 条回复,实际只抓到了 357 个)。
这些限制均是 X 的限制,无法解决。此外就是和推文回复爬虫功能相关的新增功能:
- CSV 导出新增推文回复相关字段(回复推文 ID、回复推文用户 ID、回复推文用户名,仅在推文回复功能中有效,其他功能设置无效)。
- 文件 & 文件夹名模板新增推文回复相关字段(回复推文 ID、回复推文用户 ID、回复推文用户名,仅在推文回复功能中有效,其他功能设置无效)。
- 推文 HTML、JSON、TXT 导出新增推文回复相关字段(回复推文 ID、回复推文用户 ID、回复推文用户名,仅在推文回复功能中有效,其他功能设置无效)。
文件 & 文件夹名模板新增更多变量
本次更新在文件 & 文件夹名模板新增了两个新变量:
文件 & 文件夹名模板新增不带前缀版本各种变量
本次更新在文件 & 文件夹名模板新增了不带前缀版本各种变量,具体修改如下:
- 新增:推文ID、媒体ID、媒体索引、媒体高度、媒体宽度。
- 为保持向后兼容,所有旧版 ID 仍然可用,旧版 ID 会在名字后面以:“(旧 V1 带前缀)”进行标识。
跳过 & 停止条件新增推文语言表达式
本次更新在所有跳过 & 停止条件新增了推文语言表达式,可以通过设置推文语言表达式来决定是否跳过 & 停止下载。
新增获取用户是否认证账号相关信息
本次更新新增了获取用户是否认证账号相关信息功能,具体更新如下:
- TXT、HTML、JSON,以及 CSV 导出新增用户是否认证账号字段。
- 涉及到用户信息展示的地方如果用户是认证账号,会显示一个蓝色标志标记,方便辨认。
需要注意,目前仅区别用户是否为认证账号,暂不支持判断是企业认证还是个人认证。