本文目录一览:
- 1、怎样才能把别人论坛上的帖子批量倒入自己论坛上?我的论坛是Discuz! 7.0.0系统!
- 2、【scrapy爬虫实战】Discuz 论坛版块全部帖子信息爬取
- 3、discuz论坛中怎么增加百度爬虫和google爬虫?
- 4、有关discuz采集发帖的问题
怎样才能把别人论坛上的帖子批量倒入自己论坛上?我的论坛是Discuz! 7.0.0系统!
估计没有太方便的办法,都是用爬虫把数据爬回来再整理,然后放到数据库的吧。
【scrapy爬虫实战】Discuz 论坛版块全部帖子信息爬取
Discuz 是一款由PHP编写的开源论坛
Discuz 官方论坛:
要爬取的页面地址:
Discuz BUG与问题交流板块;
应该打开创建项目命令生成的那个目录 如果选择再下层目录 就不能导模块了
遍历帖子列表
时间信息同样有两种状态 第二种带有 "发表于 " 字样
存储
列表遍历完成
获取下一页的url 定义一个类的变量来记录页数
结果存在data.json中
discuz论坛中怎么增加百度爬虫和google爬虫?
其实就是增加外链,但是要高品质外链,这样才能有用
还可以在后台生成sitemap.xml然后提交到GG上去
有关discuz采集发帖的问题
内容方面,在初期人气非常有限的时候,可以考虑用以下方式去补充内容,通过采集软件去批量的采集一些合适的内容转过来,这个的话你可以去用下八爪鱼采集器,这个挺好用的,也不要钱,另外,除了采集来的内容之外,你的论坛还需要有些自己的精华内容,这个在初期用户不能提供的话,还是得你自己多原创一些内容上来