文章采集过滤不相关文章的教程

  文章采集过滤不相关文章的教程

文章采集过滤不相关文章的教程

  快捷导读:

  一、打开词库

  二、添加敏感词

  三、调用词库

  四、总结

  很多网友提出,在采集的时候会采集到一些不相关的文章,这是因为大家没有设置敏感词库,在设置了敏感词库后就可以大大避免采集到不相关的文章,下面就是采集工具,过滤不相关文章的教程:

  一、打开词库

  在采集首页,找到窗口右上方的【词库配置】,弹出词库界面,然后在词库界面点击右上角的【新增词库】。

  二、添加敏感词

  如下图所示,在新增词库界面选中【敏感词】,然后在下方的方框内输入用户不像采集的敏感词,多个敏感词的话,只需要跳行输入即可,设置好后点击上方的保存就可以了。

  三、调用词库

  回到采集任务界面,按照下图所示,点击1号箭头所指的【设置】弹出2号箭头所指的词库调用界面,在此界面选到刚刚设置好的词库就可以了。

  四、总结

  通过增加敏感词的方式确实能大大过滤采集时的不相关文章,但是根据用户自己需求,敏感字还需要用户多多挖掘和发现。


转载请说明出处 内容投诉内容投诉
九幽软件 » 文章采集过滤不相关文章的教程