搜索留痕蜘蛛池SEO技术是什么?
搜索留痕蜘蛛池SEO技术是什么?
详解:百度蜘蛛,搜索引擎的工作原理!#SEO
推荐阅读:
原文地址:https://www.bsw80.com/post/1690.html
我们今天来讲一下蜘蛛池的搭建和后台的操作,那么首先我们知道蜘蛛池的一个作用,就是对我们在做泛目录或者泛战群做任何都是有起到一个非常重要的一个作用,它可以快速的引支出。那么有了蜘蛛就可以快速收录,所以说蜘蛛池是我们在做黑帽当中是非常重要的,那这时候我们来说一下,来看一下蜘蛛池,像我们这个是我们之前搭建的一个蜘蛛池,用的是拉锯名来搭建的,我们来看一下我们这个蜘蛛,现在是在 21 号的时候是可以达到 63 万,这是百度的,我们可以看到百度的一个支柱量,但是为啥后来下降了?主要是因为是我们这个域名,现在很多域名都被抢了,就是国内打不开,导致我们的网站现在很多域名都打不开。我们比如说像我们现在这个羽苗,我们在国内它是打不开的。
看一下这个,我们在国内直接输入我们的一个后台,你看我们国内是打不开的,那么这种域名的话,它现在只有在通过这种服务器,我们服务器的话是香港或者美国,它是可以打开的,所以说导致了就是我们那个蜘蛛急剧下降,那么也就是说通过我们这种方法用拉锯名也是可以去搭建的。那么之前最高的时候我们其实是最高。这还不是最高,最高的时候我们蜘蛛量是可以达到 70 多万的。
我们来看这是我们的一个最高的,那么后来就是又被攻击,然后再加上现在就是被这个域名,现在就是打不开,导致我们现在的只有部分域名才能正常打开,所以说我们这个蜘蛛量就维持在每天现在的几万、十万以内,那么百度也就是3万六。那么但是虽然说每天 36, 000,但是用这个来去做我们这个业务它也是可以的,就也是起到一个引蜘蛛。
那么我们做饭目录主要是在于前期的一个引蜘蛛,引完蜘蛛之后,后期它会自动的去,本来就会自动去生产大量的一个蜘蛛,所以说这些蜘蛛我们前期做业务它也是够用的。但是如果说我们这个域名用的是备案域名,可能效果会更好。那么如果说用垃圾域名的话,可能需要用那种有收入的老域名,并且域名数量要多一点,那么现在我们来说一下这个整体的是怎么搭建的,那么首先就是说我们需要去做第一步,就是蜘蛛石的一个搭建。那首先我们需要去有这个程序,我们有这个提供这个滞留池的一个程序,有最新版,当然还有我们现在用的是 X10 这个版本。 X10 个版本首先有个好处,就是它可以保留了句子库,而最新版的话它只有Pro,所以说我们现在还是用这个 X10 版本去做这个蜘蛛池是蛮好的。
然后现在就是蜘蛛池的搭建,首先把程序上传上我们的一个网站,就上传到我们的根目录,然后我们这边还需要去做一件事,我们现在就是来演示一下。首先程序上传之后,我们需要去做违禁态,第一步就找到TMP。在这里面有一找到reward,点开这个,这边他说的是我们需要去将这个第一行和最后一行,就是不要我们从这里开始复制好,复制复制完之后我们去回到我们那个网站,找到对应的我那么个网站去做一下 5 静态。好,我们现在就是回到这里面,我们来做一下稳定态。
这边就是违禁态,我们已经做好了,做好之后就是直接安装,直接安装就可以了,直接安装这边需要授权,如果说需要授权的话可以联系我,我来给你提供这个永久版的一个书全,当然了这个都是官方的,我们并不是破解的。然后我们现在这是完成了第一步,就是蜘蛛池的一个搭建,那如果说我要开启这里面的一个这个插件,就是这里面有个插件,我们来看一下,就是插件,这个插件如果说你想要开启这个插件的话,我们需要去在这个点击软件商店找到对应的版本,就是我们那个建网站用的 PP 版本,如果说我们用的是 7.2 或者说7.1、7.0,那么我们需要去点击设置找到配置修改,这边有一个 short open tag,默认是开启的,我们选择关闭保存。然后这边我们再点击这个服务,点击重载配置它就可以了,那么这就是相当于是把 PP 版本给重载了,这时候我们就可以用这个插件了。那么有的时候如果你这个 PP 短标签不关闭的情况下,它会导致我们这个插件是打不开的。所以说我们就直接将这个插件,如果想用插件的话,就可以通过这里面就是在配置修改里面关闭短标签就可以了。
我们搭建好蜘蛛池的第一步就是一定要找到核心设置,找到系统设置,将这个蜘蛛池的状态一定要调整为开启,要不然你的网站是打不开的。我们这时候开启我们的一个网站,我们看一下我们之前搭建的蜘蛛石是用的下载站,所以说我们这次就是以下载站来完善它这样的一个域名,它是怎么弄的?那首先我们来说一下它,这个我们就不屏蔽了,然后这边我们点击这个战区管理,这时候我们开始讲它的一个后台的一个设置了。因为它搭建的比较简单,最重要的就是我们整个蜘蛛池的一个后台的一个设置,把它设置好之后才能去来更多的蜘蛛。
那首先就是我们需要去完善这几个,第一个就是我们要完善我们的一个战群管理,就是网站管理。好,我们到我们那个后台看一下,在网站管理,其实这个就相当于是一个分组,我们可以把它理解成就是为了更方便管理,我们可以去设置分组。比如说我要做百度植入池,我可以在这里面去写个百度植入池,可以设置百度蜘蛛词,我们来看一下。百度蜘蛛词那么配置的文件夹我们也可以设置百度。然后这边选择模型,我们可以选择下载站,这边下载站这个模型如果说默认的时候它这里面这个模型它是没有的,那么我们就需要去在这个模型里面去创建。就比如说我要做下载站,它这里面如果说没有这个下载站的模型,或者说我要做小说,它没有这个模型的话,我们需要去点击这个模型管理去添加这个模型,这个模型就相当于说我们添加这个模型之后,后面所有的模板都可以放到这个模型里面。比如说我们做的电影,我们就可以将这个模板的数量全部做的,只要是电影模板我们全部给它放到这里面,或者说小说站的模板我们全部也可以给它放到这里面。
那么如果说我是做下载站的,这里面它没有的话,我们就需要去在这里面去添加一个模型,当然我也可以在这里面去添加一个百度植入池啊。就如果说我也可以分成一个百度蜘蛛池,就是说我自己测试出来哪些模板收录比较好,那我就可以添加一个百度蜘蛛池,那么这边还需要去添加一个文件夹。
当我们添加好这个百度蜘蛛池的时候,文件夹是百度,这时候我们点击这个模板,我们来看一下。点击我们的模板管理,这时候你会发现多了一个百度植入池,但是我们要去到我们那个网站去,如果说上传模板的话,它是要手动的去创建的,我们来看一下。首先我们要去找到我们的一个网站。我们来找到我们的一个网站,我们来看一下,这个是我们的一个网站,首先我们要到这个template, template 就是模板存放的一个文件的一个录制,就路径。我们点击这个template,这时候我们发现这里面它并没有主动的去创建我们这个模型。首先就是在这里面模型,我们在这边创建的这个文件夹叫百度,那么这时候我们就需要在这里面去新建一个百度这个文件夹。我们给它保存,保存完之后这时候我们去,我们现在不上传模板,我们现在就将这里面的模板我们给它复制几个,复制几个,然后主要是我们的目的就是怎么去放置这个模板,那么如果说我们新建的模型的话,就要在这里面去新建一个文件夹,这时候我们给它粘贴进去。好,这时候我们到我们的一个后台,点击我们的一个模板管理,我们来看一下。
这时候你看我们这个百度蜘蛛池,这时候它有三套模板,那是因为我们刚刚将它这个模板给它复制过去了,这时候它是有三套的,那么其它的正常的做模板,做好模板也是一样的,就是上传的方法也是一样的,就是如果你单独创建的模型,那么你就要去重新在这个后台去添加模型对应的文件夹,那么这个文件夹,然后剩下的这个一个文件夹就是一个模板。
这个是我们讲的一个网站的管理,那么我们来看一下网站的管理,刚刚我们讲的一个网站的管理,这时候如果说我纯粹的就是把它养成一个蜘蛛池,那首先我可以给它分组测试,比如说我给它改成一个叫百度蜘蛛池,然后这边的文章所属的模型,我给它改成百度蜘蛛池。
改成百度的植入池之后,我们可以看到,这个就相当于说我们给它改成百度的蜘蛛池了。那么然后如果说我要做其他蜘蛛池,比如说我要做搜狗,或者说做谷歌,那么一样的道理,我可以在这里面去添加一个谷歌蜘蛛池。这边我们写个谷歌好好GOGRE,然后这边我们选择一个模型,比如说这个,我发现谷歌对这个企业站收入比较好,我可以专门做一批企业的模板,用来做企业做谷歌的支持,或者说,唉,我发现文章新闻来现在速度比较好,这时候我可以单独放一些文章新闻,我可以把这个域名给它放上去,这时候我们这里面只放根育苗。
站点模式这边我们要设置一下自动生成,然后这边我们可以选择泛域名,我们如果说我们要做泛域名蜘蛛池的话,我们这边可以选择泛域名。内容模式的话,我们选择句子拼凑,这边我们选择句子拼凑,然后 URL 设置,我们选择随机模式,这些都不用管好,我们点击提交保存。
这时候相当于说我们在这里面创建了有百度支持,有谷歌支持。如果说我们还需要去做一个搜狗支付池的话,我们可以在这个分组去重新添加。当然这个分组我们也可以去添加,比如说我们要做电影、做小说,那我可以在这里面去单独的去添加电影小说,然后或者说其他的那么分组它主要是起到一个这样的一个作用。
然后我们来说一下这是网站管理,那么接下来我们说刚刚已经说了这个模型的话,就是我们创建好模型之后,它这里面它其实是有个 URL 的。那么首先我们要去设置它的一个修改,点击随机模式的一个 URL 规则,那么这个模式就是要我们要看看我们这边 URO 的模式,这边如果是随机的话,我们这边修改的话就要修改随机模式的一个 URO 规则。
我们点击修改,那这边我们就以下载站为我们以下载站为例啊。首先我们去搜索这样的一个下载站,那么这个是个 PC 下载网,如果说我们要去做它的一个标题,或者说 URL 的规则的话,我们怎么去设置?首先我们先去设置它的一个 URL 规则,那么它的 URL 规则我们可以看到它随便打开一个内容,这个是它的内容,那么打开之后我们可以看一下它的一个 u r 规则,都是soft。然后好,我们如果说我们要设置它这样的一个 UR 规则,怎么设置好?我们来看一下。
那么首先我们需要在这里面改成soft,然后斜杠, soft 斜杠,然后这时候我们调用的是随机模式,我们必须让它包含一个ID,然后我们可以看到它是一个,这是URL,是数字,那么数字的话我们这边我们可以用让它用成一个数字,数字 1- 8,然后点h、t、m、l,这就相当于说,唉,我们这边给它改一下。
我们给它改一下,改一下之后我们需要去现在将之前的这个分组,我们去给它,或者我们用这个来改一下,我们用这个叫谷歌蜘蛛池,对应的是文章新闻。我们在模型管理找到对应的文章新闻,我们就改它吧。点击它,我们在这里面去修改一下。这个是 URL 的一个规则,你看我们之前写的一个 UR 规则,主要是针对于一个下载站,所以说我们下载站的 UR 规则是这样的。如果说我们是做下载站,那我们就可以,这个是我们之前设置好的,但这个设置好的话是根据自己的一个情况去设置,你看有的下载的它后面会带上这个点APP。
那么所以说我们可以在这里面去设置好,我们来找一下这个网站分组,我们还是找到这个百度支付池,还是找到这个模型管理,在模型管理我们找到这个修改,然后这边的一个UL,我们得去修改成soft,然后提交保存。这时候我们把这个域名我们给它换一下,我们给它换一下。我们来演示一下,给它换一下,这边只是作为测试,所以说我们把这个给它更换一下就行了。
然后这边是,我们可以看到这边是我们的主域名,然后我们选择的是百度模式,但是我们现在把这个模板我们给它调整一下,我们不用这个模板,我们用这个下载站里面的模板,但是这里面它是没有内容的啊。我们来说一下,首先这个是我们要调整一个URL,这边如果说你这个开启之后,我们发现它这个规则,它并没有按照我们设置的话,那我们这边就要去点击开启或者关闭。这边我们就选择一个这个蜘蛛池,我们选择一个电影的这样的目的的话,我们是演示它的 URL 的。
我们来看一下这边模型,我选择的是电影,那么我在模型管理的这边我就要去修改电影的。我们去修改电影,修改,然后这边这边是,它是这个是自带的。我们把这个去掉,我们改成soft,然后斜杠,然后我们用 ID 来代替。这边我们再加上一个数字, 1- 8 点 AGT 瞄,当然这只是一个 URO 的规则,这时候我们可能需要去找很多的一个 URO 规则去给它填写上去。我们来看一下,然后我们现在打开我们这个主域名,我们来看一下。这是打开了,然后我们也可以看到左,我们去用这个电脑打开,我们来看一下电脑,我们这个域名也是被抢了,就是国内网打不开,我们现在只能在服务器里面去操作。然后我们看一下这个页面, URL 页面, UL 它并不是我们设置的soft,它是,而是还是保留之前的,那这时候怎么办?我们就回归到我们这个网站管理,在网站管理我们找到修改,点击这个URL,我们点击把它开启,然后我们再来看它的一个首页。我们来看一下,这时候你看我们这个页面就变成 soft 了,然后我们弄好之后,我们可以将这个 116 规则我们继续给它关闭就行了。好,关闭,这样的话就实现了我们这个修改url。
那么接下来说一下就是 ADPS 站点的一个管理,那么如果说我们想要做蜘蛛池的话,想让我们这个收入会更好的话,我们需要做的就是绑定ADPS,如果说我的域名很多,但首先我们要去申请泛域名的一个ADPS,那么泛域名的 APS 的话,需要我们去找到对应的这个文件的一个路径,那么首先我们要去百度搜索一下,百度搜索我们搜索。我们可以通过百度来搜索宝塔域名证书的位置。
我们搜索宝塔,然后这边加上域名证书位置,这个时候我们如果说域名有很多的情况下,我们需要怎么弄呢?你看它这个就相当于是它是有这个域名证书的,我们需要去找到这个对应的这个,你看域名证书我们需要去找到 3W root,好,我们来看一下,这时候我们需要回到 3W root。这时候你看像这里面它每一个站它都是有,或者说我们去找到对应的。
当然这个是域名证书官方的,我们可以去设置我们的一个域名证书,然后他会给你发一个密钥跟那个什么。那么也就是说我们需要将密钥都给它全部设置好,当然这个我们后面再单独录一个视频,就是怎么去设置批量设置密钥,因为现在我们是没有这个范围名证书,所以说我现在没有办法给你去具体的设置。那么翻译名证书我们是需要去购买的,我们可以在淘宝上去购买。我们在淘宝上去购买。淘宝上我们去搜索域名证书。我们来看一下,我们在本地打开看一下啊。好,在这里面我们去搜索域名证书。这里面它其实这个或者说域名 SSL 这些词可能现在被屏蔽了。我们来看一下。我们搜直接去搜索 SSL 这边它会有专门有卖这个通配符,看到通配符 SL 就是我们说的泛域名证。那么这种话是可以去配置我们的一个泛域名的,那么他给你发了密钥和这个其他的时候,我们有这个密钥或者还有这个证书的时候,我们才能去设置好这个。是啊,这个密钥,这个证书。我们接下来继续看一下。那么这边弄好之后,我们需要在后台去设置一下,到我们的一个后台,我们来看一下,先到我们的一个后台。我们看一下到我们的一个后台。这里面我们就需要哪个域名,你做了 ADBS 证书你就可以放上去。如果说你做的是泛域名证书,那你就把这个星号点放上去就可以了。就星号加上你的域名就可以了。这是我们讲的一个啊,这个泛域名证书,那么接下来我们来说一下 t k d b 的一个调用。
TKDB 就是说我们来看一下,首先我们来看这边有一个,我们是看这个 PC 下载网,它的一个,这个它的一个我们来看,噢,标题是怎么写的?首先我们到这个后台,我们去找到TKDB,找到对应的分组,我们的分组名称比如说第一个是叫百度蜘蛛池,好,我们对应的分组我们在这里面去修改,那么修改首先我们可以把它先放在最下面。
我们来设置,首先你看这个是关键词,然后系统检测工具,然后系统检测软件。那么这时候我们可以把这个词给它换一下,换成关键词。换成关键词,然后这个也是关键词,我们给它换成关键词。但是这边我们需要去设置我们这个关键词。当然了如果说我不想设置,我可以设置title,它也是可以的。就这个 title 我们又给它设成 title 也是可以的,因为我们主要是做蜘蛛池的话,我们是可以不用去上传,我们上传那个啥的就上传我们的一个关键词,直接用采集出来就行了。
设置title,这时候我们就相当于说这边有个 PC 加载网,这个是可以设置我们的一个网站名称。设置我们那个网站名称。这时候这就相当于是一个首页的规则,但是这个是我们要去给它设置成这个内容页的规则,然后我们来看它的首页规则是什么样的,你看啊?这种,这是属于首页的话,我们需要去怎么去修改?看好我们就把它保存到这里面,然后这边可以写一个什么网站名称就行了。
我们可以给它写上去。写上去,然后这个属于这个标题,那么如果说我可以去找到 PC 下载网,还有很多的这种下载站,我可以一行一个让他后面无限的去调用,包括我们这个内业 URL 规则也是一样的。然后我们保存这时候就相当于说我们设置好了它的一个标题,就是 TKDB 的一个标题设置,那么还有描述关键词描述这些我们都要去设置,那么我们来看一下他们的一个规则,你像他们这个规则的话就是正常的话,唉,提供什么什么的什么的东西,或者说我们为了保证我们的一个就是里面这个东西都不一样的话,我们可以是这样的。
我们可以在这里面去设置,就前面我们加上一个我们那个调用的关键词。后面暂时要加上一段话,这个就是内容的第一段,我们后面会教完就是怎么完善这个内容库。这个是 t k、 d b 的一个设置。那么接下来就是站点优化的一个设置,站点优化的话就是相当于说我们来看一下后台,我们找到这里面有一个站点优化战略,优化战略互联,首先这里面我们要去选择加入的分组,比如说我们选择加入分组,就加入这个百度蜘蛛池,好,然后展示的网站分组也是这个百度主持。
然后这边你看如果说我设置的首页URL,那么保存好,我们来看一下,我们打开这边,我们来看一下这边如果说我设的是单域名的情况下,那么它调用的时候它只会调用一个好单域名。然后我们现在去到后台模板管理,我们来看一下。在模板管理我们找到电影,因为这里面我们绑定的是电影。这里面我们去选择一个模板,好比如说我们就选择这个模板,那么选择这个模板我们给它绑定一下。这时候我们选择保存,这时候相当于说我们这个绑定的是一个主域名,如果说我想要绑定泛域名的话,我可以在这里面去输入星号,在星号里面去绑定,那么相当于说他去绑定这个,我们现在再去打开这个模板,我们来看一下。
这边我们可以看到这个就是绑定了一套模板,但是相当于说打开之后它就是这个,然后我们现在就是给你看一下,如果说我们后台这边设置了一个,我们看一下这个,我们之前我们这边有一个讲的一个测试站给你看一下,因为这里面我们去,因为有些模板我们是没有做这个外链的,我们来看一下这个。
首先我们来看一下这个,行了,不看,我们不看这个了,我们还继续去用这个吧?就是说这边跟你说一下它是什么意思?在战略优化这里面内容互联,战略互联它就相当于说是每个网站进行一个轮链。那么这边如果说选择首页URL,它就是链接的是首页,如果说链接的是内页,它就会自动去链接我们那个内页URL,然后互链的毛文本,我们可以选择标题库就可以了,保存设置就可以了。
然后这边有一个内容优化设置,我们来看一下内容优化设置,这边我们要去找到我们的一个支柱池,这边我们要,主要是这边主要是把这个其他设置这就可以开启就行了。这边就按照这个设置就可以好好保存。然后我们现在去找到,我们来接下来看一下这个相当于说是我们把战群管理和站点优化这一库设置完了,那么接下来我们来要去设置它的一个内容库的完善。那么首先内容库我们就要去来看一下后台内容库,这里面我们要去看它主要就是分为文章库、标题库、网站名称库、栏目库、句子库,还有图片库,我们最重要的是完善我们的一个网站名称库,比如说我们做的是一个下载站。那么这时候你看我们这个网站名称,就是提前需要自己准备好,比如说像绿色下载,比克下载什么太平洋软件,这些都叫网站名称。那么这个可以自己去提前的去收集一些网站名称,然后找到对应的分组去上传就行了。
那么标题库就是我们要采集的一个标题,那首先我们来看一下下载这样的标题,它这里面其实是我们采集的,这个并不准,但是如果说我们想要去采集的话,我们可以通过后台去采集,后台有自带的采集规则。那么首先我们来用这个采集规则来去采集,这边我们可以看到我们是,其实我发给你们这里面是我们已经写了很多的这样的一个采集规则,那么有电影的,有下载站的,还有这个其他的。那么现在我们来说用这个采集规则它是怎么去写的?我们来添加一个规则,这边它只有文章、标题、图片、句子和整篇内容,我们来采集整篇内容吧。整篇内容这边我们还是以这个 PC 下载库为主。你像这种标题我们就完全可以通过这个火车头也可以采集,那么后台也是可以采集。现在我们来说怎么去采集它?这个比如像这个软件下载,或者说我们来找一下,我们来看一下就这个分类下面的这个怎么采集?首先我们需要去看它的一个列表页,我们来看它的规则,我们发现它的规则都是递增的,中间是一个,这个是一个变量。我们来看一下,我们把它复制下来到服务器里面,然后我们这边写个规则,比如说 PC 下载,然后杠内容。然后我们对应的分组,我们可以写到一个下载里面,我们看看这里面有没有。
我们可以体育下载站,我们可以要归属到下载站,然后这边我们选择分割成句子就行了。那么如果说你要 5 原创的话,这边要提前去配置好这个 AI 5 原创的一个那个密钥,然后这边我们把它放上去,然后这边是什么意思? p 代表的是开始,那么它一是从第一页开始, 5 是到第五页结束,那么一是属于递增值。可以看到 P1 是代表开始,那么中间这个数字代表是结束,然后递增。好,我们把这个复制下来。好,复制下来如果说我要采集它的实验,那么我就可以在这里面去写上它的实验,那么这是一个网站的栏目,我们可以把其他的网站栏目也许给它弄下,弄在下来就是其它网站栏目也许可以给它通过这种方式来给它复制下来。
那么然后我们来怎么弄呢?我们先来看一下怎么去采集这边我们需要去采集我们的一个网址,那首先我们打开一个网址,这个就是我们要采集的网址。然后我们给它放到这里面,这是我们的一个测试网址,然后我们给它放进去,首先我们来看一下它的一个规律,它的规律都是前面 soft 是不变,后面是一个数字。那我们在改的时候只需要让它填写一个d。我们只需要将它换成一个d,然后这边就是我们的一个内容截取规则了,那么内容截取规则的话,首先我们来看一下我们的内容是从这里开始的,或者说从这里,好,我们查看源代码。
这边我们可以看到它的共有四条,我们来看看它是从哪里开始的?他应该是从这里开始的,那么也就是说我们需要去在其他,在他的前面我们要去找一段唯一的代码,我们看这段代码是不是唯一的?它是唯一的,那么我们还需要去打开多个内容,我们来看一下这段代码是不是在其他内容也能出现?都能出现。
这时候它就是唯一的,那么我们可以在这里面写上div,那么中间这个东西我们可以用这个点星号来代替,然后我们再继续往下看它的结束是从哪里结束的?它的结束就是从这里结束。我们来找一下它的结束,这是它的结束,我们就要在后面去找一段代码,这段代码并且是唯一的,我们来看这段代码是不是唯一的?这段代码是唯一的,然后我们需要在这里面也需要去查询一下,就是说我们打开的两个内容都要去查询是不是都有同样的代码号,这时候他就有了。
我们可以放到这里面,然后我们可以保存规则,然后我们现在来测试看它是否能够采集到我们的一个内容。那这时候你看我们的一个句子就已经获取到了,并且也获取到了一个图片地址啊。这时候我们就相当于是规则就已经写好了,当然我们也可以用这个火车头去写,你好,我们这个内容库的完善可以用火车头去写这个标题,还有这个句子库。
那首先我们来看怎么弄?如果说我要,我们要去写这个,我们可以在这里面新建一个分组,比如说这个分组我们就叫下载站好,我们保存好右键新建任务,这时候我们可以选择,我们来看一下,我们可以在这里面选择一个列表,它火车通有个好处,它是可以无限的往下挖掘的。
首先我们在这个,这是一个列表页,我们只要去点击它的首页就行了。点击他的首页,因为火车头我们可以设置无限的往下挖掘。就放一个就可以了,我们添加向导,普通王者。添加一个之后,我们现在这边我们来看它的一个所有的页面都是包含点 e t mail 的。我们可以在这里面就让它包含点 h t、 m l。然后我们现在分页,我们看它的分页,我们点击查看,然后它的分页就是第二页、第三页,我们来看一下它的分页。这个是它的一个分页,我们从它的这里面找一段唯一的代码,我们看这段代码是不是唯一的?它是唯一的。这时候我们把这个点击高级模式,点击分页设置好,我们给它从这里开始,然后它结束是从这个876,那么我们就要在这里面去找一段唯一代码。我们来看一下它这里面有没有唯一代码?
这是 77 页,我们来看它的第二页的时候也是77,也好,那这时候我们就可以看一下,通过这里面我们就只需要看看这个是不是唯一代码。它是唯一的,这时候我们可以放到这里面来测试一下。我们来测试看它是否能无限的去采集页面。这时候我们可以发现它是无限的,可以去采集我们这个页面的。然后我们现在就是相当于说第一步就已经完成了,就是我们这个列表也完成了,接下来我们来采集它的标题。
我们来写它的标题,这个是我们的一个页面,我们要去采集它的标题,就是采集列表页的标题,就是我就是这里面的文章标题,我们打开之后这个标题好,我们给它复制下来。这个是我们的一个标题,我们来查看源代码。我们可以看到复制出来之后,它其实是有非常多的,然后我们可以看到哪一个是它的真正的一个标题?我们来看这个是它的一个标题,但是这样弄的话,我们的标题就特别的长,就不能提取出来我们的关键词。所以说我们可以手动的去采集一些,我们可以采,可以这样,我们可以只要它的一个title。我们来看一下它是到哪里,我们看看这个是它单独的,我们可以看能不能采集它这个标题。这个是他单独的,也就是说我们可以从这里开始。好标题,从这里开始,然后到这里结束。这时候我们放一个测试地址。然后我们点击测试啊。这时候你看我们这个标题就已经完全采集出来了,但是标题采集出来了,我们现在还要去看一下它是不是能够采集所有的页面的一个标题。
我们来看一下,我们再继续 Ctrl f 查找,然后我们继续看一下它的一个规则,标题的规则,在这里面我们是不是都能查找到?都能查得到,那说明这个就是,对了。那么接下来我们来采集它的一个内容的话,其实和我们刚刚写的一个后台那个规则是一样的,我们可以在这里面用这个复制过去啊。这个就是我们的一个内容,我们可以用它来写这个内容,我们可以用正则,然后中间这个东西,中间这个东西我们可以用参数,我们可以用参数来代替。然后这边我们组合结果要参数,我们来测试一下。
这时候我们这个内容都已经出来了,但是内容出来了,我们发现这里面的内容很多有空格,然后我们需要去点击内容,我们需要去找到 AGT 标,这个标签过滤,我们可以把这个所有的标签都给它去掉。我们把这些所有标签给它去掉。段落,我们留着段落是换行的,当然这里面还有个换行, 5 个留着。这时候我们再来测试,这时候我们发现这时候的内容它就比较哎好看一点了,但是这里面它有长有短,但是我们用火车都采集完之后,我们需要去将它这里面的一个内容后期要再进行筛选。所以说我们能用后台去采集,就后台写这个采集规则就可以了,那么也比较方便,它是后面会自动挂机去采集。
这个就是我们讲完了一个内容库的一个完善,那么接下来就是一个关键词的一个设置。但正常的话,如果说我们想要调用关键词的情况下,那么就需要在这里面找到,这里面有个外链关键词,找到关键词管理,找到对应的分组,我们需要将关键词上传到这里面就可以了。那并且我们需要去关键词插入的话,我们需要去选择分组,选择我们要插入的一个分组,比如说我们选择这个分组,并且我们需要将这个内衣首页文章页全部要开启,然后就可以了,然后这边插入的概率,如果说你想要完全插入的话,这边可以写成100,相当于说我们可以在这个战群 TKDB 里面,然后相当于说去调用我们的关键词,这时候我们这里面就可以给它换成关键词,就可以给它换成这样的一个关键词。就可以了。
就换成这样的一个关键词就可以了,就把原先的标题换成关键词,关键词的目的就是说我不想通过后台自动去采集,但是我这边有一批这种下载这样的这种游戏,或者说这种关键词,我可以去专门让他去调用关键词,也是可以的。你看像我们这边呢,就是调用关键词的。
因为我们去采集标题的话,采集很慢,但是我们可以去采集内容是可以的,你看我们在这里面去调用这个 TKB 的时候,我们来看一下,我们这里面调用的就是直接调用的关键词,我们将关键词直接上传到这个外链关键词,关键词管理好就是在这个这里面好,这里面就是我们对应的关键词,那么也就是说提前我们将关键词下载好,这样的话比较省事,我们不用去采集了。
好采集管理这个其实我们都讲过了,就是也是属于后台的一个采集,那么模板的设置就刚刚我们也说过,模板如果说不绑定的情况下,就是我们在这里面选择不绑定的话,那么它就会随机去调用,就是我们所有的模板都会随机调用,就是泛应用模板都会随机调用,那么如果绑定的情况下,相当于说它是就好比我们刚刚绑定了一个电影站啊。
我们来看一下香香,我们在这里面绑定的是一个电影,那么如果说我们绑定的情况下,它这里面相当于说它是一个绑定的,不绑定的情况下它是什么?它相对说我在这里面随便去输入,随便输入,它都是不一样的模板。我们来看一下,你看随便输入它都是不一样的模板,这就是不绑定。
所以说模板这一库我们之前也讲过,就是你创建好模型就要去添加对应的模板,然后这个就相当于说,我们是相当于说在这里面随便输入它,就是每一个都是不同的,并且这个电影的名称我们一定要去写好,你看我们这个叫联务电影网,但是后面叫官方软件下载,这其实就是我们设置的一个TKDB。到这里就是我们的一个蜘蛛池的一个搭建,还有后台的一个完善,基本上就到完。
来源:百收网
详解:百度蜘蛛,搜索引擎的工作原理!#SEO