当前位置:网站首页 > 新闻资讯 >搜浪观点 > 认识蜘蛛的工作
认识蜘蛛的工作
日期:2012-07-20     浏览:1126     作者:搜浪君
关键词:整合营销推广

我们都知道蜘蛛对于我们的优化来说就是一个传递者,一个表达我们网站基础内容,给我们进行评分的裁判,那么一个裁判是根据什么来决定我们的分数的呢,那要从蜘蛛的工作开始说起,我们也许不知道蜘蛛的算法,但是假如我们仍拒绝去了解蜘蛛的话,对我们的整合营销推广来说,在开始就已经输了。


首先是二进制文件处理,网络中除了HTML文件和XML文件外,也有大量的二进制文件,搜索引擎对二进制文件采用单独处理的方式,其对内容的理解完全需要依靠二进制文件的锚点描述来完成。锚点描述通常代表了文件的标题或是基本内容,也就是通常所说的锚文字这就是为什么我们要对网站锚文字的分析选择的原因所在。


其次是脚本文件的处理,网页中的客户端脚本,当网页加载*读取到该脚本,搜索引擎往往会直接省略对它的处理。但是由于现在网站设计者对于无刷新页面要求的提高和对ajax技术的大量使用,对它的分析处理往往会采用另外一种网页检索程序,由于脚本程序复杂和多样性,通常站长会根据自身网站将这些脚本存放到一个文档中,采用调用技术,从而加快页面加载速度,同时蜘蛛也不能对调用文件分析处理。这也属于搜索引擎优化技术,如果忽略了对它的处理将会是一项巨大的损失。


对于文件类型处理,对于网页内容的提取分析一直是网络蜘蛛的重要技术环节,这也是SEO需要去了解的搜索引擎技术,这取决于网站信息更新的多样性。这也就是为什么专业网站上会在网站内附有下载的execl,pdf等各种文件类型,这也是属于搜索引擎优化过程中需要注意的。网上不同文件类型文件的处理,网络蜘蛛通常是采用插件的方式来处理。如果有能力,网站信息内容的更新尽可能采取多样性,来帮助网站达到一个搜索信息多样化的SEO体系。


前面说到了一些简单的工作原理,但是我们要怎样来调整策略呢?


首先是搜索策略


我们能够知道的策略首先是深度优先的搜索策略和广度优先的搜索策略两种。


广度优先的搜索策略一般被认为是盲目的搜索。它是一种以搜索更多的网页为优先的一种贪婪的搜索策略。只要有东西检索,它就抓取。它会先读取一个文档,保存下文档上的所有链接,然后读取所有这些链接文档,并依次进行下去。


深度优先的搜索策略网络蜘蛛程序分析一个文档,并取出它的*个链接所指的文档继续分析,然后如此继续下去。这样的搜索策略达到了网站结构的分析,以及页面链接深度分析,从而传达网站信息。


这些都是很简单的一些概念,作为一个接触优化的人,是必须要依靠这些来进阶的。更新策略以网页变化的周期为依据,只对那些经常变化的网页做更新操作也是一些小型的搜索引擎常采用的方法。这也就是为什么站长会每个几周对网站页面内容的一个小更新,这是基于搜索引擎优化的技术。网络爬虫也经常采用个体更新的策略。它是以个别网页的变化频率来决定对网页的更新频率,这样一来基本上每个网页都会有一个独立的更新频率。相比较于蜘蛛的工作,我们的工作是没有真正具体的指导的,作为整合营销推广,借助于蜘蛛但是如果我们连蜘蛛做什么都不知道那还谈什么推广,所以这里提到以上的几个蜘蛛工作原理希望各位站长多多注意。


本站原创,转载需要注明出处:


广州网站推广:http://www.soola.


返回列表
联系方式
公司固话: 020-85557485/85675730
销售电话:13922395952(黄经理)
销售电话:13533390539(郭经理)
售中客服:337604623(QQ)郭小姐
售后客服:2101996011(QQ)郑小姐
微信公众号
SEO优化名词解析
网站首页 业务热线 提交需求 官方微信