以我之力、赋彼之能

当前位置:网站首页>网络推广
一个纯采集站长的SEO、采集、运维总结
发布时间:2016-12-22

  我是一个纯采集站长,下面的这些总结,有些是关于关于SEO,有些是关于采集和运维,都是很根基的小我赐教,仅作分享,请自辨黑白长短,实践出真知。

  

 

  原创好照旧采集好?

  当然是原创好,因为百度是这么说的,谁叫人家是裁判。

  为什么我原创了许多文章,照旧不收录?收录了没排名?

  一个搜刮引擎,它的焦点价值是要为用户供给他/她最需要的成绩。搜刮引擎是有统计网民需求的,对于网民需求量小或者几乎没有需求的内容,即使你是原创也可能被搜刮引擎忽略,因为它不想挥霍资源在无意义的内容上。

  对网民需求量大的内容,收录应该会比力多、比力快,可是,正因为收录多,即使你是原创,也可能很难挤进排名。

  搜刮引擎统计网民需求以什么来标识?

  环节词。每一小我搜刮一个环节词时,就表明他/她对这个词相关的内容有需求。并且,利用搜刮引擎的人,每每是有问答需求、检索查询需求。当然搜刮引擎内部必定有非常重大的阐明系统,对这些需求进行切确的定位,详见百度指数。好比搜刮的环节词是“手机”,很有可能是想要买手机或者查某款的价钱,也可能只是想要下载大度的壁纸。可是,假如是想要壁纸,就会有更切确的环节词“手机壁纸”,以下拉框或者相关搜刮的形式呈现出来。

  既然原创好,为什么要采集?

  1. 固然原创好,但只要方式恰当,采集的成效并不会比原创差几多几何几许若干,甚至比没把握到方式的那些原创好许多。

  2. 精神有限,原创很难包管恒久大量更新,假如请个编纂,投入产出比可能是负数。

  市情上采集器那么多,应该用哪个好?

  每个采集器都有它的怪异之处,所谓存期近合理。请按照本身的需求来选择即可。我的采集器是本身开发的,开发的过程中考虑了以下几方面,利用其他采集器的也可作参考:

  1. 直接供给已分类的海量环节词,这些环节词都是百度已经统计的有网民需求的词(有百度指数),或者是这些词的长尾词,来自百度下拉框或相关搜刮。

  2. 直接按环节词藻集,智能阐明网页正文进行抓取,不需要本身写采集规矩。

  3. 抓取到的正文颠末规范的标签清理,段落所有以

  标签呈现,乱码一律去除。

  4. 按照采集到的内容主动配图,图片必然是与该内容相关度非常高的。以这种格局取代伪原创,既不影响可读性,又使文章图文并茂,做到比原创所供给的信息更富厚。

  5. 正文内容中的环节词主动加粗,也可自界说要插入的环节词。但没有做句子重排、段落重排等影响可读性的所谓“伪原创”功能。

  6. 可直接利用环节词和其相关词组合作为题目,也可抓取方针网页题目。

  7. 可进行微信文章采集。

  8. 不消触发或者挂机。

  9. 集成百度站长平台自动推送,加速收录。

  分歧的网站法式,好比织梦、WordPress、dz、zblog、帝国cms或者其他,对SEO有什么影响?

  理论上没有影响。因为搜刮引擎并不知道你是什么法式,或者它或许过程一些规矩识别出来,也不行能因为法式自己的分歧而影响它的判断。

  那什么会影响SEO呢?谜底是模板。因为根基上这些法式都有模板机制,同样法式或许输出分歧的页面,分歧的法式也或许输出同样的页面,这就是模板。模板确定之后,你的每一个页面就按照这个框架来输出,也就是整个html布局已经确定。而这些html,恰是搜刮引擎要重点存眷的,它得从这些html中获得它想要的信息。是以,一套好的模板非常主要。

  模板设计应该留意哪些细节?

  1. 权重布局按次。整个页面的html中(留意是html,而不是显示出来的版面),越靠前的位置,权重越高。由此引申出来,“title”、keyword、description三个标签,因为最靠前,权重最高。其次每每是导航,也是根基上是最靠上的,权重也非常高。再次就是文章题目和正文。这是按照html的前后来排序的。

  2. 因为搜刮引擎起首要遵循W3C尺度,所以,W3C界说的一些原本就是用来默示主要信息的标签,权重天然就高,好比,格外是h1,用来默示当前页面最主要的信息,普通每个页面只能有一个,其权重估量与title相当,也每每是用来放当前页面的题目,当然也有为了提高首页权重,用h1来放置logo或首页链接,都是或许的。别的还有em、strong如许的标签,用来默示强调,普通认为strong权重高于标签,同样也是加粗感化,但我们认为从SEO的角度看是没有权重增强的。

  3. css或者js代码对搜刮引擎来说每每是无意义的,尽量利用零丁的文件来存放,或者在答应的状况下放到html尾部去

  网站布局规划应该留意哪些问题?

  1. URL设计。URL也是或许包含环节词的,好比你的网站是关于电脑的,你的URL中或许包含“PC”,因为它在搜刮引擎眼里每每是“电脑”的同义词。URL不要太长,条理尽量不要高出4层,这个就点到为止。

  2. 栏目设计。栏目每每是与导航相关系的,设计时应该考虑网站整体的主题,用户可能会对哪些内容感爱好,栏目名称最好是网站的几个主环节词,如许也利便哄骗导航的权重。

  3. 环节词结构。理论上每一个内容页都应该有它的焦点环节词,统一个栏目今的文章,尽可能环绕栏目环节词睁开。一个简洁卤莽的门径就是直接用栏目环节词的长尾词。

  动态、伪静态、静态,这三者哪个好?

  这个不及一概而论,保举利用伪静态或静态。这三者的区别,是是否生成静态文件,以及URL花式是否动态。生成静态文件,素质上是为了加速会见速度,削减数据库查询,但会不息增加占用空间;伪静态只是过程URL重写点窜URL,现实上照旧每次都要颠末法式运算、查询数据库再输出页面,对加速会见速度完全无效。动态与伪静态的不同只在于URL,带问号加参数。

  所以存眷两个点就好:网站打开速度是否够快?你是否需要节约办事器空间?

  分歧的网站法式,数据库操作的效率可能分歧。普通来讲,内容页数目在1万以内的,页面打开速度都是比力快的,数据量更大一些,达到5万、十万甚至更多,每每就要考虑静态化了。

  有哪些途径改善会见速度?

  1. 上面已经说到的静态化。

  2. 每每许多网站模板中都有随机挪用文章或者近似的版块,事实上对数据库来说,随机是一项比力重的承当,在模板中应该尽量削减随机文章的挪用。假如不行避免,或许考虑从数据库上优化,对有索引的字段排序每每比没有索引要快许多。

  3. 将图片、js、css等不经常点窜的文件,放到专用的静态办事器上,多个js、或者多个css能归并的尽量归并到一个文件,削减http毗连次数。

  4. 利用各类云加快产物。对通俗网站来说,免费的百度云加快或者360的云加快都还或许。

  文章比力多,网站已经开启静态,可是每次全站更新都要花很长时候怎么办?

  我的做法是利用缓存机制,这里只供给一个思路,可能需要本身二次开发。

  网站设定为伪静态,每一个恳求达到时,法式查抄是否存在对应的缓存html文件,假如该文件的生成时候是几多几何几许若干小时或几天以前,我们鉴定它需要更新,这时辰执行正常流程,法式查询数据库,生成html后,写入到缓存文件,再输出到客户端。

  当下一次会见达到时,好比1分钟今后又来一个会见不异页面,再次查抄缓存文件时候。从时候上或许判断文件非常新,完全不消更新,则直接读取文件内容输出到客户端。如许每个页面都或许实现主动生成,也只有第一个访客会感触感染到速度慢,后背的访客会见时都相当于是静态会见,速度长短常快的。

  假如是自力办事器,还或许考虑主动检测办事器负载,假如负载原本就高,那就算判断出来需要更新,也临时不更新,改为直接输出。

  图片是引用长途网址好照旧放在本身办事器好?

  这个也是各有好坏。引用长途网址,或许节约本身的带宽,但很可能会因为对方办事器迟缓、或删除资源、或防盗链,图片无法显示。假如下载到本身办事器,当然一切都本身掌控,可是图片会非常占用空间,总体上可能比生成静态所占的空间更大,并且假如会见量大,图片是最吃带宽的。

  网站内链应该如何优化?

  内链是百度官方保举的优化手段之一,所以这是必然要做的。每每阐发的形式是正文中泛起某个环节词,给这个环节词加上一个链接,指向另一个正好是这个环节词相关内容的页面。是以就降生了一些所谓的优化手法,强行在正文中插入一些环节词和链接,以此进行近似互推的操作。还有的为了提高首页权重,各处都放上彀站名称,并做上首页链接,觉得如许或许提高方针页面的权重。可是这些很可能都是拔苗助长,因为搜刮引擎会统计每个链接的点击率。假如放在精通位置点击却很少的链接,有可能会判断为作弊。所以,请只在正文中原本就有的环节词上做内链,就或许了。

  段落重排、句子重排、同义词替代这些伪原创手法究竟好欠好?

  欠好。因为搜刮引擎已经智能,已经不是简洁的数据库检索,它会天然语义阐明(详情请搜刮“NLP”),凡是语义解析比力艰巨的句子或者段落,它是或许判断为可读性差的,所以我认为这些“伪原创”可能是自作伶俐。

  辩论模块根基上没有人用,该要照旧不要?

  要。辩论模块最头疼是工作是垃圾辩论,每每真正讲话的访客很少,垃圾辩论一大堆,成天和营销软件斗智斗勇。这里供给一个我已经实现的方案,对收录可能有必然接济(没有依据的,只是猜测):

  保留辩论框、但禁止辩论。所有辩论由本身的网站法式生成。前面提到搜刮引擎会天然语义阐明,此中有一项主要的能力,就是感情判断。搜刮引擎管帐算每条辩论的感情值,是positive(积极)照旧negative(消极),具体倾向是10%照旧90%。假如辩论内容表达的是积极感情,则或许给你的正文加分,反之则减分。至于如何主动生成积极的辩论,就八仙过海各显神通吧。

  这是在收集社交成长起来后的必然趋势,用这种格局来反映一个页面的用户体验度。同理还有分享、点赞等,道理近似。

  绿萝卜算法之后,外链究竟还有没有效?

  有效。拜见搜刮引擎三定律之相关性定律。既然是定律,就不会改变。谁的内容被引用得多,谁就是巨子。在自动推送泛起之前,外链应该算是蜘蛛熟悉一个页面内容的第一渠道。

  外链必然要锚文本或者裸链吗?

  不是。搜刮引擎肩负重任,要勉力发现真正有价值的器械,破除那些没价值的器械。所以有可能你直接提交的链接充公录,在别人处所随便发个纯文本网址,被它发现了,还争论了加分。

  除了锚文本和裸链,还或许用环节词+网址的形式发纯文本。如许在网址前面的阿谁环节词是会主动与该网址关系的。

  还有,有些链接固然加了nofollow属性,可是在百度争论外链的时辰,照旧管帐算的。

  收录和索引究竟什么关系?

  收录默示蜘蛛来抓取过、阐明过。索引默示蜘蛛阐明之后,认为内容有必然价值。只有进入索引的内容才有可能泛起在搜刮成绩中,揭示给用户。也就是说只有索引的内容才有机会带来流量。

  滥觞:卢松松博客,接待分享,微信公家号:izhanzhang




本文来源:重庆网站优化|重庆网络推广整理编辑(部分内容来源于网络,如有侵犯您的权益,请联系我们删除)

本文网址:https://www.1234114.cn/wzbk/tgzs/4356.html

详细咨询:请拨打电话13629754288!



IT服务年限

我们团队的IT服务始于2007年!

累计服务企业

我们服务于各类企业,为企业提供全面信息化建设

客户好评百分比

客户的口碑是我们立足的根本,满意度95%

我们的伙伴

Our partner