网站日志是做SEO时网站管理员和搜索引擎对话沟通的途径。通过日志,了解搜索引擎蜘蛛的访问情况。在很多时间,我们需要查看网站日志。以获得了解搜索引擎如何爬取咱们的网站。


如何下载日志

通过FTP访问网站的根目录。可以看到一个包含log的文件夹,这是存放日志的地方。

微信图片_20181108173907.png


如何查看日志

下载、解压、打开日志文件,日志文件内容如:

61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)" (注:百度,这部分为本文添加)


203.208.60.43 - - [11/Jan/2009:04:02:43 +0800] "GET /sns/space-13563-do-friend-view-me.html HTTP/1.1" 200 5162 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" (注:Google)


202.160.178.21 - - [11/Jan/2009:04:02:44 +0800] "GET /sns/space.php?uid=323 HTTP/1.0" 200 7535 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)" (注:雅虎)


65.55.220.217 - - [11/Jan/2009:04:02:57 +0800] "GET /ucenter/avatar.php?uid=12373&size=small&type=virtual HTTP/1.1" 301 - "-" "msnbot-media/1.1 (+http://search.msn.com/msnbot.htm)" (注:MSN)


日志文件样板全文下载:

http://edu.seowhy.com/ziliao/wwwlog20090112.log


如何分析日志

蜘蛛名称:百度->baiduspider、Google ->Googlebot、Msn ->msnbot、yahoo ->Slurp、yodao ->YoudaoBot、sogou ->Sogou+get+spider。在日志文件里,搜索以上蜘蛛名称。就可以看到蜘蛛抓取的痕迹。


我们分析的主要点是,HTTP状态码,如以上的200和301。

" 200 5162 " 代表正常抓取,这次抓取了5162个字节。

不同的服务器或虚拟主机设置的日志记录内容不同。

有的如:200 0 33834 237 953 我们通过多看几条记录,观察规律,可以判断第三个数字代表字节数。

有的如:200 0 0或200 0 64 这是没有记录抓取字节数。注意:200 0 0和200 0 64 没代表什么问题。所谓200 0 64代表要被K的言论没有根据,一般的网站都有64代码。

在日志里,发现比较多的HTTP状态码是,200(正常)、304(没变化)、404(错误链接)。

304代表,自从上次抓取后,该内容没有更新。一般情况下,网站的图片经常会返回该值。

404代表,访问的这个链接是错误链接。这个错误链接,一方面来自原本存在后来删除了网页,另一方面可能来自本来就不存在,但其他人外链了这么个死链接

阅读本文的人还阅读了:

首选域是什么意思

外链资源是什么

夫唯讲群站SEO系列1:群站是什么?企业做群站效果为什么这么好?

学习了一级目录是什么?一级目录有什么好处?之后,开始学习怎么给网站建立一级目录,学会这些,做一个简单的网站是没有问题的。


怎么给网站建立一级目录

在FTP后台,鼠标点击右键—>新建文件夹。然后鼠标右键点击这个文件夹,重新命名,输入bbs,或blog即可。

然后,我需要上传一个“一级目录的首页”到bbs或9dian文件夹里。

首页一般命名为index.html、或index.php、index.asp等等。

上传了这样的文件后,就可以通过一级目录链接正常访问了。

 

怎么建立一个一级目录的博客或者论坛

把这个博客的所有程序上传到blog文件内,按安装说明执行后,就可以如seowhy.com/blog一样访问了。

没有很好理解以上说法的同学,也可以这样理解:把程序的内容放在一个叫blog的文件夹里,然后,把blog整个文件夹上传到网站根目录。

以上是同一个事情的两个说法。

 

一级目录要点

1、目录不宜过深,2-3级目录为佳。

2、各个目录中的内容应该严格分开。

3、如果把一个完整的网站系统放在一级目录里,比如bbs,blog,sns,那么在长时间或稳定后,搜索引擎会把这个目录也看作一个完整的网站。

4、同样的网站,比如bbs,放一级目录与放根目录,在Google那里,没有优势上的太大差别。但百度往往给二级目录的权重比较低。

5、适当的一级目录,可以为主域名提供庞大的内容,从而增加主域名权重。

6、只是一般加粗的标题就用二级标题,是概括全文的就用二级标题。不算最后的"/"。链接中一个"/",就是一级目录,两个就是二级目录。

7、在一级目录的博客上发了文章后,如果能很好的调用到网站首页,则可以给网站首页更新带来好处,这些也都是学SEO最常见的问题

阅读本文的人还阅读了:

文章页面优化的三个技巧

网站从业者必看的SEO五条金律

怎么优化关键词?

网站日志相关问题合集

想要做SEO的SEOer,了解并运用锚文本外链是一件很重要的事情,锚文本外链作用很多,主要在以下4点:


1、 提高排名

合理的站内锚文本外链指向会使引擎更加准确的认识文章的内容所要描述信息,从而使长尾关键词排名提升,网站权重增加。外部链接的锚文本也会给网站很高的关键权重。


2、 有助于搜索引擎

锚文本外链具有强大的引导作用,合理的分布站内锚文本,会使搜索引擎蜘蛛更快速的爬行网站目录。


3、 用来分析对手优化策略

说得简单一点,就是页面与页面的链接,以及链接的文本说明。SEOer在进行竞争对手分析的时候,可以通过锚文本链接导向以及锚文本的文本说明研究出到竞争对手的优化侧重点,以此给出相应的应对策略。


4、 增加用户体验

当用户浏览某一个页面的时候,可能文章的内容对用户而言不是非常的有用,这个时候锚文本就起到了一种引导性的作用,通过锚文本,用户往往会更快更准确的找到自己需要的资料。


锚文本外链在我们的理论体系里起到基础性作用,可以认为,现在搜索引擎排名的核心是围绕锚文本展开。锚文本结构做的好,会提升企业网站的排名、权重,如果只是为了做优化,而过度优化锚文本外链,这将会带来相反的作用。

阅读本文的人还阅读了:

锚文本链接是什么?

如何做好锚文本链接优化?

当我们研究透彻网站日志在哪里?如何下载日志?以后,SEOer们肯定还会有些疑问和问题,所以我总结了网站日志相关问题合集送给大家。


1、网站刚上线,怎么看搜索引擎蜘蛛的抓取情况?

如果网站提交给搜索引擎2天后,发现日志里蜘蛛不少,并都返回200,则说明已经可以正常收录。

Google展示的时间比较快,而百度则需要20天左右展示出来。


2、日志分析工具可以用哪些?

可以在百度搜索下光年日志分析工具或金花日志分析工具。


3、日志文件几十M,太大了,用什么打开比较合适?

可以采用 editplus 这个工具。下载地址: http://edu.seowhy.com/thread-23-1-1.html


4、我的网站怎么没有日志文件?

这个需要主机服务商开通。请联系空间商的技术。


5、解决网站被封问题时,怎么观察日志情况?

网站被封时,往往日志里有百度蜘蛛,但很少,而且往往只访问robots.txt文件和首页。

如果一直这样的情况维持1个月,可以考虑放弃该域名

如果蜘蛛明显增加,而且返回200居多,则收录的希望很大,时间问题。


6、好像日志里收录了,但不一定展示出来?

是的。我们可以看到百度蜘蛛和google机器人访问很频繁,但不一定他们都展示出来。

这个目前没有解决办法。但只要它们频繁访问和正常抓取,一切就会很正常。


7、网站收录异常,怎么对比日志中蜘蛛的行为情况?

收录正常增加时和现在异常时的日志,进行对比分析。如果没有异常,则应该是搜索引擎展示数据库出问题所致。

如果蜘蛛爬取量明显减少,观察外链是否突然减少很多。

如果日志依然,则认为是搜索引擎的展示问题。


8、我的日志里怎么都没有蜘蛛?

很大的可能是,主机没有记录蜘蛛的功能。请看下同主机下其他站点的收录情况是否正常。

如果是win的主机,请看下这里:http://edu.seowhy.com/thread-7171-1-1.html


9、发现日志里蜘蛛情况和之前都一样,但最近收录或排名发生变化,是怎么回事?

这应该属于搜索引擎数据库变更,可以说没有具体对网站进行如何改进来挽救的明显有效措施。


10、提供的样板日志文件里的 http://bsalsa.com/ 是什么?

这是一个浏览器插件开发商,日志里有这个代表,采用该插件的用户访问过你的网站。

阅读本文的人还阅读了:

文章页面优化的三个技巧

网站从业者必看的SEO五条金律

怎么优化关键词?

网站日志相关问题合集

绝对地址指的是包含域名的完整网址。有些网站程序或空间不方便设置301,为了实现首选域,可以给网站部分链接主导航或重要链接采用设置绝对地址的方式,同样也可以起到确定首选域的作用。

如何给网站部分链接设置绝对地址?

在网站首页点击右键查看源代码,或者打开网站程序首页的源代码:
查找指向网站首页的链接,一般情况下是如下两种情况:
<a  href="/">首页</a>
<a  href="http://lab.labds.top/">首页</a>   (以SEOWHY为例)

前者是相对地址,后者是绝对地址。当我们要把首页链接的相对地址修改为绝对地址时,

操作方法是:把<a  href="/">修改为<a  href="http://lab.labds.top/">。


同样,其他的链接修改:
把<a  href="/bbs/">修改为<a  href="http://lab.labds.top/bbs/">;
把<a  href="/1_13.html">修改为<a  href="http://www.seo.cn/1_13.html">。

很多时候,源代码里看不到类似这样的href="/1_13.html" 的代码,而是一个用来调出这个代码的函数。你可以:
1、直接在那个函数前面加 http://www.seo.cn
2、或者删除函数,直接把绝对地址写上。(这样的后果是,内容变化时需要手工修改。)

举例说明:
原来是:<li><a href="{formaturl type="article" siteurl=$siteurl name="contact"}">联系我们</a></li>;
你可以通过2个方式试试:

1、<li><a href="{formaturl type="article" siteurl=http://www.17qiti.com/xxx.html name="contact"}">联系我们</a></li>;  其中,xxx.html 是现在“联系我们”页面的URL地址。
2、<li><a href="{formaturl type="article" siteurl=http://www.17qiti.com/$siteurl name="contact"}">联系我们</a></li>;
提示:操作之前注意备份,预防有误。

如果没有办法把所有链接都采用绝对地址,给网站部分链接主要的导航、栏目、页眉和页脚采用绝对地址,其他可以灵活处理。

相关疑问:
1、采用绝对地址有什么好处呢?和SEO有什么关系? 
①如果网站设置绝对地址,当不同的域名同时解析一个网站时,那么多的域名会访问到一样的内容上,让搜索引擎分辨不出到底哪一个是主域名。
②如果网站没有设置绝对地址,可能导致竞争对手恶意镜像你的网站,搜索引擎误收录虚拟主机提供的二、三级域名则不收录主域名。

③首页采用绝对地址可以解决首选域的问题。

2、需要把相对地址修改为绝对地址吗?
建议新运营的网站,尽量这么操作,可以避免未来发生的各种问题。如果遇到修改比较麻烦,不一定要所有的都采用绝对地址,首页部分链接采用绝对地址也可以。例如:采用论坛程序的网站,只需要右下角的页脚采用绝对地址。

3、简单概述相对地址和绝对地址的概念。

比如说:你现在在哪一个城市?你肯定会回答:深圳。如果换成一位俄罗斯人问你,你应该回答:中国深圳。

前面是相对地址,因为我和你都在中国,就省略了。
后面是绝对地址,说“中国深圳”,所有的地球人都知道你在哪里。
网站上采用绝对地址,就是为了明确告诉搜索引擎,网站的主域名是哪一个。

4、操作开源程序会遇到不知修改哪一个页面?
采用开源程序例如:discuz、shopex,程序相对比较复杂,可以先采用301解决,能实现301那么程序上尽量不修改;如果不能实现301,那么在网站的主导航和页脚链接采用绝对地址处理,板块、分类、内页链接可以不用修改。

阅读本文的人还阅读:

有关SEO的基本知识总结(一)

SEO模板如何选择

做网站该注意哪些基本要素?

SEO的目的有哪些?