SEO十三问,你能回答多少?

SEO十三问,你能回答多少?

1. 影响页面质量因素有哪些?

典型的低质量页面有以下特征:

  • 主需求无效/未满足(过期分类广告/软件下载页面,下载链接无效等)
  • 死链
  • 虚假信息/诈骗等
  • 点不稳定
  • 影响主需求的权限问题(下载/浏览需要注册会员/积分等)
  • 信息不完整(转载不全等)
  • 浏览体验差(广告/字体/页面布局等)

典型的高质量页面存在以下一些特征:

  • 访问速度快(页面加载快/资源下载速度快)
  • 页面整洁干净,主体内容在显著位置。
  • 页面信息完整。
  • 页面元素丰富(文字、图片、评论、相关推荐等)

2. 平时用啥分析日志?
平时都用shell分析网站日志,常用的shell命令有:

  • curl
  • cat
  • grep
  • sed
  • awk

3. 你了解你网站的结构和产品吗?聊聊你的认识?
网站的结构即是网站的架构从大方面上说的是前端+后端

前端:

  • 内容
    • 让访问者浏览的信息(内容归于前端是因为内容是显性的,但对于内容的处理确实隐形的,那个归于后端)
  • 结构层(HTML)
    • 使内容具有逻辑性和易用性
  • 表现层(CSS)
    • 修饰内容的外在表现使之看起来美观
  • 行为层(Javascript)
    • 与内容的交互操作
  • UI(User Interface)
    • 用户界面要注意用户体验

后端:

  • 服务器
    • Apache
    • Nginx
    • IIS
  • 程序语言
    • php
    • asp
    • python
  • 数据库
    • access
    • mysql
    • mongodb
  • 各种模块
    • CMS

4. 熟悉http协议吗?稍微讲讲
HTTP协议工作于客户端-服务端架构为上。浏览器作为HTTP客户端通过URL向HTTP服务端即WEB服务器发送所有请求。
Web服务器有:Apache服务器,IIS服务器(Internet Information Services)等。
Web服务器根据接收到的请求后,向客户端发送响应信息。
HTTP默认端口号为80,但是你也可以改为8080或者其他端口。

HTTP的三点注意事项:

  • HTTP是无连接的
  • HTTP是媒体独立的
  • HTTP是无状态的

5. 我挖了相关行业的10万关键字,请问接下来你准备如何处理?

  • 提取实体
  • 去重
  • 受控词表
  • 分类
    • 按照意图进行分类
      • 导航:自己做or单独做个频道
      • 信息:放入资讯,问答,产品库
      • 事务:一般放在主力产品线上,页面上会有功能体现,比如”添加到购物车”,”下载链接“,”在线预定”等等

处理词之后能做什么呢?
1.内容关联
2.自动tagging
3.提高站内检索精度


6. 如果让你生成一个100万url的sitemap,请问如何处理?
使用python程序进行处理。


7. 如何保证定时更新
CMS定时更新


8. 你熟悉ga吗?平时你都用ga做什么?
还行吧,一般都是看看流量和排名以及索引的数据


9. 请问什么是ajax技术?对seo的影响又是啥?
AJAX即“Asynchronous JavaScript and XML”(异步的JavaScript与XML技术),指的是一套综合了多项技术的浏览器端网页开发技术

使用Ajax的最大优点,就是能在不更新整个页面的前提下维护数据。这使得Web应用程序更为迅捷地回应用户动作,并避免了在网络上发送那些没有改变的信息。

Ajax不需要任何浏览器插件,但需要用户允许JavaScript在浏览器上执行。就像DHTML应用程序那样,Ajax应用程序必须在众多不同的浏览器和平台上经过严格的测试。随着Ajax的成熟,一些简化Ajax使用方法的程序库也相继问世。同样,也出现了另一种辅助程序设计的技术,为那些不支持JavaScript的用户提供替代功能。

对应用Ajax最主要的批评就是,它可能破坏浏览器的后退功能。在动态更新页面的情况下,用户无法回到前一个页面状态,这是因为浏览器仅能记下历史记录中的静态页面。

一个被完整读入的页面与一个已经被动态修改过的页面之间的差别非常微妙;用户通常都希望单击后退按钮,就能够取消他们的前一次操作,但是在Ajax应用程序中,却无法这样做。

不过开发者已想出了种种办法来解决这个问题,当中大多数都是在用户单击后退按钮访问历史记录时,通过创建或使用一个隐藏的IFRAME来重现页面上的变更。(例如,当用户在Google Maps中单击后退时,它在一个隐藏的IFRAME中进行搜索,然后将搜索结果反映到Ajax元素上,以便将应用程序状态恢复到当时的状态。)

一个相关的观点认为,使用动态页面更新使得用户难于将某个特定的状态保存到收藏夹中。该问题的解决方案也已出现,大部分都使用URL片断标识符(通常被称为锚点,即URL中#后面的部分)来保持追踪,允许用户回到指定的某个应用程序状态。(许多浏览器允许JavaScript动态更新锚点,这使得Ajax应用程序能够在更新显示内容的同时更新锚点。)这些解决方案也同时解决了许多关于不支持后退按钮的争论。

进行Ajax开发时,网络延迟——即用户发出请求到服务器发出响应之间的间隔——需要慎重考虑。如果不给予用户明确的回应,没有恰当的预读数据,或者对XMLHttpRequest的不恰当处理,都会使用户感到厌烦。通常的解决方案是,使用一个可视化的组件来告诉用户系统正在进行后台操作并且正在读取数据和内容。


10. 请问什么是卡片分拣技术?请模拟一下卡片分拣对于关键的分类作用
是一种人工分拣关键词的方法,可以集思广益,在操作的过程中可以进行一定的筛选和层级的把控。此方法详见图书《锦绣蓝图,如何规划一个让人流连忘返的网站》


11. 你对于seo频道是怎么看的?
SEO频道从信息的角度来看是不同于网站中其他页面的,它包含了很多的内容元素,诸如: 通用性信息,交互性信息,及时性信息,推荐性信息,排行性信息,形式主要以图片,文本,视频,表格,链接等展现。


12. 你平时是如何模拟post抓取的?
使用火车头进行post抓取,也会使用python去写一个


13. 对于防采集,你有好的想法吗?你一般是如何处理的?
防采集一般情况下是使用几种不同的模板,其中内容 布局等都是一样的,只是类等命名不同,所以利用这个不同的命名的方法即可简单的防止采集。

 

——————ITSEO日比哥专属问答,转载注明出处!

ckhero

发表评论

To create code blocks or other preformatted text, indent by four spaces:

    This will be displayed in a monospaced font. The first four 
    spaces will be stripped off, but all other whitespace
    will be preserved.
    
    Markdown is turned off in code blocks:
     [This is not a link](http://example.com)

To create not a block, but an inline code span, use backticks:

Here is some inline `code`.

For more help see http://daringfireball.net/projects/markdown/syntax