我妻子带着一个问题来找我。她想要的是节日的,还是异想天开的,还有可能搭配的Hanukkah睡衣。但在谷歌的名字中,没有足够的选项出现,所以她告诉我,她正在系统地整理所有的拼写,以便汇编她的购物清单。
我对这一点感到非常惊讶——我曾期望谷歌能足够聪明地认识到,这些都是同样的东西,尤其是后蜂鸟。显然的是,事实并非如此。
一些不知道的人的背景:Hanukkah实际上是一个来自希伯来语的音译词。因为希伯来语有自己的字母表,所以有很多的拼写可以用来引用它: Hanukkah, Chanukah和 Channukah都是同一个节日的可接受的拼写。
因此,当有人搜索“Hanukkah睡衣”或“Chanukah睡衣”时,谷歌真的应该足够聪明,明白他们是同一个概念的不同拼写,并提供几乎相同的结果。但谷歌不!我想,其他的节日和其他文化的名字也会出现这种情况,我很想知道其他的读者是否也会遇到同样的问题。
为什么我对谷歌为不同的拼写返回不同的结果感到惊讶呢?好吧,随着知识图谱(和蜂鸟)的引入,谷歌标志着SEO的改变。比以往任何时候都更重要的是,我们可以开始考虑搜索查询,而不仅仅是作为关键字字符串,而是作为相互关联的真实世界的概念。
我这样说的意思是什么呢?
当有人搜索“亚伯拉罕林肯”时,他们很可能是在寻找美国第16任总统的实体代表,而不是“亚伯拉罕”和“林肯”这个词的出现,或者他们的叔叔,也叫亚伯拉罕林肯。如果他们搜索“林肯党”,谷歌知道我们很可能讨论的是政党,而不是在林肯镇的政党。因为这是一个与历史实体亚伯拉罕林肯密切相关的概念。
同样,谷歌也可以理解,当我们使用关键词“Hanukkah”时,它指的是假日实体,各种拼写也指的是同一个实体。尽管有不同的拼写,但不同的搜索实际上意味着相同的东西。但是,唉,就像我妻子为了发现她所有的“Hanukkah睡衣”选项一样,需要对每一个单词的拼写进行一次不同的搜索,所以说谷歌在此方面并没有做得最好。
如何普遍是Chanukah/Hanukkah/ Chanukkah搜索问题?以下是对 Chanukah项目的一些搜索结果:
正如你从第一个屏幕截图中看到的,一些大的零售商,如Target,梅西百货和JCPenney,在谷歌的页面上排名第一。不过,在截图中,他们基本上没有出现——像PajamaGram和Etsy这样的网站在不同的拼写服务中占据着主导地位。
这意味着,针对已经很小的Hanukkah购物者的商店,实际上只在他们的页面上使用了一种拼写,从而减少了潜在客户的数量。(实际上,根据我选择的关键字工具,尽管“Hanukkah”的搜索量在301100次全球月度搜索量中排名最高,其他所有的拼写组合仍然构成了55,500个搜索量——这意味着对这两个词进行优化的零售商可以看到18%的流量。)
调查拼写变化和观察
因为我是一个非常好奇的人,所以我想进一步研究这个现象。
我构建了一个小的、简单的工具,以显示两个不同查询的搜索引擎结果页面(SERP)的相似之处在于检查两个SERP中的列表。如果我们看一下Hanukkah的5种常见拼写,我们会看到如下:
这个工具在这里展示了一些非常有趣的东西:不仅结果不同,而且根据拼写不同,结果可能只有20%相同,这意味着在第1页的10个列表中有8个完全不同。
然后我开始好奇为什么这些术语没有被规范化,所以我看了维基数据,这是谷歌在它的知识图谱中使用的主要数据源之一。事实证明,有一个包含所有变体的实体:
然后我查看了谷歌知识图谱搜索API,很明显谷歌可能会感到困惑:
根据API文档,表明“实体匹配请求约束的程度”,结果分数值非常低。在这种情况下,实体并不是很匹配。这与不同的结果是一致的,如果不是因为一个知识图是用Freebase ID/m/022w4返回的所有拼写变量,这与知识图API返回的结果不同。因此,在这种情况下,似乎API并不是评估问题的可靠方法。所以让我们继续看一些其他的观察。
值得注意的是,当搜索hannukah时,谷歌将用户推至hannukah的搜索结果。在搜索Hannukah 和Hannukkah时,谷歌将用户推给了Hanukkah的结果。因此,谷歌似乎是根据用户的“H”或“Ch”,将Hanukkah拼合在一起的。
Chanukah, Hannukah和Hanukkah 也是唯一获得Hanukkah的特殊待遇的变体:
一家销售Hanukkah产品的零售商应该做什么
显然,如果我们想要全面覆盖术语(和我的妻子找到Hanukkah睡衣),我们就不能仅仅依赖于优化关键词的最高搜索量,因为谷歌似乎不把所有的变量都看作是完全一样的。最好的办法是在页面的某个地方包含每个拼写变体的实际字符串,而不是依赖于谷歌来理解它们是同一件事情的变体。
如果你是一个更小的玩家,那么将优化优先考虑到一个不那么流行的拼写变体可能是有意义的,因为自然竞争可能没有那么重要。(当然,这并不能阻止你使用拼写变体,因为它有可能赢得多个拼写。)
在最低限度中,你可以选择包含H和Ch开头的拼写,并且希望谷歌在大多数情况下会引导用户使用相同的SERP。
未来的实验
我开始了一项实验,看看是否将结构化数据与不同属性包含在一起,这可能是让谷歌理解一个实体的单一拼写的潜在途径,消除了包含不同拼写变体的需要。到目前为止,要知道测试的结果还为时过早,而且现在它们还没有定论,但我期待着在未来分享这些结果。
这篇文章是由lunarpages主机中文导航(https://lunarpages.cn/)提供的,专业提供服务器托管、云服务器、lunarpages主机等相关主机技术、最新资讯。