SEO初学者-搜索引擎如何工作

  1. 搜索引擎基础
  2. 搜索引擎是如何建立索引的
  3. 搜索引擎如何对网页进行排名
  4. 搜索引擎是如何个性化搜索结果的

 搜索引擎的工作方式是使用网络爬虫抓取数十亿个页面。爬虫也称为蜘蛛或机器人,它们在网络上导航并跟踪链接以查找新页面。然后,这些页面会被添加到搜索引擎从中提取结果的索引中。

 

什么是搜索引擎?

搜索引擎是可搜索的网络内容数据库。它们由两个主要部分组成: 

  1. 搜索索引。有关网页的信息的数字图书馆。 
  2. 搜索算法。负责匹配搜索索引结果的计算机程序。

搜索引擎的目的是什么?

每个搜索引擎都致力于为用户提供最佳、最相关的结果。这也是他们赢得市场份额的方式之一。

搜索引擎如何赚钱?

搜索引擎有两种类型的搜索结果: 

  1. 来自搜索索引的自然结果。您无需付费即可访问此处。
  2. 来自广告商的付费结果。您可以付费来到这里。

每次有人点击付费搜索结果时,广告商都会向搜索引擎付费。这就是所谓的按点击付费 (PPC) 广告,这就是市场份额如此重要的原因。用户越多,广告点击次数越多,收入也就越多。

每个搜索引擎都有自己的搜索索引构建流程。以下是 Google 使用的流程的简化版本.

让我们分解一下。

网址

一切都始于已知的 URL 列表。Google 会通过多种方式发现这些 URL,但最常见的三种方式是: 

  • 通过反向链接。谷歌拥有数千亿个网页的索引。如果有人从已知页面链接到新页面,谷歌就可以从那里找到它。
  • 来自站点地图。站点地图会告诉 Google 你认为网站上哪些页面和文件比较重要。
  • 通过 URL 提交。Google允许网站所有者在Google Search Console中请求抓取单个 URL 。

爬行

抓取是指计算机机器人(称为蜘蛛)访问并下载已知 URL 的过程。Google 的抓取工具是Googlebot

处理和渲染

处理是指 Google 理解和提取抓取到的网页中的关键信息。为此,它必须呈现网页,也就是运行网页代码以了解网页在用户眼中是什么样子。 

除了 Google 之外,没有人知道这个过程的所有细节。但这并不重要。我们真正需要知道的是,它涉及提取链接和存储内容以供索引。 

索引

索引是将抓取的页面中处理过的信息添加到搜索索引中。

搜索索引就是您使用搜索引擎时搜索的内容。这就是为什么在 Google 和 Bing 等主要搜索引擎中建立索引如此重要。除非您在索引中,否则用户无法找到您。 

你可知道?

Google 占据了 91.43% 的搜索引擎市场。它可以比其他搜索引擎带来更多流量,因为它是大多数人使用的搜索引擎。

发现、抓取和索引内容只是难题的第一部分。搜索引擎还需要一种方法来在用户执行搜索时对匹配结果进行排名。这是搜索算法的工作。

什么是搜索算法?

搜索算法是从索引中匹配和排列相关结果的公式。Google 在其算法中使用了许多因素。

谷歌排名的关键因素

没有人知道所有的 Google 排名因素,因为 Google 并未公布这些因素。但我们确实知道一些关键因素。让我们来看看其中的几个。

反向链接

反向链接是从一个网站的页面链接到另一个网站的链接。它们是 Google 最重要的排名因素之一。这可能就是为什么我们在对超过十亿个页面的研究中发现链接域和自然流量之间存在很强的相关性的原因。

不过,数量并不重要。质量也很重要。拥有的少量高质量反向链接页面通常比拥有大量低质量反向链接的页面排名更高。

关联

相关性是指搜索结果对搜索者的实用性。Google 有很多方法可以确定相关性。最基本的方法是查找包含与搜索查询相同的关键词的页面。它还会查看互动数据,看看其他人是否认为该结果有用。

新鲜

新鲜度是与查询相关的排名因素。对于需要新鲜结果的搜索,新鲜度更重要。这就是为什么你会看到“new Netflix series”的热门结果,而不是“how to resolve a rubik's cube”的原因。 

页面速度

网页速度是桌面和移动设备上的排名因素。但它对排名的影响更多的是负面的,而不是正面的。这是因为它对最慢的页面产生负面影响,而不是对速度极快的页面产生正面影响。

移动友好性

自2019 年谷歌转向移动优先索引以来,移动友好性一直是移动设备和桌面设备上的排名因素。

Google 会根据每位用户的情况定制搜索结果。它使用用户的位置、语言和搜索历史等信息来实现这一点。让我们仔细看看这些内容。

地点

Google 会使用您的位置来个性化具有本地意图的搜索结果。这就是为什么“意大利餐厅”的所有搜索结果都来自或关于本地餐厅。Google 知道您不太可能为了吃午饭而飞越半个地球。

语言

Google 知道向西班牙用户显示英文搜索结果毫无意义。因此,它会向使用不同语言的用户排名本地化版本的内容(如果有)。

 

搜索历史

谷歌会保存你做过的事情和去过的地方,以便为你提供更加个性化的搜索体验。你可以选择不这样做,但大多数人可能不会这样做。 

关键要点

  • 搜索引擎由两个主要部分组成:索引和算法。
  • 为了建立索引,它会抓取已知页面并跟踪链接来查找新页面。 
  • 搜索算法的目的是返回最佳、最相关的结果。
  • 搜索结果质量对于建立市场份额至关重要。
  • 没有人知道 Google 影响自然搜索结果排名的所有因素。
  • 关键排名因素包括反向链接、相关性和新鲜度。 
  • Google 会根据您的位置、语言和搜索历史记录来个性化其搜索结果。 

参考

  1. “了解 JavaScript SEO 基础知识”。谷歌。2022 年 8 月 16 日检索。 
  2. “组织信息——谷歌搜索的工作原理”。谷歌。2022 年 8 月 16 日检索
  3. “了解站点地图”。谷歌。检索日期:2022 年 8 月 16 日
  4. “Googlebot”。谷歌。2022 年 8 月 16 日检索
  5. “全球搜索引擎市场份额”。Statcounter。2022年 8 月 16 日检索
  6. “Google Q&A+ #March”。YouTube。2022年 8 月 16检索
  7. “90.63% 的内容没有从 Google 获得流量。以及如何成为剩下的 9.37%”。Ahrefs。2020年 1 月 31 日。2022 年 8 月 16 日检索
  8. “CloudFlare Radar” 。CloudFlare。2022年8 月 16 日检索
  9. “搜索结果排名——谷歌搜索的工作原理”。谷歌。2022 年 8 月 16 日检索
  10. “在网页搜索排名中使用网站速度”。谷歌。检索日期:2022 年 8 月 16 日
  11. “在移动搜索排名中使用页面速度”。谷歌。检索日期:2022 年 8 月 16 日
  12. “移动优先索引最佳实践”。谷歌。检索日期:2022 年 8 月 16 日
  13. “查找并控制你的网络和应用活动”。谷歌。2022 年 8 月 16 日检索

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/938877.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

react中实现导出excel文件

react中实现导出excel文件 一、安装依赖二、实现导出功能三、自定义列标题四、设置列宽度五、样式优化1、安装扩展库2、设置样式3、扩展样式功能 在 React 项目中实现点击按钮后导出数据为 Excel 文件,可以使用 xlsx 和 file-saver 这两个库。 一、安装依赖 在项目…

Latex中表格添加底部文本注释并调整对齐

如何实现从第一个表到第三个表的转换, 其中主要涉及到两点: (1)底部脚注与表格自动对齐并缩进换行 (2)表格自适应页面宽度 底部脚注的对齐与换行缩进需要用到 \usepackage{threeparttable} \usepackage{…

MySQL基础 -----MySQL数据类型

目录 INT类型 tinyint类型 类型大小范围 测试tinyint类型数据 float类型 测试: 测试正常数据范围的数据 测试插入范围超过临界值的数据: 测试float类型的四舍五入 ​编辑 decimal类型 同样测试: 字符串类型 char类型 测试&…

【HarmonyOS NEXT】Web 组件的基础用法以及 H5 侧与原生侧的双向数据通讯

关键词:鸿蒙、ArkTs、Web组件、通讯、数据 官方文档Web组件用法介绍:文档中心 Web 组件加载沙箱中页面可参考我的另一篇文章:【HarmonyOS NEXT】 如何将rawfile中文件复制到沙箱中_鸿蒙rawfile 复制到沙箱-CSDN博客 目录 如何在鸿蒙应用中加…

ONES 功能上新|ONES Copilot、ONES Wiki 新功能一览

ONES Copilot 可基于工作项的标题、描述、属性信息,对工作项产生的动态和评论生成总结。 针对不同类型的工作项,总结输出的内容有对应的侧重点。 应用场景: 在一些流程步骤复杂、上下游参与成员角色丰富的场景中,工作项动态往往会…

使用qemu搭建armv7嵌入式开发环境

目录 目录 1 概述 2 环境准备 2.1 vexpress系列开发板介绍 2.2 安装工具 2.2.1 安装交叉工具链 2.2.2 安装qemu 2.2.3 安装其他工具 3 启动uboot 3.1 uboot下载与编译 3.1.1 下载 3.1.2 编译 3.2 使用qemu启动uboot 4 启动kernel 4.1 下载和编译kernel 4.1.1 下…

28.操作数据库

第三方库pymysql 使用安装命令 pip install pymysql 连接数据库、选择库、获取游标,执行创建表语句 from pymysql import Connection# 获取到mysql数据库连接对象 conn Connection(host"localhost", passwd"123456", user"root", …

docker(wsl)命令 帮助文档

WSL wsl使用教程 wsl -l -v 列出所有已安装的 Linux 发行版 wsl -t Ubuntu-22.04 --shutdown 关闭所有正在运行的WSL发行版。如果你只想关闭特定的发行版 wsl -d Ubuntu-22.04 登录到Ubuntu环境 wsl --list --running 查看正在wsl中运行的linux发行版 wsl --unregister (系统名…

JVM系列之内存区域

每日禅语 有一位年轻和尚,一心求道,多年苦修参禅,但一直没有开悟。有一天,他打听到深山中有一古寺,住持和尚修炼圆通,是得道高僧。于是,年轻和尚打点行装,跋山涉水,千辛万…

【ADS射频电路学习笔记】2.阻抗匹配电路设计

本节课学习smith圆图匹配 1.史密斯圆图各功能介绍 首先调出s参数的控件 并增加两个端口 调出smith chart matching的控件 连接好端口在ADS中,默认是从负载端(term2)向源端(term1)做匹配的。 调节s参数控件的的频率扫…

springcloud-gateway获取应用响应信息乱码

客户端通过springcloud gateway跳转访问tongweb上的应用,接口响应信息乱码。使用postman直接访问tongweb上的应用,响应信息显示正常。 用户gateway中自定义了实现GlobalFilter的Filter类,在该类中获取了上游应用接口的响应信息,直…

泷羽sec学习打卡-brupsuite8伪造IP和爬虫审计

声明 学习视频来自B站UP主 泷羽sec,如涉及侵权马上删除文章 笔记的只是方便各位师傅学习知识,以下网站只涉及学习内容,其他的都 与本人无关,切莫逾越法律红线,否则后果自负 关于brupsuite的那些事儿-Brup-FaskIP 伪造IP配置环境brupsuite导入配置1、扩展中先配置python环境2、安…

【优选算法---分治】快速排序三路划分(颜色分类、快速排序、数组第K大的元素、数组中最小的K个元素)

一、颜色分类 题目链接: 75. 颜色分类 - 力扣(LeetCode) 题目介绍: 给定一个包含红色、白色和蓝色、共 n 个元素的数组 nums ,原地 对它们进行排序,使得相同颜色的元素相邻,并按照红色、白色、蓝色顺序…

【译】仅有 Text2SQL 是不够的: 用 TAG 统一人工智能和数据库

原文地址:Text2SQL is Not Enough: Unifying AI and Databases with TAG 摘要 通过数据库为自然语言问题提供服务的人工智能系统有望释放出巨大的价值。此类系统可让用户利用语言模型(LM)的强大推理和知识能力,以及数据管理系统…

leetcode 面试经典 150 题:长度最小的子数组

链接长度最小的子数组题序号209题型数组解题方法滑动窗口难度中等 题目 给定一个含有 n 个正整数的数组和一个正整数 target 。找出该数组中满足其总和大于等于 target 的长度最小的 子数组 [numsl, numsl1, …, numsr-1, numsr] ,并返回其长度。如果不存在符合条件…

vue 设置 VUE_APP_TITLE 打包部署后不生效

VUE_APP_TITLE 名门望族云科技有限公司网站 这里的 名门望族云科技有限公司网站 两边不能加 (单引号) 部署后,浏览器刷新网站根目录

经济研究复刻:企业ESG表现与创新(2009-2023年)

参照方先明(2023)的做法,对来自经济研究《企业ESG表现与创新—来自A股上市公司的证据》一文中的基准回归部分进行复刻。论文基于利益相关者理论分析了ESG表现对企业创新可能的影响及机制,利用2009-2023年A股上市公司的专利数据&am…

ECharts 手势框选方案:实现鼠标自由刷选区域,定向放大图表(文末附源码)

一. 背景 在 ECharts 中,图表开发属于最基础的组件开发,适合统计展示各种各样的数据,使用图形化的效果将海量数据直观的展示给用户,以便于让用户能够快速获取到数据展示及走向。但随着用户需求的不断迭代,我们最近的一…

卡尔曼滤波器的实用方法及其实现方法

前言 卡尔曼滤波器对于不熟悉的人来说就是一种算法,它使用随时间观察的一系列观量值,,加速度计和陀螺仪在测量值是就会包含测量误差的噪声.卡尔曼滤波器将尝试根据当前和以前的状态来估计系统的状态,这往往比测量更加的精准.问题在于机器人来回的移动,加速度计在用于测量重力加…

QScreen在Qt5.15与Qt6.8版本下的区别

简述 QScreen主要用于提供与屏幕相关的信息。它可以获取有关显示设备的分辨率、尺寸、DPI(每英寸点数)等信息。本文主要是介绍Qt5.15与Qt6环境下,QScreen的差异,以及如何判断高DPI设备。 属性说明 logicalDotsPerInch&#xff1…