百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程文章 > 正文

面试官:你都说不出SQL查询语句执行过程,我凭什么要你?

qiyuwang 2024-10-05 03:18 10 浏览 0 评论

前言

今天,来简单说一下MySQL的基础架构吧。很多人都会增删改查,平时写sql也是轻而易举的,但是,我们在写sql的同时,时常都不会去深入了解一条语句的执行过程到底是什么?都经历了什么?怎么解析语句、到赋参数值、最后返回结果?

例如:select * from T where ID=10;

这个我们看到的是一个执行的查询语句,返回的是结果,却不知道具体执行了哪些过程。所以,今天来对MySQL拆解,查看一下其内部构成的具体零件。

MySQL基本架构

下图是MySQL基本架构示意图,从图中可以看出来一条sql的具体执行流程:

从大方面来说,MySQL可以分为Server层和存储引擎两个部分。

  • Server层:

包括连接器、查询缓存、分析器、优化器、执行器等,涵盖 MySQL 的大多数核心服务功能,以及所有的内置函数(如日期、时间、数学和加密函数等),所有跨存储引擎的功能都在这一层实现,比如存储过程、触发器、视图等。

  • 存储引擎:

负责数据的存储和提取。其架构模式是插件式的,支持 InnoDB、MyISAM、Memory 等多个存储引擎。现在最常用的存储引擎是 InnoDB,它从 MySQL 5.5.5 版本开始成为了默认存储引擎。可以在create table 语句中使用 engine=memory, 来指定使用内存引擎创建表。

连接器

连接器负责跟客户端建立连接、获取权限、维持和管理连接。客户端与数据库交互最先就是要从连接池中获取到连接,才能继续后续的操作。

mysql -h$ip -P$port -u$user -p

与数据库建立连接,完成经典的TCP握手后,会校验身份(用户名、密码),校验通过后获得数据库连接。这也说明一个问题:一个用户成功建立连接后,即使你用管理员账号对这个用户的权限做了修改,也不会影响已经存在连接的权限。修改完成后,只有再新建的连接才会使用新的权限设置。

建立连接后,如果没有后续操作,那么连接空闲,在一段时间后,数据库会自动断开连接(默认8小时)。

查询缓存

MySQL 拿到一个查询请求后,会先到查询缓存看看,之前是不是执行过这条语句。之前执行过的语句及其结果可能会以 key-value 对的形式,被直接缓存在内存中。key 是查询的语句,value 是查询的结果。如果你的查询能够直接在这个缓存中找到 key,那么这个 value 就会被直接返回给客户端。

如果在缓存中查不到,就会继续后续的操作。这里可能大部分人会觉得 那缓存命中率高了,数据库性能就好了,不是很好吗?其实,这里不建议大家查询缓存,虽然缓存效率高,但是弊端却很大,最主要的就是:缓存更新不及时,查询的结果为旧数据,影响实际业务。

我们可以将参数 query_cache_type 设置成 DEMAND,这样对于默认的 SQL 语句都不使用查询缓存。而对于你确定要使用查询缓存的语句,可以用 SQL_CACHE 显式指定,像下面这个语句一样:

mysql> select SQL_CACHE * from T where ID=10;

但是,MySQL8.0之后就没有这个功能了。

分析器

当MySQL没有命中缓存,就需要知道这个语句是要他做什么了。

  1. MySQL会进行“词法分析”。其实我们输入的sql语句是多个字符串加空格组成,MySQL要识别语句中的字符串,并匹配字符串的含义。
  2. 根据语法规则判断语句是否合法,如果你的语句不对,就会收到“You have an error in your SQL syntax”的错误提醒,比如下面这个语句 select 少打了开头的字母“s”。
mysql> elect * from t where ID=1;
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'elect * from t where ID=1' at line 1

优化器

若语句满足语法要求,那么MySQL就要对其进行优化,优化器是MySQL选择一种最优的方式去获取你要的结果:

  1. 决定使用的索引
  2. 多表关联,决定关联的顺序,例如:
mysql> select * from t1 join t2 using(ID) where t1.c=10 and t2.d=20;
  • 既可以先从表 t1 里面取出 c=10 的记录的 ID 值,再根据 ID 值关联到表 t2,再判断 t2 里面 d 的值是否等于 20。
  • 也可以先从表 t2 里面取出 d=20 的记录的 ID 值,再根据 ID 值关联到 t1,再判断 t1 里面 c 的值是否等于 10。

虽然,两种方法的结果一样,但是效率不同。MySQL就是选择一种较优的方案。

执行器

万事俱备,只差最后操作。经过一系列的准备,终于要去执行获取结果了。是不是很激动?等等…

开始执行的时候,要先判断一下你对这个表 T 有没有执行查询的权限,如果没有,就会返回没有权限的错误。所以执行前一定要确定该用户有权限操作数据库喲~

mysql> select * from T where ID=10;
ERROR 1142 (42000): SELECT command denied to user 'b'@'localhost' for table 'T'

当你具备了钥匙(操作权限),就可以打开表继续操作啦。以上述例子来说明:

  1. 调用 InnoDB 引擎接口取这个表的第一行,判断 ID 值是不是 10,如果不是则跳过,如果是则将这行存在结果集中;
  2. 调用引擎接口取“下一行”,重复相同的判断逻辑,直到取到这个表的最后一行。
  3. 执行器将上述遍历过程中所有满足条件的行组成的记录集作为结果集返回给客户端。

至此,语句就执行完了。

总结

今天,用了一个简单的例子来跟大家一起学习了MySQL的查询语句执行过程,其实我自己在实际使用中,都没有考虑过一个简单的查询语句的背后,到底做了什么,今天学习了才知道,原来简简单单毫秒返回,竟然可以做这么多事情,涨知识啦~

留个问题跟大家一起讨论吧:

如果表 T 中没有字段 k,而你执行了这个语句 select * from T where k=1, 那肯定是会报“不存在这个列”的错误: “Unknown column ‘k’ in ‘where clause’”。你觉得这个错误是在我们上面提到的哪个阶段报出来的呢?

欢迎大家留言讨论呀~

欢迎大家关注我哟~

相关推荐

# 安装打开 ubuntu-22.04.3-LTS 报错 解决方案

#安装打开ubuntu-22.04.3-LTS报错解决方案WslRegisterDistributionfailedwitherror:0x800701bcError:0x80070...

利用阿里云镜像在ubuntu上安装Docker

简介:...

如何将Ubuntu Kylin(优麒麟)19.10系统升级到20.04版本

UbuntuKylin系统使用一段时间后,有新的版本发布,如何将现有的UbuntuKylin系统升级到最新版本?可以通过下面的方法进行升级。1.先查看相关的UbuntuKylin系统版本情况。使...

Ubuntu 16.10内部代号确认为Yakkety Yak

在正式宣布Ubuntu16.04LTS(XenialXerus)的当天,Canonical创始人MarkShuttleworth还非常开心的在个人微博上宣布Ubuntu下个版本16.10的内...

如何在win11的wsl上装ubuntu(怎么在windows上安装ubuntu)

在Windows11的WSL(WindowsSubsystemforLinux)上安装Ubuntu非常简单。以下是详细的步骤:---...

Win11学院:如何在Windows 11上使用WSL安装Ubuntu

IT之家2月18日消息,科技媒体pureinfotech昨日(2月17日)发布博文,介绍了3中简便的方法,让你轻松在Windows11系统中,使用WindowsSubs...

如何查看Linux的IP地址(如何查看Linux的ip地址)

本头条号每天坚持更新原创干货技术文章,欢迎关注本头条号"Linux学习教程",公众号名称“Linux入门学习教程"。...

怎么看电脑系统?(怎么看电脑系统配置)

要查看电脑的操作系统信息,可以按照以下步骤操作,根据不同的操作系统选择对应的方法:一、Windows系统通过系统属性查看右键点击桌面上的“此电脑”(或“我的电脑”)图标,选择“属性”。在打开的...

如何查询 Linux 内核版本?这些命令一定要会!

Linux内核是操作系统的核心,负责管理硬件资源、调度进程、处理系统调用等关键任务。不同的内核版本可能支持不同的硬件特性、提供新的功能,或者修复了已知的安全漏洞。以下是查询内核版本的几个常见场景:...

深度剖析:Linux下查看系统版本与CPU架构

在Linux系统管理、维护以及软件部署的过程中,精准掌握系统版本和CPU架构是极为关键的基础操作。这些信息不仅有助于我们深入了解系统特性、判断软件兼容性,还能为后续的软件安装、性能优化提供重要依据。接...

504 错误代码解析与应对策略(504错误咋解决)

在互联网的使用过程中,用户偶尔会遭遇各种错误提示,其中504错误代码是较为常见的一种。504错误并非意味着网站被屏蔽,它实际上是指服务器在规定时间内未能从上游服务器获取响应,专业术语称为“Ga...

猎聘APP和官网崩了?回应:正对部分职位整改,临时域名可登录

10月12日,有网友反映猎聘网无法打开,猎聘APP无法登录。截至10月14日,仍有网友不断向猎聘官方微博下反映该情况,而猎聘官方微博未发布相关情况说明,只是在微博内对反映该情况的用户进行回复,“抱歉,...

域名解析的原理是什么?域名解析的流程是怎样的?

域名解析是网站正常运行的关键因素,因此网站管理者了解域名解析的原理和流程对于做好域名管理、解决常见解析问题,保障网站的正常运转十分必要。那么域名解析的原理是什么?域名解析的流程是怎样的?接下来,中科三...

Linux无法解析域名的解决办法(linux 不能解析域名)

如果由于误操作,删除了系统原有的dhcp相关设置就无法正常解析域名。  此时,需要手动修改配置文件:  /etc/resolv.conf  将域名解析服务器手动添加到配置文件中  该文件是DNS域名解...

域名劫持是什么?(域名劫持是什么)

域名劫持是互联网攻击的一种方式,通过攻击域名解析服务器(DNS),或伪造域名解析服务器(DNS)的方法,把目标网站域名解析到错误的地址从而实现用户无法访问目标网站的目的。说的直白些,域名劫持,就是把互...

取消回复欢迎 发表评论: