【揭秘】数据库面试葵花宝典,让你面试一次过
大家可以叫我老张,网名superZS!一直从事数据库行业10余年,工作于某数据库服务公司,兼数据库资深讲师,就面试中大家遇到的比较困惑的数据库问题,和刚进入数据库领域的同学们,我在这里给大家做一个详细的总结,希望对大家在工作或者面试中有所帮助,老师会倾囊相授,道行尚浅,大家相互学习!让我们努力学习技术,为了拿到高薪,追到心仪的姑娘,而奋斗吧!
葵花宝典
Question 1:
你目前接触的mysql版本是什么?除了官方版本,还接触过其他的mysql分支版本嘛?
产生分支的原因
许多开发人员认为有必要将其拆分成其他项目,并且每个分支项目都有自己的专长。该需求以及Oracle对核心产品增长缓慢的担忧,导致出现了许多开发人员感兴趣的子项目和分支
三个流行MySQL分支:Drizzle、MariaDB和Percona Server(包括XtraDB引擎)
MariaDB不仅是mysql的替代品,主要还是创新和提高mysql自有技术。
新功能介绍
multi-source replication 多源复制
表的并行复制
galera cluster集群
spider水平分片
tokuDB存储引擎
XtraDB是innodb存储引擎的增强版,可用来更好地发挥最新的计算机硬件系统性能,还包含在高性能模式下的新特性。它可以向下兼容,因为它是在innodb基础上构建,所以他有更多的指标和扩展功能。而且它在cpu多核的条件下,可以更好地使用内存,时数据库性能提到更高!
Drizzle与mysql的差别就比较大了,并且不能兼容,如果想运行此环境,就需要重写一些代码了!
Question 2:
mysql主要的存储引擎myisam和innodb的不同之处?
事务的支持不同(innodb支持事务,myisam不支持事务)
锁粒度(innodb行锁应用,myisam表锁)
存储空间(innodb既缓存索引文件又缓存数据文件,myisam只能缓存索引文件)
存储结构
(myisam:数据文件的扩展名为.MYD myData ,索引文件的扩展名是.MYI myIndex)
(innodb:所有的表都保存在同一个数据文件里面 即为.Ibd)
5. 统计记录行数
(myisam:保存有表的总行数,select count(*) from table;会直接取出出该值)
(innodb:没有保存表的总行数,select count(*) from table;就会遍历整个表,消耗相当大)
Question 3:
Innodb的体系结构简单介绍一下?
谈及到innodb的体系结构,首先要考虑mysql的体系结构,分为两部分mysql的server层和存储引擎层
先要跟面试官聊清楚mysql的整体方向,然后再去涉及innodb体系结构
建议从三方面介绍innodb体系结构:内存----线程-----磁盘
内存中包含insert_buffer,data_buffer,index_buffer,redo_log_buffer,double_write
内存刷新到磁盘的机制,redo,脏页,binlog的刷新条件
各种线程的作用,master_thread,purge_thread,redo log thread,read thread,write thread,page cleaner thread
磁盘中存放着数据文件,redo log,undo log,binlog
Question 4:
mysql有哪些索引类型:
数据结构角度上可以分:B+tree索引,hash索引,fulltext索引(innodb,myisam都支持)
存储角度上可以分:聚集索引,非聚集索引
逻辑角度上可以分:primary key,normal key,单列,复合,覆盖索引
Question 5:
mysql binlog有几种格式:
1. statement
优点:不需要记录每一行的变化,减少了binlog日志量,节约了IO,提高性能
缺点:当使用一些特殊函数的时候,或者跨库操作的时候容易丢失数据
注:在生产中不建议使用
2. row
优点:清晰记录每行的数据信息,不会出现跨库丢数据的情况
缺点:内容当记录到日志中的时候,都将以每行记录的修改来记录,但就会产生大量的binlog,对于网络开销也比较大
注:生产中推荐使用
3. mixed
是mysql5.1的时候,一个过渡版本,DDL语句会记录成statement,DML会记录row。
注:生产中不建议使用
Qusetion 6:
mysql主从复制的具体原理是什么?
主服务器把数据更新记录到二进制日志中,从服务器通过io thread向主库发起binlog请求,主服务器通过IO dump thread把二进制日志传递给从库,从库通过io thread记录到自己的中继日志中。然后再通过sql thread应用中继日志中sql的内容。
Qusetion 7:
数据库中双一是什么?
sync_binlog=1
innodb_flush_log_at_trx_commit=1
innodb_flush_log_at_trx_commit和sync_binlog 两个参数是控制MySQL 磁盘写入策略以及数据安全性的关键参数
innodb_flush_log_at_trx_commit设置为1,每次事务提交时MySQL都会把log buffer的数据写入log file,并且刷到磁盘中去。
sync_binlog =N (N>0) ,MySQL 在每写 N次 二进制日志binary log时,会使用fdatasync()函数将它的写二进制日志binary log同步到磁盘中去
Qusetion 8:
如何监控mysql replication复制延迟?
可以通过第三方工具 业界中的瑞士×××percona-toolkit中的命令,pt-heartbeat进行主从延迟监控。
传统方法,通过比较主从服务器之间的position号的差异值。
还可以通过查看seconds_behind_master估算一下主从延迟时间
Qusetion 9:
大表DDL语句,如何实施,才能把性能影响降到最低?
可以通过传统方法导入导出数据,新建一张与原表一样的表结构,把需要执行的ddl语句在无数据的新表执行,然后把老表中的数据导入到新表中,把新表改成老表的名字
通过第三方工具 业界中的瑞士×××percona-toolkit中的命令,pt-online-schema-change进行在线操作
对于新版本的mysql(5.7)可以直接在线online ddl
Qusetion 10:
为什么要为innodb表设置自增列做主键?
1.使用自增列做主键,写入顺序是自增的,和B+数叶子节点分裂顺序一致
2.表不指定自增列做主键,同时也没有可以被选为主键的唯一索引,InnoDB就会选择内置的rowid作为主键,写入顺序和rowid增长顺序一致
所以InnoDB表的数据写入顺序能和B+树索引的叶子节点顺序一致的话,这时候存取效率是最高
Qusetion 11:
如何优化一条有问题的sql语句?
针对sql语句的优化,我们不要上来就回答添加索引,这样显得太不专业。我们可以从如下几个角度去分析
回归到表的设计层面,数据类型选择是否合理
大表碎片的整理是否完善
表的统计信息,是不是准确的
审查表的执行计划,判断字段上面有没有合适的索引
针对索引的选择性,建立合适的索引(就又涉及到大表DDL的操作问题)
Qusetion 12:
服务器负载过高或者网页打开缓慢,简单说说你的优化思路 ?
首先我们要发现问题的过程,通过操作系统,数据库,程序设计,硬件角度四个维度找到问题所在
找到瓶颈点的位置
制定好优化方案,形成处理问题的体系
体系制定好之后,在测试环境进行优化方案的测试
测试环境如果优化效果很好,再实施到生产环境
做好处理问题的记录
Qusetion 13:
接触过哪些mysql的主流架构?架构应用中有哪些问题需要考虑?
M-S
MHA
MM keepalived
PXC
共同存在的问题:主从延迟问题的存在,在主库宕机,切换过程中要考虑数据一致性的问题,避免出现主从复制不一致
Qusetion14:
什么是死锁?锁等待?如何优化这类问题?通过数据库哪些表可以监控?
死锁是指两个或多个事务在同一资源上互相占用,并请求加锁时,而导致的恶性循环现象。当多个事务以不同顺序试图加锁同一资源时,就会产生死锁。
锁等待:mysql数据库中,不同session在更新同行数据中,会出现锁等待
重要的三张锁的监控表innodb_trx,innodb_locks,innodb_lock_waits
Qusetion 15:
处理过mysql哪些案例
我们可以简单从mysql四个知识模块跟他聊聊mysql体系结构,数据备份恢复,优化,高可用集群架构
mysql版本的升级
处理mysql集群的各种坑和问题
根据公司业务类型,设计合理mysql库,表,架构。
定期进行灾备恢复演练
误删除数据之后,恢复数据
简单先从这几个方向说说,每个问题再展开分析。
当然还会有一些人事上面的问题,例如为啥选我们的公司,你觉得你自己的优势是什么?你期望的薪资大概是多少?这些问题,就很简单了。我们只要过了技术面试,这些都不是啥问题了!
今后还会逐渐展开某个问题的具体剖析,和详细步骤处理方法!望大家继续关注后期创作
_____________________________________________________________
打个小广告,最近老张我开了视频课程,希望大家多多支持,和我的文章一样,定会让你有不小的收获!
通过对 MySQL 体系结构深入剖析讲解,配合生产环境备份恢复,主从复制,高可用集群架构和优化等实战演练,让同学们可以对 MySQL 数据库有个由浅到深的认识。最后的课程部分还会对面试题总结进行讲解,有利于同学们可以找到理想的 MySQL DBA 的工作。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
分布式开放消息系统(RocketMQ)的原理与实践
分布式消息系统作为实现分布式系统可扩展、可伸缩性的关键组件,需要具有高吞吐量、高可用等特点。而谈到消息系统的设计,就回避不了两个问题: 消息的顺序问题 消息的重复问题 RocketMQ作为阿里开源的一款高性能、高吞吐量的消息中间件,它是怎样来解决这两个问题的?RocketMQ 有哪些关键特性?其实现原理是怎样的? 关键特性以及其实现原理 一、顺序消息 消息有序指的是可以按照消息的发送顺序来消费。例如:一笔订单产生了 3 条消息,分别是订单创建、订单付款、订单完成。消费时,要按照顺序依次消费才有意义。与此同时多笔订单之间又是可以并行消费的。首先来看如下示例: 假如生产者产生了2条消息:M1、M2,要保证这两条消息的顺序,应该怎样做?你脑中想到的可能是这样: 假定M1发送到S1,M2发送到S2,如果要保证M1先于M2被消费,那么需要M1到达消费端被消费后,通知S2,然后S2再将M2发送到消费端。 这个模型存在的问题是,如果M1和M2分别发送到两台Server上,就不能保证M1先达到MQ集群,也不能保证M1被先消费。换个角度看,如果M2先于M1达到MQ集群,甚至M2被消费后,M1才达到消费端...
- 下一篇
数据库优化之降龙十八掌
技术老铁们,工作累了,我们就一起来放松一下!老张我呢是个金庸迷,在金庸小说中,降龙十八掌无愧巅峰外功,它的威力之大可想而知。而今儿,老张要给大家介绍18招式,来优化我们的 MySQL 数据库,让它跑起来更快,更稳定! 之前老有学生问我,张老师该如何优化我们的 MySQL 数据库呢?这个问题太泛泛了,不是很具体!因为数据库的优化要从多个角度去考虑,通过不同的维度模型去排查问题。老师整理了下思路,大概可以从18个角度,大致四个方向去给大家一些建议。 第一掌----亢龙有悔 要想保证数据库能够高效,稳定地运行在服务器上面,我们首先要保证有充足的内存,只有内存足够大了,我们才能缓存住那些我们经常访问的热数据,一些 update 语句的操作当然也可以在内存中优先完成。但是我们要考虑内存使用黄金分割法则,由于不同业务的存在,对内存的需求当然也就不一样了。 举个列子来说,用户经常访问的热数据,对于内存的分配就要尽可能达到达到数据库内存的 70-80% 左右。众所周知,我们知道 MySQL 数据库内存主要靠 innodb_buffer_pool,redo log buffer,double write...
相关文章
文章评论
共有0条评论来说两句吧...