APP下载

云端计算工程师面试题集锦 云端计算面试题及答案

消息来源:baojiabao.com 作者: 发布时间:2026-05-26

报价宝综合消息云端计算工程师面试题集锦 云端计算面试题及答案

云端计算现在发展前景很好,很多人都会选择云端计算。但是学完云端计算如何面试成功也是重要的一环。这次在本文就为大家带来云端计算面试及答案,希望能够对大家找工作的征程有所助益。

从互联网公司的面试过程来看,求职者必须注意以下几点:

1、计算机网络和数据库的相关知识是所有互联网公司基础知识考察的重要方面,上述也给出了不少面试题,很多公司的题目都很相像,这也基本给出了重点。

2、性格测试被越来越多的互联网公司纳入考察范围,有些问题看起来似乎是正常考察,但很多时候可以看出一个人的性格,公司基本都更喜欢乐观向上、态度积极的求职者。

3、如果基础面试没问题,多数互联网公司的人力会让求职者打印半年或一年的工资流水,所以各位求职者在薪资这件事上大可以直接说出历史资料和期望资料,造假是不可取的。

下面给大家分享一些实用的面试题:

1MySQL的复制原理以及流程

基本原理流程,3个执行绪以及之间的关联;

(1)主:binlog执行绪——记录下所有改变了数据库资料的语句,放进master上的binlog中;

(2)从:io执行绪——在使用start slave 之后,负责从master上拉取 binlog 内容,放进 自己的relay log中;

(3)从:sql执行执行绪——执行relay log中的语句;

2MySQL中myisam与innodb的区别,至少5点

(1)、问5点不同:

1>.InnoDB支援事物,而MyISAM不支援事物

2>.InnoDB支援行级锁,而MyISAM支援表级锁

3>.InnoDB支援MVCC, 而MyISAM不支援

4>.InnoDB支援外来键,而MyISAM不支援

5>.InnoDB不支援全文索引,而MyISAM支援。

(2)、innodb引擎的4大特性:

插入缓冲(insert buffer);

二次写(double write);

自适应杂凑索引(ahi);

预读(read ahead)。

(3)、2者selectcount(*)哪个更快,为什么

myisam更快,因为myisam内部维护了一个计数器,可以直接调取。

3MySQL中varchar与char的区别以及varchar(50)中的50代表的涵义

(1)、varchar与char的区别

char是一种固定长度的型别,varchar则是一种可变长度的型别。

(2)、varchar(50)中50的涵义

最多存放50个字元,varchar(50)和(200)储存hello所占空间一样,但后者在排序时会消耗更多内存,因为order by col采用fixed_length计算col长度(memory引擎也一样)。

(3)、int(20)中20的涵义

是指显示字元的长度

但要加引数的,最大为255,比如它是记录行数的id,插入10笔资料,它就显示00000000001 ~~~00000000010,当字元的位数超过11,它也只显示11位,如果你没有加那个让它未满11位就前面加0的引数,它不会在前面加0

20表示最大显示宽度为20,但仍占4字节储存,储存范围不变;

(4)、mysql为什么这么设计

对大多数应用没有意义,只是规定一些工具用来显示字元的个数;int(1)和int(20)储存和计算均一样。

4问了innodb的事务与日志的实现方式

(1)、有多少种日志:

错误日志:记录出错资讯,也记录一些警告资讯或者正确的资讯。

查询日志:记录所有对数据库请求的资讯,不论这些请求是否得到了正确的执行。

慢查询日志:设定一个阈值,将执行时间超过该值的所有SQL语句都记录到慢查询的日志档案中。

二进位制日志:记录对数据库执行更改的所有操作。

中继日志。

事务日志。

(2)、事物的4种隔离级别

隔离级别

读未提交(RU)

读已提交(RC)

可重复读(RR)

序列

(3)、事务是如何通过日志来实现的,说得越深入越好。

事务日志是通过redo和innodb的储存引擎日志缓冲(Innodb log buffer)来实现的,当开始一个事务的时候,会记录该事务的lsn(log sequence number)号; 当事务执行时,会往InnoDB储存引擎的日志。

的日志快取里面插入事务日志;当事务提交时,必须将储存引擎的日志缓冲写入磁盘(通过innodb_flush_log_at_trx_commit来控制),也就是写资料前,需要先写日志。这种方式称为“预写日志方式”。

5问了MySQL binlog的几种日志录入格式以及区别

(1)、binlog的日志格式的种类和分别;

(2)、适用场景;

(3)、结合第一个问题,每一种日志格式在复制中的优劣。

1.Statement:每一条会修改资料的sql都会记录在binlog中。

优点:不需要记录每一行的变化,减少了binlog日志量,节约了IO,提高效能。(相比row能节约多少效能 与日志量,这个取决于应用的SQL情况,正常同一条记录修改或者插入row格式所产生的日志量还小于Statement产生的日志量,但是考虑到如果带条 件的update操作,以及整表删除,alter表等操作,ROW格式会产生大量日志,因此在考虑是否使用ROW格式日志时应该跟据应用的实际情况,其所 产生的日志量会增加多少,以及带来的IO效能问题。)

缺点:由于记录的只是执行语句,为了这些语句能在slave上正确执行,因此还必须记录每条语句在执行的时候的 一些相关资讯,以保证所有语句能在slave得到和在master端执行时候相同 的结果。另外mysql 的复制,像一些特定函式功能,slave可与master上要保持一致会有很多相关问题(如sleep函式, last_insert_id,以及user-defined functions(udf)会出现问题).

使用以下函式的语句也无法被复制:

* LOAD_FILE

* UUID

* USER

* FOUND_ROWS

* SYSDATE (除非启动时启用了 --sysdate-is-now 选项)

同时在INSERT ...SELECT 会产生比 RBR 更多的行级锁

2.Row:不记录sql语句上下文相关资讯,仅储存哪条记录被修改。

优点: binlog中可以不记录执行的sql语句的上下文相关的资讯,仅需要记录那一条记录被修改成什么了。所以rowlevel的日志内容会非常清楚的记录下 每一行资料修改的细节。而且不会出现某些特定情况下的储存过程,或function,以及trigger的呼叫和触发无法被正确复制的问题

缺点:所有的执行的语句当记录到日志中的时候,都将以每行记录的修改来记录,这样可能会产生大量的日志内容,比 如一条update语句,修改多条记录,则binlog中每一条修改都会有记录,这样造成binlog日志量会很大,特别是当执行alter table之类的语句的时候,由于表结构修改,每条记录都发生改变,那么该表每一条记录都会记录到日志中。

3.Mixedlevel: 是以上两种level的混合使用,一般的语句修改使用statment格式储存binlog,如一些函式,statement无法完成主从复制的操作,则 采用row格式储存binlog,MySQL会根据执行的每一条具体的sql语句来区分对待记录的日志形式,也就是在Statement和Row之间选择 一种.新版本的MySQL中队row level模式也被做了优化,并不是所有的修改都会以row level来记录,像遇到表结构变更的时候就会以statement模式来记录。至于update或者delete等修改资料的语句,还是会记录所有行的 变更。

6问了下MySQL数据库cpu飙升到500%的话他怎么处理?

(1)、没有经验的,可以不问;

(2)、有经验的,问他们的处理思路。

列出所有程序 show processlist 观察所有程序 多秒没有状态变化的(干掉)

检视超时日志或者错误日志 (做了几年开发,一般会是查询以及大批量的插入会导致cpu与i/o上涨,,,,当然不排除网络状态突然断了,,导致一个请求服务器只接受到一半,比如where子句或分页子句没有传送,,当然的一次被坑经历)

7sql优化

(1)、explain出来的各种item的意义;

select_type

表示查询中每个select子句的型别

type

表示MySQL在表中找到所需行的方式,又称“访问型别”

possible_keys

指出MySQL能使用哪个索引在表中找到行,查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询使用

key

显示MySQL在查询中实际使用的索引,若没有使用索引,显示为NULL

key_len

表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度

ref

表示上述表的连线匹配条件,即哪些列或常量被用于查询索引列上的值

Extra

包含不适合在其他列中显示但十分重要的额外资讯。

(2)、profile的意义以及使用场景;

查询到 SQL 会执行多少时间, 并看出 CPU/Memory 使用量, 执行过程中 Systemlock, Table lock 花多少时间等等。

8备份计划,mysqldump以及xtranbackup的实现原理

(1)、备份计划;

这里每个公司都不一样,您别说那种1小时1全备什么的就行

(2)、备份恢复时间;

这里跟机器,尤其是硬盘的速率有关系,以下列举几个仅供参考

20G的2分钟(mysqldump)

80G的30分钟(mysqldump)

111G的30分钟(mysqldump)

288G的3小时(xtra)

3T的4小时(xtra)

逻辑汇入时间一般是备份时间的5倍以上

(3)、xtrabackup实现原理

在InnoDB内部会维护一个redo日志档案,我们也可以叫做事务日志档案。事务日志会储存每一个InnoDB表资料的记录修改。当InnoDB启动时,InnoDB会检查资料档案和事务日志,并执行两个步骤:它应用(前滚)已经提交的事务日志到资料档案,并将修改过但没有提交的资料进行回滚操作。

9mysqldump中备份出来的sql,如果我想sql档案中,一行只有一个insert....value的话,怎么办?如果备份需要带上master的复制点资讯怎么办?

--skip-extended-insert[[email protected] ~]# mysqldump -uroot -p helei --skip-extended-insertEnter password:KEY `idx_c1` (`c1`),KEY `idx_c2` (`c2`)) ENGINE=InnoDB AUTO_INCREMENT=51 DEFAULT CHARSET=latin1;/*!40101 SET character_set_client = @saved_cs_client */;---- Dumping data for table `helei`--LOCK TABLES `helei` WRITE;/*!40000 ALTER TABLE `helei` DISABLE KEYS */;INSERT INTO `helei` VALUES (1,32,37,38,\'2016-10-18 06:19:24\',\'susususususususususususu\');INSERT INTO `helei` VALUES (2,37,46,21,\'2016-10-18 06:19:24\',\'susususususu\');INSERT INTO `helei` VALUES (3,21,5,14,\'2016-10-18 06:19:24\',\'susu\');10500台db,在最快时间之内重启

puppet,dsh

11innodb的读写引数优化

(1)、读取引数

global buffer pool以及 local buffer;

(2)、写入引数;

innodb_flush_log_at_trx_commit

innodb_buffer_pool_size

(3)、与IO相关的引数;

innodb_write_io_threads = 8

innodb_read_io_threads = 8

innodb_thread_concurrency = 0

(4)、快取引数以及快取的适用场景。

query cache/query_cache_type

并不是所有表都适合使用query cache。造成query cache失效的原因主要是相应的table发生了变更

第一个:读操作多的话看看比例,简单来说,如果是使用者清单表,或者说是资料比例比较固定,比如说商品列表,是可以开启的,前提是这些库比较集中,数据库中的实务比较小。第二个:我们“行骗”的时候,比如说我们竞标的时候压测,把query cache开启,还是能收到qps激增的效果,当然前提示前端的连线池什么的都配置一样。大部分情况下如果写入的居多,访问量并不多,那么就不要开启,例如社交网站的,10%的人产生内容,其余的90%都在消费,开启还是效果很好的,但是你如果是qq讯息,或者聊天,那就很要命。第三个:小网站或者没有高并发的无所谓,高并发下,会看到 很多 qcache 锁 等待,所以一般高并发下,不建议开启query cache。12你是如何监控你们的数据库的?你们的慢日志都是怎么查询的?

监控的工具有很多,例如zabbix,lepus,我这里用的是lepus。

13你是否做过主从一致性校验,如果有,怎么做的,如果没有,你打算怎么做?

主从一致性校验有多种工具 例如checksum、mysqldiff、pt-table-checksum等。

14你们数据库是否支援emoji表情,如果不支援,如何操作?

如果是utf8字符集的话,需要升级至utf8_mb4方可支援。

15你是如何维护数据库的资料字典的?

这个大家维护的方法都不同,一般是直接在生产库进行注释,利用工具汇出成excel方便流通。

16你们是否有开发规范,如果有,如何执行的

有,开发规范网上有很多了,可以自己看看总结下。

17表中有大字段X(例如:text型别),且字段X不会经常更新,以读为为主,请问

(1)、您是选择拆成子表,还是继续放一起;

(2)、写出您这样选择的理由。

答:拆带来的问题:连线消耗 + 储存拆分空间;不拆可能带来的问题:查询效能;

如果能容忍拆分带来的空间问题,拆的话最好和经常要查询的表的主键在物理结构上放置在一起(分割槽) 顺序IO,减少连线消耗,最后这是一个文字列再加上一个全文索引来尽量抵消连线消耗。

如果能容忍不拆分带来的查询效能损失的话:上面的方案在某个极致条件下肯定会出现问题,那么不拆就是最好的选择。

18MySQL中InnoDB引擎的行锁是通过加在什么上完成(或称实现)的?为什么是这样子的?

答:InnoDB是基于索引来完成行锁

例: select * from tab_with_index where id = 1 for update;

for update 可以根据条件来完成行锁锁定,并且 id 是有索引键的列,

如果 id 不是索引键那么InnoDB将完成表锁,,并发将无从谈起

19如何从mysqldump产生的全库备份中只恢复某一个库、某一张表?

在Mysqldump官方工具中,如何只恢复某个库呢?

全库备份

[[email protected] ~]# mysqldump -uroot -p --single-transaction -A --master-data=2 >dump.sql

只还原erp库的内容

[[email protected] ~]# mysql -uroot -pMANAGER erp --one-database 可以看出这里主要用到的引数是--one-database简写-o的引数,极大方便了我们的恢复灵活性。

那么如何从全库备份中抽取某张表呢,全库恢复,再恢复某张表小库还可以,大库就很麻烦了,那我们可以利用正则表示式来进行快速抽取,具体实现方法如下:

从全库备份中抽取出t表的表结构

[[email protected] ~]# sed -e\'/./{H;$!d;}\' -e \'x;/CREATE TABLE `t`/!d;q\' dump.sql

DROP TABLE IF EXISTS`t`;

/*!40101 [email protected]_cs_client [email protected]@character_set_client */;

/*!40101 SETcharacter_set_client = utf8 */;

CREATE TABLE `t` (

`id` int(10) NOT NULL AUTO_INCREMENT,

`age` tinyint(4) NOT NULL DEFAULT \'0\',

`name` varchar(30) NOT NULL DEFAULT \'\',

PRIMARY KEY (`id`)

) ENGINE=InnoDBAUTO_INCREMENT=4 DEFAULT CHARSET=utf8;

/*!40101 SETcharacter_set_client = @saved_cs_client */;

从全库备份中抽取出t表的内容

[[email protected] ~]# grep\'INSERT INTO `t`\' dump.sql

INSERT INTO `t`VALUES (0,0,\'\'),(1,0,\'aa\'),(2,0,\'bbb\'),(3,25,\'helei\');

20开放性问题:据说是腾讯的

一个6亿的表a,一个3亿的表b,通过外间tid关联,你如何最快的查询出满足条件的第50000到第50200中的这200条资料记录。

1、如果A表TID是自增长,并且是连续的,B表的ID为索引

select * from a,b where a.tid = b.id and a.tid>500000 limit 200;

2、如果A表的TID不是连续的,那么就需要使用覆盖索引.TID要么是主键,要么是辅助索引,B表ID也需要有索引。

select * from b , (select tid from a limit 50000,200) a where b.id = a .tid;

2019-12-07 19:53:00

相关文章