sql server cpu占用率近100%后导致服务器很卡,网站打不开。但是多次重启sql server服务无果,启动之后cpu很快又上来了。这个线上的环境,也不能重启服务器中,所以有些麻烦,刚开始我们排除了服务器遭到攻击的可能,因为服务器带宽及请求情况没有异常。这样只能把问题定位到不是不数据库中有些事务锁或者耗性能sql语句导致的。
后来我们启用了sql server profier跟踪了一下最近执行的sql语句。大概的看出的问题,由于之前对一个大表有update操作,导致服务器很卡,后来想到怕影响正常业务操作,就取消了。操作虽然取消了,但是可能占用的资源还没有释放,后来业务中又有很多对这个库的写的sql操作,虽然这个写操作不是针对之前那个update的同一个表,但是有点奇怪就是为什么通过profiler看到是这个写操作还是占用cpu比较多,还有很多Audit Logout也占用比较多的cpu和内存。后来我把写sql的那个语句改了一下,改成写到另外的库,问题就解决了。
下面我就来分享下 Sql Server Cpu 100% 的常见原因及优化:
针对udit Logout也占用比较多的cpu和内存一般有以下分析和解决方法:
1、dbcc checkdb 重建索引
2、sp_lock 檢查有沒有死鎖
3、A CPU bottleneck that happens suddenly and unexpectedly, without additional load on the server, is commonly caused by a nonoptimal query plan, a poor configuration, or design factors, and not insufficient hardware resources. Before rushing out to buy faster and/or more processors, you should first identify the largest consumers of CPU bandwidth and see if they can be tuned.
http://technet.microsoft.com/zh-cn/library/cc966540(en-us).aspx
4、用pssdig抓一下,然后在RMLUtils中看消耗cpu的用户和数据库以及对应的程序。
5、在这个事件类别里面看到的CPU数不是指aduit logout所使用的cpu时间,而是指该该连接在连接期内所使用的CPU的总数。再仔细的Profiler一下。
6、看看产生aduit logout事件的是否来自同一个进程
Sql Server Cpu 100% 的情况并不太常见,一般引起 Sql Server 产生性能问题的,都是 阻塞、连接数、IO 磁盘等。所以,一般Sql Server 的使用率都是比较低的。但是,在有些情况下,还是会出现Cpu 100%的情况的。
Sql Server 在做哪些操作的时候,会比较集中使用 CPU 资源呢?
常见Cpu 100%的原因主要如下:
1. 编译和重编译
编译是 Sql Server 为指令生成执行计划的过程。Sql Server 要分析指令要做的事情,分析它所要访问的表格结构,也就是生成执行计划的过程。这个过程主要是在做各种计算,所以CPU 使用比较集中的地方。
执行计划生成后会被缓存在 内存中,以便重用。但是不是所有的都可以 被重用。在很多时候,由于数据量发生了变化,或者数据结构发生了变化,同样一句话执行,就要重编译。
2. 排序(sort) 和 聚合计算(aggregation)
在查询的时候,经常会做 order by、distinct 这样的操作,也会做 avg、sum、max、min 这样的聚合计算,在数据已经被加载到内存后,就要使用CPU把这些计算做完。所以这些操作的语句CPU 使用量会多一些。
3. 表格连接(Join)操作
当语句需要两张表做连接的时候,SQL Server 常常会选择 Nested Loop 或 Hash 算法。算法的完成要运行 CPU,所以 join 有时候也会带来 CPU 使用比较集中的地方。
4. Count(*) 语句执行的过于频繁
特别是对大表 Count(*) ,因为 Count(*) 后面如果没有条件,或者条件用不上索引,都会引起 全表扫描的,也会引起 CPU 的大量运算
在 SQL SERVER 这里,和 CPU 有关的设置却很有限,主要在 sp_configure 下,常见的设置有 Priority Boost 和 Lightweight Pooling
而对于 执行计划的观察,利用 sys.dm_exec_cached_plans 视图 会比较方便直观的观察,是很有的。
解决办法:
1. 紧急处理时,可以重启Sql Server 的服务,当然,如果 DB 是在线的 DB ,请谨慎此操作。
2. 利用 Sql Server Profiler 来抓去语句,找出耗性能的SQL 语句,优化点。可以说,Sql 语句就好比 Sql server 的性能之匙,80 % 以上的 SQL SERVER 性能问题都是 SQL 语句引起的。
3. 根据 累计 使用 CPU 资源最多的语句 和 最经常 需要编辑的存储过程 来优化 语句 和存储过程。
–使用DMV来分析SQL Server启动以来累计使用CPU资源最多的语句。
例如下面的语句就可以列出前50名。
select
c.last_execution_time,c.execution_count,c.total_logical_reads,c.total_logical_writes,c.total_elapsed_time,c.last_elapsed_time,
q.[text]
from
(select top 50 qs.*
from sys.dm_exec_query_stats qs
order by qs.total_worker_time desc) as c
cross apply sys.dm_exec_sql_text(plan_handle) as q
order by c.total_worker_time desc
go