红帽linux基础命令 IO监控iostat常见用法
更新时间: 2021-04-30 01:22
iostat -d -k 1 10 #查看TPS和吞吐量信息(磁盘读写速度单位为KB)
iostat -d -m 2 #查看TPS和吞吐量信息(磁盘读写速度单位为MB)
iostat -d -x -k 1 10 #查看设备使用率(%util)、响应时间(await)
iostat -c 1 10 #查看cpu状态
iostat -d -k 2
参数 -d 表示,显示设备(磁盘)使用状态;-k某些使用block为单位的列强制使用Kilobytes为单位;2表示,数据显示每隔2秒刷新一次。
Linux 3.10.0-957.el7.x86_64 (oracle10g) 2020年09月07日 _x86_64_ (4 CPU)
Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn
sda 2.52 75.41 10.11 396653 53175
scd0 0.00 0.20 0.00 1028 0
dm-0 2.19 69.22 7.18 364091 37774
dm-1 0.02 0.47 0.00 2460 0
输出信息的含义
tps:该设备每秒的传输次数(Indicate the number of transfers per second that were issued to the device.)。"一次传输"意思是"一次I/O请求"。多个逻辑请求可能会被合并为"一次I/O请求"。"一次传输"请求的大小是未知的。
kB_read/s:每秒从设备(drive expressed)读取的数据量;
kB_wrtn/s:每秒向设备(drive expressed)写入的数据量;
kB_read:读取的总数据量;
kB_wrtn:写入的总数量数据量;这些单位都为Kilobytes。
上面的例子中,我们可以看到磁盘sda与其它分区的统计数据,当时统计的磁盘总TPS是2.52,下面是各个分区的TPS。(因为是瞬间值,所以总TPS并不严格等于各个分区TPS的总和)
指定监控的设备名称为sda,该命令的输出结果和上面命令完全相同。
比如:iostat -d sda 2 默认监控所有的硬盘设备,现在指定只监控sda
[root@oracle10g ~]# iostat -d sda 2
Linux 3.10.0-957.el7.x86_64 (oracle10g) 2020年09月07日 _x86_64_ (4 CPU)
Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn
sda 2.33 69.10 9.51 396661 54612
iostat -d -x -k 1 10
[root@oracle10g ~]# iostat -d -x -k 1 10
Linux 3.10.0-957.el7.x86_64 (oracle10g) 2020年09月07日 _x86_64_ (4 CPU)
Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await r_await w_await svctm %util
sda 0.00 0.09 2.11 0.33 72.46 9.95 67.61 0.02 9.44 10.50 2.63 2.91 0.71
scd0 0.00 0.00 0.00 0.00 0.19 0.00 114.22 0.00 46.11 46.11 0.00 45.83 0.02
dm-0 0.00 0.00 1.71 0.41 66.51 7.14 69.31 0.02 10.77 12.73 2.60 3.29 0.70
dm-1 0.00 0.00 0.02 0.00 0.45 0.00 54.67 0.00 0.69 0.69 0.00 0.58 0.00
rrqm/s:每秒这个设备相关的读取请求有多少被Merge了(当系统调用需要读取数据的时候,VFS将请求发到各个FS,如果FS发现不同的读取请求读取的是相同Block的数据,FS会将这个请求合并Merge);wrqm/s:每秒这个设备相关的写入请求有多少被Merge了。
rsec/s:每秒读取的扇区数;
wsec/:每秒写入的扇区数。
rKB/s:The number of read requests that were issued to the device per second;
wKB/s:The number of write requests that were issued to the device per second;
avgrq-sz 平均请求扇区的大小
avgqu-sz 是平均请求队列的长度。毫无疑问,队列长度越短越好。
await: 每一个IO请求的处理的平均时间(单位是微秒毫秒)。这里可以理解为IO的响应时间,一般地系统IO响应时间应该低于5ms,如果大于10ms就比较大了。
这个时间包括了队列时间和服务时间,也就是说,一般情况下,await大于svctm,它们的差值越小,则说明队列时间越短,反之差值越大,队列时间越长,说明系统出了问题。
svctm 表示平均每次设备I/O操作的服务时间(以毫秒为单位)。如果svctm的值与await很接近,表示几乎没有I/O等待,磁盘性能很好,如果await的值远高于svctm的值,则表示I/O队列等待太长, 系统上运行的应用程序将变慢。
%util: 在统计时间内所有处理IO时间,除以总共统计时间。例如,如果统计间隔1秒,该设备有0.8秒在处理IO,而0.2秒闲置,那么该设备的%util = 0.8/1 = 80%,所以该参数暗示了设备的繁忙程度
。一般地,如果该参数是100%表示设备已经接近满负荷运行了(当然如果是多磁盘,即使%util是100%,因为磁盘的并发能力,所以磁盘使用未必就到了瓶颈)。
iostat还可以用来获取cpu部分状态值:
比如:
[root@oracle10g ~]# iostat -c 1 10
Linux 3.10.0-957.el7.x86_64 (oracle10g) 2020年09月07日 _x86_64_ (4 CPU)
avg-cpu: %user %nice %system %iowait %steal %idle
0.10 0.00 0.25 0.19 0.00 99.46