业务系统中RDS的mysql的空间捉襟见肘时就会想起来需要做一下容量的统计和趋势监控 实施的方案是:

定时用python从mysql的information_schema库中的TABLES表中抽取DATA_LENGTH+INDEX_LENGTH的数据以及DATA_FREE的数据来做统计项 将数据抽取到influxDB中备查

核心的查询语句:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
        # 1048576 字节 等于 1MB
        # 监控门槛:
        # DATA_FREE>= 6MB (可优化空间大于6MB)
        # TABLE_ROWS>= 100k (10万行以上)
        # DATA_LENGTH>= 20MB (数据空间占用大于20MB)
        # INDEX_LENGTH>= 20MB (索引空间占用大于20MB)
        # `TABLE_SCHEMA` IN ('{"','".join(self.check_dbs)}')
        sql = f""" SELECT `TABLE_SCHEMA`,`TABLE_NAME`, CONCAT_WS('.',`TABLE_SCHEMA`,`TABLE_NAME`) AS DBTABLENAME,
(`DATA_FREE`/1048576) AS free_len_mb,
(`DATA_LENGTH`+ `INDEX_LENGTH`)/1048576 AS row_len_mb,
(`TABLE_ROWS`/1000) AS rows_kb ,
(`DATA_LENGTH`/1048576) AS dat_len_mb,
(`INDEX_LENGTH`/1048576) AS idx_len_mb
FROM `information_schema`.`TABLES` WHERE
`TABLE_SCHEMA` IN ('{"','".join(self.check_dbs)}')
AND (`DATA_FREE`>=6291456 OR TABLE_ROWS >= 100000 OR DATA_LENGTH>=20971520 OR INDEX_LENGTH>=15728640 )
ORDER BY free_len_mb DESC,row_len_mb DESC,dat_len_mb DESC,idx_len_mb DESC, `TABLE_SCHEMA` ASC,`TABLE_NAME` ASC
"""

然后单行的influxdb的表结构:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
    tsdb_item_record = {
        'measurement': 'dbtable_stats',
        'tags': {
            'db': db,
            'table':table,
            'dbtable':dbtable,
        },
        'time': f'{utcnow.strftime("%Y-%m-%dT%H:%M:%S")}Z',
        'fields': {
            'free_len_mb':free_len_mb,
            'row_len_mb':row_len_mb,
            'rows':rows_kb,
            'dat_len_mb':dat_len_mb,
            'idx_len_mb':idx_len_mb
        }
    }

这样在influxdb中我们就有了每个埋点间隔下统计的数据信息,接下来在grafana中可以用InfluxDB的查询函数统计出对应的信息并展示图表

按时间查询各个表的空间占用(数据+索引)的增长量:

1
SELECT cumulative_sum(difference(mean("row_len_mb"))) FROM "dbspace_watches_rp"."dbtable_stats" WHERE $timeFilter GROUP BY time(5m), "dbtable" fill(null)

再加上一下查询起始时的值就是当下的总数据量的表数据空间排名:

1
SELECT first("row_len_mb") + cumulative_sum(difference(mean("row_len_mb"))) FROM "dbspace_watches_rp"."dbtable_stats" WHERE $timeFilter GROUP BY time(5m), "dbtable" fill(null)

image-20200826173247724

同理也可以得到库表的DATA_FREE也就是可优化空间的增长量和排名在此不再赘述 另外提一句,mysql在做optmize释放空间的时候会锁表,所以还是在业务空闲期做这些释放空间的活比较好

另外可以顺便求一下倒数得到查询时间区间内的各表的增长率,方便发现特别高增长的表做对应的优化

1
SELECT derivative(cumulative_sum(difference(mean("row_len_mb"))), 10m) FROM "dbspace_watches_rp"."dbtable_stats" WHERE $timeFilter GROUP BY time(1h), "dbtable" fill(null)