Thanos部署实践与理解

笔者在此前文章中提到了Thanos的部署,里面主要提到了部署thanos receive和thanos query两个模块,部署完成之后,的确是可以查询数据,而且感觉响应速度还可以(毕竟数据量不大)。但是用了一段时间之后,发现了一个新的问题:

因为thanos最终将数据存放至对象存储系统中,所以本地只是缓存了近期一段时间内的数据。在具体使用thanos query 进行数据查询的时候发现只能查询最近15天左右的数据,此前的历史数据可以在对象存储系统中看到,确认是存在的,但是查询结果反馈是NO DATA。没有数据?why?

笔者重新看了Thanos 的架构图,我们可以看到,thanos 要想从对象存储系统中拿到数据,需要有thanos store这个模块,而我们没有部署,那自然就无法从对象存储系统中提取数据了。这也就理解了为什么只有最近15天左右的数据,因为这些数据是被缓存在thanos receive所在主机,无需连接对象存储系统。

既然已经找到了原因所在,那么我们就来解决这个问题,也就是启动Thanos store 模块,具体命令如下:

thanos store –data-dir /aiops/webMonitor/ –objstore.config-file /aiops/bucket.yml –http-address 192.168.1.12:19191 –grpc-address 192.168.1.12:10919

其中之后查询发现仍然无法查询15天之前的历史数据,这是怎么回事?莫慌,无妨,因为还需要修改一下thanos query,增加这个store,具体命令如下:

thanos query –http-address 192.168.1.12:19192 –grpc-address=192.168.1.12:10906 –store 192.168.1.12:10907 –store 192.168.1.12:10919

也就是将store的grpc 添加至thanos query 就可以了。

至此,重新测试发现可以查询任意时间段的历史数据了。因此问题解决。

正是在查看thanos receive 总体架构图的过程中,看到有 thanos compact模块,因此此处爷用上,具体命令如下:

thanos compact –wait –data-dir /tmp/thanos-compact –objstore.config-file=/aiops/bucket_compact.yml –http-address=”0.0.0.0:10992″ –retention.resolution-raw=0d –retention.resolution-5m=0d –retention.resolution-1h=0d

其中的/aiops/bucket_compact.yml 与/aiops/bucket.yml除了修改桶名,其他都一样。

————————————————
版权声明:本文为本人原创,转载请附上原文出处链接及本声明。
原文链接:http://laowubiji.com/index.php/2023/06/01/thanos_practice2/

此条目发表在智能运管分类目录,贴了, 标签。将固定链接加入收藏夹。

发表回复