2 負(fù)責(zé) k8s 環(huán)境的 prometheus 監(jiān)控,普通環(huán)境的 prometheus 的搭建與監(jiān)控
3 使用 ELK 配合研發(fā)定位問(wèn)題
4 阿里" />
1 負(fù)責(zé) zabbix 監(jiān)控系統(tǒng)的搭建維護(hù) (基于 docker)
2 負(fù)責(zé) k8s 環(huán)境的 prometheus 監(jiān)控,普通環(huán)境的 prometheus 的搭建與監(jiān)控
3 使用 ELK 配合研發(fā)定位問(wèn)題
4 阿里云線(xiàn)上環(huán)境維護(hù),k8s 環(huán)境維護(hù)
5 書(shū)寫(xiě) shell 自動(dòng)化腳本 (對(duì)數(shù)據(jù)庫(kù)主從,redis,nginx,mq 等中間件監(jiān)控,輸出對(duì)程序的 JVM 監(jiān)測(cè)指標(biāo)等)
6 阿里云運(yùn)維,阿里云新技術(shù)探索,阿里云 VPC 網(wǎng)絡(luò)設(shè)計(jì),OSS,阿里云數(shù)據(jù)遷移,阿里云容器化環(huán)境構(gòu)建。設(shè)
計(jì)從研發(fā)到生產(chǎn)基于 CI/CD 流水線(xiàn)
7 devops 自動(dòng)化發(fā)布
8 ansible 等工具的使用
9 基于 gitlab,jenkins,ansible 實(shí)現(xiàn)智慧出行平臺(tái)(私有云)版本發(fā)布。
10 各種服務(wù)搭建 (nginx 負(fù)載均衡,redis 集群,哨兵,jenkins master/slave)
11 軟件調(diào)優(yōu)(各中間件的參數(shù)修改調(diào)優(yōu))
12 協(xié)助網(wǎng)絡(luò)故障排查
13 會(huì)python,會(huì)運(yùn)維開(kāi)發(fā),曾寫(xiě)過(guò)監(jiān)控程序狀態(tài),若端口不存在那么應(yīng)用重啟。監(jiān)控服務(wù)器狀態(tài)等
硬件配置:
1.4 核 16G 作為監(jiān)控主機(jī)
2.架構(gòu)說(shuō)明:
1)在監(jiān)控端部署一臺(tái) centos 的 docker 容器作為頁(yè)面訪問(wèn)入口和 zabbix-server
2)部署一個(gè) mysql 作為數(shù)據(jù)存儲(chǔ)
3)自動(dòng)化腳本每日凌晨執(zhí)行清除 mysql 歷史數(shù)據(jù)(保留一個(gè)月),與清除服務(wù)端產(chǎn)生的 log 日志
監(jiān)控方式:
orabbix 作為監(jiān)控中間件監(jiān)控 oracle 數(shù)據(jù)庫(kù)
監(jiān)控其他應(yīng)用機(jī)器采用主動(dòng)模式
1。mysql 的 zabbix 庫(kù)升級(jí),此次從原來(lái)搭建的 3 版本升級(jí)到 4 版本
2。原來(lái)宿主機(jī)上部署的 zabbix3,改造成基于 docker 的部署方式
3。變被動(dòng)模式為主動(dòng)模式 減小了 server 端的壓力
4。對(duì)數(shù)據(jù)庫(kù)的歷史數(shù)據(jù)控制 每天定時(shí)執(zhí)行刪除歷史數(shù)據(jù)任務(wù) (保留近期一個(gè)月數(shù)據(jù))
5。優(yōu)化了聚合圖形 增加了一些新的監(jiān)控功能
1.一個(gè)線(xiàn)程監(jiān)聽(tīng)一個(gè)應(yīng)用程序的進(jìn)程端口。如果發(fā)現(xiàn)不存在,那么重啟應(yīng)用,重啟成功(只重啟一次),如果重啟沒(méi)成功,該線(xiàn)程阻塞。 2.查詢(xún)出上月指定數(shù)據(jù)后存成xls文件
查詢(xún)出上月指定數(shù)據(jù)后存成xls文件,之后對(duì)數(shù)據(jù)庫(kù)數(shù)據(jù)進(jìn)行刪除操作,目前用到庫(kù)為pymysql,datetime,xlwt,pandas