13
sensuとその周辺のはなし Monitoring Casual #6 2014.6.12 ハッチ株式会社 Nobutoshi Ogata

sensuとその周辺のはなし

Embed Size (px)

Citation preview

Page 1: sensuとその周辺のはなし

sensuとその周辺のはなしMonitoring Casual #6

2014.6.12ハッチ株式会社

Nobutoshi Ogata

Page 2: sensuとその周辺のはなし

自己紹介• 尾形暢俊 a.k.a @nobu666

•    → ハッチ株式会社

• talentio というサービスを作っています

• 人材採用と求職活動のためのサービスです

• インフラエンジニア、といつつL4から上

Page 3: sensuとその周辺のはなし

talentioのサーバ構成概要

Direct Connect 踏み台 DB

memchached

DCAWS

ELBWWW

batch

sensu

Page 4: sensuとその周辺のはなし

入社してすぐの状態• メールも飛ばない状態のZabbix

• 設定を試みるがUIのダメさに心が折れる

• all-in-oneなのはいいんだけどなー

• なるべく少ない設定で死活監視入れたい

• かつ拡張性があるとなおよい

Page 5: sensuとその周辺のはなし
Page 6: sensuとその周辺のはなし

sensuのいいところ• clientの登録をしないでいい

• client.jsonに適当にattributesを追加して、sensu-serverで一括管理できる

• nagios pluginをパクれる

Page 7: sensuとその周辺のはなし

sensuのつらみ (1)

• No keep-alive… が消えてくれない

• どなたか解決方法をご存知でしたら教えて下さい…

Page 8: sensuとその周辺のはなし

sensuのつらみ (2)• イラっとする

• のでこうしました…$ cat /etc/init.d/sensu #!/bin/bash /etc/init.d/sensu-server $1 /etc/init.d/sensu-api $1

Page 9: sensuとその周辺のはなし

sensuでやってること• Health check

• process(http/mysql/batch)

• response(http)

• replication status(mysql/solr)

• disk usage, load ave.

• Notification

• mail

• slack

Page 10: sensuとその周辺のはなし

多少手を入れてる• backup用にいくつかのmysqlをmysqld_multiで集約してる

• check-mysql-alive.jsonにいちいち付け足すのがめんどいので、mysqld_multi reportとmy.cnfから監視対象を勝手に決めるように

• slack通知時 ```hogehoge``` としたかったので指定の文字列で囲めるようにpull request中

Page 11: sensuとその周辺のはなし

sensuでやってないこと• metricsの収集

• why?

• graphiteめんどい(単によくわかってない)

• es+kibanaは大げさな気がする

• いまはNewRelic使ってる

• agentのinstallとpluginのinstallがちょっとめんどい

• めんどいっつーかたまにsyntax errorとかでて動かない

• mackerelもちょっとお試し中

Page 12: sensuとその周辺のはなし

これからやりたいこと• ansible連携

• reloadだのrestartだののタイミングでalertが飛んでしまうので黙らせたい

• sensu-cliでできるのかな

• twilio + slack連携

• 深夜だとメールだけでは気づかないので電話鳴らしたい

• 電話に出てしまうと金かかるので、slackから電話とめる

• hubot + slack連携

• sensu-adminの画面からできることはslackからやれるようにしたい

Page 13: sensuとその周辺のはなし

ご静聴 ありがとうございました