ベータ公開中

もう二度と、
SSHでの生存確認に時間を使わない。

機械学習などの長時間プロセスをリアルタイムで追跡。完了・失敗の通知と実行状況を、コード変更なしで一元管理。

Installation

curl
$ curl -fsSL https://github.com/kazuki-kanaya/obsern/releases/latest/download/install.sh | sh
user@machine:~

# 通常の実行

python train_model.py --epochs 100

# 一度だけ初期化 (generate obsern.yaml)

obsern init

# obsern でラップして実行

obsern run python train_model.py --epochs 100

HOW IT WORKS

SDK統合不要。軽量ですぐに使える。

既存コマンドをラップするだけ。数分で監視を始められます。

Obsern ダッシュボードのアニメーションデモ

The pain

Obsernがなぜ必要か?

SSHでプロセスを都度確認する運用は、完了の見逃しや異常終了の発見遅れを生みます。Obsernはその “待ち時間と手戻り” を減らし、運用の負担を軽減します。

サイレント停止

途中で止まっていたのに、気づいたのはかなり後だった。通知があれば、もっと早く動けたのに。

エラー原因の把握が遅い

異常終了しても、バックグラウンド実行のせいで原因は不明。Obsernなら、終了ステータスとエラー内容をすぐ確認できます。

マルチサーバーの混乱

どのサーバーで何が動いているのかわからない。複数ホストを横断して、実行状況とログを1画面で可視化します。

実行状況を、個人でもチームでも確実に把握。

  • コード変更不要

    既存コマンドを obsern でラップするだけ。SDK導入や計測コードは不要です。

  • 通知をすぐ受け取れる

    Webhook連携で、失敗や完了、実行ログの通知を Slack / Discord にすぐ送れます。

  • 統合ダッシュボード

    実行状況、ログ、実行サーバーをまとめて確認できます。エラーの原因特定もスムーズに。

  • チーム利用に最適

    ワークスペース共有、メンバー招待、owner/editor/viewer 権限管理で、チームでの運用を安全かつ明確に進められます。

Obsern dashboard preview
Slack notification showing a successful job run
Slack notification showing a canceled job run
Slack notification showing a failed job run

他ツールとの違い

実験メトリクスではなく、実行健全性の監視に主眼を置きます。

項目 Obsern MLflow TensorBoard
主な目的 実行監視 実験管理 学習メトリクス可視化
導入方法 CLIでラップ(コード変更なし) SDK組み込み SDK組み込み
監視対象 実行中のプロセス 実験ログ 学習ログ
異常終了の通知 即時通知(Slack等) 基本なし なし
監視スコープ 複数サーバー横断 プロジェクト単位 ローカル中心

今すぐバックグラウンドジョブを監視。

数分でセットアップできます。