No-bot
Bot を会議に呼ばずに AI 議事録を取る方法
問題は Bot にある。ノートは Bot を必要としない。
2020 年、「AI 議事録」とは Bot が通話に参加することだった。2026 年、もはやそうである必要はない。技術面(一般 OS でのシステム音声キャプチャが信頼できる水準になった)と文化面(顧客が Bot に気づき押し返し始めた)の両方で潮目が変わった。本稿は実践版だ。Bot が今や負債である理由、デバイス上録音の実際の仕組み、そして「第三者を会議に入れずに」AI 議事録を成立させるための具体的なスタックを示す。
なぜ会議 Bot は「コストゼロ」ではなくなったのか
- 見え方 — 「Otter has joined the meeting」はあなたの見込み客の第一印象になる。望まなかったブランド露出であり、あなたのプロダクトが繊細さを欠くという静かな投票だ。
- セキュリティ — 会議 Bot はあなたのライブ会話を録音する SaaS だ。規制業界(金融、医療、防衛、法務)では禁止が広がっている。規制外の買い手でさえ「あなたの AI アシスタントが自分のピッチに第三者として参加しているのはなぜか」と問う。
- プラットフォーム制限 — Zoom Phone、規制テナントの MS Teams、多くのエンタープライズ Google Workspace は、サードパーティ録音を能動的に遮断する。
- 気まずさ — Bot が参加者グリッドに並ぶと、冗談は止まり、反論は止まり、会議はより演技じみたものになる。
- 同意 — Bot の録音は録音ベンダーのサーバー上にある。すると、同意はあなたと相手の問題ではなくベンダーの問題に化ける。
「デバイス上」とは具体的に何か
デバイス上での会議キャプチャは、ホストマシンで 2 つの音声ストリームを記録する。システム音声(スピーカーから聞こえるすべて)とマイク音声(あなたの声)だ。両ストリームはローカルでミックスされ、文字起こしエンドポイントへストリーミングされる。会議そのものには何も参加しない — 録音はあなたのコンピュータ上に存在する。ノート PC のスクリーン録画があなたのコンピュータ上に存在するのと同じだ。
仕組みは OS によって違う。macOS 13 以降では Apple の ScreenCaptureKit が、ドキュメント化された API を通じてシステム音声を露出する(ユーザの明示的な許可付き)。Windows 10 以降では WASAPI ループバックキャプチャが同じものを提供する。どちらも初回に一度の許可付与が必要で、本質的に「単一参加者の操作」だ — キャプチャを走らせている端末だけが音声を持ち、会議内の他者は持たない。
誰も語らないトレードオフ
自分が実際に参加している会議しか録音できない
Bot は、所有者が招待されているが参加していない会議にも入れる。デバイス上はそうはいかない — あなたのノート PC が通話に居る必要がある。ほとんどのワークフローではこれは正しい振る舞いだが(参加していない会議を録音すべきではない)、Fireflies が強く打ち出してきた「AI を代わりに聞かせる」パターンは選べなくなる。
帯域とストレージは自分側に乗る
音声ストレージのコストはローカルで負担する(無圧縮で ~10MB/分、圧縮で ~1MB/分)。会議の多い一週間で数百メガバイトに達する。多くのツール(Reline 含む)はバックアップとしてクラウドへ同期するが、生の音声はまずあなたのディスクに住む。
プラットフォームからのアイデンティティ信号なしでの話者識別は難しい
Bot は参加者グリッドを読める — 「Sarah が話している」と分かる。デバイス上では音声だけから話者ダイアリゼーションを行う必要がある。品質はかなり上がった(我々は 、競合は Deepgram や AssemblyAI を使う)が、無料ではない — およそ 200ms のレイテンシが加わり、話者同士の声の高さや音色が十分に異なる必要がある。
実際に望ましいデバイス上スタック
- ドキュメント化された OS の音声 API を経由したキャプチャ(macOS は ScreenCaptureKit、Windows は WASAPI ループバック)。カーネル拡張や VB-Audio Cable 系のハックは避ける — OS のアップデートのたびに壊れる。
- ストリーミング文字起こしプロバイダ — 、Deepgram、AssemblyAI、または極端に慎重な環境ではデバイス上で動作する Whisper。ストリーミングならライブキャプション、バッチなら最終文字起こしが得られる。
- 話者ダイアリゼーション — ほとんどのプロバイダが同梱する。レイテンシのコストは ~200ms。
- 要約レイヤー — 実際の要約には Claude 4.x や GPT-4.x を用いる。どれを選ぶにせよ、引用付き出力(各主張を裏付ける文字起こしセグメントへのリンク)を必須にする。
- ストレージと同期 — ノートはクラウド同期、長期保管が必要なら音声は S3 級のオブジェクトストレージへ。
- 共有レイヤー — 明示的な権限を採用すること。「リンク共有」では team-of-N 問題が必ず生まれる。
なぜ Reline は Bot 不使用というカテゴリーを実装したのか
AI ノート系のあらゆる他のツールが、(a) Bot を出して上記コストを受け入れる、(b) ソロユーザー向けのノートに留まる、のいずれかにコミットしていたから、我々は Reline を作った。第三の選択肢があると考えたのだ — Bot 不使用でありながら、Bot が SaaS であることで歴史的に獲得してきたチーム向けプリミティブ(権限、共同編集、RAG チャット)も備える、という方向だ。2026 年のインフラはその両立を可能にする。デバイス上で取り込み、ノートをチームのワークスペースへ同期し、音声は録音者の制御下に留め置く。
それでも Bot が要る場面
正直な答え:必要なときだ。参加できない会議を録音しなければならないなら、Bot は唯一の選択肢だ。会議プラットフォームが API アクセス付きの公式クラウド録音をサポートしており(Zoom Enterprise、一部の Teams テナント)、セキュリティチームが承認しているなら、Bot が最短経路になり得る。それ以外 — とりわけセキュリティに敏感な買い手に売っている人 — にとっては、2026 年では「Bot 不使用」がより良いデフォルトだ。
よくある質問
よくあるご質問
- Reline はどうやって会議に参加せず録音するのか?
- macOS(ScreenCaptureKit)と Windows(WASAPI ループバック)のドキュメント化されたシステム音声 API を用いる。参加者の 1 人が Reline に一度だけ許可を与えれば、以降はマシンが再生するものを Reline がキャプチャする。会議プラットフォームには Reline の参加者として何も映らない。
- 相手は録音されていることに気づくか?
- あなた次第だ。Reline は相手側に自身を告知しないが、録音の同意ルールは管轄によって異なる(米国の two-party consent 州では開示が必要)。我々は相手に伝えることを推奨する — ほとんどの相手は事前の一言を歓迎するし、慣行としても望ましい。
- Zoom / Google Meet / Microsoft Teams / 電話で動くか?
- はい — Reline はスピーカーから流れる音とマイクが拾う音を録るので、会議プラットフォームに依存しない。ブラウザベースの電話システム(Aircall、Dialpad、RingCentral)も同様だ。
- 録音はどこに保管されるか?
- まずローカル(録音したマシン)、次に暗号化されたクラウドストレージへ同期する。他のデバイスからもノートにアクセスできる。Professional と Enterprise プランでは地域別のデータローカリティを設定できる。
- 自分が参加していない会議を録音できるか?
- できない — Bot 不使用の録音は本質上、自分がその会議にいることを要求する。参加せずに録音する必要があるなら、Bot を使うツールが唯一の選択肢だ。