No-bot

Cómo tomar notas de reunión con IA sin que un bot entre en tu llamada

El bot es el problema. El bloc de notas no necesita uno.

Reline Team 24 de mayo de 2026

En 2020, «notas de reunión con IA» significaba que un bot entraba en tu llamada. En 2026, ya no tiene por qué. El cambio es técnico (la captura de audio del sistema en sistemas operativos de consumo se volvió fiable) y cultural (los clientes empezaron a notar el bot y a rechazarlo). Este artículo es la versión práctica: por qué un bot es ahora una desventaja, cómo funciona de verdad la grabación en el dispositivo y el stack exacto para tomar notas de reunión con IA sin que un tercero entre en tu reunión.

Por qué el bot de reunión dejó de ser gratis

  • Imagen — «Otter se ha unido a la reunión» es la primera impresión de tu prospecto. Es un momento de exposición de marca al que no se apuntó y un voto silencioso en contra de que tu producto sea cuidadoso.
  • Seguridad — todo bot de reunión es un grabador SaaS de tu conversación en vivo. Las industrias reguladas (finanzas, salud, defensa, legal) lo prohíben cada vez más. Incluso los compradores no regulados preguntan por qué tu «asistente de IA» es un participante externo en su pitch.
  • Bloqueos de plataforma — Zoom Phone, MS Teams en algunos tenants y muchos Google Workspaces enterprise bloquean activamente a los grabadores externos.
  • Incomodidad — el bot está en la cuadrícula de participantes. La gente deja de bromear, deja de discrepar, y la reunión se vuelve más performativa.
  • Consentimiento — la grabación del bot está en los servidores del proveedor del grabador, lo que significa que el consentimiento es una cuestión del proveedor, no una cuestión entre tú y ellos.

Qué significa de verdad «en el dispositivo»

La captura de reuniones en el dispositivo graba dos flujos de audio desde la máquina anfitriona: el audio del sistema (todo lo que oyes por tus altavoces) y tu micrófono (tu voz). Los dos flujos se mezclan y se transmiten a un endpoint de transcripción. Nada entra en la reunión en sí — la grabación existe en tu ordenador, igual que una grabación de pantalla de tu portátil existe en tu portátil.

El mecanismo varía según el SO. En macOS 13+, ScreenCaptureKit de Apple expone el audio del sistema mediante una API documentada (con el permiso explícito del usuario). En Windows 10+, la captura loopback de WASAPI expone lo mismo. Ambos requieren un único permiso la primera vez, y ambos son inherentemente una operación de un solo participante — solo el dispositivo que ejecuta la captura tiene el audio, nadie más en la reunión lo tiene.

Las concesiones que nadie menciona

Solo puedes grabar reuniones en las que realmente estás

Un bot puede entrar en reuniones a las que su dueño está invitado pero no asiste. En el dispositivo no — tu portátil tiene que estar en la llamada. Para la mayoría de los flujos esto es correcto (no deberías capturar reuniones a las que no asististe), pero descarta el patrón de «envía a mi IA a escuchar» que Fireflies promociona con fuerza.

El ancho de banda y el almacenamiento viven contigo

Pagas el coste de almacenamiento del audio localmente (sin comprimir: ~10MB/min; comprimido: ~1MB/min). En una semana larga de reuniones eso son unos pocos cientos de megabytes. La mayoría de las herramientas (Reline incluida) sincronizan con la nube para respaldo, pero el audio en bruto vive primero en tu disco.

La atribución de hablantes es más difícil sin señal de identidad de la plataforma de reunión

Un bot puede leer la cuadrícula de participantes: «esta es Sarah hablando». En el dispositivo hay que hacer la diarización de hablantes solo a partir del audio. La calidad de la diarización se ha vuelto muy buena (usamos; los competidores usan Deepgram o AssemblyAI) pero no es gratis — añade ~200 ms de latencia y requiere que los hablantes difieran lo suficiente en tono/timbre.

El stack en el dispositivo que de verdad quieres

  1. Captura de audio del SO mediante la API documentada (ScreenCaptureKit en macOS, loopback de WASAPI en Windows). Evita las extensiones de kernel / los hacks de VB-Audio Cable — se rompen en cada actualización del SO.
  2. Proveedor de transcripción en streaming —, Deepgram, AssemblyAI o Whisper ejecutándose en el dispositivo para configuraciones paranoicas. El streaming te da subtítulos en vivo; el batch te da transcripts finales.
  3. Diarización de hablantes — la mayoría de los proveedores la incluyen; el coste de latencia es de ~200 ms.
  4. Capa de summarización — Claude 4.x o GPT-4.x para el resumen en sí. Elijas el que elijas, exige una salida respaldada por citas (que enlace con el segmento del transcript que justifica cada afirmación).
  5. Almacenamiento + sincronización — sincronización en la nube para la nota, almacenamiento clase S3 para el audio si necesitas retención a largo plazo.
  6. Capa de compartición — permisos explícitos, no «enlace para compartir» (eso es lo que crea el problema del equipo de N).

Por qué Reline lanzó la categoría sin bot

Construimos Reline porque todas las demás herramientas de la categoría de blocs de notas con IA se habían comprometido con una de dos opciones: (a) lanzar un bot y aceptar los costes anteriores, o (b) lanzar un bloc de notas solo para usuarios en solitario. Pensábamos que había una tercera opción — sin bot, pero con las primitivas de equipo (permisos, colaboración, chat RAG) que los bots habilitaban históricamente por ser un SaaS. La infraestructura existe en 2026 para hacer ambas cosas: capturar en el dispositivo, sincronizar la nota con un espacio de equipo, mantener el audio bajo el control de quien graba.

Cuándo deberías seguir usando un bot

Respuesta honesta: cuando no te queda otra. Si tu flujo requiere grabar una reunión a la que no puedes asistir, un bot es tu única opción. Si tu plataforma de reunión es una de las pocas que admite grabación oficial en la nube con acceso por API (Zoom enterprise, ciertos tenants de Teams), y tu equipo de seguridad lo ha aprobado, un bot puede ser el camino más fácil. Para todos los demás — y en especial para quien vende a compradores conscientes de la seguridad — sin bot es el mejor valor por defecto en 2026.

Preguntas frecuentes

Preguntas comunes

¿Cómo graba Reline sin entrar en la reunión?
Usamos la API documentada de audio del sistema en macOS (ScreenCaptureKit) y Windows (loopback de WASAPI). Un participante concede permiso a Reline una vez; a partir de ahí, Reline captura lo que reproduce la máquina. La plataforma de reunión nunca ve un participante de Reline.
¿Sabrá mi cliente que estoy grabando?
Eso depende de ti. Reline no se anuncia al otro lado, pero las reglas de consentimiento de grabación varían según la jurisdicción (los estados de EE. UU. con consentimiento de dos partes exigen divulgación). Aun así recomendamos avisar a tus interlocutores — la mayoría agradece el aviso y es buena práctica.
¿Funciona Reline en Zoom, Google Meet, Microsoft Teams y llamadas telefónicas?
Sí — Reline graba lo que tu ordenador reproduce por los altavoces y lo que oye tu micrófono. La plataforma de reunión es irrelevante. Lo mismo para los sistemas telefónicos basados en navegador (Aircall, Dialpad, RingCentral).
¿Dónde se almacena mi audio?
Primero local (en la máquina que lo grabó), luego sincronizado a almacenamiento cifrado en la nube para que puedas acceder a las notas desde otros dispositivos. Puedes configurar la localidad regional de los datos en los planes Professional y Enterprise.
¿Puedo grabar reuniones a las que no asisto?
No — la grabación sin bot requiere inherentemente que estés en la reunión. Si necesitas grabar reuniones a las que no puedes asistir, una herramienta basada en bot es tu única opción.

Listo cuando tú lo estés

Deja de tomar notas.
Empieza a entregar resultados.

Pruébalo gratis. Cinco minutos para instalar. Tu primera transcripción ya te está esperando.