• Soy EmplIAdo
  • Posts
  • OpenAI hace “humanas” las apps de voz (por fin)

OpenAI hace “humanas” las apps de voz (por fin)

Llega GPT-realtime con la Realtime API en disponibilidad general: voz natural, llamadas telefónicas vía SIP, entrada de imágenes durante la conversación y más.

In partnership with

Leer en nuestro sitio web / Tiempo de lectura para hoy: 10 minutos 

Practical AI for Business Leaders

The AI Report is the #1 daily read for professionals who want to lead with AI, not get left behind.

You’ll get clear, jargon-free insights you can apply across your business—without needing to be technical.

400,000+ leaders are already subscribed.

👉 Join now and work smarter with AI.

Hola, emplIAdos.

Antes de la clase, alerta rápida de privacidad: Anthropic cambió su política y, desde el 28 de septiembre de 2025, usará tus chats para entrenar modelos a menos que optes por salir en ajustes (antes era “opt-in”).

Si prefieres no compartir, entra a Settings → Help improve Claude y desactívalo; el servicio sigue funcionando igual. Revisa también sus nuevos Términos.

Lanza tu primera app de voz con gpt-realtime

OpenAI liberó gpt-realtime y puso su Realtime API en GA con mejoras clave: modelo de habla a habla más avanzado, SIP para contestar teléfonos reales, entrada de imágenes en mitad del diálogo, y soporte nativo para MCP/Connectors (agenda, CRM, etc.) sin “pegamento” extra. Además, bajó precios a US$32/1M tokens de audio de entrada y US$64/1M de salida (≈20% menos que el preview), lo que en ritmos de conversación habituales se traduce en ≈ US$0,75 por hora como referencia.

Tu plan en 6 pasos (copiar/pegar)

  1. Prueba rápida en el Playground
    Abre el Playground de Realtime, elige una voz y define el “rol” del agente (recepción, soporte o ventas). Comprueba latencia y naturalidad (interrupciones a mitad de frase, risas/suspiros).

  2. Crea tu sesión Realtime (Websocket o WebRTC)
    Sigue la guía oficial; define endpointing (detección de turnos), barge-in (interrumpir al modelo) y callbacks para herramientas. Mantén logs de intentos, errores y tiempos de respuesta.

  3. Conecta herramientas con MCP/Connectors
    Añade un conector a tu Calendario (Google/Outlook) y a tu CRM. Con MCP (el “USB-C” de los agentes) puedes sumar/retirar herramientas sin tocar el prompt. Empieza con: calendar.createEvent, crm.lookupContact.

  4. Activa teléfono real (SIP)
    Si quieres que atienda llamadas: configura SIP hacia la Realtime API (ej.: Twilio Media Streams, Voximplant u otro PBX). Prueba una llamada externa y valida eco/latencia.

  5. Prompting de producción
    Usa la Realtime Prompting Guide: define rol, objetivo, tono y reglas (p. ej., no inventar políticas; pedir confirmación antes de agendar). Añade fallbacks (“no entendí, ¿puedes repetir?”) y protocolo de escalado a humano.

  6. Costeo y límites
    Estima consumo con el nuevo pricing (audio in/out); controla duración por llamada y resume antes de respuestas largas. Ajusta silence timeouts para evitar “habla de más”.

Links que vas a necesitar

  • Blog/Anuncio: gpt-realtime + novedades (SIP, imágenes, MCP, GA).

  • Docs Realtime API (cómo iniciar sesiones, audio bidireccional).

  • Guía de prompting Realtime (plantilla de sistema lista).

  • MCP/Connectors (cómo enchufar calendario/CRM).

  • Precios (tabla actualizada).

Microsoft presentó MAI-Voice-1 (modelo de voz propio) y MAI-1-preview; Meta anunció NPCs con LLM para Horizon Worlds; Agility Robotics publicó avances de control para su humanoide Digit. Señales de que voz + agentes + mundo físico avanzan en paralelo.

Nota de contexto (opcional en “Hoy en IA”)

Cosas que deberías probar hoy

  1. Krea – video en tiempo real (lista de espera): Convierte un boceto, un prompt o tu webcam en video en tiempo real (12+ fps) con coherencia de estilo y movimiento. Útil para prototipar anuncios, motion y reels sin renders eternos. → Únete a la waitlist. krea.ai

  2. Air (busca por “lo que hay en tu contenido”): Gestor creativo que indexa objetos, colores, rostros y diálogos para buscar cosas tipo “vestido rojo” o “Juan hablando” sin abrir carpetas. → Air | Cómo busca.

“Las 33 startups de IA en EE.UU. que ya levantaron $100M+ en 2025” (para mapear proveedores/aliados). → TechCrunch.

Bonus lectura

Recomendación de hoy

Pensamientos ContrariosSomos una comunidad de Rebeldes del Pensamiento que cuestiona lo establecido, porque sabemos que «Las ideas cómodas no cambian nada». Aquí pensamos distinto, aunque incomode.

DE NUESTROS SOCIOS.

Los Mejores Prompts del Mercado.

Con God Of Prompts encontrarás los mejores prompts para todo lo que quieras y crear tus mejores órdenes para que ChatGPT y otras plataformas de IA funcionen para ti.

Ventas, productividad, ideas… todo lo tienes con God of Prompts.

Abre tu cuenta y te impresionarás de todo lo que hay dentro.

Puedes abrir tu cuenta gratis, pero si decides adquirir uno de los planes Premium usa este cupón y obtén 10% de descuento: INNOVAITE

Lo Más Caliente

  1. Microsoft lanzó MAI-Voice-1 (impulsa Copilot Daily/Podcasts y llega a Copilot Labs); además, MAI-1-preview se está probando públicamente en LMArena con acceso limitado por solicitud. → Blog MS / LMArena.

  2. Meta permitirá crear NPCs con IA para Horizon Worlds (conversaciones realistas y herramientas en el Worlds Desktop Editor). Oportunidad para experiencias de marca/juego. humanaigc.github.iohuggingface.co

  3. Copilot llega a TVs Samsung 2025: Pide con voz recomendaciones, recaps sin spoilers y consultas en pantalla (gratuito en modelos 2025). → Microsoft + Samsung.

  4. Agility Robotics: Entrenó un “corteza motora” en simulación para que Digit camine, se equilibre y manipule objetos desde prompts; paso clave hacia robots generalistas.

Consejo del Día

Domina Rows AI para análisis y reportes en minutos

Rows es una hoja de cálculo moderna con IA integrada (prompts, funciones AI, conectores) ideal para growth marketers y PMs. Este tutorial se basa en este video práctico en español (te lo recomiendo ver completo) y la guía oficial de Rows.

Objetivo

Crear en 30–45 min un tablero que:
a) trae datos (CSV/URL/API),
b) limpia y enriquece con IA,
c) arma gráficos y un reporte compartible (link o embed).

Paso a paso

  1. Crea el archivo y trae datos

    • Entra a Rows → New spreadsheet.

    • Import un CSV de ventas o pega una URL (p. ej., hoja pública de Google Sheets) desde Insert → Import.

    • Tip: si tu fuente es dinámica (p. ej., una API o un Google Sheet), habilita Refresh para actualizar cada X horas.

  2. Limpia columnas con IA (sin fórmulas complejas)

    • Agrega una columna “Categoría (IA)” y usa AI() con un prompt claro:

      =AI("Clasifica este producto en {Electrónicos, Moda, Hogar}: " & [@Nombre])

    • Para normalizar ciudades/países, usa otro AI() con reglas (“responde solo con el país ISO-2”).

  3. Enriquece texto (copy para ecommerce o ads)

    • Genera descripciones o bullet points desde la ficha del producto:

      =AI("Escribe 3 bullets de venta (tono cercano, 90-120 caracteres) para: " & [@Nombre] & " - " & [@Características])

    • Crea UTMs con una plantilla + AI para el headline según audiencia.

  4. Consultas en lenguaje natural (tablas nuevas)

    • Abre la AI Sidebar y pide: “Crea una tabla con ventas por país y mes (YYYY-MM), ordena desc, limita a top-10.”

    • Rows generará el query/tabla y podrás editar el prompt si faltó algo.

  5. KPIs y visualizaciones

    • Inserta Charts (línea para tendencia, barras para top-10, circular solo si es inevitable).

    • Crea una hoja “Dashboard” con: Ingresos totales, AOV, CAC estimado, % conversión (si tienes sesiones).

  6. Automatiza el reporte

    • Programa Refresh y Share → Public link para enviar a stakeholders (o Embed en Notion/tu web).

    • Activa Comments para feedback en contexto (como Figma, pero en tu planilla).

Plantilla de prompts (copia/pega)

  • Clasificación:
    “Clasifica el siguiente producto en {Electrónicos, Moda, Hogar}. Responde solo con una de esas tres opciones. Producto: ”

  • Resúmenes ejecutivos:
    “Resume en 120 palabras los hallazgos clave de esta tabla para un CMO. Enfatiza oportunidades de crecimiento y riesgos.”

  • Limpieza de texto:
    “Normaliza este país al código ISO-2. Si no hay país, devuelve ‘NA’.”

Checklist de calidad

  • Campos críticos sin vacíos (IDs, fechas, montos).

  • Gráfica legible (≤3 colores dominantes, etiquetas claras).

  • Prompt determinista (listas cerradas, formato esperado).

  • Compartido con permisos correctos (view vs. edit).

Tendrás un tablero vivo que el equipo puede consultar sin pedirte “la última versión”.

Resultado
Ingresos Pasivos InteligentesEste boletín va de estrategias e ideas INCREIBLES para construir Ingresos Pasivos Inteligentes.

¿Te sirvió? Sube al Soy EmplIAdo PRO

  • Videos paso a paso de cada herramienta.

  • Prompts para copiar‑pegar.

  • Una sesión en vivo al mes con nuestro director.

La modalidad gratuita continúa, pero la PRO multiplica tu productividad. Únete aquí y transforma cada PDF ladrillo en resultados tangibles.

Conclusión

Esta semana el tema central fue apps de voz realistas y útiles (OpenAI Realtime + SIP), que ya compiten con IVRs tradicionales y cambian la manera en que atendemos clientes por teléfono. Alrededor de eso, el ecosistema se mueve rápido: MAI-Voice-1 empuja a Microsoft, NPCs de Meta abren nuevas experiencias, Codex acelera a los equipos de ingeniería, y Copilot en TVs lleva la IA a la pantalla grande del hogar.

En herramientas prácticas, desde Krea hasta Air, pasando por Wan-S2V y Letta, tienes piezas para prototipar más rápido, operar con memoria y producir mejor contenido. Y con el tutorial de Rows AI, quedas listo para transformar datos en decisiones compartibles en minutos.

La meta: menos fricción, más impacto medible en FRT, % resolución, bookings y CSAT. Nos leemos en la próxima —y cuéntanos qué flujo activaste primero.

Nos vemos mañana con una nueva edición.

Arthur quiere conocer tu opinión del Boletín de hoy.

Iniciar Sesión o Suscríbete para participar en las encuestas.

Reply

or to participate.