voz natural multi-idioma
español neutro, mexicano, argentino, español de españa, inglés, portugués. tts vía openai o cartesia. el cliente no nota que es ia los primeros 30 segundos.
agente de ia que contesta tus llamadas 24/7, agenda citas en tu calendar, consulta tu knowledge base y transfiere a humano cuando hace falta. lo que costaba un recepcionista nocturno, ahora a $0.16/min — o flat $97/mes con ai employee.
voice ai de ghl no es solo "un bot que atiende". es un agente conectado a tu crm, calendar, workflows y knowledge base. todo en un solo dashboard.
español neutro, mexicano, argentino, español de españa, inglés, portugués. tts vía openai o cartesia. el cliente no nota que es ia los primeros 30 segundos.
subes urls, pdfs, faqs, listas de precios. el agent las consulta en tiempo real durante la llamada. cualquier cambio en la kb se refleja al instante sin retraining.
integración nativa con calendarios de ghl. el agent ve los huecos disponibles, propone, confirma y crea la cita. cliente cuelga con cita confirmada + email + sms recordatorio.
definís keywords ("hablar con persona", "agente real", "no entiendo") y el agent transfiere la llamada al teléfono que vos digas. también por intent — ej: si menciona "cancelar" → transfiere a soporte.
al colgar, el agent dispara workflows: tag al contacto, mover oportunidad, enviar email de resumen, asignar a sales rep, generar nota en crm. todo lo que pasa después se automatiza.
cada llamada queda grabada, transcrita y resumida con ia. lo ves en el contacto del crm. útil para qa, training, dispute resolution. exportable a csv.
la pregunta más común: "¿cuánto me sale?". desglose honesto. la suma de todo: ~$0.16/min en setup standard. con ai employee unlimited ($97/mes flat) cancelás el metering del engine + tts.
ejemplo real: dentista con 100 calls/mes promedio 4 min = 400 min × $0.16 = $64/mes en voice ai. con ai employee unlimited ($97/mes), el voice ai inbound es flat — solo pagás llm tokens (~$30-40) + twilio (~$15). total ~$140-150/mes para automatizar el 100% de la recepción telefónica.
de cero a voice ai contestando llamadas reales. el bottleneck no es la tecnología — es cargar buena knowledge base. dale tiempo a ese paso.
en tu agency settings → ai employee → activate. $97/mes flat = voice ai + conversation ai + content ai sin metering. alternativa: pay-per-use (~$0.16/min) si tenés bajo volumen. (source: ghl ai pricing ↗)
tip: ai employee se paga aparte del plan ghl ($97/mes adicionales al plan que tengas). en pro plan + ai employee, son $497 + $97 = $594/mes.
sub-account → voice ai → create new agent. le ponés nombre, voice (español neutro / mx / es), modelo llm (gpt-4o, claude, gemini). cada agent puede atender uno o varios números. (source: creating voice ai agents ↗)
tip: arrancá con gpt-4o-mini para reducir costos. si notás respuestas pobres, subí a gpt-4o o claude. la diferencia entre modelos es ~$0.05-0.10/min.
agent → knowledge base → cargar urls (sitio web, faqs), pdfs (catálogos, brochures), texto plano (políticas, hours). el agent solo sabe lo que cargás. si tu sitio tiene precios, los va a citar — si no, va a inventar.
tip: cargá tu sitio + un faq de 30-50 preguntas comunes + lista de servicios con precios. eso cubre 90% de las llamadas inbound de pyme.
tab agent goals: personality (formal/cercano), language (es-mx/neutro), goals (capturar nombre, agendar cita, cualificar lead). prompt principal: "sos asistente de [empresa]. saludas, escuchas, agendas o transferís según necesidad."
tip: no hagas el prompt una novela. 5-10 líneas claras > 50 líneas confusas. el llm sigue mejor instrucciones cortas y específicas.
agent → phone numbers → assign. ghl te deja comprar un número o portar el tuyo (us $1.15/mes, mx ~$3, es ~$2). también podés usarlo en el chat widget de tu sitio.
tip: si ya tenés número con otro provider (twilio, voip), portarlo a ghl tarda ~5 días hábiles. mientras esperás, usás un número de prueba ghl-issued.
tab actions: workflow trigger ("cuando se cuelgue, ejecutar X"), tag automation ("agregar tag based on intent"), notification ("avisar a sales rep si calificó"). el valor está en el después, no en la llamada en sí.
tip: mínimo: un workflow que envíe sms de resumen al cliente + email a sales rep. extiende según madurez de tu operación.
3 casos típicos en pyme latam. los costos son aproximados pero realistas — basados en cohortes ghlcurso 2025-2026.
vapi.ai y retell son las alternativas técnicas más conocidas. comparativa honesta — ninguna gana en todo:
fuentes: ghl ai pricing ↗ · voice agents overview ↗ · knowledge base integration ↗
voice ai está bueno pero no es magia. estas son las trade-offs reales antes de subir el agent a producción:
~$0.80 por llamada con setup standard (gpt-4o-mini + voz cartesia). el desglose: voice engine $0.045 × 5 = $0.225, tts $0.015 × 5 = $0.075, llm tokens ~$0.30, phone twilio ~$0.05-0.20. si tenés ai employee unlimited ($97/mes flat), no metering en voice ai inbound — solo pagás los tokens y phone. (source: ghl ai pricing ↗)
depende. con voces de cartesia o openai modernas + un prompt bien hecho, los primeros 30 segundos suelen pasar como humano. después de 1-2 minutos, gente atenta nota patrones (silencios extraños, frases repetidas, no entiende coloquialismos extremos). en latam funciona mejor con saludos formales y vocabulario neutro. evita slang regional fuerte.
el agent intenta responder con el llm general, pero puede inventar (hallucinate) si no tiene la info exacta. por eso es crítico cargar buena kb: faq amplia + sitio web + lista de servicios. recomendamos también un fallback: "si no estoy seguro, te transfiero con [nombre]". esto previene que el bot prometa cosas que no podés cumplir.
para 90% de casos pyme: gpt-4o-mini — barato (~$0.05-0.10/min), suficientemente bueno para citas y triage. para casos complejos (b2b qualifying, multi-idioma fluido, razonamiento): claude sonnet 4.6 o gpt-4o. evita gpt-3.5 — ya está deprecated y no soporta function calling robusto.
sí, los tres. el llm entiende cualquier variante. la voz se elige al crear el agent: hay opciones específicas para mx, es-es, neutro y latam genérico. el español neutro funciona bien para audiencias mixtas (no-spañol, no-mexicano). prueba 2-3 voces antes de elegir — la diferencia en percepción de calidad es grande.
sí, pero con cuidado. ghl soporta outbound voice ai pero en us tiene regulaciones strict (tcpa) — solo a contactos con consent explícito. en latam (mx, ar, co, es) la regulación es más laxa pero igualmente: solo a leads que te dejaron su número (formulario, compra previa, etc). nunca a listas compradas — el bloqueo de operadora viene en horas.
fallback automático: si el agent no entiende 2 veces seguidas, transfiere a número humano definido. también podés definir keywords de escape ("hablar con persona", "agente real"). siempre configurá el fallback antes de poner el agent en producción. sin fallback, una llamada confusa = cliente perdido + reseña negativa.
vapi y retell son api-first, más control pero requieren dev integration (webhooks, custom logic). ghl voice ai es no-code: ui completa, integración nativa con crm/calendar/workflows. para agencias hispanas que quieren vender voice ai como add-on a clientes pyme, ghl es ~10x más rápido de implementar. para saas builders que quieren custom deeply integrated voice agents, vapi gana en flexibilidad. (source: ghl voice agents overview ↗)
trial 30 días + 1:1 conmigo para configurar tu primer voice ai. te ayudo a montar el knowledge base + el agent + el primer número conectado (gratis, parte del bonus).
probar 30 días + bonuses →