Moderne KI-Sprachagenten kombinieren drei Komponenten: eine Echtzeit-Engine für Sprache-zu-Text, ein LLM (oft eine abgestimmte Variante von GPT oder Claude) zur Generierung von Antworten und eine hochwertige Text-zu-Sprache-Engine. Die Latenz von Ende zu Ende liegt typischerweise bei 600–1.200 ms.
Die Agenten von Callsy weisen zu Beginn des Anrufs auf ihre KI-Eigenschaft hin, im Einklang mit dem EU-KI-Gesetz und den Erwartungen des US-amerikanischen TCPA. Anrufe mit offengelegter KI schneiden in Conversion-Tests genauso gut ab wie nicht offengelegte.
Anwendungsfälle: Rückgewinnung abgebrochener Warenkörbe, Qualifizierung eingehender Leads, Terminbuchung, Reaktivierung, Zahlungserinnerungen, NPS-Umfragen.