VoiceXML (VXML)
Die Voice eXtensible Markup Language (VoiceXML, VXML) ist eine Anwendung der Extensible Markup Language (XML), die in Verbindung mit der Spracherkennungstechnologie einen interaktiven Zugang zum Web über das Telefon oder einen sprachgesteuerten Browser ermöglicht. Eine einzelne Sitzung funktioniert durch per Spracherkennung und/oder Tastatureingabe. Per XML kann ein Programmierer die Spracherkennung durch Hinzufügen einiger einfacher Tags aktivieren.
VoiceXML entstand durch die Zusammenarbeit von AT&T, IBM, Lucent Technologies und Motorola, die jeweils an ihrem eigenen Ansatz arbeiteten, sich aber zusammenschlossen, um einen offenen Standard zu schaffen. Darum kümmert sich das VoiceXML Forum, während das World Wide Web Consortium (W3C) den Standard verabschiedet. Aktuell ist VoiceXML 2.1 der gültige Standard, Version 3.0 befindet sich seit Ende 2010 in der Draft-Phase. Für die Telefonieunterstützung wurde für VoiceXML die Call Control eXtensible Markup Language (CCXML) entwickelt.
Mit VoiceXML können Menschen mit einem normalen Sprachtelefon auf das Internet zugreifen, um E-Mails abzurufen und zu versenden, Sportergebnisse abzufragen, Reservierungen vorzunehmen und so weiter. VXML unterstützt auch natürliche Sprache, was bedeutet, dass der Benutzer nicht an ein begrenztes Skript gebunden ist, sondern natürlich sprechen kann. Im sogenannten Modeless- oder Conversational-Modus kann der Anwender das System sogar mit einer kontextfremden Frage unterbrechen und so die Sitzung umleiten. Ziel ist es, den Austausch so natürlich wie möglich zu gestalten, so als ob zwei Menschen miteinander sprechen würden.
Hier ein Beispiel dafür, was ein Benutzer mit VXML tun könnte: Er nimmt den Hörer ab, wählt die Nummer einer Wetter-Website und fordert zum Beispiel die Wochenendvorhersage an. Die Sprachanfrage löst eine XML-Abfrage aus, und das Abfrageergebnis wird in eine Sprachnachricht umgewandelt, die dem Benutzer die gewünschten Informationen liefert.