VoiceXML Presentation
Τί είναι η VXML -Υποσύνολο της XML. -Markup Language, ό,τι κάνει η html για οπτική περιγραφή, κάνει η vxml για φωνητική περιγραφή. -Προτεινόμενο πρότυπο από το W3C. -Έχει σχεδιαστεί έτσι, ώστε να δίνει τη δυνατότητα στους συγγραφείς να περιγράψουν πλήρως ένα φωνητικό διάλογο.
Για Τους Χρήστες Πολύς κόσμος δεν έχει υπολογιστή ή/και δίκτυο σπίτι του. Και να υπάρχει υπολογιστής στο σπίτι, σπάνια ξέρουν να τον χρησιμοποιούν όλα τα μέλη της οικογένειας Ακόμα και για όσους έχουν υπολογιστή και ξέρουν να τον χρησιμοποιούν, συχνά δεν έχουν άμεση πρόσβαση σ’ αυτόν (π.χ. ενώ βρίσκονται στο δρόμο, ή κάπου εκτός του γραφείου τους) Αντίθετα, το τηλέφωνο είναι σαφώς πιο διαδεδομένο και άμεσα προσβάσιμο, σε σύγκριση με τον υπολογιστή
Για Τις Εταιρείες Προσθέτουν αξία στην επένδυση που έχουν κάνει για συλλογή ηλεκτρονικής πληροφορίας σχετικά με την εταιρεία (είτε διαφημιστική, είτε με τη μορφή υπηρεσιών προς τους πελάτες τους) Αποκτούν πρόσβαση σε πολύ μεγαλύτερο κοινό από ότι μέσω διαδικτύου Παρέχουν χρήσιμες υπηρεσίες (voice banking, εύρεση πλησιέστερου καταστήματος/ATM, ενημέρωση για νέα, δάνεια, προσφορές, κλπ) Καλύπτουν ηλεκτρονικά και μέσω τηλεφώνου μεγάλο μέρος αναγκών που καλύπτονταν από το προσωπικό.
Εξυπηρέτηση Πελατών Call Center, με κατάλληλη οργάνωση ώστε οι πιο συνηθισμένες αιτήσεις των χρηστών να εξυπηρετούνται αυτόματα, ενώ οι πιο εξειδικευμένες αιτήσεις / ερωτήσεις να εξυπηρετούνται από το προσωπικό Δίνεται η επιλογή στον πελάτη, σε περίπτωση που δεν το επιθυμεί, να εξυπηρετηθεί απ’ ευθείας από το προσωπικό (περίπτωση τεχνοφοβικού πελάτη) Δεν καταργείται το προσωπικό, διευκολύνεται και αυτοματοποιείται η δουλειά του, και μειώνεται το πλήθος των ωρών εργασίας του. Διαθέσιμο 24/7
Ενημέρωση / Διαφήμιση Ενημέρωση για τις προσφορές που ισχύουν αυτή την περίοδο Διαφήμιση συγκεκριμένων προϊόντων, είτε επειδή θέλει να τα προωθήσει το κατάστημα, είτε γιατί το κατάστημα συνεργάζεται με τον προμηθευτή σε θέματα διαφήμισης του προϊόντος Ενημέρωση για το ωράριο των καταστημάτων Ενημέρωση για έκτακτες ώρες λειτουργίας / μη λειτουργίας
Εύρεση Πλησιέστερου S/M Σε περίπτωση που πρόκειται για αλυσίδα καταστημάτων, ή για σύνδεσμο καταστημάτων Απαιτεί χαρτογράφηση των καταστημάτων που ανήκουν στην αλυσίδα ή στο σύνδεσμο Ερώτηση του χρήστη για την περιοχή όπου αναζητά κατάστημα, και αναφορά των διευθύνσεων όπου υπάρχουν καταστήματα στην περιοχή αυτή. Εναλλακτική λύση, πιο πολύπλοκη, που ενδεχομένως να χρειάζεται την άδεια του χρήστη: Ανίχνευση της θέσης του χρήστη (μέσω του τηλεφώνου του), και εύρεση των πλησιέστερων σ’ αυτόν καταστημάτων
Loyalty Club Συχνά τα καταστήματα δίνουν, με κάποιο τρόπο (κάρτες, κλπ) τη δυνατότητα στους πελάτες να συλλέγουν πόντους, και να τους εξαργυρώνουν αργότερα με τη μορφή προϊόντων Μπορούν οι πελάτες, με τη χρήση του προσωπικού τους κωδικού, να ενημερώνονται για τα προϊόντα που μπορούν να αγοράσουν εξαργυρώνοντας τους πόντους τους
Αγορές μέσω τηλεφώνου Υπάρχουν ήδη καταστήματα που παρέχουν αγορές μέσω διαδικτύου. Μπορεί η ίδια υπηρεσία να παρέχεται και μέσω τηλεφώνου Υπάρχει πολύ μεγάλο πλήθος προϊόντων, που δύσκολα μπορούν να «διαβαστούν» μέσω τηλεφώνου. Λύσεις: –Να διατίθενται μόνο τα πιο συνηθισμένα προϊόντα –Η φωνητική αναγνώριση μπορεί να συντομεύσει πάρα πολύ τη διαδικασία –Εγγραφή χρηστών, όπου θα δηλώνουν τα προϊόντα που προτιμούν από το κάθε είδος, ώστε να έχουν να επιλέξουν μόνο από αυτά τα προϊόντα
Σχηματικά
Η Όλη Διαδικασία Η φωνητική πλατφόρμα αποτελείται από τρία διακριτά μέρη: Τη φωνητική εφαρμογή (VoiceXML, η λογική της πλατφόρμας) Τη μηχανή αναγνώρισης φωνής (user input) Τη μηχανή σύνθεσης φωνής (user output) Τα δύο τελευταία μπορούν και να παραλειφθούν, παρόλα αυτά μπορούν να αποδειχθούν πολύ χρήσιμα στις περισσότερες περιπτώσεις.
VoiceXML Ο «εγκέφαλος» της εφαρμογής, που καθορίζει τη ροή των διαλόγων (dialogue flow). Ο κάθε διάλογος έχει την γενική μορφή: –Προτροπή χρήστη –Αποδοχή απάντησης –Προώθηση στον επόμενο διάλογο Παράδειγμα: –«Εισάγετε τον αριθμό του τηλεφώνου σας» –« » (έλεγχος ότι είναι αποδεκτή η απάντηση, π.χ. ότι το νούμερο αποτελείται από 10 ψηφία) –Ολοκλήρωση διαλόγου. Προώθηση στον επόμενο διάλογο, που μπορεί, για παράδειγμα, να ζητάει το όνομα του χρήστη.
User Input – DTMF (1/2) Εισαγωγή από τα πλήκτρα του τηλεφώνου. Ερωτήσεις της μορφής: «Αν βρίσκεστε στην Αθήνα, πιέστε 1. Αν βρίσκεστε στο Ηράκλειο, πιέστε 2.» Υπέρ: –Ασφαλές, όταν ο χρήστης πρόκειται να δώσει κωδικό πρόσβασης, οπότε δεν πρέπει να «ακουστεί» –Πάντα αναγνωρίσιμο. Κατά: –Γίνεται κουραστικό για τον χρήστη, όταν υπάρχουν πολλές επιλογές. Γενικά, για πάνω από 6 επιλογές, δεν προτείνεται η χρήση DTMF.
User Input – ASR (2/2) Automatic Speech Recognition – Ερωτήσεις της μορφής: «Πείτε το σημείο όπου βρίσκεστε». Υπέρ: –Σχεδόν μονόδρομος, όταν η λίστα των δυνατών απαντήσεων του χρήστη είναι μεγάλη (πάνω από 6) –Πιο φιλικό προς τον χρήστη, αφού είναι πιο κοντά στο φυσικό λόγο Κατά: –Δεν πρέπει να χρησιμοποιείται, όταν ο χρήστης εισάγει ευαίσθητα ή προσωπικά δεδομένα –Μερικές φορές λανθάνει, αν ο τρόπος έκφρασης του χρήστη είναι πολύ ιδιαίτερος –Κόστος άδειας χρήσης
User Output – Ηχογραφημένα (1/2) Ηχογράφηση μηνυμάτων σε μορφή.wav Υπέρ: –Φιλικό προς τον χρήστη (φυσική φωνή) –Ιδανικό για στατικά δεδομένα –Συνήθως, χαμηλότερο ή ανάλογο κόστος με τη μηχανή σύνθεσης φωνής Κατά: –Συχνά είναι δύσκολο να χρησιμοποιείται σε μερικώς δυναμικά δεδομένα (π.χ. που αλλάζουν μία φορά το μήνα), γιατί θα πρέπει να γίνονται ηχογραφήσεις όσο συχνά αλλάζουν τα δεδομένα –Δε μπορεί να χρησιμοποιείται σε δυναμικά δεδομένα.
User Output – TTS (2/2) Μετατροπή γραπτού κειμένου σε φωνή. Υπέρ: –Πολύ βολικό, και συχνά μονόδρομος, για δυναμική πληροφορία (ημερομηνίες, αριθμούς, κλπ...) Κατά: –Παρόλο που έχει εξελιχθεί πολύ και συνεχίζει να βελτιώνεται, δεν είναι ακόμα εξίσου φιλικό προς τον χρήστη όσο ο φυσικός λόγος. Αυτό φαίνεται κυρίως στην ανάγνωση μεγάλων, συνεχόμενων κειμένων. –Πρέπει η έξοδος να γραφτεί με τέτοιο τρόπο, ώστε να διαβαστεί σωστά από τη μηχανή σύνθεσης φωνής –Κόστος άδειας χρήσης
References & Questions (τελευταία έκδοση vxml: 2.0)