ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ «ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ» ΜΕ ΘΕΜΑ: A Comparison of Methodic Segmentation Techniques for Music Information Retrieval ΣΥΓΚΡΙΣΗ ΤΕΧΝΙΚΩΝ ΚΑΤΑΤΜΗΣΗΣ ΜΕΛΩΔΙΩΝ ΓΙΑ ΑΝΑΚΤΗΣΗ ΜΟΥΣΙΚΩΝ ΠΛΗΡΟΦΟΡΙΩΝ Giovanna Neve and Nicola Orio Department of Information Engineering – University of Padova Via Gradenigo, 6/b – Padova, Italy {mcic,
ΕΙΣΑΓΩΓΗ ΕΙΣΑΓΩΓΗ McLean (1996), Εφαρμογή καθιε- ρωμένων αρχών ανάκτησης πλη- ροφοριών κειμένου στη μουσική αναπαράσταση. Ανάκτηση πληροφοριών κειμένου: Λέξεις (αποτελούν ) Ανάκτηση πληροφοριών κειμένου: Λέξεις (αποτελούν όρους ευρετηρίου) Ανάκτηση μουσικών εγγράφων: Ειδικοί αλγόριθμοι κατάτμησης για παραγωγή μουσικών Ανάκτηση μουσικών εγγράφων: Ειδικοί αλγόριθμοι κατάτμησης για παραγωγή μουσικών λεξικολογικών μονάδων.
Πρόσβαση με βάση το περιεχόμενο σε μουσικές ψηφιακές βιβλιοθήκες Σημαντικό γνώρισμα περιγραφής μουσικών πληροφοριών: η Μελωδία Ερώτημα με παράδειγμα (τραγουδώντας) Ομοιότητα μεταξύ εγγράφων Σύσταση μουσικής Αναζήτηση σε μουσικές συλλογές
Δύο κατηγορίες ανάκτησης μουσικών πληροφοριών Τεχνικές επιγραμμικής (on- line) αναζήτησης Τεχνικές ευρετηρίασης, που εξάγουν μη επιγραμμικά (off- line) πληροφορίες Οι μελωδίες ευρετηριάστηκαν με: 1.Χρήση Ν γραμμάτων, όπου Ν αλληλουχία Ν διαστημάτων τόνου 2.Αυτόματα επισημασμένες λεξικολογικές μονάδες (μελωδικά & ρυθμικά μοτίβα) με αυτόματο αλγόριθμο κατάτμησης βάση μουσικής θεωρίας
Προσεγγίσεις κατάτμησης μελωδιών Προσεγγίσεις κατάτμησης μελωδιών Η μουσική είναι συνεχής ροή γεγονότων χωρίς σαφείς διαχωριστές, γίνετε απαραίτητη η αυτόματη ανίχνευση λεξιλογικών μονάδων ενός μουσικού εγγ- ράφου, για όρους ευρετηρίου.
ΣΤΡΑΤΗΓΗΚΕΣ ΚΑΤΑΤΜΗΣΗΣ ΜΕΛΩΔΙΩΝ (1/2) Κατάτμηση σταθερού μεγέθους (Fixed- Length Segmentation - FL). Κατάτμηση σταθερού μεγέθους (Fixed- Length Segmentation - FL). Εξαγωγή από μία μελωδία υποακολουθιών Ν νοτών (Ν γράμματα). Κατάτμηση από τα δεδομένα (Data- Driven Seg- mentation - DD). Κατάτμηση από τα δεδομένα (Data- Driven Seg- mentation - DD). Πραγματοποιείται θεωρώντας ότι συνήθη περάσματα μιας μελωδίας επαναλαμβάνονται πολλές φορές. Κατάτμηση με βάση την αντίληψη (Perception- Based Segmentation - PB). Κατάτμηση με βάση την αντίληψη (Perception- Based Segmentation - PB). Οι ακροατές κατατέμνουν το μη δομημένο ακουστικό ρεύμα σε μικρότερες μονάδες (μελωδικές φράσεις, μοτίβα ή μουσικές κινήσεις).
ΣΤΡΑΤΗΓΗΚΕΣ ΚΑΤΑΤΜΗΣΗΣ ΜΕΛΩΔΙΩΝ (2/2) Κατάτμηση προσανατολισμένη στη μουσικολογία (Musicological- oriented Segmentation - MO). Κατάτμηση προσανατολισμένη στη μουσικολογία (Musicological- oriented Segmentation - MO).Βασίζεται σε γνώσεις σχετικά με τη μουσική θεωρία, Μεικτή κατάτμηση και συγχώνευση δεδομένων (Mixed Segmentation and Data Fusion - FUS). Μεικτή κατάτμηση και συγχώνευση δεδομένων (Mixed Segmentation and Data Fusion - FUS). Κάθε τεχνική κατάτμησης επιτρέπει την περιγραφή της μελωδίας με ένα διαφορετικό σύνολο ακολουθιών νοτών. Τα έγγραφα ευρε- τηριάζονται με τη χρήση μονάδων που περιέχουν μόνο πληροφορίες ρυθμού ή τόνου ή των συνδυασμό και των δύο. Κατάτμηση με ερωτήματα (Query Segmentation - QS)
Πειραματική σύγκριση τεχνικών κατάτμησης (1/3) Μοντέλο ανάκτησης πληροφοριών Cranfield: συλλογή μουσικών τεστ λαϊκής μουσικής από 2310 αρχεία MIDI ως μουσικά έγγραφα 1.Επιλέχθηκε ο υψηλότερος τόνος ως τμήμα της μελωδίας για πολυφωνικές παρτιτούρες 2.40 ερωτήματα. Το θέμα από το οποίο λαμβανόταν το ερώτημα θεωρούνταν σχετικό Δοκιμές με μηχανή ανάκτησης, που βασίζεται στο Διανυσματικό Μοντέλο 1.Ανθεκτικότητα σε σφάλματα: με τροποποίηση τόνου & διάρκεια νοτών 2.Αποτέλεσμα μήκους ερωτημάτων; Με συντόμευση αρχικών ερω τημάτων
Πειραματική σύγκριση τεχνικών κατάτμησης (2/3) Πίνακας 1 Βασικά χαρακτηριστικά λεξικολογικών μονάδων για διαφορετικές κατατμήσεις FLDDPBMOFUS Μέσο μήκος (νότες) 3,04,84,03,63 Μέσες μονάδες / έγγραφο 52,161,943,245,0132,4 Αριθμός μονάδων 70,093123,65470,71367,893253,783
Πειραματική σύγκριση τεχνικών κατάτμησης (3/3) Πίνακας 2 Αποτελεσματικότητα ανάκτησης διαφορετικών προσεγγίσεων FLDDPBMOFUS Μέση Ακρίβεια Μέση Ακρίβεια0,980,960,800,831,0 = 1 97,592,572,577,5100 <= 3 97,510087,587,5100 <= 5 97,510087,592,5100 <= ,095,0100 Δεν βρέθηκε 0,00,0102,50,0
Συμπεράσματα (1/2) Η πρόσβαση και ανάκτηση της μουσικής βρίσκονται σε πρώιμο στάδιο. Αντικείμενο επιστημονικής έρευνας, ένας αρι- θμός μεθοδολογιών και τεχνικών από την α - ναγνώριση των κατάλληλων γνωρισμάτων,ως δείκτες περιγραφής περιεχομένου. Οι προσεγγίσεις κατάτμησης (FL) με επικαλυ- πτόμενες μονάδες έδωσαν καλύτερα αποτε- λέσματα από προσεγγίσεις με βάση τη μουσι- κή αντίληψη(PB) ή τη μουσική θεωρία (MO).
Συμπεράσματα (2/2) Η κατάτμηση σταθερού μήκους(FL) πιο αν- θεκτική σε σφάλματα ερωτημάτων και σε σύντομα ερωτήματα από την κατάτμηση δεδομένων(DD). Για τη μουσική μια απλή προσέγγιση, που δεν φιλτράρει καμία πληροφορία, βελτιώνει το πο- σοστό αποτελεσμάτων χωρίς υποβάθμιση της ακρίβειας(FUS,FL). Για μία εργασία ανάκτησης μουσικής η αντι- γραφή των πληροφοριών βοηθά στην επα- κόλουθη βελτίωση των επιδόσεων του συ- στήματος.