Κατέβασμα παρουσίασης
Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε
ΔημοσίευσεYalena Verga Τροποποιήθηκε πριν 9 χρόνια
1
Τίτλος εργασίας: ΙΕΡΑΡΧΙΚΗ ΟΡΓΑΝΩΣΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΜΟΥΣΙΚΩΝ ΣΥΛΛΟΓΩΝ ΣΕ ΕΠΙΠΕΔΟ ΚΑΛΛΙΤΕΧΝΗ Υπεύθυνος καθηγητής: Σαράντος Καπιδάκης Υπεύθυνη εργασίας: Παναγιώτα Μπατσή
2
Περιεχόμενα: 1.Εισαγωγή-Σκοπός 2.Σχετικές εργασίες 3.Υπολογισμός της ομοιότητας 4.Ιεραρχική ομαδοποίηση (ιεραρχικό clustering) 5.Περιβάλλον διεπαφής χρήστη 6.Επιλογή όρων για την περιγραφή των κόμβων 6.1Λεξικό ειδικού πεδίου 7.Αποτελέσματα & προβληματισμοί 8.Συμπεράσματα
3
1.Εισαγωγή-Σκοπός Elias Pampalk, Arthur Flexer and Gerhard Widmer) Η μελέτη (Elias Pampalk, Arthur Flexer and Gerhard Widmer) είναι αποτέλεσμα της έρευνας του Τμήματος του Αυστριακού Ινστιτούτου Ερευνών για την Τεχνητή Νοημοσύνη και του Τμήματος Υπολογιστικής Αντίληψης του Πανεπιστημίου Johannes Kepler του Λίντζ στην Αυστρία. Οι μουσικές ψηφιακές συλλογές και η άμεση ανάγκη για την αυτόματη οργάνωσή τους. Αναλύεται το περιεχόμενο ιστοσελίδων οι οποίες έχουν ιεραρχηθεί από το Google έτσι ώστε να υπολογιστεί η ομοιότητα των καλλιτεχνών. Εξετάζεται πως αυτή η ομοιότητα μπορεί να χρησιμοποιηθεί για την αυτοματοποιημένη οργάνωση καλλιτεχνών σε επικαλυπτόμενες ιεραρχικές ομάδες (overlapping hierarchical clusters)
4
2.Σχετικές εργασίες Δεδομένα βασισμένα στο δίκτυο (χρησιμοποιούν μέθοδο ταξινόμησης με τεχνικές ανάσυρσης δεδομένων) Λίστες μουσικών ραδιοφωνικών σταθμών και βάσεις δεδομένων με cd μουσικών συλλογών Ιστοσελίδες (όπου γίνεται αξιολόγηση ακουστικών τεχνικών και των υποκειμενικών τους στοιχείων π.χ All Music Guide) Ανάλυση που να βασίζεται στην ομοιότητα των ηχογραφήσεων μεταξύ 2 καλλιτεχνών Κριτικές δίσκων (ακροατής μηχανών) Ανάλυση στίχων τραγουδιών Ανάλυση ηχητικών σημάτων (το Island of Music είναι ένα καλό παράδειγμα)
5
3.Υπολογισμός της ομοιότητας Χρησιμοποιείται το πρωτόκολλο επικοινωνίας SOAP του Google και για κάθε καλλιτέχνη πραγματοποιείται μια σειρά αναζητήσεων αποτελούμενες από: όνομα καλλιτέχνη + music + review Μετακινούνται όλες οι ετικέτες (tag) HTML και λαμβάνεται υπ΄όψιν μόνο το περιεχόμενο απλού κειμένου και χρησιμοποιείται μια λίστα αποκλειόμενων λέξεων (stop word list) Αποκλείουμε για κάθε καλλιτέχνη τους όρους που δεν εμφανίζονται τουλάχιστον σε 3 ιστοσελίδες για τον ίδιο. Τελικά αποκλείουμε από τη λίστα για όλους τους καλλιτέχνες, τους όρους που δεν εμφανίζονται σε τουλάχιστον 10 ιστοσελίδες. Με συγκεκριμένους μαθηματικούς υπολογισμούς υπολογίζουμε τη βαρύτητα του όρου για κάθε καλλιτέχνη. Με βάση τη συχνότητα εμφάνισης του κάθε όρου για κάθε καλλιτέχνη, υπολογίζουμε την «απόσταση» ανάμεσα σε 2 καλλιτέχνες. Για το σύνολο των 224 καλλιτεχνών (χειροκίνητα καταχωρημένους σε 14 είδη) το οποίο χρησιμοποιούμε στα πειράματά μας, παίρνουμε μια ακρίβεια μετρήσεων 85%.
6
4.Ιεραρχική ομαδοποίηση (ιεραρχικό clustering) Μορφή Clusrering:
7
SOM (self organazing map) Μονοδιάστατος χάρτης με ικανότητα αυτοοργάνωσης που μπορεί να δομηθεί ιεραρχικά Είναι ο δημοφιλέστερος τεχνητός νευρικός αλγόριθμος δικτύων στην ανεπιτήρητη κατηγορία εκμάθησης Ο SOM ομαδοποιεί παρόμοια αντικείμενα σε ομάδες (clusters) και τοποθετεί παρόμοιες ομάδες(clusters) τη μια κοντά στην άλλη Αφού έχει εκπαιδευτεί ο SOM αυξάνεται το μέγεθος της ομάδας (cluster) κατά 20% προσθέτοντας τους καλλιτέχνες που είναι πιο κοντά στο όριο
8
5.Περιβάλλον διεπαφής χρήστη Απλό περιβάλλον διεπαφής χρήστη HTML Δύο μέρη 1.Οι ομάδες του πρώτου επιπέδου στην ιεραρχία οπτικοποιούνται με τη χρήση πέντε κουτιών στην πρώτη (κορυφαία) σειρά. 2. Ο αριθμός των καλλιτεχνών που είναι χαρτογραφημένοι σε μία ομάδα οπτικοποιείται μέσω μίας μπάρας δίπλα από την ομάδα όρων. http://www.ofai.at/~elias.pampalk/wa/ http://www.ofai.at/~elias.pampalk/wa/
9
6.Επιλογή όρων για την περιγραφή των κόμβων Η επιλογή των όρων είναι θεμελιώδες συστατικό του περιβάλλοντος διεπαφής χρήστη Στόχος είναι να γίνει επιλογή λέξεων οι οποίες να συνοψίζουν με τον καλύτερο τρόπο τα χαρακτηριστικά μιας ομάδας καλλιτεχνών 3 υποθέσεις: 1.Οι καλλιτέχνες είναι κατά βάση άγνωστοι στον χρήστη 2.Δεν είναι γνωστό επίσης ποιους καλλιτέχνες γνωρίζει ο χρήστης 3.Ο χώρος είναι περιορισμένος και πρέπει να γίνει περιγραφή του κάθε κόμβου με όσο το δυνατόν λιγότερες λέξεις
10
Στα εν λόγω πειράματα γίνεται σύγκριση πέντε τεχνικών επιλογής όρων και δύο διαφορετικών τρόπων προσέγγισης σχετικά με το σύνολο των όρων εξ αρχής και προτείνεται ειδικό λεξικό 1. tf x idf 2. LabelSOM 3. χ² 4. Lagus και Kaski 5. χ² Lagus και Kaski (LK) Υποκειμενικά πάντως, η γενικότερη εντύπωση των μελετητών, ήταν πως η προσέγγιση από τους Lagus & Kaski απέδωσε ελαφρώς καλύτερα από τις υπόλοιπες. http://www.ofai.at/~elias.pampalk/wa/
11
6.1.Λεξικό ειδικού πεδίου Η χρήση λεξικού είναι πολύ σημαντική ώστε να αποφευχθεί η περιγραφή των ομάδων, με ονόματα καλλιτεχνών, δίσκων και άλλων εξειδικευμένων λέξεων που είναι πολύ πιθανό να είναι άγνωστες στον χρήστη Περιέχει γενικές λέξεις που χρησιμοποιούνται για την περιγραφή της μουσικής, όπως τα ονόματα των ειδών της Περιλαμβάνει 1.398 λήμματα, εκ των οποίων 1.269 εμφανίζονται σε σχετικά τεκμήρια
12
6.1.Λεξικό ειδικού πεδίου Συντάχθηκε χειροκίνητα από τους συγγραφείς αντιγράφοντας καταλόγους από διάφορες πηγές όπως η Wikipedia, η μηχανή αναζήτησης Yahoo, το allmusic.com και άλλες πηγές που περιλάμβαναν είδη μουσικής (και υποείδη), μουσικά όργανα ή επιθετικούς προσδιορισμούς Απέχει πολύ από το να θεωρηθεί πλήρες και περιέχει όρους που θα έπρεπε να απομακρυνθούν (π.χ. world, uk, band και song) Δεν τροποποιήθηκε, ωστόσο, με στόχο την καλύτερη κατανόηση των πιθανών μειονεκτημάτων
13
7.Αποτελέσματα & προβληματισμοί Ένα από τα κύρια προβλήματα είναι πως η συγκεκριμένη προσέγγιση βασίζεται σε ονόματα καλλιτεχνών Πολλοί καινούργιοι και όχι και τόσο γνωστοί καλλιτέχνες δεν εμφανίζονται σε ιστοσελίδες Η δυναμική των περιεχομένων του δικτύου Σημαντικές αλλαγές στις ιεραρχήσεις που δίνει το Google, αλλά αυτές δεν είχαν σημαντική επίδραση ως προς τον υπολογισμό των ομοιοτήτων
14
8.Συμπεράσματα Σε αυτήν τη μελέτη έγινε παρουσίαση κάποιων εκδοχών σχετικά με την ιεραρχική οργάνωση των ψηφιακών μουσικών συλλογών σε επίπεδο καλλιτέχνη. Συγκεκριμένα η εν λόγω εργασία προτείνει τη χρήση ιεραρχικής ομαδοποίησης με επικαλυπτόμενες ομάδες (clusters) που περιγράφονται με τη χρήση ειδικού λεξικού. Τα αποτελέσματα είναι πολλά υποσχόμενα. Σε μελλοντική μελέτη σχεδιάζεται να διεξαχθεί μικρής έκτασης μελέτες χρηστών και να συνδυαστεί αυτή την προσέγγιση με άλλες οι οποίες βασίζονται στην ανάλυση ηχητικού σήματος.
15
Ευχαριστώ πολύ για την προσοχή σας! Μπατσή Παναγιώτα
Παρόμοιες παρουσιάσεις
© 2024 SlidePlayer.gr Inc.
All rights reserved.