Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Πανεπιστήμιο Πατρών ΘΕΜΑΤΙΚΕΣ ΠΕΡΙΟΧΕΣ ΔΙΠΛΩΜΑΤΙΚΩΝ ΕΡΓΑΣΙΩΝ 2006-07 ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ 2006-07 Καθηγητής Ε. ΓαλλόπουλοςΕ. Γαλλόπουλος Εργαστήριο Πληροφοριακών.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Πανεπιστήμιο Πατρών ΘΕΜΑΤΙΚΕΣ ΠΕΡΙΟΧΕΣ ΔΙΠΛΩΜΑΤΙΚΩΝ ΕΡΓΑΣΙΩΝ 2006-07 ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ 2006-07 Καθηγητής Ε. ΓαλλόπουλοςΕ. Γαλλόπουλος Εργαστήριο Πληροφοριακών."— Μεταγράφημα παρουσίασης:

1 Πανεπιστήμιο Πατρών ΘΕΜΑΤΙΚΕΣ ΠΕΡΙΟΧΕΣ ΔΙΠΛΩΜΑΤΙΚΩΝ ΕΡΓΑΣΙΩΝ 2006-07 ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ 2006-07 Καθηγητής Ε. ΓαλλόπουλοςΕ. Γαλλόπουλος Εργαστήριο Πληροφοριακών Συστημάτων Υψηλής Επίδοσης http://scgroup.hpclab.ceid.upatras.gr/faculty/stratis/stratisgr.html

2 Πανεπιστήμιο Πατρών Πληροφορίες Τα θέματα των διπλωματικών αφορούν στη μελέτη και στην αξιολόγηση υπαρχόντων μεθόδων και εργαλείων για τον Επιστημονικό Υπολογισμό και στην ανάπτυξη και υλοποίηση νέων. Πολλά από τα θέματα προσφέρονται για περαιτέρω έρευνα στα πλαίσια μεταπτυχιακών σπουδών καθώς και για συνεργασία με ερευνητές στις Η.Π.Α. και στην Ευρώπη. Δείτε επίσης σχετικές αναφορές του επιβλέποντα εδώ. εδώ Ορισμένες προϋποθέσεις για την εκπόνηση καλής διπλωματικής στα παρακάτω θέματα:  Να ενδιαφέρεστε για τα θέματα που περιγράφονται, να έχετε την περιέργεια να παρακολουθείτε τη σχετική βιβλιογραφία και να ενδιαφέρεστε να συνεισφέρετε στην τρέχουσα έρευνα.  Να έχετε τεκμηριωμένη ικανότητα (π.χ. μέσω καλής επίδοσης σε συναφή μαθήματα) στη Γραμμική Άλγεβρα και στα συναφή μαθήματα (καλή Γραμμική Άλγεβρα, να ενδιαφερθήκατε και να ασχοληθήκατε σοβαρά με τις εργασίες που δόθηκαν στον Επιστημονικό Ι, κ.λπ.)  Ορισμένα θέματα προϋποθέτουν εξοικείωση με την παράλληλη και κατανεμημένη επεξεργασία, τεχνολογίες διαδικτύου και την ανάκτηση πληροφορίας.  Οι υλοποιήσεις θα γίνονται σε MATLAB ή συναφή περιβάλλοντα, ενώ σε αρκετές περιπτώσεις θα χρειαστεί να χρησιμοποιήσετε C, C++, Java και άλλες γλώσσες προγραμματισμού σε Linux ή Windows.  Ορισμένες διπλωματικές αφορούν και την αξιοποίηση Πλέγματος (Grid) δεδομένης και της εγκατάστασης σχετικού κόμβου στο ΤΜΗΥΠ. Στα πλαίσια των παρακάτω διπλωματικών θα συνεργαστείτε και με μεταπτυχιακούς και άλλους ερευνητές και συνεργάτες του επιβλέποντα σε ακαδημαϊκά ιδρύματα εδώ και στο εξωτερικό. Ενδέχεται επίσης η εργασία να είναι στα πλαίσια ερευνητικών προγράμματων. Για περισσότερες πληροφορίες καλείστε να επικοινωνήσετε με τον επιβλέποντα το συντομότερο (κατ’ αρχήν μέσω email: stratis@ceid.upatras.gr).stratis@ceid.upatras.gr

3 Πανεπιστήμιο Πατρών Θεματικές περιοχές I.Τεχνολογίες επιστημονικού υπολογισμού στην ανάκτηση πληροφορίας II.Από το διαδίκτυο στο πλέγμα III.Χαρακτηριστικά που «καθοδηγούν» επιστημονικούς υπολογισμούς IV.Περιβάλλοντα Επίλυσης Προβλημάτων για τον Επιστημονικό Υπολογισμό. V.Άλλα θέματα.

4 Πανεπιστήμιο Πατρών I) Τεχνολογίες επιστημονικού υπολογισμού στην ανάκτηση πληροφορίας  Στα πλαίσια τρέχουσας έρευνας αναπτύχθηκε to TMG, μια εργαλειοθήκη (toolbox) MATLAB για την αυτόματη προετοιμασία πινάκων "όρων-κειμένων" από συλλογές κειμένων με στόχο την περαιτέρω επεξεργασία τους (ως μητρώα) με τεχνικές γραμμικής άλγεβρας. Το εργαλείο αυτό έχει ήδη διανεμηθεί σε πολλούς χρήστες σε όλον τον κόσμο. Οι πίνακες αυτοί αποτελούν κύριο δεδομένο σε αλγόριθμους ανάκτησης πληροφορίας. Συνήθως είναι εξαιρετικά αραιοί και πολύ μεγάλοι.TMG  Μια διπλωματική θα εστιάσει στην περαιτέρω ανάπτυξη του TMG καθώς επίσης και στην επισκόπηση και στη συγκριτική αξιολόγηση άλλων σχετικών εργαλείων. Ορισμένες δραστηριότητες που αφορούν βελτιώσεις του TMG είναι ο εμπλουτισμός του με νέους αλγορίθμους, επιτάχυνσή του μέσω παράλληλης επεξεργασίας καθώς και η επέκταση της χρήσης του σε εφαρμογές πέραν των κειμένων με την ανάπτυξη των κατάλληλων API κ.λπ. Στόχοι μας είναι η συνεισφορά στη μετεξέλιξη του TMG σε περιβάλλον επίλυσης προβλημάτων για ανάκτηση πληροφορίας. Ανοικτά ενδιαφέροντα θέματα αφορούν επίσης στην προσαρμογή του TMG στα Ελληνικά, και στην ανάπτυξη εργαλείων και στη χρήση του για την αναζήτηση, συλλογή και ανάλυση πληροφορίας στο διαδίκτυο. Εφαρμογές με ιδιαίτερο ενδιαφέρον αποτελούν συλλογές όπως το Gutenberg, IMDB, κ.λπ.TMG D. Zeimpekis and E. Gallopoulos, "TMG: A MATLAB Toolbox for generating term-document matrices from text collections«. In "Grouping Multidimensional Data: Recent Advances in Clustering", J. Kogan, C. Nicholas and M. Teboulle, eds., pp. 187-210, Springer, 2005.  Ανάπτυξη εργαλειοθήκης με υπολογιστικούς πυρήνες με έμφαση στην ανάκτησης πληροφορίας. Ενδιαφέρουν ιδιαίτερα αλγόριθμοι για τον υπολογισμό της διάσπασης σε ιδιάζουσες τιμές (svd). Όπως είναι γνωστό, οι αλγόριθμοι αυτοί σχετίζονται άμεσα με αλγόριθμους για την εύρεση ιδιοζευγών. Μας ενδιαφέρει η προσαρμογή αλγορίθμων/βιβλιοθηκών όπως το PRIMME για τον υπολογισμο του svd. Ενιδαφέρει επίσης η μελέτη της αριθμητικής ποιότητας αλγορίθμων: Ειδικότερα, ενδιαφέρει η μελέτη των χαρακτηριστικών των μητρώων που εμφανίζονται στην ανάκτηση πληροφορίας και η κριτική αξιολόγηση των χρησιμοποιούμενων αλγορίθμων με βάση τα χαρακτηριστικά αυτά.PRIMME  Στην επίβλεψη των παραπάνω διπλωματικών θα επικουρεί ο υποψήφιος διδάκτορας κ. Δ. Ζεϊμπέκης.

5 Πανεπιστήμιο Πατρών Σχεδιασμός και υλοποίηση αποτελεσματικών αλγορίθμων: Διπλωματική εργασία θα εστιάσει στην ανάπτυξη αλγορίθμων, την υλοποίησή τους σε πρακτικά εργαλεία και την αξιολόγησή τους στην ανάκτηση πληροφορίας ξεκινώντας από μοντέλα συναφή με το διανυσματικό μοντέλο. Ορισμένα θέματα που ενδιαφέρουν:μοντέλα συναφή  Μελέτη και υλοποίηση αλγορίθμων για παράλληλη ομαδοποίηση.  Ειδικές παραγοντοποιήσεις των μητρώων όρων-κειμένων και η χρήση τους στην ανάκτηση και κωδικοποίηση πληροφορίας.  Χρήση τεχνικών πολυγραμμικής (multilinear) άλγεβρας και ανάλυσης τανυστών για την αποτελεσματική επεξεργασία κειμενικής και άλλης πληροφορίας.  Αποτελεσματική προσέγγιση μητρώων από μητρώα μειωμένης τάξης, δηλ. αλγόριθμοι για τη ελαχιστοποίηση κάποιου μέτρου απόστασης μεταξύ μητρώου Α και Β, όπου Β είναι μητρώο μικρής τάξης, π.χ. r, σε σχέση με την τάξη του A. H. Cheng, Z. Gimbutas, P.G. Martinsson, and V. Rokhlin. On the compression of low rank matrices. SIAM J. Sci. Stat. Comput., 26(4):1389–1404, 2005. P. Drineas, R. Kannan, and M. Mahoney. Fast Monte Carlo algorithms for matrices II: Computing a low-rank approximation to a matrix. Technical Report TR-1270, Yale University, Department of Computer Science, February 2004. D. Zeimpekis and E. Gallopoulos, "CLSI: A Flexible Approximation Scheme from Clustered Term- Document Matrices", Proc. SIAM 2005 Data Mining Conf. H. Kargupta, J. Srivastava, C. Kamath and A. Goodman, eds., pp. 631-635, April 2005, Newport Beach, California. For an extended version, see TR HPCLAB-SCG 2/10-04.SIAM 2005 Data Mining Conf.TR HPCLAB-SCG 2/10-04  Στην επίβλεψη των παραπάνω διπλωματικών θα επικουρεί ο υποψήφιος διδάκτορας κ. Δ. Ζεϊμπέκης. I) Τεχνολογίες επιστημονικού υπολογισμού στην ανάκτηση πληροφορίας

6 Πανεπιστήμιο Πατρών II) Από το διαδίκτυο στο πλέγμα Δυο από τις σημαντικότερες "υπολογιστικές τεχνολογίες" στην αποτελεσματική επίλυση των πολύ μεγάλων προβλημάτων του Επιστημονικού Υπολογισμού είναι α) οι επαναληπτικοί αλγόριθμοι και β) η παράλληλη επεξεργασία. Ο υπολογισμός του PageRank έχει αναδειχθεί, λόγω της κλίμακας του προβλήματος και των ειδικών συνθηκών που επικρατούν για τον υπολογισμό του, ως μια από τις μεγαλύτερες προκλήσεις υπολογισμών με μητρώα. Δείτε για παράδειγμα τα παρακάτω άρθρα:  C. Moler, The World’ s Largest Matrix Computation Google's PageRank is an eigenvector of a matrix of order 2.7 billionThe World’ s Largest Matrix Computation Google's PageRank is an eigenvector of a matrix of order 2.7 billion  K. Bryan and T. Leise, The $25,000,000,000 Eigenvector: The Linear Algebra behind Google K. BryanT. LeiseThe $25,000,000,000 Eigenvector: The Linear Algebra behind Google Ένα θέμα διπλωματικής αφορά στη χρήση μεθόδων Γραμμικής Άλγεβρας για τη διερεύνηση δίκτυων ευρείας κλίμακας που αναπαριστούν διασυνδέσεις στο Διαδίκτυο ("a la google"). Σημαντικά εμπόδια στην ανάλυση είναι το μέγεθός τους και η ταχύτατη μεταβολή τους. Ειδικότερα, η διπλωματική θα επικεντρωθεί στη χρήση ειδικών μεθόδων που αφορούν στον υπολογισμό του PageRank. Ενδιαφέρει επίσης η σύνδεση με σύγχρονα περιβάλλοντα παράλληλου υπολογισμού όπως το Petsc καθώς και ο σύγχρονος και ασύγχρονος υπολογισμός του στο Grid.  D. Gleich, L. Zhukov, and P. Berkhin. Fast parallel pagerank: A linear system approach. Technical report, Yahoo Corp., 2004.  G.H. Golub and C. Greif. Arnoldi-type algorithms for computing stationary distribution vectors, with application to PageRank. Technical Report SCCM-04-15, Stanford University, 2004.  C. Brezinski and M. Redivo-Zaglia, the pagerank vector: Properties, computation, approximation, and acceleration, SIAM Matrix Analysis, 2006.  A. Langville and C. Meyer. Google’s PageRank and beyond: The science of search engine rankings, Princeton Univ. Press, 2006.  P. Berkhin. A survey on pagerank computing. Internet Math., 2(1):73-120, 2005.  G. Kollias and E. Gallopoulos, "PageRank computations for compressed link-structures", Abstract at joint GAMM-SIAM Conference on Applied Linear Algebra, Duesseldorf, Germany, July 2006. Also Report (presentation) TR HPCLAB-SCG 7/07- 06, CEID, University of Patras.joint GAMM-SIAM Conference on Applied Linear Algebra  G. Kollias, E. Gallopoulos and D. Szyld, "Asynchronous iterative computations with Web information retrieval structures: The PageRank case", TR HPCLAB-SCG 5/08-05, CEID, University of Patras, August 2005. Presented at ParCo2005, Malaga, Spain (Sept. 2005) and to appear in the ParCo2005 Conference Proceedings.ParCo2005  Στην επίβλεψη των παραπάνω διπλωματικών θα επικουρεί ο υποψήφιος διδάκτορας κ. Γ. Κόλλιας.

7 Πανεπιστήμιο Πατρών II) Από το διαδίκτυο στο πλέγμα Ένα θέμα αφορά στο σχεδιασμό και στην υλοποίηση μεθόδων για τον ταχύ υπολογισμό συναρτήσεων (όπως του εκθετικού) πολύ μεγάλων, αραιών μητρώων. Το θέμα αυτό είναι κεντρικό στο σχεδιασμό αποτελεσματικών μεθόδων στον Επιστημονικό Υπολογισμό. Ειδικότερα ενδιαφέρει άμεσα η εφαρμογή των μεθόδων αυτών στον υπολογισμό του PageRank.  C. Moler and C. Van Loan, Nineteen Dubious Ways to Compute the Exponential of a Matrix, Twenty- Five Years Later. SIAM Review, Vol 45, No 1, March 2003.SIAM Review  http://www.math.ntnu.no/num/expint/matlab.php  Håvard Berland, Bård Skaflestad, and Will Wright. Expint — A Matlab package for exponential integrators. ACM Transactions on Mathematical Software (to appear).Expint — A Matlab package for exponential integrators.  R.B. Sidje. EXPOKIT: Software package for computing matrix exponentials. ACM Trans. Math. Softw., 24(1):130–156, 1998.EXPOKIT  A. Farahat, T. LoFaro, J.C. Miller, G. Rae, and L.A.Ward. Authority Rankings from HITS, PageRank, and SALSA: Existence, uniqueness, and effect of initialization. SIAM J. Sci. Comput. (to appear).  J.C. Miller, G. Rae, F. Schaefer, L.A. Ward, A. Farahat, and T. LoFaro. Modifications of Kleinberg’s HITS algorithm using matrix exponentiation and web log records. In Proc. 24th Annual International ACM SIGIR Conf. on Research and Development in Information Retrieval, pages 444–445, 2001.  P. Boldi, M. Santini and S. Vigna, PageRank as a Function of the Damping Factor, In Proc. of the Fourteenth International World Wide Web Conference, Chiba, Japan, 2005. ACM Press  A. Frommer and V. Simoncini, Matrix functions March 2006, pp.1-24. A. Frommer Matrix functions

8 Πανεπιστήμιο Πατρών III) Χαρακτηριστικά που καθοδηγούν επιστημονικούς υπολογισμούς & εφαρμογές Η θεματική αυτή αφορά στο θέμα της αξιολόγησης της πληροφορίας που προέρχεται από την εκτίμηση ορισμένων χαρακτηριστικών των μητρώων που διαχειριζόμαστε στη διάρκεια επιστημονικών υπολογισμών. Έχει αποδειχτεί ότι οι πληροφορίες που μας παρέχουν οι ιδιοτιμές αφορούν την ασυμπτωτική συμπεριφορά μητρώων και (επαναληπτικών) αλγορίθμων ενώ για την περιγραφή της συμπεριφοράς μητρώων σε «μεταβατικές» φάσεις των προβλημάτων πρέπει να χρησιμοποιήσουμε άλλες τεχνικές. Στόχος της εργασίας είναι να μελετηθούν ορισμένες από τις τεχνικές αυτές.  Με βάση προηγούμενες έρευνες, υπάρχουν αρκετά σημαντικά αποτελέσματα για το «ψευδοφάσμα μητρώων» Ενδιαφέρει ιδιαίτερα και ο υπολογισμός των παραπάνω χαρακτηριστικών σε υπολογιστικά περιβάλλοντα που επιτρέπουν παράλληλη επεξεργασία.«ψευδοφάσμα μητρώων»  Μια αφετηρία για διπλωματικές εργασίες είναι η μελέτη της εξέλιξης ψευδοφασμάτων μητρώων που εξαρτώνται από παραμέτρους (δείτε εδώ μια πρόσφατη παρουσίαση έρευνάς μας στην περιοχή) καθώς και η αποδοτική υλοποίηση και συγκριτική αξιολόγηση μιας τεχνικής (αριθμητικού πολυωνυμικού κελύφους) που έχει προταθεί σχετικά με το παραπάνω πρόβλημα. εδώτεχνικής  L. N. Trefethen and M. Embree, Spectra and Pseudospectra: The Behavior of Nonnormal Matrices and Operators, Princeton University Press, Princeton, NJ, 2005.Spectra and Pseudospectra: The Behavior of Nonnormal Matrices and Operators  Άρθρα στην ιστοσελίδα δημοσιευμάτων του διδάσκοντα.ιστοσελίδα δημοσιευμάτων  Ιστοσελίδα αναφοράς για τα ψευδοφάσματα. Ιστοσελίδα

9 Πανεπιστήμιο Πατρών IV) Περιβάλλοντα Επίλυσης Προβλημάτων, Επιστημονικός Υπολογισμός και Υπολογισμοί στο Πλέγμα. Θα επικεντρωθείτε σε θέματα που αφορούν Περιβάλλοντα Επίλυσης Προβλημάτων (Problem Solving Environments (PSEs)) για τον Επιστημονικό Υπολογισμό με έμφαση στον παράλληλο και κατανεμημένο υπολογισμό. Ένα τυπικό PSE είναι η MATLAB για εφαρμογές που διατυπώνονται, στις περισσότερες περιπτώσεις, με γραμμική άλγεβρα. Τα ΠΕΠ θα πρέπει να επιτρέπουν τη χρήση υπολογιστικών πόρων αιχμής, π.χ. παράλληλη επεξεργασία. Μια πρόταση είναι να ασχοληθείτε με το περιβάλλον Jylab που προτάθηκε πρόσφατα και που αποτελεί διαδραστικό εργαλείο για αναπτυξη επιστημονικών εφαρμογών με έμφαση σε διαδικτυακούς υπολογισμούς. Η γλώσσα διεπαφής του Jylab είναι η Python που με τη σειρά της υποστηρίζεται από Java. G. Kollias and E. Gallopoulos, "Jylab: A System for Portable Scientific Computing over Distributed Platforms". To appear in Proc. 2nd IEEE Int'l. Conf. on e-Science and Grid Computing (e-Science 2006): Session on Innovative and Collaborative Problem Solving, Amsterdam, Dec. 2006.e-Science 2006Session on Innovative and Collaborative Problem Solving  Πώς θα μπορούσαμε να βελτιώσουμε το Jylab; Μερικές προτάσεις:  η οργάνωση της παραγωγής διανομής/εγκατάστασης του Jylab γύρω από την ιδέα της μεταδιανομής,  η υλοποίηση ιδεών που θα αφορούν στη δυνατότητα ανεξάρτητης επέκτασης του Jylab από την κοινότητα των χρηστών του, η κατασκευή wrappers για κάποιες βιβλιοθήκες υπολογιστικής γραμμικής άλγεβρας, η προσπάθεια περαιτέρω αυτοματοποίησης της σχετικής διαδικασίας.  Η πειραματική διερεύνηση της αποδοτικότητας του προκύπτοντος συστήματος διεπαφής, σύγκριση με ισοδύναμες λειτουργίες όπως προσφέρονται από άλλα "πακέτα". Επισκόπιση, μελέτη, αξιοποίηση και αξιολόγηση του Jylab σε σχέση με πρόσφατα πακέτα όπως το Star-P της Interactive Supercomputing καθώς και με συστήματα όπως distributed MATLAB, Scilab, MPITB και άλλες εκδοχές παράλληλης MATLAB και το Netsolve/Gridsolve.Star-PNetsolve/Gridsolve  Eφαρμογές, μελέτες περιπτώσεων (case studies) και σχετικές αναφορές και αξιολογήσεις.  Ενδιαφέρουν η χρήση του διαδικτύου και τεχνολογιών Grid και ο συνδυασμός τους με το Jylab για την επίλυση προβλημάτων επιστημονικού υπολογισμού.  Στην επίβλεψη των παραπάνω διπλωματικών θα επικουρεί ο υποψήφιος διδάκτορας κ. Γ. Κόλλιας.


Κατέβασμα ppt "Πανεπιστήμιο Πατρών ΘΕΜΑΤΙΚΕΣ ΠΕΡΙΟΧΕΣ ΔΙΠΛΩΜΑΤΙΚΩΝ ΕΡΓΑΣΙΩΝ 2006-07 ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ 2006-07 Καθηγητής Ε. ΓαλλόπουλοςΕ. Γαλλόπουλος Εργαστήριο Πληροφοριακών."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google