Εισαγωγή στη Βιοπληροφορική

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ΄ΛΥΚΕΙΟΥ
Advertisements

Γενετικής-Ιατρικής Πληροφορίας
ΕΦΑΡΜΟΣΜΕΝΗ ΜΟΡΙΑΚΗ ΒΙΟΛΟΓΙΑ
Εισαγωγή στη Βιοπληροφορική 3η διάλεξη Μάθημα Ελεύθερης Επιλογής Τομέα Λογικού των Υπολογιστών Εαρινό Εξάμηνο Ακαδ. Έτους Χ. Mακρης- Α. Περδικούρη.
Εισαγωγή στη Βιοπληροφορική 2η διάλεξη
Τεχνικές κατασκευής δένδρων επιθεμάτων πολύ μεγάλου μεγέθους και χρήσης τους για γρήγορη αναζήτηση βιολογικών δεδομένων Βασίλης Πολυχρονόπουλος.
Πτυχιακή εργασία των Κωνσταντίνου Κουρμούση (1604)
Μικροσυστοιχίες και ανάλυση δεδομένων
Φυλογενετικά δέντρα.
ΚΕΦΑΛΑΙΟ 1ο ΓΕΝΕΤΙΚΟ ΥΛΙΚΟ ΜΕΡΟΣ Α
Proteomics and Genomics for Drug Discovery / Personalized Medicine
ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ
ΚΕΦΑΛΑΙΟ 3 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΤΩΝ Γ.Σ.Π.. ΟΡΙΣΜΟΙ Ένα σύστημα για τακτικό και συνηθισμένο τρόπο επεξεργασίας δεδομένων και για απάντηση προκαθορισμένων και.
Οι λειτουργίες του γενετικού υλικού.
Πτυχιακή εργασία: «Ανάπτυξη αλγορίθμου Γενετικού Προγραμματισμού (Genetic Programming) με δυνατότητα διαχείρισης δενδροειδών δομών και εφαρμογή του στην.
Το έργο «Εθνικό Πληροφοριακό Σύστημα Έρευνας και Τεχνολογίας (ΕΠΣΕ+Τ) - Γ' ΦΑΣΗ "Αποθετήρια και Επιστημονικά Ηλεκτρονικά Περιοδικά Ανοικτής Πρόσβασης"»
ΕΥΡΕΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΕΚΤΟΠΩΝ ΣΕ ΒΙΒΛΙΟΓΡΑΦΙΚΗ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ
ΑΝΤΙΓΡΑΦΗ, ΕΚΦΡΑΣΗ ΚΑΙ ΡΥΘΜΙΣΗ ΤΗΣ ΓΕΝΕΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ
ΚΕΦΑΛΑΙΟ 1ο ΓΕΝΕΤΙΚΟ ΥΛΙΚΟ ΜΕΡΟΣ Α.
ΑΝΤΙΓΡΑΦΗ, ΕΚΦΡΑΣΗ ΚΑΙ ΡΥΘΜΙΣΗ ΤΗΣ ΓΕΝΕΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ
Οργάνωση πληροφοριών Ευρετηρίαση Μέρος Β Σχεδιασμός ευρετηρίων.
ΤΟ ΓΕΝΕΤΙΚΟ ΥΛΙΚΟ ΟΡΓΑΝΩΝΕΤΑΙ ΣΕ ΧΡΩΜΟΣΩΜΑΤΑ
ΛΕΙΤΟΥΡΓΙΕΣ ΤΟΥ ΓΕΝΕΤΙΚΟΥ ΥΛΙΚΟΥ
Δημήτριος Ι. Φωτιάδης Πανεπιστήμιο Ιωαννίνων
ΑΝΤΙΓΡΑΦΗ, ΕΚΦΡΑΣΗ ΚΑΙ ΡΥΘΜΙΣΗ ΤΗΣ ΓΕΝΕΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ
Βιοπληροφορική.
Εισαγωγή στη Βιοπληροφορική
ΕΙΣΑΓΩΓΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ
Χωρικοί-χρονικοί συμβιβασμοί
Διδακτική της Πληροφορικής ΗΥ302 Εργασία :Παρουσίαση σχολικού βιβλίου Γ’ Λυκείου Τεχνολογικής Κατεύθυνσης «Ανάπτυξη εφαρμογών σε προγραμματιστικό περιβάλλον»
ΓΟΝΙΔΙΑΚΗ ΡΥΘΜΙΣΗ:Ο ΕΛΕΓΧΟΣ ΤΗΣ ΓΟΝΙΔΙΑΚΗΣ ΕΚΦΡΑΣΗΣ
 Λαμβάνουν υπόψη τις πολιτισμικές και κοινωνικές συνθήκες μάθησης.  Έχουν επιρροές από ανθρωπολογία και κοινωνική ψυχολογία  Ενδιαφέρονται για τις.
Προηγμένη Εφαρμογή Ιστού Διαχείρισης Δεδομένων Βιοεπιστημών Διπλωματική Εργασία του Γεωργίου Πρέκα ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ.
1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Ανακάλυψη Γνώσης από Βιολογικές Αλληλουχίες Αλεξανδρίδου Αναστασία.
Η ΔΟΜΗ ΤΩΝ ΝΟΥΚΛΕΙΚΩΝ ΟΞΕΩΝ
TO ΓΕΝΕΤΙΚΟ ΥΛΙΚΟ ΟΡΓΑΝΩΝΕΤΑΙ ΣΕ ΧΡΩΜΟΣΩΜΑΤΑ
ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΒΙΟΛΟΓΙΑΣ & Η ΔΙΔΑΚΤΙΚΗ ΤΗΣ Dr. ΜΙΧΜΙΖΟΣ ΔΗΜΗΤΡΗΣ
ΕΞΑΤΟΜΙΚΕΥΜΕΝΗ ΙΑΤΡΙΚΗ
ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΣΩΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ.
ΠΡΟΓΡΑΜΜΑ ΑΝΘΡΩΠΙΝΟΥ ΓΟΝΙΔΙΩΜΑΤΟΣ & ΕΞΕΛΙΞΗ
Η ροή της γενετικής πληροφορίας
Απομόνωση DNA Mια πλήρης σειρά όλης της γενετικής πληροφορίας ενός ιού ή ενός κυττάρου αποτελεί το γονιδίωμα. Στα σωματικά κύτταρα ενός ευκαρυωτικού οργανισμού.
1 ΒΙΟΧΗΜΕΙΑ ΤΟΥ ΜΕΤΑΒΟΛΙΣΜΟΥ ΑΣΚΗΣΗ ΠΡΑΞΗΣ 10η ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΠΡΩΤΕΪΝΕΣ.
Εισαγωγή στη Βιοπληροφορική Ενότητα 1: Εισαγωγικά θέματα Μακρής Χρήστος, Τσακαλίδης Αθανάσιος, Περδικούρη Αικατερίνη Πολυτεχνική Σχολή Τμήμα Μηχανικών.
DNA (Δεοξυριβονουκλεϊκό οξύ)
شیمی آلی 3.
ΝΟΥΚΛΕΪΝΙΚΑ ΟΞΕΑ.
Η ροή της γενετικής πληροφορίας. Στo DNA βρίσκονται αποθηκευμένες οι πληροφορίες που αφορούν : στον αυτοδιπλασιασμό του →εξασφαλίζοντας έτσι τη μεταβίβαση.
Θέματα Υπολογισμού στον Πολιτισμό Εύη Παπαϊωάννου
ΕΝΟΤΗΤΑ 1. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΕΦΑΛΑΙΟ 1.1 ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ 1.
ΟΜΑΔΕΣ Δημιουργία Ομάδων
Ανάλυση δεδομένων κοινωνικής έρευνας
ΕΘΝΙΚΟ & ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ Τμήμα Τεχνολόγων Περιβάλλοντος
Από το Αλφαβητάρι του Σχολείου στο Αλφαβητάρι της Ζωής
ΑΝΤΙΓΡΑΦΗ, ΕΚΦΡΑΣΗ ΚΑΙ ΡΥΘΜΙΣΗ ΤΗΣ ΓΕΝΕΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ
Γαριπίδης Ιορδάνης Βιολόγος 3ο ΓΕΛ Χαϊδαρίου
Πολυμεσικές υπηρεσίες στην υγεία (ΛΟΓ51) 1. Εισαγωγή στο μάθημα
Ερωτήσεις από όλη την ύλη
Η δομή των νουκλεϊκών οξέων
ΤΟΜΕΙΣ ΕΠΙΣΤΗΜΗΣ Επιστημονικοί τομείς χωρίζονται σε :
ΝΟΥΚΛΕΪΚΑ ΟΞΕΑ 2ο ΓΕΛ ΧΑΪΔΑΡΙΟΥ.
ΕΞΕΤΑΣΤΕΑ ΥΛΗ για το ΔΙΑΓΩΝΙΣΜΑ ΟΜΑΔΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ
Βιολόγος 3ο ΓΕΛ Χαϊδαρίου
מצגת " חומצות אמיניות" ערכה : מרגולין אירנה..
مركبات الغذاء مركبات الغذاء الأساسية فيتامينات ومعادن
Παράδειγμα χρήσης λογισμικού παρουσίασης
Σκοπός Η συνοπτική παρουσίαση
Πρόγραμμα επιμόρφωσης Β1 Συστάδα 2: Φυσικές Επιστήμες, Τεχνολογία, Φυσική Αγωγή και Υγεία Εισαγωγική Επιμόρφωση για την εκπαιδευτική αξιοποίηση ΤΠΕ Εκπαιδευτικός:
Ερωτήσεις από τον Πανελλήνιο Διαγωνισμό Βιολογίας
Μεταγράφημα παρουσίασης:

Εισαγωγή στη Βιοπληροφορική Εισαγωγικό Φροντιστήριο

Τι είναι Βιοπληροφορική Βιο μοριακή βιολογία Πληροφορική επιστήμη των υπολογιστών Βιοπληροφορική επιλύει προβλήματα που προκύπτουν από τη βιολογία χρησιμοποιώντας μεθοδολογία από την επιστήμη υπολογιστών

Βιοπληροφορική και συναφείς επιστήμες Βιοπληροφορική και συναφείς επιστήμες Επιστήμη των υπολογιστών Μαθηματικά και Στατιστική Βιολογία Ιατρική Χημεία Φυσική

Η Βιοπληροφορική σχετίζεται με: Εξαγωγή ακολουθιών DNA από το γενετικό υλικό Σχολιασμός ακολουθιών (π.χ. με πληροφορίες από πειράματα) Κατανόηση του ελέγχου της έκφρασης των γονιδίων (δηλαδή κάτω από ποιες συνθήκες δημιουργούνται οι πρωτεΐνες από το DNA Τη σχέση μεταξύ την αλληλουχία αμινοξέων των πρωτεϊνών και τη δομή τους

Στόχος της έρευνας στη Βιοπληροφορική Η κατανόηση της λειτουργίας των ζωντανών όντων Σχεδιασμός φαρμάκων Αναγνώριση γενετικών παραγόντων κινδύνου Γονιδιακή θεραπεία Γενετική τροποποίηση φυτών και ζώων Βελτίωση μέσων βιολογικού πολέμου

Βασικές Έννοιες Βιοπληροφορική είναι η διαχείριση της Βιολογίας σε όρους μορίων (με την έννοια της Φυσικής Χημείας) και η εφαρμογή “τεχνικών πληροφορικής” (εφαρμοσμένα μαθηματικά, επιστήμη των υπολογιστών και στατιστική) για την κατανόηση και οργάνωση πληροφορίας που σχετίζεται με τα μόρια σε μεγάλη κλίμακα. Figure from “Bioinformatics, from Genomes to Drugs”. T. Lengauer

DNA Το DNA αποτελείται από 1 διπλή έλικα βάσεων. Οι βάσεις ενώνονται σε συγκεκριμένη σειρά και αποθηκεύουν τη γενετική πληροφορία κάθε οργανισμού: Α (αδενίνη), Τ (θυμίνη), C (κυτοσίνη), G (γουανίνη) Κάθε μόριο του DNA μπορεί να θεωρηθεί ως μία συμβολοσειρά με αλφάβητο {A,C,T,G} Διπλή έλικα, η γνώση της μίας έλικας συνεπάγεται και τη γνώση της άλλης (Α-Τ, C-G)

DNA

Γονιδιώματα (Genomes) Ο όρος γονιδίωµα-genome, αναφέρεται σε ολόκληρη την ακολουθία DNA ενός ζωντανού οργανισµού, Το ανθρώπινο γονιδίωµα αποτελείται από 46 χρωµοσώµατα, Κάθε κύτταρο περιλαµβάνει ολόκληρο το γονιδίωµα ενός οργανισµού (διαφοροποίηση ευκαρυωτικών από προκαρυωτικά κύτταρα)

Human Genome Project Παγκόσμια προσπάθεια χαρτογράφησης του ανθρώπινου DNA To project άρχισε το 1990 και ολοκληρώθηκε το 2003 Στόχος να αναγνωριστούν και τα 30000 περίπου γονίδια του ανθρώπινου οργανισμού και να διαβαστούν όλες οι ακολουθίες DNA Στόχος επίσης να τοποθετηθεί όλη η πληροφορία σε βάσεις δεδομένων και να βελτιωθούν τα εργαλεία για την ανάλυσή της

Ακολουθία βάσεων DNA

Γονίδιο Βασική μονάδα κληρονομικότητας Ακολουθία βάσεων η οποία μεταφέρει την πληροφορία που απαιτείται για να δημιουργηθεί μια συγκεκριμένη πρωτεΐνη. Ένα γονίδιο κωδικοποιεί μια πρωτεΐνη ή ένα μόριο RNA

Από το γονίδιο στην πρωτεΐνη

Πρωτεΐνες - Proteins Οι πρωτεΐνες είναι µόρια που αποτελούνται από ένα ή περισσότερα πολυπεπτίδια, Ένα πολυπεπτίδιο, είναι ένα πολυµερές που δοµείται από αμινοξέα, Τα κύτταρα κατασκευάζουν τις πρωτεΐνες τους από 20 διαφορετικά αμινοξέα, Μια ακολουθία πρωτεΐνης μπορεί να θεωρηθεί ως µια συμβολοσειρά, από ένα αλφάβητο 20 χαρακτήρων, Σ= {Ala, Arg, Asp, Asn, Cys, Glu, Gln, Gly, Hsi,Ile, Leu, Lys, Met, Phe, Pro, Ser, Thr, Trp, Tyr, Val}.

Δομή Πρωτεΐνης Η λειτουργία των πρωτεϊνών καθορίζεται από τη δομή τους. Η δομή τους καθορίζεται από την αλληλουχία των αμινοξέων.

Επίπεδα δομής πρωτεϊνών Πρωτογενής δομή (γραμμική ακολουθία αμινοξέων) Δευτερογενής δομή Τριτογενής δομή δομές αμινοξέων στο Τεταρτογενής δομή χώρο ολοένα και πιο σύνθετες

Επίπεδα δομής πρωτεϊνών

Στόχοι Μοριακής Βιολογίας Ακολουθιοποίηση και σύγκριση των γονιδιωµάτων διαφορετικών οργανισµών (εξελικτική πορεία, επακριβής συσχέτιση). Αναγνώριση γονιδίων και καθορισµός των λειτουργιών που ρυθµίζουν (αναγνώριση σημείων πρόσδεσης πρωτεινών, και από εκεί αναγνώριση γονιδίων). Κατανόηση της γονιδιακής έκφρασης (κάθε γονίδιο δραστηριοποιείται μετά την παραγωγή της αντίστοιχης έκφρασης, μελέτη της διαδικασίας δραστηριοποίησης). Κατανόηση Γενετικών Ασθενειών (μετάλλαξη γονιδίων).

Τομείς Έρευνας Βιοπληροφορικής Στόχοι της Βιοπληροφορικής: Αποδοτική οργάνωση των δεδομένων ώστε να είναι δυνατή η αποθήκευση, ανάκτηση και ενημέρωσή τους. Παράδειγμα: Protein Data Bank.

Τομείς Έρευνας Βιοπληροφορικής Υλοποίηση και Σχεδιασµός υπολογιστικών εργαλείων για αυτόµατη ανάκτηση γνώσης από Βάσεις Βιολογικών ∆εδοµένων. Ανάλυση Ακολουθιών Βιολογικών∆εδοµένων Κατηγοριοποίηση Βιολογικών ∆εδοµένων Μοριακή Μοντελοποίηση Ανάλυση Πρωτεϊνών Σχεδιασµός Φαρµάκων µε χρήση Η/Υ

Διάγραμμα Ύλης Α’ Μέρος Κεφάλαιο 1: Εισαγωγή στη χρήση αλγορίθµων για αποτελεσµατική διαχείριση και αποθήκευση συµβολοσειρών (strings) και ακολουθιών βιολογικών δεδοµένων. Κεφάλαιο2: Αλγόριθµοι ακριβούς ταιριάσµατος προτύπου (Boyer-Moore, Knuth-Morris-Pratt, Shift-Or, Πολλαπλών Προτύπων). Κεφάλαιο 3: Εισαγωγή στο δέντρο επιθεµάτων (suffix tree) και στις εφαρµογές του. Κεφάλαιο 4:Αλγόριθµοι προσεγγιστικού ταιριάσµατος προτύπου και στοίχισης συµβολοσειρών/ακολουθιών (Sequence Alignment). Κεφάλαιο 5: Αλγόριθµοι αναζήτησης σε Βάσεις ∆εδοµένων ακολουθιών (FASTA, BLAST, PROSITE)

Διάγραμμα Ύλης Β’ Μέρος Η Θεωρητική Βάση του Μοριακού Σχεδιασµού Διάγραμμα Ύλης Β’ Μέρος Η Θεωρητική Βάση του Μοριακού Σχεδιασµού Μοριακά Μοντέλα και Βιοχηµική Πληροφορία Η Βασιζόµενη στη ∆οµή Σχεδίαση Φαρµάκων Ανοικτά Προβλήµατα Γ’ Μέρος Τεχνικές ομαδοποίησης και κατηγοριοποίησης βιολογικών δεδοµένων (clustering and categorization techniques) µε σκοπό την πρόβλεψη της συµπεριφοράς βιολογικών µορίων.

Εξέταση Μαθήματος Η εξέταση του μαθήματος συνίσταται: Στην παράδοση µιας εργασίας από οµάδες 1-2 ατόµων → 30% βαθµού Παρουσίαση & Προφορική Εξέταση πάνω στις σηµειώσεις του µαθήµατος και σε μία επιπλέον εργασία → 70% βαθµού

Προτεινόμενη Βιβλιογραφία Πανεπιστημιακές Σημειώσεις: Α. Περδικούρη, Α. Τσακαλίδη,  με τίτλο "Εισαγωγή στη Βιοπληροφορική" Dan Gusfield, “Algorithms on Strings, Trees and Sequences: Computer Science and Computational Biology”

Αλγόριθμοι Ακριβούς Εύρεσης Προτύπου Απλοϊκή Προσέγγιση Η απλοϊκή προσέγγιση αναζήτησης ενός προτύπου- pattern P μήκους n σε ένα κείμενο ή βιολογική ακολουθία X μήκους m, στοιχίζει το πρότυπο στην πρώτη θέση της ακολουθίας και εξετάζει έναν προς έναν τους χαρακτήρες του προτύπου Σε περίπτωση μη ταιριάσματος- mismatch, η σύγκριση ξαναρχίζει με μετατόπιση του προτύπου κατά μια θέση. Η απλοϊκή αυτή προσέγγιση στοιχίζει O(n*m) χρόνο.

Αλγόριθμοι Ακριβούς Εύρεσης Προτύπου Απλοϊκή Προσέγγιση

Αλγόριθμοι Ακριβούς Εύρεσης Προτύπου Αλγόριθμοι που χρησιμοποιούν διάφορες τεχνικές επιτάχυνσης της διαδικασίας αναζήτησης. Boyer-Moore, συγκρίνει τους χαρακτήρες του προτύπου (pattern) ως προς την ακολουθία από δεξιά προς τα αριστερά, Knuth-Morris-Pratt, αποτελεί το πιο σημαντικό αλγόριθμο γραμμικής πολυπλοκότητας Shift-Or, χρησιμοποιεί αριθμητικές μεθόδους.

Suffix Trees Δέντρο Επιθεμάτων (Suffix Tree) και Γενικευμένο Δέντρο Επιθεμάτων (Generalized Suffix Tree) Επιτρέπουν την αποδοτική αποθήκευση και διαχείριση συμβολοσειρών. Εφαρμογές

Suffix Trees Το Δέντρο Επιθεμάτων (Suffix Tree), αποθηκεύει όλα τα δυνατά επιθέματα της συμβολοσειράς S, όπως φαίνεται και στο ακόλουθο σχήμα.

Γενικευμένο Δέντρο Επιθεμάτων Το Γενικευμένο Δέντρο Επιθεμάτων (Generalized Suffix Tree), αποτελεί ένα Γενικευμένο Δέντρο Επιθεμάτων το οποίο αποθηκεύει όλα τα δυνατά επιθέματα ενός συνόλου συμβολοσειρών S={S1,S2,…Sn}

Αλγόριθμοι προσεγγιστικής εύρεσης προτύπου και στοίχισης συμβολοσειρών. Επιτρέπεται η ύπαρξη διαφοροποιήσεων στις εμφανίσεις του προτύπου, που προκύπτουν από την αντικατάσταση, προσθήκη ή διαγραφή συμβόλων. Τοπική - local sequence alignment Ολική - global sequence alignment

Μέθοδος του Δυναμικού Προγραμματισμού Αναδρομική μέθοδος, η οποία μας επιτρέπει να υπολογίσουμε την απόσταση μετασχηματισμού μεταξύ 2 ακολουθιών και ταυτόχρονα την ακολουθία μετασχηματισμού ή κάτω από ένα διαφορετικό πρίσμα τη στοίχιση-ομοιότητα 2 ακολουθιών.

Αλγόριθμοι Κατηγοριοποίησης Βιολογικών Δεδομένων Ξεκινώντας από ένα σύνολο δεδομένων, επιχειρεί να το οργανώσει σε ομάδες ομοειδών στοιχείων που ονομάζουμε συστάδες (clusters). Οι ομάδες αυτές δεν είναι εκ των προτέρων γνωστές αλλά προκύπτουν δυναμικά. Αντίθετα σε μια διαδικασία ταξινόμησης ή επιβλεπόμενης μάθησης (supervised learning), οι κλάσεις/ κατηγορίες στις οποίες αντιστοιχίζονται τα δεδομένα, είναι εκ των προτέρων γνωστές και αποτελούν είσοδο στην αντίστοιχη μέθοδο.

Ιεραρχικές Μέθοδοι Ομαδοποίησης Ιεραρχική Συσσωρευτική Κατηγοριοποίηση- Hierarchical Agglomerative Clustering Ιεραρχική Διαιρετική Κατηγοριοποίηση- Hierarchical Divisive Clustering

Επαναληπτική Διαιρετική Κατηγοριοποίηση- Iterative Divisive Partitioning Ξεκινάμε διαχωρίζοντας το σύνολο των δεδομένων σε έναν αριθμό συστάδων και υπολογίζουμε τα κέντρα βάρους τους. Στη συνέχεια κάθε στοιχείο αντιστοιχίζεται στη συστάδα με το κοντινότερο κέντρο βάρους και υπολογίζουμε εκ νέου τα νέα κέντρα βάρους. Η διαδικασία επαναλαμβάνεται έως ότου τα στοιχεία δεν αλλάζουν συστάδα. Ο πιο αντιπροσωπευτικός αλγόριθμος αυτής της κατηγορίας είναι ο k-means.