Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Δομή πρωτεϊνών. Θέματα διαλέξεων  Εισαγωγή στις πρωτεΐνες  Δομή πρωτεϊνών  Ταξινόμηση βάσει δομής  Βάσεις με δομές πρωτεϊνών  Ευθυγράμμιση δομών.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Δομή πρωτεϊνών. Θέματα διαλέξεων  Εισαγωγή στις πρωτεΐνες  Δομή πρωτεϊνών  Ταξινόμηση βάσει δομής  Βάσεις με δομές πρωτεϊνών  Ευθυγράμμιση δομών."— Μεταγράφημα παρουσίασης:

1 Δομή πρωτεϊνών

2 Θέματα διαλέξεων  Εισαγωγή στις πρωτεΐνες  Δομή πρωτεϊνών  Ταξινόμηση βάσει δομής  Βάσεις με δομές πρωτεϊνών  Ευθυγράμμιση δομών  Πρόβλεψη δομής

3 Εισαγωγή στις πρωτεΐνες

4 Ρόλος πρωτεϊνών  Δομικές πρωτεΐνες: περίβλημα ιών, το εξωτερικό στρώμα του δέρματος,  Καταλύτες: χημικών αντιδράσεων (ένζυμα)  Μεταφορά και αποθήκευση (haemoglobins)  Ρυθμιστικές πρωτεΐνες (ορμόνες, reception signal transduction)  Αναγνώριση (cell adhesion και αντισώματα)

5 Πρωτεΐνες  Οι πρωτεΐνες είναι μεγάλα μόρια πολυπεπτίδια  Active region = η ενεργός περιοχή της πρωτεΐνης= η περιοχή που προσδιορίζει τη λειτουργία της  η υπόλοιπη πρωτεΐνη έχει δομικό ρόλο  Γνωρίζουμε τη δομή πρωτεϊνών (βάση PDB, Μαρτ. 2004)  Μέθοδοι: κρυσταλλογραφία (ακτίνες Χ)/Nuclear Magnetic Resonance

6 οι πρωτεΐνες είναι πολυπεπτίδια Mainchain, ίδια για όλες τις πρωτεΐνες Side chain, διαφέρει σε κάθε πρωτεΐνη Τα R j προσδιορίζουν την πρωτεΐνη, αναφέρονται και ως redisidues Ομάδα άνθρακα υδροξυλίου Ομάδα αζώτου γωνία Φ Γωνία ΨΓωνία ω=180 ή σπάνια 0

7 Δομές πρωτεϊνών  a-helix  b-sheet  Loops: μεταξύ α-helices, b-sheets Διαφορετικά μήκη Στην επιφάνεια της πρωτεΐνης  Coils

8

9 Alpha proteins, παράδειγμα

10 beta proteins (PDB:1eap)

11 Alpha and beta proteins (a/bAlpha and beta proteins (a/b), Mainly parallel beta sheets (beta-alpha-beta units)

12 a+b, Mainly antiparallel beta sheets (segregated alpha and beta regions)

13 20 αμινοξέα που απαντώνται στη φύση Υδρόφοβα I: Isoleucine A: Alanine L: Leucine P: Proline F: Phenylamine V: Valine M: Methionine Πολωμένα S: Serine Q: Glutamine C: Cysteine H: Histidine T: Treonine Y: Tyrosine N: Aspargine W: Tryptophan Φορτισμένα D: Aspartic Acid E: Glumatic Acid K: Lusine R: Arginine G: Glycine

14 Side chain  Οι φυσικοχημικές ιδιότητες της side chain δημιουργούν τις δομές των πρωτεϊνών  Τα αμινοξέα ταξινομούνται βάσει της ομάδας R

15 Sasisekharan – Ramakrishnan – Ramachadran plot  Περιγράφει δυνατές δομές της κύριας αλυσίδας  Oι επιτρεπόμενες τιμές για τις γωνίες φ, ψ, ω  Με στίγματα απεικονίζονται τα α/a  Τα περισσότερα είναι στις περιοχές β-sheets (πάνω αριστερά) α-helices (κάτω αριστερά)

16 Ramachadran plot της 1a2q πρωτεΐνης

17 Ευστάθεια πρωτεϊνών  Tι δίνει στις πρωτεΐνες την ευστάθειά τους;  Tι δίνει στις πρωτεΐνες τη μοναδική δομή τους;  Απαντήσεις μέσω μελέτης του denaturation denuaturation: η πρωτεΐνη σε συνθήκες διαφορετικές από τις φυσιολογικές Π.χ. Θερμότητα/ περιβάλλον ουρίας  Συμπεράσματα: Πρωτεΐνες οριακά σταθερές

18 Γιατί οι πρωτεΐνες υιοθετούν τη δομή τους; Δομή πρωτεΐνης  ικανοποίηση παρακάτω κριτηρίων  Για main και sidechains  στερεοχημικά δυνατές δομές  Μεταξύ Εμφωλιασμένων πολωμένων ατόμων  δεσμοί υδρογόνου  Η υδρόφοβη επιφάνεια πρέπει να είναι εμφωλιασμένη

19 Πως βρίσκουν τη δομή τους;  Σε κατάλληλες συνθήκες (διαλύτης/ θερμοκρασία)  3διάστατη δομή.

20 Εφαρμογές των υδρόφοβων καταλοίπων (residues)  Η υδροφοβική ιδιότητα μπορεί να χρησιμοποιηθεί για πρόβλεψη θέσεων turns και άλλων τριδιάστατων δομών  Κατασκευάζεται αρχικά το υδροφοβικό προφίλ (γράφημα) της πρωτεΐνης  Τα ελάχιστα του γραφήματος δηλώνουν πιθανές θέσεις υδρόφιλων καταλοίπων.  Είναι πιθανότατα στην επιφάνεια

21 Figure 5.4 (hen egg white lusozyme) Ελάχιστα στις θέσεις 17,44, 70, 93, 117

22 Δομή πρωτεϊνών

23 Περιγραφή πρωτεϊνών βάσει δομής a  Primary structure: ακολουθία α/α  Secondary structure: helices, sheets (ουσιαστικά αλληλεπιδράσεις μεταξύ C=0 και ΝΗ)  Tertiary structure: σύνθεση από helices, sheets  Quaternary structure: πρωτεΐνες που αποτελούνται από πολλές υπομονάδες, κάθε μία έχει μία tertiary structure

24 Ταξινόμηση πρωτεϊνών

25 1. Βάσει Δομής 2. Βάσει Ομοιότητας ακολουθίας (ευθυγραμμίσεις κτλ.)

26 Λόγος ταξινόμησης βάσει Δομής  Δομική ομοιότητα  ισχυρή ένδειξη ομολογίας  Ταξινόμηση σε διάφορα επίπεδα Παρόμοια διπλώματα πρωτεϊνών (χωρίς οι δομές να σχετίζονται απαραίτητα)  Ταξινόμηση μπορεί να χρησιμοποιηθεί για την εύρεση της εξελικτικής σχέσης και πιθανώς της λειτουργίας (ρόλου)  Μπορεί να ψάξει τη βάση, βάσει δομής

27 Ταξινόμηση βάσει δομής  SCOP (Structural Classification of Proteins)  CATH (Class, Architecture, Topology, Homologous superfamily)  FSSP/DDD (Fold classification based on Structure-Structure alignment of Proteins/Dali Domain Director  CE (The combinatorial Extension Model)

28 SCOP, Ιεραρχική Ταξινόμιση: Ταξινομεί βάσει 1. εξελικτικής προέλευσης 2. Δομικής ομοιότητας Κατηγορίες, από το ειδικό στο γενικό a. Domains b. Families c. Supefamilies d. Folds e. Class

29 Domains  Λειτουργικός ρόλος:Ένα domain, είναι ένας ανεξάρτητος δομικός λίθος που απαντάται σε πολλές πρωτεΐνες.  Φυσικοχημικός ρόλος: Κάθε domain έχει ένα υδρόφοβο πυρήνα.  Τοπολογικός: οι αποστάσεις των ατόμων στο ίδιο domain είναι ελάχιστες. Οι αποστάσεις μεταξύ ατόμων διαφορετικών domains είναι μέγιστες  Πρωτεΐνες: Mία πρωτεΐνη μπορεί να αποτελείται από πολλά domains. To ίδιο domain απαντάται σε πολλές πρωτεΐνες

30 Family  Κοινή εξελικτική προέλευση=τουλάχιστον 50% ομοιότητα

31 Superfamily  Μικρή ομοιότητα στην primary structure  Δομές και λειτουργία υποδεικνύουν κοινή εξελικτική προέλευση,  Πιθανότητα να μην σχετίζονται ακολουθίες του ίδιου superfamily < 10 -6

32 Fold, Class  Ίδιες κύριες δευτερογενείς δομές  Στην ίδια διάταξη  E.g. rossman fold=εναλλασσόμενα α helices και β-sheets  Τα folds υποδιαιρούνται σε classes α-helices β-sheets α/β α+β  Multi domain proteins  Membrane and cell surface proteins  Small proteins

33 Παράδειγμα από SCOP, Flavodoxin from Clostridium beijerinckii 1. Root: SCOP 2. Class: Alpha and beta proteins (α/β) 3. Fold: Flavodoxin-like 1. 3 layers, α/β/α parallel β sheet of 5 strands, 4. Superfamily: Flavoproteins 5. Family: Flavodoxin-related binds FMN 6. Protein: Flavodoxin

34 Βάση ταξινόμησης SCOP 1.65 release PDB Entries (1 August 2003) Domains. Class Number of folds Number of superfamilies Number of families All alpha proteins All beta proteins Alpha and beta proteins (a/b) Alpha and beta proteins (a+b) Multi-domain proteins38 53 Membrane and cell surface proteins Small proteins Total

35 Βάσεις με δομές πρωτεϊνών

36 Protein Data Bank (PDB) hepatitis C Virus Ns3 Proteinase 1a1q

37 PDB format ATOM 1 CA PRO A C ATOM 2 CA ILE A C ATOM 3 CA THR A C ATOM 4 CA ALA A C ATOM 5 CA TYR A C ATOM 6 CA SER A C ATOM 7 CA GLN A C ATOM 8 CA GLN A C …………. ATOM 532 CA GLU C C ATOM 533 CA THR C C ATOM 534 CA THR C C

38 Βάση PDB, πρωτεΐνες

39 Βάση PDB, Folds

40 Καινούργια Folds

41 Ευθυγράμμιση πρωτεϊνικών δομών

42 Ευθυγράμμιση  Ευθυγραμμίζουμε δομές για τον ίδιο λόγο που ευθυγραμμίζουμε ακολουθίες  Πως βαθμολογούμε την ευθυγράμμιση; Ακολουθίες: π.χ. Τα ποσοστά των αμινοξέων που είναι κοινά. Η μέση απόσταση των αμινοξέων (rmsd=root mean square deviation)

43 Ποιά είναι η βέλτιστη Ευθυγράμμιση; +

44 Υπέρθεση δομών  Υποθέστε ότι έχουμε τρόπο ευθυγράμμισης δομών  Τότε Α. Έχουμε καλύτερα sequence alignments B. Μπορούμε να βρούμε ομοιότητες πάνω στην ενεργή περιοχή (δηλαδή δομικές).  Κριτήριο ποιότητας ευθυγράμμισης

45 Root Mean Squared Distance Μονάδα μέτρησης του RMSD => π.χ Ångstroms - Ταυτόσημες δομές => RMSD = “0” - Παρόμοιες δομές => RMSD (1 – 3 Å) - distant structures => RMSD > 3 Å - (1Å= m, συγκριτικά το μέγεθος φύλου χαρτιού είναι m)

46 μειονεκτήματα του RMSD  Χειριζόμαστε όλα τα άτομα με τον ίδιο τρόπο (ενώ τα άτομα α/α στο εξεωτερικό της πρωτεΐνης έχουν μεγαλύτερη πιθανότητα για αλλαγές, από αυτά στο εσωτερικό)  Η βέλτιστη ευθυγράμμιση δεν δίνει πάντα και το μικρότερο RMSD

47 Πως γίνεται η ευθυγράμμιση δομών;  Υπόθεση: αν δύο α/α σε άλλη πρωτεΐνη είναι σε επαφή  το ισχύει και σε συγγενική. Μεταλλάξεις που αλλάζουν το μέγεθος α/α  αλλαγές στο «πακετάρισμα» helices, sheets.

48 Distance matrix ALIgnment) DALI  Κάνει ευθυγράμμιση δομών  Holm & Sander  Βρίσκει ομολογίες που είναι στην γκρίζα περιοχή (13% ομοιότητα α/α)

49 Πως λειτουργεί το Dali;  Άτομα Δοσμένων των ατομικών συντεταγμένων δύο δομών  Υπολογισμός των πινάκων απόστασης Υπολόγισε για κάθε δομή τις αποστάσεις μεταξύ των αμινοξέων της.  Αυτό το βήμα είναι απαραίτητο γιατί οι ενδοαποστάσεις είναι ανεξάρτητες των συντεταγμένων  Οι αρχικές συντεταγμένες δεν μπορούν να συγκριθούν για αυτό χρησιμοποιούμε πίνακες απόστασης. Ευθυγράμμιση υποπινάκων  Βρές μικρούς υποπίνακες κατά μήκος της διαγωνίου που ταιρίαζουν  Ένωσε τα ταιρίασματα για να φτιάξεις το ολικό

50 Ευθυγράμμιση δομών The regions of common fold, as determined by the program DALI by L. Holm and C. Sander, in the TIM- barrel proteins mouse adenosine deaminase [1fkx] (black) and Pseudomonas diminuta phosphotriesterase [1pta] (red):

51 Ευθυγραμμίσεις δομών/ακολουθιών

52  Ο αλγόριθμος Needleman-Wunsch βρίσκει τη βέλτιστη ευθυγράμμιση μεταξύ δύο ακολουθιών  ‘βέλτιση’ εξαρτάται από τον πίνακα βαθμολόγισης  Δεν λαμβάνει 3-διάστατες δομές : Δευτερογενείς δομές (helices, sheets) Hydrophobicity

53 Πρόβλεψη δομής

54 Πρόβλεψη δομής πρωτεΐνης  Πρόβλεψη δευτερογενών δομών, χωρίς σύνθεσή τους  Αναπαραγωγή των ατομικών αλληλεπιδράσεων & αναζήτηση κατάστασης ελάχιστης ενέργειας  Μοντελοποίηση βάσει ομολογίας  δηλαδή προκύπτουν συντεταγμένες ατόμων, για mainchain και sidechains  Αναγνώριση Folds (fold recognition), Πρέπει να υπάρχει μικρός αριθμός από folds Και είμαστε κοντά στο τέλος  Υδροφοβική ιδιότητα.

55 Υδροφοβικό προφίλ

56 Υδροφοβικό προφίλ, αλγόριθμος  Τι κάνει: Δείχνει Κατανομή polar/apolar α/α για μία πρωτεΐνη  Τι χρειαζόμαστε: Δείκτης Υδροφοβικότητας για κάθε α/α Kyte Doolitle, (δείτε και εργαστηρική άσκηση)  Ο Δείκτης Τι εκφράζει: Αρνητικές τιμές, υδρόφοβα α/α Θετικές τιμές, υδρόφιλα α/α  Κατασκευή: παράθυρο (5-7 surface exposed regions ή transmebrane domains). Μετατόπιση παραθύρου, δεξιά, και μέση τιμή  Tα ελάχιστα δηλώνουν την πιθανότητα παρουσίας turns.  Μπορεί να χρησιμοποιηθεί και για εύρεση ελίκων  Προσοχή: Δεν υπάρχει υποχρεωτική 1-1 αντιστοιχία, μεταξύ turns και ελαχίστων

57 Παράδειγμα Υδροφοβικού, profile Τα ελάχιστα σχετίζονται με την παρουσία turns Μικρές τιμές του κατακόρυφου άξονα, δηλώνουν, χαμηλή υδροφοβικότητα

58 Membrane proteins  Πολλές membrane proteins έχουν δομή 7 helices Συνδεδεμένες με loops Όλη η έλικα αποτελείται από υδρόφοβα α/α γιατί είναι σε μη υδάτινο περιβάλλον Προφίλ υδροφοβικότητας  μέγιστες περιοχές, πιθανές έλικες

59 Παράδειγμα 2 Ptisyn, α-helices σε globular proteins  υδρόφιλο τμήμα  υδρόφοβο τμήμα  Διαφορά 100 ο, μεταξύ τους  Πρακτικά, 1 υδρόφιλο, 4 υδρόφοβα  Οπότε Πρόβλεψη: αν γνωστή η ακολ. α/α και έχει το σχέδιο 1-4, πιθανότατα α-helice

60 Νευρωνικά Δίκτυα/Πρόβλεψη δομής

61 Πρόβλεψη δομής με Νευρωνικά Δίκτυα  Τι θέλουμε; Από κάποιες πρωτεΐνες των οποίων είναι γνωστή η δομή τους κατασκεύασε ένα μοντέλο Αν έχεις κάποια πρωτεΐνη άγνωστης δομής χρησιμοποίησε το μοντέλο για να προβλέψεις τη δομή της

62  Πρόβλεψη δευτερεύουσας δομής μόνο α- helices, β-sheet  Πρόβλεψη τριτογενούς δομής (tertiary structure) δυσκολότερο 1 βήμα: helices, b-sheets 2 βήμα: σύνθεσή τους Πρόβλεψη δομής πρωτεΐνης β

63 Πρόβλεψη δομής, παράδειγμα Α/Α ALVEDPPLKVSEGGLIREGYDODKDAKRAAHREGVAYFLELEERERERTG Πρόβλεψ η: ΗΗ ΕΕΕ------ΗΗΗΗΗΗΗΗΗΗ-ΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗ- Πείραμα : -Ε Ε-----ΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗ- H HELIX E STRAND - OTHER

64 Πως επιτυγχάνεται; 1. Ξεκινούμε από κάποια βάση (π.χ. PDB), που έχει πρωτεΐνες και τη δομή τους. 2. Επιλέγουμε κάποιες πρωτεΐνες που θα χρησιμοποιηθούν για την κατασκευή του μοντέλου 3. Μία καλή επιλογή για την μοντελοποίηση είναι τα Τεχνητά Νευρωνικά δίκτυα (ΤΝΔ) 1. Ένα ΤΝΔ έχει είσοδο, έξοδο και εσωτερική δομή. 2. Στην είσοδο δίνεται η σειρά αμινοξέων 3. Στην έξοδο παίρνουμε τη δομή

65 Νευρωνικά Δίκτυα, τρόπος λειτουργίας  Φάση εκπαίδευσης Είσοδος οι πρωτεΐνες που χρησιμοποιούμε για εκπαίδευση Η διαφορά της επιθυμητής εξόδου και της εξόδου που παράγει το δίκτυο, χρησιμοποιείται για να αλλάξει η δομή του μοντέλου  Φάση λειτουργίας Το δίκτυο χρησιμοποιείται

66 Νευρωνικά Δίκτυα 20 Κόμβοι ανά α/α AN F … … Έξοδος Είσοδος

67 Αλγόριθμος εκπαίδευσης  Στη φάση της εκπαίδευσης Για τις δεδομένες εισόδους Παράγει κάποιες εξόδους Η διαφορά επιθυμητών από τις πραγματικές εξόδους, παράγει σφάλμα Τα σφάλμα χρησιμοποιείται για την προσαρμογή των παραμέτρων (βάρη)  Εναλλακτική εκπαίδευση με Support Vector Machines Εύρεση διαχωριστικών επιφανειών μεταξύ των κλάσεων Μη παραμετρικό μοντέλο, δεν χρειάζεται αριθμός κρυμμένων μονάδων

68 Μοντελοποίηση βάσει Ομολογίας

69 Μοντελοποίηση βάσει ομολογίας Πότε εφαρμόζεται;  Έχω γνωστή αλληλουχία α/α, άγνωστη δομή  Έχω σημαντική ομοιότητα με δοσμένη ακολουθία γνωστής δομής Θέλω να κάνω (μικρές) αλλαγές στη γνωστή ακολουθία ώστε να προκύψει η άγνωστη.

70 Πως εφαρμόζεται η μοντελοποίηση βάσει ομολογίας; 1. ευθυγράμμιση (βάσει ακολουθίας α/α) αγνώστου δομής πρωτεΐνης με αυτήν της γνωστής δομής. 1. Εισαγωγές/διαγραφές προκύπτουν κυρίως σε περιοχές με loops μεταξύ helices και sheets. 2. Πρόβαλε τις περιοχές που έχουν εισαγωγές/διαγραφές στην άγνωστη ακολουθία 3. Αντικατέστησε τα α/α της side chain που έχουν μεταλλαχθεί 4. Εξέτασε το μοντέλο (με υπολογιστικές μεθόδους αλλά και δια γυμνού οφθαλμού) για περίπτωση ατόμων στην ίδια θέση.

71 Πηγή, g/swissmod/

72

73

74

75

76

77

78 Τελευταία βήματα  Επιβεβαίωσε το μοντέλο (π.χ. Να μην υπάρχουν δύο άτομα στην ίδια θέση)  Εφάρμοσε αλγόριθμο, ελαχιστοποίησης ενέργειας.

79 Συμπεράσματα/Προβληματισμοί  Η μέθοδος πρόβλεψης δομής λειτουργεί υπό την προϋπόθεση ότι μπορεί να βρεθεί ομοιότητα της τάξης του 40-50%.  SWISS-MODEL

80 Αναγνώριση FOLDS

81 3-διάστατα προφίλ  Παρόμοια με τα προφίλ, για ακολουθίες πρωτεϊνών  Φτιάξε προφίλ, ακολουθιών και δομών.  Ταξινόμησε το περιβάλλον κάθε α/α βάσει Δευτερογενούς δομής Το βαθμό που είναι εξωτερικό/εσωτερικό σε μία πρωτεΐνη ( 114A 2 ) Polar/non-polar περιβάλλον  6 κλάσεις (polar/non-polar/εσωτερική-εξωτερική)  3 τύποι δευτερογενών δομών  18 κλάσεις

82 3-διάστατα προφίλ  Αλφάβητο 18 χαρακτήρων  Ευθυγράμμιση δομής, βάσει 18 χαρακτήρων Δηλαδή δύο πρωτεΐνες μπορούν να ευθυγραμμιστούν βάσει των προφίλ τους  Ποιες Ακολουθίες α/α που έχουν το ίδιο fold;

83 Threading  Mέθοδος Αναγνώρισης folds

84 Αναπαραγωγή ατομικών αλληλεπιδράσεων, ελάχιστη ενέργεια  Η δομή της πρωτεΐνης έχει φτάσει σε κατάσταση ελάχιστης ενέργειας  Οι αλληλεπιδράσεις των ατόμων δημιουργούν την δομή  Δύσκολη αυτή η πρόβλεψη: Το μοντέλο των αλληλεπιδράσεων δεν είναι ακριβές Υπάρχουν έλλειψη γραμμικότητας Η αντικειμενική συνάρτηση έχει πολλά τοπικά ελάχιστα

85 Σημεία προσοχής 1. Ομοιότητα ακολουθίας  ομοιότητα δομής 2. Παρόμοια δομή  (όμοια ή διαφορετική ακολουθία)


Κατέβασμα ppt "Δομή πρωτεϊνών. Θέματα διαλέξεων  Εισαγωγή στις πρωτεΐνες  Δομή πρωτεϊνών  Ταξινόμηση βάσει δομής  Βάσεις με δομές πρωτεϊνών  Ευθυγράμμιση δομών."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google