Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Εισαγωγή στην Πληροφορική και στην διαχείριση μεγάλου όγκου δεδομένων

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Εισαγωγή στην Πληροφορική και στην διαχείριση μεγάλου όγκου δεδομένων"— Μεταγράφημα παρουσίασης:

1 Εισαγωγή στην Πληροφορική και στην διαχείριση μεγάλου όγκου δεδομένων
Γρηγόριος Αμούτζιας Επικ. Καθηγητής Βιοπληροφορικής στη Γενωμική Τμήμα Βιοχημείας & Βιοτεχνολογίας, Πανεπιστήμιο Θεσσαλίας

2 Εισαγωγή στην Πληροφορική και εφαρμογές της στις Βιοεπιστήμες

3 Προτεινόμενα συγγράμματα

4 Τι είναι Πληροφορική η επιστήμη, η οποία ασχολείται με τους Η/Υ και τις εφαρμογές τους. Κλάδοι: Επιστήμη των Υπολογιστών (Computer Science) Τεχνολογία Πληροφοριών (Information Technology) Πληροφοριακά Συστήματα (Information Systems)

5 ΔΕΔΟΜΕΝΑ ΠΛΗΡΟΦΟΡΙΑ ΓΝΩΣΗ

6 Τι είναι ο Υπολογιστής;
Μια προγραμματιζόμενη, ηλεκτρονική, ψηφιακή μηχανή γενικού σκοπού με μνήμη Προγραμματιζόμενη γιατί: μπορεί να εκτελεί διαφορετικά προγράμματα, δηλ. ακολουθίες εντολών που καθοδηγούν τον υπολογιστή. Ηλεκτρονική γιατί: αποτελείται από ηλεκτρονικά στοιχεία (π.χ. κυκλώματα). Ψηφιακή γιατί: οι πληροφορίες αναπαρίστανται και επεξεργάζονται σε μορφή δυαδικού ψηφίου (0 ή 1). Γενικού σκοπού γιατί: η χρήση του ποικίλλει και ορίζεται από τα προγράμματά του, τα οποία μπορούν να ανανεώνονται ή/και μεταβάλλονται. Με μνήμη γιατί: είναι απαραίτητο συστατικό για την αποθήκευση ψηφιακών πληροφοριών (δεδομένων ΚΑΙ προγραμμάτων).

7 Τι είναι το Υλικό Υπολογιστή;
Τι είναι το Υλικό Υπολογιστή; Ο επεξεργαστής (ή Κεντρική Μονάδα Επεξεργασίας) Τα κυκλώματα μνήμης Η οθόνη Ο εκτυπωτής Το ποντίκι Το πληκτρολόγιο Και άλλα Υλικό (hardware) ονομάζουμε τα μηχανικά και απτά μέρη ενός υπολογιστή.

8 Τι είναι το λογισμικό Υπολογιστή;
Τι είναι το λογισμικό Υπολογιστή; Το λειτουργικό σύστημα (π.χ. Linux, Windows, Mac) Τα συστήματα διαχείρισης βάσεων δεδομένων Οι μεταγλωτιστές γλωσσών προγραμματισμού (π.χ. JVM, yacc) Οι εφαρμογές γραφείου (π.χ. Microsoft Office, Open office) Οι εφαρμογές πλοήγησης στο Internet Και άλλα Λογισμικό (software) ονομάζουμε τo σύνολο των προγραμμάτων ενός υπολογιστή.

9 Τι είναι ένα Υπολογιστικό Σύστημα;
Υπολογιστής = Επεξεργαστής + Μνήμη + Συσκευές Εισόδου/Εξόδου (Βασικό Υλικό). Υπολογιστικό Σύστημα = Υπολογιστής + Λογισμικό. Ο προσωπικός Η/Υ μας είναι ένα Υπολογιστικό Σύστημα.

10 Τι είναι ένα Πληροφοριακό Σύστημα;
Πληροφοριακό Σύστημα = Υπολογιστικό Σύστημα + Δεδομένα + Άνθρωποι + Διαδικασίες Ένα πληροφοριακό σύστημα είναι π.χ. ένα σύστημα πλοήγησης σε ένα μουσείο. Ένα τέτοιο σύστημα αποτελείται από: υπολογιστικά συστήματα [π.χ. εξυπηρετητές, υπολογιστές χειρός (PDA), wireless access points,κτλ] λογισμικό που διερμηνεύει και επικοινωνεί στους επισκέπτες πληροφορίες σχετικές με τα εκθέματα, τους ίδιους τους επισκέπτες αλλά και τους υπαλλήλους του μουσείου που χειρίζονται τα παραπάνω τα δεδομένα που αφορούν τα εκθέματα τις διαδικασίες χρήσης των συστημάτων

11 Προ-Ιστορία της Πληροφορικής
Πρώτοι Υπολογιστές 5000 π.Χ.: Άβακας (Έλληνες, Ρωμαίοι, Βυζαντινοί, Κινέζοι, Ίνκας, Μάγια) 80 π.Χ. : Ο αστρολάβος των Αντικηθύρων

12 Σημερινοί υπολογιστές βασίζονται στις αρχές της μηχανής von Neumann
Προτάθηκε από τον John Von Neumann, Μαθηματικό, Ουγγρικής καταγωγής (αλλά δεν κατασκευάστηκε από αυτόν). Πρώτη ηλεκτρονική υπολογιστική μηχανή με αποθηκευμένο πρόγραμμα (stored program) Η μνήμη δε χρησιμοποιείται μόνο για να αποθηκεύει δεδομένα και αποτελέσματα, αλλά και τα ίδια τα προγράμματα που επενεργούν στα δεδομένα Η αρχιτεκτονική της μηχανής von Neumann ακολουθείται μέχρι σήμερα

13 Αρχιτεκτονική von Neumann
Μονάδα Εισόδου (Input) Επικοινωνία του χρήστη με το υπολογιστικό σύστημα, εισαγωγή δεδομένων Επεξεργασία (Processing) Εκτέλεση προγραμμάτων και εντολών Χωρίζεται σε Αριθμητική και Λογική Μονάδα (εκτέλεση πράξεων) και Μονάδα Ελέγχου (συντονισμός λειτουργίας του υπολογιστή) Μνήμη (Memory) Καταχώρηση προγραμμάτων και δεδομένων Χωρίζεται σε κύρια και βοηθητική Μονάδα Εξόδου (Output) Επικοινωνία υπολογιστικoύ συστήματος με το χρήστη, εμφάνιση αποτελεσμάτων εκτέλεσης προγραμμάτων

14 Η Ιστορία Συνοπτικά Διάρκεια Βασικά Επιτεύγματα 1951-1958
Λυχνίες Κενού Διάτρητες κάρτες στην είσοδο – έξοδο Τρίοδος Ηλεκτρονική Λυχνία (τρανζίστορ) Ολοκληρωμένα Κυκλώματα Μεγάλης Ολοκλήρωσης (LSI) Οθόνες και Πληκτρολόγια στην είσοδο - έξοδο 1971-σήμερα Ολοκληρωμένα Κυκλώματα Πολύ Μεγάλης Ολοκλήρωσης (VLSI) Μικροεπεξεργαστής – Προσωπικός Υπολογιστής Μέλλον (?) Οπτικοί, Μοριακοί, Κβαντικοί Υπολογιστές

15 Μηχανές με Λυχνίες Κενού
Από το 1951 μέχρι το 1958 κατασκευάζονται οι υπολογιστικές μηχανές με Λυχνίες Κενού (π.χ. UNIVAC) Κυκλώματα: λυχνίες κενού (λαμπτήρες) Αποθήκευση (μνήμη): Μαγνητικά τύμπανα και μαγνητικές ταινίες Είσοδος: Διάτρητες κάρτες ή χαρτοταινίες Έξοδος: Εκτυπωτικές συσκευές ή συσκευές διάτρησης καρτών

16 Μηχανές με Λυχνίες Κενού
Universal Automatic Computer (UNIVAC) Πρώτη μηχανή μαζικής παραγωγής & πώλησης Η πρώτη πώληση έγινε για λογαριασμό του Γραφείου Απογραφών των Η.Π.Α Συνολικά πουλήθηκαν 46 κομμάτια

17 Μηχανές με Λυχνίες Κενού
International Business Machines (IBM) Ξεκίνησε να ασχολείται με την κατασκευή Η/Υ από το 1953

18 Μηχανές Βασισμένες σε Τρανζίστορ
Από το 1959 μέχρι το 1964 κατασκευάζονται οι υπολογιστικές μηχανές βασισμένες σε τρανζίστορ Εφεύρεση της τριόδου ηλεκτρονικής λυχνίας (transistor - τρανζίστορ) το 1948 στα εργαστήρια της εταιρίας Bell Αντικαθιστά τα μαγνητικά μέσα στην αποθήκευση

19 Μηχανές βασισμένες σε Ολοκληρωμένα Κυκλώματα
Από το 1965 μέχρι το 1970 κατασκευάζονται υπολογιστικές μηχανές με ολοκληρωμένα κυκλώματα (chip) Στο εσωτερικό κάθε ολοκληρωμένου περιέχεται ένα μονολιθικό κύκλωμα πυριτίου με πολλά αλληλοσυνδεδεμένα τρανζίστορ και άλλα στοιχεία Από το 1971 μέχρι και σήμερα κατασκευάζονται υπολογιστικές μηχανές με ολοκληρωμένα Κυκλώματα Πολύ Μεγάλης Ολοκλήρωσης (VLSI-Very Large Scale Integration) που μειώνουν τον όγκο και αυξάνουν τις δυνατότητες αποθήκευσης και επεξεργασίας των υπολογιστών Δημιουργία του Μικροεπεξεργαστή (Microprocessor) Πρώτος μικροεπεξεργαστής ο 4004 της Intel και ακολούθησαν οι 8008 και 8080

20 Ο Προσωπικός Υπολογιστής (PC)
Αποτέλεσμα της δημιουργίας του μικροεπεξεργαστή είναι η γέννηση του Προσωπικού Υπολογιστή (PC – Personal Computer). Πωλήσεις υπολογιστών και σε άτομα εκτός από επιχειρήσεις και οργανισμούς. Διεύρυνση της χρήσης τους σε καθημερινά προβλήματα και όχι μόνο για επιχειρηματικές ανάγκες και επιστημονικές εφαρμογές.

21 Το μέλλον Οπτικοί Υπολογιστές Μοριακοί Υπολογιστές Χημικοί Υπολογιστές
Κβαντικοί Υπολογιστές Άλλοι: Υπολογιστές που μπορούν να ενσωματωθούν στα ρούχα των χρηστών τους (wearable computing)

22 Η πληροφορική στις Βιοεπιστήμες (Βιοπληροφορική)
Η πληροφορική στις Βιοεπιστήμες (Βιοπληροφορική)

23 Βιοπληροφορική: τι είναι
Εισαγωγή Βιοπληροφορική: τι είναι Η ανάπτυξη και χρήση τεχνικών και εργαλείων πληροφορικής/μαθηματικών/στατιστικής για την ανάλυση βιολογικών δεδομένων (κυρίως μοριακής βιολογίας) Σήμερα γίνεται διάκριση μεταξύ της βιοπληροφορικής και της υπολογιστικής βιολογίας Βιοπληροφορική: Η ανάπτυξη μεθόδων και προγραμμάτων. Υπολογιστική Βιολογία: Η χρήση των παραπάνω μεθόδων και προγραμμάτων για την ανάλυση βιολογικών δεδομένων. Συχνά συμβαίνουν και τα δύο ταυτόχρονα και τα σύνορα δεν είναι πάντα ευδιάκριτα Πολλές και συμπληρωματικές μεταξύ τους ειδικότητες (από Βιολογία, Βιοχημεία, Χημεία, Χημική Μηχανική, Μηχανική, Υπολογιστές, Μαθηματικά, Στατιστική κ.α.) συνεργάζονται σήμερα στο χώρο της Βιοπληροφορικής

24 Βιοπληροφορική: βασικοί τομείς
Εισαγωγή Βιοπληροφορική: βασικοί τομείς Βάσεις δεδομένων (Databases) Οργάνωση, αποθήκευση, αναζήτηση των δεδομένων. Ανάλυση ακολουθιών DNA, RNA, πρωτεϊνών. (Sequence analysis) Στοίχιση ακολουθιών: Σύγκριση των αντίστοιχων/ομόλογων περιοχών, μεταξύ δύο ή περισσοτέρων ακολουθιών. Φυλογενετική ανάλυση: Οι εξελικτικές σχέσεις μεταξύ ομοειδών αντικειμένων (γονίδια, πρωτεΐνες, οργανισμοί). Γονιδιακή ρύθμιση/έκφραση (Gene expression) Ανάλυση δεδομένων από μικροσυστοιχίες, RNA-seq. Δομή RNA/πρωτεϊνών (structural biology): Πρόβλεψη δευτεροταγούς και τριτοταγούς δομής. Ανάλυση πρωτεϊνικών επιφανειών που αλληλεπιδρούν μεταξύ τους. Εξόρυξη δεδομένων από βιβλιογραφία (text mining). Βιολογικά δίκτυα/μονοπάτια, Βιολογία Συστημάτων (FBA, MCA). Οντολογίες (Ontologies) Η χρήση ενός ελεγχόμενου λεξιλογίου (με ιεραρχική δόμηση), για την περιγραφή των ιδιοτήτων και των λειτουργιών ομοειδών αντικειμένων (π.χ πρωτεϊνών).

25 Εισαγωγή Παρόν/μέλλον Μέχρι το 2000, Βιοπληροφορική σήμαινε κυρίως ανάλυση ακολουθιών. Η γενωμική αποτέλεσε το ερέθισμα για την ανάπτυξη τεχνολογιών που κάνουν μετρήσεις ευρείας κλίμακας. Από το 2000 και μετά, η Βιοπληροφορική καλείται επίσεις να διαχειριστεί και να αναλύσει μεγάλα και πολύπλοκα δεδομένα από το χώρο της γενωμικής, της γονιδιακής έκφρασης, της πρωτεομικής κ.α. Πλέον ο όρος ‘Βιοπληροφορική’ είναι τόσο εξειδικευμένος/γενικός, όσο και ο όρος ‘Μοριακή Βιολογία’! Βρισκόμαστε σε μια μεταβατική περίοδο για τις Βιολογικές Eπιστήμες, όπως η Φυσική πριν πολλά χρόνια. Βέβαιη η εισδοχή περισσότερων μαθηματικών, στατιστικής και πληροφορικής (προγραμματισμός) μεσοπρόθεσμα στο πρόγραμμα σπουδών.

26 Bioinformatics Market - Advanced Technologies, Global Forecast and Winning Imperatives (2009 - 2014)
Απόσπασμα από: The market for bioinformatics platforms is growing at a significant pace with the increasing demand from U.S. and Europe. This trend is supported by the increasing demand for sequencing platforms with increasing life science research using techniques such as gene expression analysis, sequence analysis, and protein expression analysis. The global bioinformatics market is expected to reach $8.3 billion by 2014 at a high CAGR of 24.8% from While knowledge management formed the largest submarket is 2009 at $1.3 billion, the bioinformatics platforms market is expected to have greatest market share in 2014 at an estimated $3.9 billion, due to rising demand from the U.S. and Europe. Συμβουλευτική (δουλειά από το σπίτι)?

27 Χαμηλό κόστος γενωμικών τεχνολογιών θα οδηγήσει σε καθημερινές εφαρμογές.
Κόστος αλληλούχισης πέφτει διαρκώς. Illumina -> 1 lane: 19GBp, ~ €3000, 10 βακτηριακά γενώματα. Τα δείγματα αποστέλλονται σε κέντρα με μεγάλες εγκαταστάσεις και χαμηλό κόστος λειτουργίας (οικονομία κλίμακας). Η ανάλυση των δεδομένων όμως δεν υπόκειται σε όρους οικονομίας κλίμακας. Πλέον, ένα σημαντικό μέρος του ολικού κόστους είναι η βιοπληροφορική ανάλυση. Μηχανήματα αλληλούχισης ακριβά (Illumina ~ € ) - service φτηνό. Mισθός ακριβός (ίσως ένα νέο μοντέλο συμβουλευτικής?) Yπολογιστής φτηνός (€ ), εφόσον πρόκειται για μικρά γονιδιώματα (de novo assembly), ή για re-sequencing.

28 Χαμηλό κόστος γενωμικών τεχνολογιών θα οδηγήσει σε καθημερινές εφαρμογές
Κόστος αλληλούχισης Ο νόμος του Moore προβλέπει διπλασιασμό της υπολογιστικής ισχύς κάθε δύο χρόνια.

29 Χαμηλό κόστος γενωμικών τεχνολογιών θα οδηγήσει σε καθημερινές εφαρμογές
Κόστος αλληλούχισης

30 Εφαρμογές Ανίχνευση ομόλογων γονιδίων/πρωτεϊνών.
Πρόβλεψη λειτουργίας άγνωστου βιομορίου.

31 Blast Blastn / MegaBlast

32 Εφαρμογές Πολλαπλή στοίχιση.
Εντοπισμός μεταλλάξεων που μπορεί να προσφέρουν ανθεκτικότητα σε φάρμακα.

33 MSA MSA Πολλαπλή στοίχιση ομόλογων ακολουθιών δείχνει τα αμινοξέα που είναι σημαντικά για την λειτουργία της πρωτεΐνης.

34 Blast Blastn Παράδειγμα: Eντοπισμός SNPs σε ακολουθίες του ιού HIV-1 για ανθεκτικότητα σε φάρμακα

35 Εφαρμογές Ομαδοποίηση δεδομένων. Π.χ. Ομαδοποίηση οργανισμών με βάση:
Kοινά γνωρίσματα. Γονίδια/πρωτεΐνες. Ομαδοποίηση δεδομένων γονιδιακής έκφρασης.

36 Ομαδοποίηση

37 Εφαρμογές Φυλογένεση – εξελικτικές σχέσεις.

38 Φυλογένεση σπονδυλωτών

39 Εφαρμογές ‘Ελεγχος εξελικτικών υποθέσεων - Προέλευση - Επιδημιολογία
Εφαρμογές ‘Ελεγχος εξελικτικών υποθέσεων - Προέλευση - Επιδημιολογία

40 Έλεγχος εξελικτικών υποθέσεων
Από που προήλθε ο ιός HIV; Πρωτοεμφανίστηκε μυστηριωδώς στις αρχές της δεκαετίας του 1980. Ο τύπος HIV-1 εισήλθε στους ανθρώπους, ίσως περισσότερες από μια φορές, από τον χιμπατζή. Ο τύπος HIV-2 εισήλθε στους ανθρώπους, από τους sooty mangabees

41 Έλεγχος εξελικτικών υποθέσεων
Από που προήλθε ο ιός HIV-1 subtype M; Προέλευση στην Κεντρική Αφρική. Όταν πρωτοεντοπίστηκε, αρκετοί ασθενείς στην Αμερική ήταν πρόσφατοι Αϊτινοί μετανάστες. Κάποιοι ισχυρίζονταν ότι πήγε από την Αμερική στην Αϊτή στα μέσα των 70s, λόγω σεξοτουρισμού. Από την Αϊτή στην Αμερική ή το αντίθετο; Ο Worobey χρησιμοποίησε ακολουθίες HIV από συντηρημένα δείγματα Αϊτινών ασθενών (1983)

42 Επιδημία χολέρας στην Αϊτή 2010
Μετά τον σεισμό στην Αϊτή (Ιανουαριος 2010), ξέσπασε επιδημία χολέρας (Οκτώβριος 2010). Το βακτήριο Vibrio cholerae ελευθερώνει μια τοξίνη που προκαλεί έντονες διάρροιες και αφυδάτωση, έως και θάνατο, εντός ολίγων ωρών, αν δεν αντιμετωπιστεί! Η μετάδοση γίνεται όταν τα κόπρανα ενός μολυσμένου ατόμου έρθουν σε επαφή με πόσιμο νερό ή τροφή. Τα άτομα που δεν παράγουν αρκετό γαστρικό υγρό στο στομάχι τους, ή τα άτομα με ομάδα αίματος Ο είναι πιο ευάλωτα. Το Vibrio cholerae υπάρχει σε υδάτινα περιβάλλοντα ανά την υφήλιο και εάν οι συνθήκες είναι ευνοϊκές, μπορεί να ξεσπάσει επιδημία. Η χολέρα είναι διαδεδομένη στην Ασία. Τα πρώτα κρούσματα παρατηρήθηκαν σε κεντρικές περιοχές του νησιού, στην κοιλάδα Artibonite, μια εβδομάδα μετά την έλευση Νεπαλέζων κυανόκρανων, κοντά στο στρατόπεδό τους. Λύμματα από το στρατόπεδο κατέληγαν σε γειτονικό ποταμό. Οι κάτοικοι κατηγόρησαν τον ΟΗΕ ότι οι κυανόκρανοι που ήρθαν να βοηθήσουν ευθύνονται για το ξέσπασμα της επιδημίας. ότι ο ΟΗΕ προσπάθησε να αποκρύψει το γεγονός και να μην αναλάβει τις ευθύνες του Ξέσπασαν ταραχές.

43 Επιδημία χολέρας στην Αϊτή 2010 Επιδημία χολέρας στην Αϊτή 2010
Αλληλούχιση του γονιδιώματος: 2 κλινικών στελεχών από την τωρινή επιδημία στην Αϊτή. 1 κλινικό στέλεχος από την επιδημία του 1991 στη Νότια Αμερική. 2 στέλεχη που απομονώθηκαν στη Νότια Ασία το 2002 και 2008. Επίσης χρησιμοποιήθηκαν οι μερικές αλληλουχίες από 23 άλλα στελέχη ανά την υφήλιο (τα τελευταία 98 χρόνια). 1588 συντηρημένα ορθόλογα γονίδια χρησιμοποιήθηκαν από το κάθε στέλεχος, για να γίνει το φυλογενετικό δένδρο.

44 Επιδημία χολέρας στην Αϊτή 2010

45 Εφαρμογές Αλληλούχιση οργανισμών - Ανίχνευση οργανισμών - Μεταγενωμική
Εφαρμογές Αλληλούχιση οργανισμών - Ανίχνευση οργανισμών - Μεταγενωμική

46 Χαμηλό κόστος γενωμικών τεχνολογιών θα οδηγήσει σε καθημερινές εφαρμογές.
Κόστος αλληλούχισης πέφτει διαρκώς. Illumina -> 1 lane: 19GBp, ~ €3000, 10 βακτηριακά γενώματα. Τα δείγματα αποστέλλονται σε κέντρα με μεγάλες εγκαταστάσεις και χαμηλό κόστος λειτουργίας (οικονομία κλίμακας). Η ανάλυση των δεδομένων όμως δεν υπόκειται σε όρους οικονομίας κλίμακας. Πλέον, ένα σημαντικό μέρος του ολικού κόστους είναι η βιοπληροφορική ανάλυση. Μηχανήματα αλληλούχισης ακριβά (Illumina ~ € ) - service φτηνό. Mισθός ακριβός (ίσως ένα νέο μοντέλο συμβουλευτικής?) Yπολογιστής φτηνός (€ ), εφόσον πρόκειται για μικρά γονιδιώματα (de novo assembly), ή για re-sequencing.

47 Shotgun sequencing

48 Genome assembly

49 Εφαρμογές στην τοξικολογία/ τοξικογενωμική
Μέτρηση της γονιδιακής έκφρασης μετά από έκθεση σε τοξικό παράγοντα μπορεί να δείξει τον μοριακό μηχανισμό δράσης του παράγοντα. Μπορεί να αποτελέσει μοναδική μοριακή υπογραφή του συγκεκριμένου τοξικού παράγοντα, για μελλοντική ανίχνευσή του. Ομαδοποίηση τοξικών παραγόντων με κοινή δράση, με βάση την ομοιότητα των μοριακών προφιλ τους

50 Μοριακό προφίλ τοξικότητας

51 Μοριακό προφίλ τοξικότητας
Hierarchical cluster analysis showed a close association in gene expressional responses between aroclor 1254 and 3-methylcholanthrene.


Κατέβασμα ppt "Εισαγωγή στην Πληροφορική και στην διαχείριση μεγάλου όγκου δεδομένων"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google