Κατέβασμα παρουσίασης
Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε
ΔημοσίευσεCletus Xenakis Τροποποιήθηκε πριν 9 χρόνια
1
1 Τμήμα Αρχειονομίας – Βιβλιοθηκονομίας Ιόνιο Πανεπιστήμιο Πρόγραμμα Μεταπτυχιακών Σπουδών « Εισαγωγή στην Επιστήμη της Πληροφόρησης» Εκπόνηση εργασίας στο μάθημα: «ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ» με θέμα: ¨Κατασκευή Ψηφιακών Βιβλιοθηκών για επιστημονικά στοιχεία: Μια Διερευνητική Μελέτη των Πρακτικών Δεδομένων στην Οικολογία Βιότοπων¨ (Building Digital Libraries for Scientific Data: An Exploratory Study of Data Practices in Habitat Ecology) Δήμου Παρασκευή Φεβρουάριος 2007
2
2 Περίληψη Τα δεδομένα αποτελούν το επιστημονικό κεφάλαιο, οι ψηφιακές βιβλιοθήκες γίνονται πολυτιμότερες Δημιουργία εργαλείων και υπηρεσιών Αντίληψη των πρακτικών δεδομένων των επιστημόνων διερευνητική μελέτη για τους βιότοπους των οικολόγων (επιστημόνων) στο Εθνικό Ίδρυμα Επιστήμης (National Science Foundation/NSF) και το Center for Embedded Networked Sensing (CENS) οι επιστήμονες είναι προθυμότεροι να μοιραστούν τα δεδομένα που δημοσιεύθηκαν ήδη από τα δεδομένα που προγραμματίζουν να δημοσιεύσουν, και είναι προθυμότεροι να μοιραστούν τα δεδομένα από όργανα παρά δεδομένα συλλεγμένα με το χέρι.
3
3 Εισαγωγή: Η χρήση του “cyberinfrastructure” να διευκολύνει διανεμημένα, τις επιτακτικές πληροφορίες τα ευαίσθητα δεδομένα κ την συνεργατική έρευνα Η έρευνα σε όλα τα επίπεδα γίνεται με ευαίσθητα δεδομένα και συνεργασίες, Η δυνατότητα να μοιραστούν τα δεδομένα γίνεται ακόμα πιο επιτακτική Οι ψηφιακές βιβλιοθήκες είναι απαραίτητες στην προσπάθεια του cyberinfrastructure Η οικολογία βιότοπων αντιμετωπίζει τον επικείμενο κατακλυσμό δεδομένων καθώς επεκτείνονται οι ενοργανωμένοι μέθοδοι δίκτυα αισθητήρων (sensor networks )
4
4 Cyberinfrastructure Ο cyberinfrastructure είναι ο όρος που χρησιμοποιήθηκε από το Εθνικό Ίδρυμα Επιστήμης (National Science Foundation/NSF) και από άλλους για να περιγράψουν τους πόρους της τεχνολογίας πληροφόρησης, οι οποίοι χρησιμοποιούνται από ερευνητές, κλινικούς ερευνητές, μηχανικούς, καλλιτέχνες, γενικότερα από τους αποκαλουμένους «επιστήμονες», με σκοπό να δημιουργήσουν νέα γνώση. Ο cyberinfrastructure είναι η συνεργασία οργάνων, αισθητήρων, υπολογιστικών συστημάτων μεγάλης απόδοσης, συστημάτων αποθήκευσης μεγάλου όγκου δεδομένων, πόρων δεδομένων και δυνατοτήτων απεικόνισης, που συνδέονται άρρηκτα με δίκτυα υψηλών ταχυτήτων και λειτουργούν με πολύ ανεπτυγμένα λογισμικά. Αυτός ο όρος εσωκλείει ανθρώπους, διαδικασίες, εκπαίδευση, ασφάλεια, πολιτικές και δυνατότητες που συνεχίζουν να υπάρχουν με το πέρας του χρόνου.
5
5 Ερευνητική περιοχή Δίδεται η ευκαιρία να μελετηθούν οι επιστημονικές πρακτικές δεδομένων και να δημιουργηθεί αρχιτεκτονική ψηφιακών βιβλιοθηκών προκειμένου να υποστηριχθεί η χρήση και η επαναχρησιμοποίηση των ερευνητικών δεδομένων. Οι στόχοι του CENS είναι να αναπτυχθούν, και να εφαρμοστούν σε διαφορετικά επίπεδα, καινοτόμα ασύρματα δίκτυα αισθητήρων. Οι επιστήμονες του CENS ερευνούν τις θεμελιώδεις ιδιότητες αυτών των συστημάτων σχεδιάζουν και αναπτύσσουν νέες τεχνολογίες εξερευνούν νέες επιστημονικές και εκπαιδευτικές εφαρμογές.
6
6 Ιστορικό: Οι ψηφιακές βιβλιοθήκες δεδομένων και ο κατακλυσμός δεδομένων Οι νέες τεχνολογίες για τη συλλογή δεδομένων: οδηγούν στην παραγωγή δεδομένων, σε μεγάλα ποσοστά Οι επιστήμονες αδυνατούν: να αναλύσουν να ερμηνεύσουν να βγάλουν συμπεράσματα βοήθεια να προσδιορίσουν να επιλέξουν τα δεδομένα για την τωρινή χρήση για να συντηρήσουν τα δεδομένα μακροπρόθεσμα. Ένα αποτελεσματικό cyberinfrastructure: είναι αυτό που παρέχει στις διανεμημένες κοινότητες- επιστημονικές και μη - την συνεχή πρόσβαση στα διανεμημένα δεδομένα και το λογισμικό που είναι συνήθως διαφανές, ασφαλές, και μόνιμο
7
7 Ποικιλία Δεδομένων CENS Sensor Collected Application Data Sensor Collected Proprioceptive Data Sensor Collected Performance Data Hand Collected Application Data Flow Water depth Ammonium Ammonia Phosphate Water temp pH Temperature Conductivity Chlorophyll GPS/location Time Sap flow CO2 Humidity Rainfall Packets transmitted Packets received ORP PAR Motor speed Rudder angle Heading Roll/pitch/yaw Soil moisture Nitrate Calcium Chloride Water potential Wind speed Wind direction Wind duration Leaf wetness Routing table Neighbor table Fault detection Awake time Organism presence Organism concentration Battery voltage Mercury Methylmercury Nutrient concentration Nutrient presence LandSat images Mosscam CDOM Bird calls
8
8 Πρακτικές Διαχείρισης Δεδομένων η αυτοματοποιημένη παραγωγή δεδομένων και η εργαστηριακή προετοιμασία, οι ερευνητές λιγότερο πιθανό να διανέμουν τα δεδομένα. η συλλογή και η ανάλυση δεδομένων τουλάχιστον αυτοματοποιημένες και κυρίως εργαστηριακές οι ερευνητές πιθανότερο να περιφρουρήσουν τα δεδομένα τους. Τέτοιες συμπεριφορές αποτελούν τροχοπέδη στους επιστημονικούς κλάδους και δεν αρμόζουν στην επιστήμη.
9
9 Δεδομένα και πρακτικές οικολογίας βιότοπων Η μελέτη της βιοποικιλότητας και των οικοσυστημάτων είναι μια σύνθετη διεπιστημονική περιοχή. Τα συστήματα διαχείρισης δεδομένων για την οικολογική έρευνα έχουν εξελιχθεί από μεγάλα έργα, όπως: το Διεθνές Βιολογικό Πρόγραμμα (International Biological Program/IBP, καθιερωμένο το 1964 από το Διεθνές Συμβούλιο των Επιστημονικών Ενώσεων), το Πρόγραμμα Άτομο και Βιόσφαιρα (Man and the Biosphere/MAB, καθιερωμένο το 1971 από τα Ηνωμένα Έθνη) το Αμερικάνικο Μακροπρόθεσμο Οικολογικό και Ερευνητικό πρόγραμμα (Long-term Ecological Research Program/LTER καθιερωμένο το 1980 από το Εθνικό Ίδρυμα Επιστήμης) Το Δίκτυο Γνώσης για τη Biocomplexity (Knowledge Network for Biocomplexity/ KNB), [http://knb.ecoinformatics.org/], ένα χρηματοδοτημένο πρόγραμμα από το Εθνικό Ίδρυμα Επιστήμης Η Οικολογική Γλώσσα Μεταδεδομένων (Ecological Metadata Language/ EML).
10
10 Υποδομή των πληροφοριών: προκλήσεις Καταστήσουν τα επιστημονικά στοιχεία διαθέσιμα Επιστημονική κοινότητα Εκπαιδευτική κοινότητα Διαχειριστούν τα επιστημονικά στοιχεία από τους αισθητήρες με πολλαπλούς τρόπους Ρέοντα στοιχεία Αρχειοθετημένα στοιχεία Κανονικές εξαρτήσεις αισθητήρων για τη βραχυπρόθεσμη συλλογή δεδομένων Εξυπηρετήσουν τους πολλαπλούς επιστημονικούς τομείς, τα προβλήματα και τα προγράμματα Βιολόγοι βιότοπων, περιβαλλοντικοί μηχανικοί, θαλάσσιοι βιολόγοι Μηχανικοί, επιστήμονες υπολογιστών, roboticists Εξυπηρετήσουν τις διαφορετικές κοινότητες χρηστών με τα διαφορετικά διοικητικά πρότυπα δεδομένων Επιστήμονες, εσωτερικούς και διεθνείς Σπουδαστές και καθηγητές
11
11 Ερευνητικές ερωτήσεις εξετάζουν τα αρχικά στάδια του κύκλου ζωής των δεδομένων συλλέγονται καθαρίζονται, αναλύονται, δημοσιεύονται,και γίνονται προσιτά. Χαρακτηριστικά δεδομένων: Ποια δεδομένα παράγονται; Σε ποιον ανήκουν αυτά τα δεδομένα; Σε ποιον είναι αυτά τα δεδομένα χρήσιμα; Διανομή δεδομένων: Πότε οι επιστήμονες θα μοιραστούν τα δεδομένα; Με ποιους θα μοιραστούν τα δεδομένα; Ποια είναι τα κριτήρια για τη διανομή; Ποιος μπορεί να εγκρίνει τη διανομή; Πολιτική δεδομένων: Ποιες είναι οι δίκαιες πολιτικές για την παροχή της πρόσβασης σε αυτά τα δεδομένα; Ποιοι έλεγχοι, αποκλεισμοί, περιορισμοί χρήσης, ή άλλοι περιορισμοί απαιτούνται για να βεβαιώσουν τη νομιμότητα της πρόσβασης και της χρήσης; Ποια πρότυπα δημοσίευσης των δεδομένων είναι τα κατάλληλα; Αρχιτεκτονική δεδομένων: Ποια εργαλεία δεδομένων απαιτούνται κατά την διάρκεια του ερευνητικού σχεδίου; Ποια εργαλεία απαιτούνται για τη συλλογή και την απόκτηση δεδομένων; Ποια εργαλεία απαιτούνται για την ανάλυση δεδομένων; Ποια εργαλεία απαιτούνται για την δημοσίευση των δεδομένων; Ποια πρότυπα δεδομένων χρησιμοποιούν οι επιστήμονες που παράγουν την ανάγκη για δεδομένα; Ποια πρότυπα δεδομένων χρειάζονται άλλοι για να χρησιμοποιήσουν τα δεδομένα;
12
12 Ερευνητική Μέθοδος να καταλάβουν τις πρακτικές δεδομένων και τις λειτουργικές απαιτήσεις να προσδιορίσουν που η αρχιτεκτονική συναντά την πολιτική συνεντεύξεις συμμετεχόντων με σκοπό να συζητήσουν την πολιτική διανομής των δεδομένων αναπτύξανε τις ερωτήσεις συνέντευξης για τα κίνητρα των συμμετεχόντων, την κατανόηση των κινήτρων της κοινότητάς τους, τα εργαλεία που χρησιμοποιούνται στην καθημερινή εργασία, τους τρόπους που διαιρούν την εργασία, τις σχέσεις δύναμης εντός της κοινότητάς και τους κανόνες για την κοινότητα
13
13 Αποτελέσματα (1/4) έλλειψη στα καθιερωμένα πρότυπα για τη διαχείριση των δεδομένων αισθητήρων, συγκεκριμένα εκείνων που υποστηρίζουν τη διανομή δεδομένων μεταξύ των συναδέλφων πρόθυμοι να συνεργαστούν μαζί επειδή χρειάζονται τα εργαλεία για να συλλάβουν, διαχειριστούν, και να μοιραστούν τα δεδομένα αισθητήρων αποτελεσματικότερα, αποδοτικότερα και ευκολότερα να αξιολογήσει κανείς τις εμπειρίες των επιστημόνων με την εφαρμογή αυτών των εργαλείων και των προτύπων και να αξιολογήσει τη χρησιμότητα αυτών των εργαλείων
14
14 Αποτελέσματα (2/4) Διανομή Δεδομένων χρήσιμα σχόλια : οι επιστήμονες τι δεδομένα θα μοιραστούν πότε, με ποιόν και με ποια κριτήρια η προθυμία να μοιραστεί δεδομένα επηρεάζεται επίσης από την προσπάθεια που απαιτείται να συλλέξει δεδομένα. τα συλλεγμένα με το χέρι δεδομένα του είναι πολυτιμότερα από τα δεδομένα που παράγονται με όργανα: μια ηθική και επιστημονική ευθύνη να καθαρίσουν το σύνολο των δεδομένων, γεγονός που συνιστά την επιστημονική αξία τους δεν σκέφτηκαν ότι τα δεδομένα τους θα ήταν χρήσιμα σε άλλους ερευνητές
15
15 Αποτελέσματα (3/4) Πολιτική Δεδομένων Ποιες είναι κατάλληλες πολιτικές για την εξισορρόπηση των δικαιωμάτων και αρμοδιοτήτων για την πρόσβαση στα στοιχεία CENS Τα πνευματικά δικαιώματα στις δημοσιεύσεις είναι ένα κοινό ζήτημα στην έρευνα. Σε περιπτώσεις όπου η ενοργάνωση είναι ουσιαστική στη συλλογή δεδομένων, ερωτήματα προκύπτουν μερικές φορές ως προς το εάν οι άνθρωποι της τεχνικής υποστήριξης πρέπει να είναι συντάκτες. … οι συνεργάτες της τεχνικής υποστήριξης παίρνουν μια αναγνώριση… αλλά δεν είναι ομο-συντάκτες σε μια επιστημονική δημοσίευση.
16
16 Αποτελέσματα (4/4) Αρχιτεκτονική Δεδομένων Ο σχεδιασμός εργαλείων για την υποστήριξη της απόκτησης δεδομένων, της διαχείρισης, και αρχειοθέτησης Ερευνητικός σχεδιασμός και έλεγχος υπόθεσης έναν χάρτη της ερευνητικής περιοχής Πίνακας δεδομένων από κάθε αισθητήρα Εξετάζουν τον εξοπλισμό και επιλέγουν την ποιότητα των παρατηρήσεων από τους αισθητήρες πριν αρχίζουν οποιαδήποτε πραγματική «επιστήμη». Συλλογή και απόκτηση δεδομένων απροθυμία να λάβουν τις σειρές δεδομένων κατ' ευθείαν από τους αισθητήρες χωρίς κατάλληλα εργαλεία για να αξιολογήσουν την καθαρότητα των δεδομένων Απλές και διαφανείς μεθόδους για να βρουν τα πιθανά κενά στα δεδομένα Ανάλυση δεδομένων Καθαρισμός Προτίμηση γραφικών παραστάσεων Έλεγχος έκδοσης Πολλαπλές εκδόσεις συνόλων δεδομένων περιπλέκουν την ανάκτηση για τους δημιουργούς ή και για τους μελλοντικούς χρήστες Εργαλεία Προτίμηση λογιστικών φύλλων excel Οι στήλες και οι πίνακες επιτρέπουν στον επιστήμονα να προσδιορίσει τα κενά στα δεδομένα και να καθορίσει πώς να τα καθαρίσει
17
17 Real time access to archived data and models Combine system filtering with manual identification, verification, context, sample collection Guide node placement, data collection, system debugging Transform physical observations from batch to interactive process Daily Average Temperature (Geostatistical Analyst) Aspect (Spatial Analyst) Slope (Spatial Analyst) Elevation (Calculated from Contour) Aerial Photograph (10.16cm/pixels) 3D Images Graphs Interactive data access and visualization in the field
18
18 Συμπεράσματα 1/2 συλλογική εργασία πολύ πιο αργή από την μεμονωμένη εργασία λόγω της προσπάθειας που περιλαμβάνεται στην εκμάθηση μιας κοινής γλώσσας και στην εύρεση κοινού εδάφους στα ερευνητικά ενδιαφέροντα. πολλά από τα προβλήματα με τον καθαρισμό των δεδομένων και την αξιοπιστία των αισθητήρων, λόγω του ανώριμου σταδίου των οργάνων και των δικτύων. ερευνητές εξέφρασαν την ευθύνη να επιβεβαιώσουν ότι οποιαδήποτε κοινά δεδομένα θα πρέπει να είναι τεκμηριωμένα αρκετά για να ερμηνευθούν σωστά. ποιος ελέγχει τα δεδομένα από το πρόγραμμα, και ποιος έχει τα πρώτα πνευματικά δικαιώματα.
19
19 Συμπεράσματα 2/2 Τα εργαλεία απεικόνισης στον τομέα αυτό μπορεί να είναι λιγότερο χρήσιμα από ότι αναμενόταν, δεδομένου ότι αυτοί οι επιστήμονες θέλουν να πάρουν τα δεδομένα στα δικά τους εξοικειωμένα εργαλεία. Η γρήγορη διαμόρφωση πρότυπων πηγών των δεδομένων στον επιστημονικό τομέα είναι μια ουσιαστική απαίτηση Οι περισσότερες από τις ανωτέρω απαιτήσεις προτείνουν τα εργαλεία που επεξεργάζονται με το χέρι δεδομένα για αυτή την επιστημονική κοινότητα
20
20 Προβληματισμοί μακροπρόθεσμος στόχος εξελικτικά εργαλεία διευκόλυνση στη διανομή και τη διόρθωση των επιστημονικών δεδομένων Με τη βοήθεια των υπαρχουσών γλωσσών μεταδεδομένων (EML) να αντιληφθεί η επιστημονική κοινότητα ότι η διαχείριση μεταδεδομένων είναι τα δεδομένα από κάθε αισθητήρα δικτύου, διανεμημένα στο πλαίσιο εργασίας της επιστημονικής έρευνας Συζήτηση για απελευθέρωση περιορισμών Συζήτηση αναφορικά με την υπεύθυνη χρήση των δεδομένων
21
21 Ευχαριστώ για την προσοχή σας!!!
Παρόμοιες παρουσιάσεις
© 2024 SlidePlayer.gr Inc.
All rights reserved.