Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ Κουλικούρδη Άννα Τηλ/νο: 210-6682737

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ Κουλικούρδη Άννα Τηλ/νο: 210-6682737"— Μεταγράφημα παρουσίασης:

1 ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ Κουλικούρδη Άννα Τηλ/νο: 210-6682737 E-mail: akou@ait.gr

2 ΘΕΜΑ: Πολυγλωσσικές & Πολυπολιτισμικές Ψηφιακές Βιβλιοθήκες

3 Τι περιλαμβάνει το θέμα;  Γενικά ζητήματα του πολιτισμού και της γλώσσας  Μετάβαση από τοπικά σε παγκόσμια συστήματα & οι σχεδιαστικές προκλήσεις τους  Πολυγλωσσική ανάκτηση πληροφοριών (CLIR)  Τεχνικά ζητήματα (σετ χαρακτήρων γλωσσών- μονογλωσσικά & πολυγλωσσικά)  Τρέχουσες χρήσεις & προσεγγίσεις στο διεθνή & ελληνικό χώρο  Περιορισμοί του σήμερα  Κριτική & σχόλια  Σημαντικές πηγές, προσπάθειες και θέματα  Ερωτήματα και προβληματισμοί

4 Πώς εντάσσεται το θέμα στην ενότητα;  Ψηφιακές Βιβλιοθήκες (DLs) προσβάσιμες μέσω WWW χωρίς εθνικά όρια και σύνορα  Αποτελεσματικότερη ανταλλαγή δεδομένων και επικοινωνία  Διεθνής βιβλιοθηκονομική κοινότητα  Κατάργηση αποκλεισμών ή περιορισμών πρόσβασης στη γνώση  Επιβίωση μη κυρίαρχων (non-dominant) γλωσσών και των ψηφιακών βιβλιοθηκών που διαθέτουν υλικό σε αυτές

5 Γιατί είναι σημαντικό ως θέμα;  Ως τώρα, προσπάθειες επικεντρωμένες σε μονογλωσσικές ψηφιακές βιβλιοθήκες  Δεσπόζουσα γλώσσα η Αγγλική  Επιτακτική ανάγκη για διαλειτουργικότητα, φορητότητα και ανταλλαγή δεδομένων  Ανάπτυξη πληροφοριακής υποδομής και προτύπων  Ενημέρωση επιστημόνων της πληροφόρησης, σχεδιαστών και ειδικών στις τεχνολογίες επικοινωνίας

6 Στατιστικά Στοιχεία  Οι on-line γλώσσες που χρησιμοποιούνται για τη διάχυση γνώσης στο WWW έχουν ως εξής: 1. Αγγλική: 40.2% 2. Κινεζική: 9.8% 3. Γιαπωνέζικη: 9.2% 4. Ισπανική: 7.2%  Αν θέλαμε να μεταφράσουμε τις 400.000.000 μη Αγγλικές σελίδες του WWW θα χρειάζονταν 100.000 ημέρες ( 300 χρόνια) σε ένα πολύ γρήγορο Η/Υ. Ή αλλιώς 1 μήνα σε 3.600 Η/Υ.  Οι χρήστες του Internet που δεν μιλούν Αγγλικά: 2003: 54% 2005: 59%  Η 1η διδακτορική διατριβή πολυγλωσσικής ανάκτησης πληροφοριών: 1994 του Khaled Radwan

7 Πολιτισμός και Γλώσσα  Πλούτος ανθρώπινης επικοινωνίας (προφορική, γραπτή, μεταφράσεις)  Ιδιαίτεροι τρόποι έκφρασης  Πολύπλοκη η αναζήτηση & ανάκτηση πληροφοριών  Ακριβείς αναπαραστάσεις  Ελάχιστες αλλοιώσεις των προθέσεων του δημιουργού  Εναρμόνιση των αναγκών και εκφράσεων των δημιουργών και των χρηστών της πληροφορίας

8 Ορολογία Πολυγλωσσικών Ψηφιακών Βιβλιοθηκών  Internationalization: παγκόσμια επικοινωνία ανεξαρτήτως γλώσσας  Localization: προσαρμογή στις τοπικές ανάγκες  Multilingual Digital Library: πολυγλωσσική ψηφιακή βιβλιοθήκη  Multilingual Document: πολυγλωσσικό τεκμήριο  Cross-Language Information Retrieval (CLIR): πολυγλωσσική ανάκτηση πληροφοριών  Transliteration (TL): μεταγραφή  Large Passive Vocabulary: η 2η γλώσσα που μπορούν να διαβάζουν οι χρήστες≠Small active vocabulary

9 Από τοπικά συστήματα σε παγκόσμια ΤΟΠΙΚΑ ΣΥΣΤΗΜΑΤΑ:  Εύκολα για σχεδιασμό  Προορισμένα για συγκεκριμένες εφαρμογές & κοινότητες χρηστών ΠΑΓΚΟΣΜΙΑ ΣΥΣΤΗΜΑΤΑ:  Ανοικτά συστήματα  Εξυπηρετούν απομακρυσμένους πληθυσμούς & πολλές τοπικές γλώσσες (minority languages) ΠΑΡΑΔΕΙΓΜΑΤΑ:  Ψηφιακές Βιβλιοθήκες Πανεπιστημίων  Εταιρικά sites  Επιστημονικές βάσεις δεδομένων

10 Σχεδιαστικές Προκλήσεις Στα τοπικά συστήματα:  Προσαρμογή: Διεπιφάνειας χρήστη (GUI) Παράμετροι εισόδου (input) & εξόδου (output) Πληκτρολόγια, οθόνες, εκτυπωτές, γραμματοσειρά

11 Σχεδιαστικές Προκλήσεις Στα Παγκόσμια συστήματα:  Απίστευτη ποικιλία υλικού & λογισμικού  Ποικιλία συστημάτων κωδικοποίησης χαρακτήρων  Λιγότερος έλεγχος από τους σχεδιαστές  Σχεδιαστικές προδιαγραφές (trade-offs)  Διλήμματα

12 Πολυγλωσσική Ανάκτηση Πληροφοριών (Cross- Language Information Retrieval: CLIR)  Ανερχόμενος και αναπτυσσόμενος κλάδος (http://www.clis.umd.edu/dlrg/clir)http://www.clis.umd.edu/dlrg/clir  3 προσεγγίσεις: Μετάφραση κειμένου μέσω μηχανών μετάφρασης (Machine Translation-MT): μη υψηλά αποτελέσματα και ακριβή σε κόστος Τεχνικές βασισμένες στη γνώση (λεξικά- MRD: machine readable dictionaries,πολυγλωσσικοί θησαυροί): δόμηση & διατήρηση ακριβή, υψηλή εκπαίδευση Χρήση οντολογιών (EuroWordNet project- http://www.illc.uva.nl/EuroWordNet) : δύσκολες στην ενημέρωση, ακριβή δόμησηhttp://www.illc.uva.nl/EuroWordNet

13 Μεταγραφή (Transliteration)  Αντιστοιχεί χαρακτήρες από μια γλώσσα σε άλλη  Δεν μεταφράζει νοήματα  Απώλεια αξιοσημείωτων δεδομένων (π.χ. Mao Tse-tung έναντι Mao Zedong στα Κινέζικα)  Παράλειψη διακριτικών σημείων-γνωρισμάτων (accents, διαλυτικά, κ.ά.)  Μη ολοκληρωμένες μορφές λέξεων  Ανέφικτη η αντιστοίχιση & το ταίριασμα λέξεων

14 Μονογλωσσικά, πολυγλωσσικά & παγκόσμια σετ χαρακτήρων Μονογλωσσικά (ASCII, ALA) - Παγκόσμια (Unicode)  HTTP 1.1, HTML 2.0  Universal Character Set (UCS) του ISO 10646:1993  Unicode  Συγχώνευση του Unicode με το ISO 10646

15 Unicode 4.0 (15η έκδοση)  Κωδικοποιεί αλφάβητα (χαρακτήρες), όχι γλώσσες  Ένας μοναδικός αριθμός για κάθε χαρακτήρα  Ανεξάρτητο από λειτουργικά συστήματα, λογισμικά & γλώσσες  Απαιτεί 16 bits δηλ. >65.000 χαρακτήρες  Κύριες γλώσσες Αμερικής, Ευρώπης, Μέσης Ανατολής, Αφρικής, Ινδίας, Ασίας  Ελληνικό αλφάβητο: U+0370-U+03FF  Υψηλότερες απαιτήσεις- Χρόνοι μετάδοσης  Υιοθέτηση & υποστήριξη από κορυφαίους παράγοντες (IBM, Oracle, κ.ά.)

16 Τρέχουσες Εφαρμογές-Διεθνής Χώρος  Πολυγλωσσικές ψηφιακές βιβλιοθήκες: 1960  Ενεργή συμμετοχή Ευρώπης & Ασίας  OCLC (www.oclc.org): Σετ χαρακτήρων της ALAwww.oclc.org  Βιβλιοθήκη Κογκρέσσου (www.loc.gov) & RLIN (http://www.rlg.org/rlin.html): πρωτότυπη καταλογογράφηση & κωδικοποίηση μη Ρωμαϊκών αλφαβήτωνwww.loc.govhttp://www.rlg.org/rlin.html  Υποστήριξη Unicode (Ευρωπαϊκή Ένωση)  Ερευνητικά έργα φορέων, όπως: IFLA, Mellon Foundation, κ.ά.

17 Τρέχουσες Εφαρμογές-Ελλάδα  Πρότυπο ISO 843:1997 της επιτροπής ISO/TC46/SC2 για τη μεταγραφή των Ελληνικών χαρακτήρων σε Λατινικούς  Working Group 5 της ISO/TC46/SC2 για μεταγραφή Ελληνικών  HELEN Project (1993-1995): προβλήματα μεταγραφής των Ελληνικών στις βιβλιογραφικές εγγραφές

18 Περιορισμοί & Όρια  Μαζικός όγκος κειμένων  Ποικιλία λογισμικού & υλικού (έλλειψη διαλειτουργικότητας)  Κάθε ψηφιακή βιβλιοθήκη= ξεχωριστές εφαρμογές, εργαλεία, αρχιτεκτονική, χρήστες, γλώσσα & πολιτισμό  Έλλειψη προτυποποίησης

19 Κριτική και Σχόλια  Ενημέρωση ευρύτερου κοινού - Πρωτοβουλίες  Εκπαίδευση & εμπειρία επί του αντικειμένου  Εμφάνιση νέων προκλήσεων (πολυγλωσσική ανάκτηση λόγου και ομιλίας)  Τελική επιδίωξη: παγκόσμια (global) ψηφιακή βιβλιοθήκη

20 Σημαντικές Πηγές  CLEF (Cross-Language Evaluation Forum- http://www.clef- campaign.org)http://www.clef- campaign.org  TREC (Text Retrieval Conference- http://trec.nist.gov)http://trec.nist.gov  NTCIR (NII-NACSIS Test Collection for IR Systems – http://reserach/nii.ac.jp/ntcir/) http://reserach/nii.ac.jp/ntcir/  ELRA (Evaluations and Languages Resources Distribution Association): http://www.elra.infohttp://www.elra.info Ερευνητικά προγράμματα:  HLT Central: Human Language Technologies on the Web (European Commission) (http://www.elra.info)http://www.elra.info  TIDES: Transligual Information Detection, Extraction and Summarization (DARPA) (http://www.darpa.mil/iao/TIDES.htm)http://www.darpa.mil/iao/TIDES.htm

21 Ερωτήματα & Προβληματισμοί  Όλες οι προαναφερόμενες τεχνικές βρίσκονται σε πειραματικό στάδιο  Συνεκδοχικά, ποιος ο ρυθμός υιοθέτησης καθολικά αποδεκτών & εφαρμόσιμων μεθόδων;  Πόσο ικανοποιητικά αποτελέσματα αποφέρουν οι λύσεις αυτές;  Η ανάπτυξη νέων γλωσσικών εργαλείων και τεχνικών πολυγλωσσικής ανάκτησης πληροφοριών χρήζει μείζονος προσοχής

22 Βιβλιογραφία 1. Borgman C.L., Multi-Media, Multi-Cultural, and Multi-Lingual Digital Libraries or How Do We Exchange Data in 400 Languages?, D-Lib, June 1997 (available at: http://www.dlib.org/dlib/june97/06borgman.html )http://www.dlib.org/dlib/june97/06borgman.html 2. Oard D.W., Ruiz M., Klavans J., Multi-lingual Information Discovery and AccesS (MIDAS), D-Lib, October 1999 (available at: http://www.dlib.org/dlib/october99/10oard.html) http://www.dlib.org/dlib/october99/10oard.html 3. Murthy T., Interoperability among Multi-Lingual Digital Libraries through Unicode based metadata: a model for India, Indo-US Workshop on Open Digital Libraries and Interoperability, Virginia Tech, USA, 23- 25 June 2003 (available at: http://fox.cs.vt.edu/IndoUSdl/ )http://fox.cs.vt.edu/IndoUSdl/ 4. Oard D.W., Multilingual Information Access: the user’s perspective )available at: http://www.iei.pi.cnr.it/DELOS/CLEF/workshop00.html)http://www.iei.pi.cnr.it/DELOS/CLEF/workshop00.html 5. Clews J., Digital Language Access: scripts, transliteration, and computer access, D-Lib, March 1997 (available at: http://www.dlib.org/dlib/march97/sesame/03clews.html) http://www.dlib.org/dlib/march97/sesame/03clews.html

23 Βιβλιογραφία 6. Peters C., Picchi E., Across Languages, Across Cultures: issues in multilinguality and digital libraries, D-Lib, May 1997 (available at: http://www.dlib.org/dlib/may97/peters/05peters.html) http://www.dlib.org/dlib/may97/peters/05peters.html 7. Pavani A., A Model of Multilingual Digital Library, Ci.Inf., Brasilia, v.30, n.3.,p.73-81, Sep./Dec. 2001 (available at: http://www.dlib.org/dlib/may97/peters/05peters.html) http://www.dlib.org/dlib/may97/peters/05peters.html 8. Maeda A., Multi-lingual Information Processing for Digital Libraries (available at http://pnclink.org/annual/annual2002/pdf/0921/12/c21/206- 1.pdf)http://pnclink.org/annual/annual2002/pdf/0921/12/c21/206- 1.pdf 9. Peters C., Cross-Language Evaluation Forum (CLEF): agenda for 2002, D-Lib, February 2002 (available at http://www.dlib.org/dlib/february02/02inbrief.html) http://www.dlib.org/dlib/february02/02inbrief.html 10. Peters C., ECDL 2003 Workshop Report: cross-language evaluation forum (CLEF 2003), D-Lib, September 2003 (available at: http://www.dlib.org/dlib/september03/09inbrief.html) http://www.dlib.org/dlib/september03/09inbrief.html

24 Βιβλιογραφία 11. Peters C., Cross-Language Evaluation Forum, D-Lib, February 2000 (available at: http://www.dlib.org/dlib/february00/02inbrief.html)http://www.dlib.org/dlib/february00/02inbrief.html 12. Caidi N., Komlodi A., Cross-cultural Considerations in Digital Library ResearchL report for the JCDL 2003 workshop, D-Lib, July/August 2003 (available at: http://www.dlib.org/dlib/july03/07inbrief.html)http://www.dlib.org/dlib/july03/07inbrief.html 13. Dartois M., Maeda A., Sakaguchi T., A Multilingual Electronic Text Collection of Folk Tales for Casual Users Using Off-the-Shelf Browsers, D-Lib, October 1997 (available at: http://www.dlib.org/dlib/october97/sugimoto/10sugimoto.html) http://www.dlib.org/dlib/october97/sugimoto/10sugimoto.html 14. Croft W.B., What Do People Want from Information Retrieval?, D-Lib, November 1995 (available at: http://www.dlib.org/dlib/november95/11croft.html) http://www.dlib.org/dlib/november95/11croft.html 15. Java: how to program/ Deitel H.M., Deitel P.J., Prentice Hall PTRM, 5th ed., 2002

25 Βιβλιογραφία 16. Osawa N., A Multilingual Information Processing Infrastructure for Global Digital Libraries: EPICIST, D-Lib, 1997 (available at: http://www.dl.ulis.ac.jp/ISDL97/proceedings/osawa/osawa.html) http://www.dl.ulis.ac.jp/ISDL97/proceedings/osawa/osawa.html 17. Powell J., Fox E.A., Multilingual Fedearted Searching Across Heterogeneous Collections, D-Lib, September 1998 (available at: http://www.dlib.org/dlib/septemeber98/powell/09powell.html) http://www.dlib.org/dlib/septemeber98/powell/09powell.html 18. Anderson D., Unicode and Historic Scripts, Ariadne (available at: http://www.ariadne.ac.uk/issue37/anderson/) http://www.ariadne.ac.uk/issue37/anderson/


Κατέβασμα ppt "ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ Κουλικούρδη Άννα Τηλ/νο: 210-6682737"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google