…..finalmente (o alla fine) CORPORA IN ITALIANO …..finalmente (o alla fine)
IL PIU GRANDE E PRESTIGIOSO BADIP - Banca Dati dell'Italiano Parlato Μία βάση δεδομένων της οποίας επί κεφαλής ήταν ο T. De Mauro Το project αποτελεί τμήμα του Language Server του Πανεπιστημίου Karl-Franzens του Graz στην Αυστρία. Αποτελείται από περίπου 500 χιλιάδες λέξεις Είναι προφορικού και γραπτού λόγου και το υλικό συνελέγει από διάφορες περιοχές της Ιταλίας. http://languageserver.uni-graz.at/badip/badip/home.php LIP (Lessico di frequenza dell’italiano parlato) Το Corpus που προϋπήρχε για τον προφορικό λόγο κυρίως αλλά δεν ανανεώθηκε από το 1993
IL PIU VECCHIO LIF Lessico di frequenza della lingua italiana contemporanea (1971), Σχεδιασμένο από το Universitario di Calcolo Elettronico (CNUCE) της Pisa σύμφωνα με το μοντέλο του Brown Corpus Αποτελείται από 500.000 κείμενα
IL PIU LESSICALE CoLFIS - Corpus e Lessico di Frequenza dell’Italiano Scritto 3 εκατομμύρια λέξεις, ανακτημένες από τον τύπο και βιβλία ποικίλης ύλης και επεξεργασμένες με βάση τα δεδομένα της ISTAT σχετικά με τις αναγνωστικές προτιμήσεις των Ιταλών. http://www.ge.ilc.cnr.it/strumenti.php
IL PIU USATO CORIS/CODIS - Corpus di Italiano Scritto contemporaneo Πρόγραμμα του Πανεπιστημίου της Bologna Αποτελείται από περίπου 100 εκατομμύρια λέξεις Τα κείμενα αποτελούνται από την λογοτεχνία κει την ενημέρωση των δεκαετιών 80 και 90. http://corpora.dslo.unibo.it/coris_ita.html Το τελευταίο είναι λάθος
IL PIU FACILE La Repubblica Corpus corpus επίσης, κατασκευασμένο από το Πανεπιστήμιο της Bologna Περιλαμβάνει τις εκδόσεις της Repubblica από το 1985 έως το 2000. Αποτελείται από περίπου 400 χιλιάδες λέξεις ιταλικής δημοσιογραφίας. http://dev.sslmit.unibo.it/corpora/corpus.php?path=&name=Repubblica Το δεύτερο λάθος
IL PIU PARLATO LABLITA Corpus του Πανεπιστημίου της Firenze αποκλειστικά για τον προφορικό λόγο Χαρακτηρισμένο και δεδομένες παραμέτρους στη συλλογή του υλικού http://lablita.dit.unifi.it/
IL PIU TECNOLOGICO Corpus Webbit Δημιουργήθηκε από τον Marco Baroni το 2007 http://clic.cimec.unitn.it/marco/webbit/index.html
IL PIU GLOBALE Corpora Unito.it http://www.corpora.unito.it/index.php Τα πιο σημαντικά: ένα ΗΣΚ φυσικών ομιλητών, ένα learner corpus της ιταλικής http://www.corpora.unito.it/index.php
IL PIU RECENTE Perugia Corpus (PEC) ΗΣΚ του Πανεπιστημίου της Perugia με native corpus και learner corpus. Αποτελείται από 26 εκατομμύρια λέξεις Επιστημονική υπεύθυνη η Stefania Spina Έχει χαρακτηριστεί Το πρώτο Λάθος
..e se per caso vi scappa qualcosa.. http://www.alphabit.net/Corsi/IUlinks/CorporaList.htm#italiano Alphabit: pagina curata da Isabella Chiari e contenente, nella rubrica Corpora, una lista aggiornata e ragionata di corpora per l’italiano.