Εισαγωγή στο Linux/Unix Εργαστηριακή Άσκηση 3 Η/Υ 1 ο έτος Γρ. Αμούτζιας.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
HY340 : ΓΛΩΣΣΕΣ ΚΑΙ ΜΕΤΑΦΡΑΣΤΕΣ
Advertisements

Support.ebsco.com Εκπαιδευτικό μάθημα για τη δημιουργία τοπικής συλλογής.
Σημειώσεις : Χρήστος Μουρατίδης
Εφαρμογες με αριθμους και συμβολοσειρες
Η εντολή Δείξε είναι μια εντολή εξόδου και χρησιμοποιείται για:
Εργαστήριο Λειτουργικών Συστημάτων Φροντιστήριο 2– Εισαγωγή στη Bash Ντίρλης Νικόλαος.
Microsoft Excel 4.2 Κελιά Κίκα Χρυσοστόμου.
Προγραμματισμός PASCAL Πληροφορική Γ' Λυκείου μέρος γ
Η πιο έξυπνη χελώνα στον κόσμο
Σημειώσεις : Χρήστος Μουρατίδης
Regular Expressions. Regular Expressions - γενικά  Βασική ιδέα: έχουμε ένα pattern και ένα κείμενο εισόδου. Εφαρμόζουμε το pattern στο κείμενο και μπορούμε:
ΔΙΑΔΙΚΑΣΙΑ ΑΠΟΔΕΙΞΗΣ (1)  Έχουμε τις προτάσεις: (1) master(giorgos, odi). (2) master(giannis, pluto). (3) lives(giannis, athina). (4) lives(Y, Z) :- master(X,
Δημιουργία του δικού σας χάρτη στο
Περισσότερες Ασκήσεις Συνδυαστικής
Ενότητα Η Δομή Επανάληψης
Στο λειτουργικό σύστημα Windows, υπάρχουν εικονίδια (icons) τα οποία αναπαριστούν τις διάφορες οντότητες (φυλαγμένες πληροφορίες, προγράμματα που κάνουν.
Β΄ ΓΕΛ ΕισΑρχΕπ Η/Υ παρ – 2.2.5
ΘΠ06 - Μεταγλωττιστές Πίνακας Συμβόλων. Πίνακας Συμβόλων (Symbol Table) (Ι)  Είναι μια δομή στην οποία αποθηκεύονται τα ονόματα ενός προγράμματος και.
Β΄ ΓΕΛ ΕισΑρχΕπ Η/Υ παρ – 2.2.5
Δημιουργώντας νέες λέξεις - Διαδικασίες
HY340 : ΓΛΩΣΣΕΣ ΚΑΙ ΜΕΤΑΦΡΑΣΤΕΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ, ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ, ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΥΠΟΛΟΓΙΣΤΩΝ ΔΙΔΑΣΚΩΝ Αντώνιος Σαββίδης.
Συνάρτηση SEARCH Σύνταξη SΕΑRCΗ(Κείμενο προς εύρεση; Μέσα στο κείμενο; Θέση έναρξης) Κείμενο προς εύρεσηΕίναι το μέρος του κειμένου που θέλουμε να βρούμε.
Μεταβλητές – εντολές εκχώρησης- δομή ακολουθίας
ΘΠ06 - Μεταγλωττιστές Εισαγωγή στον Bison Φροντιστήριο - 30/03/2009.
Ενότητα Α.4. Δομημένος Προγραμματισμός
Δουλεύει για όλους τους αριθμούς! Η δεύτερη ΓΡΑΨΕ δεν θα εκτελεστεί ποτέ!
Επικοινωνία Ανθρώπου Μηχανής HTML CGI JAVASCRIPT Κουμπούλης Χρήστος Α.Μ. 921 Χαλαβαζής Βασίλης Α.Μ. 988.
Slide 1/42 ΗΥ – 340 Γλώσσες και Μεταφραστές Φροντιστήριο Εισαγωγή στο Flex.
ΣΥΝΟΛΑ.
ΘΠ06 - Μεταγλωττιστές Εισαγωγή στον Bison Φροντιστήριο - 23/03/2010.
ΧΡΗΣΗ ΤΟΥ ΛΟΓΙΣΜΙΚΟΥ PERIOD04 ΓΙΑ ΤΗΝ ΕΥΡΕΣΗ ΣΥΧΝΟΤΗΤΩΝ ΑΝΑΠΑΛΣΗΣ ΠΑΛΛΟΜΕΝΩΝ ΑΣΤΕΡΩΝ Αλέξιος Λιάκος, M.Sc.
Μεταγλωττιστές (Compilers) (Θ) Ενότητα 8: Πίνακας Συμβόλων Κατερίνα Γεωργούλη Τμήμα Μηχανικών Πληροφορικής ΤΕ Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας.
Κάντε κλικ για έναρξη… Τ Ο ΠΕΡΙΒΑΛΛΟΝ ΕΡΓΑΣΙΑΣ Κέντρο εντολών Χώρος γραφικών (σελίδα) Χώρος σύνταξης διαδικασιών.
Ερωτήσεις & Φύλλο εργασίας
Εισαγωγή στην Πληροφορική και στην διαχείριση μεγάλου όγκου δεδομένων Γρηγόριος Αμούτζιας Επικ. Καθηγητής Βιοπληροφορικής στη Γενωμική Τμήμα Βιοχημείας.
Εισαγωγή στην Πληροφορική και στην διαχείριση μεγάλου όγκου δεδομένων Γρηγόριος Αμούτζιας Επικ. Καθηγητής Βιοπληροφορικής στη Γενωμική Τμήμα Βιοχημείας.
Εισαγωγή στην Πληροφορική και στην διαχείριση μεγάλου όγκου δεδομένων Γρηγόριος Αμούτζιας Επικ. Καθηγητής Βιοπληροφορικής στη Γενωμική Τμήμα Βιοχημείας.
Εισαγωγή στην Πληροφορική και στην διαχείριση μεγάλου όγκου δεδομένων Γρηγόριος Αμούτζιας Επικ. Καθηγητής Βιοπληροφορικής στη Γενωμική Τμήμα Βιοχημείας.
1Κεφάλαιο 4 Κανόνες Σύνταξης HTML Όλες οι ετικέτες εσωκλείονται μεταξύ των χαρακτήρων “ “. Κάθε τι που βρίσκεται μεταξύ των χαρακτήρων “ ”, αποτελεί σχόλιο.
Μερικές φορές το αποτέλεσμα εμφανίζεται αμέσως από κάτω.
Οι εντολές επανάληψης Σε πολλά προβλήματα απαιτείται η επανάληψη ενός συνόλου ενεργειών προκειμένου να λυθεί το πρόβλημα. Θα αναφέρουμε δύο χαρακτηριστικά.
Ο τελεστής ανάθεσης Ο τελεστής ανάθεσης (=) χρησιμοποιείται για να τοποθετήσουμε το αποτέλεσμα μιας έκφρασης (σταθερά, μεταβλητή ή παράσταση) σε μια μεταβλητή.
Βασικά στοιχεία της Java
ΚΕΦΑΛΑΙΟ Το αλφάβητο της ΓΛΩΣΣΑΣ
Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλίας Αντικειμενοστραφής Προγραμματισμός Ι Ενότητα 2: Μεταβλητές και Τύποι Δεδομένων. Διδάσκων: Νικόλαος Θ Λιόλιος,
Ξεχωριστή Μεταγλώττιση & Χώροι Ονομάτων Αντικειμενοστραφής Προγραμματισμός.
Βασικές έννοιες προγραμματισμού Κεφάλαιο 7 ο. Βασικές έννοιες προγραμματισμού Αλφάβητο και τύποι δεδομένων Σταθερές και μεταβλητές Τελεστές, συναρτήσεις.
ΜΑΘΗΜΑ: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ 2 ο ΕΡΓΑΣΤΗΡΙΟ: Μενού,Εντολές και Παράθυρα Διαλόγου Καθηγητής: Γρηγόριος Νικ. Καρατάσιος.
Εισαγωγή στην Python.
Βρόχος Do … Loop Σκοπός Μαθήματος Χρήση Do… Loop για την εκτέλεση μιας ομάδας εντολών μέχρι να εκπληρωθεί μια συγκεκριμένη συνθήκη. Αθήνα, 2015.
ΚΕΦΑΛΑΙΟ 2ο - ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΑΛΓΟΡΙΘΜΩΝ
Βρόχος Do … Loop Σκοπός Μαθήματος Χρήση Do… Loop για την εκτέλεση μιας ομάδας εντολών μέχρι να εκπληρωθεί μια συγκεκριμένη συνθήκη.
Αρχεσ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ Η/Υ ΤΑξη Β΄
ΑΛΓΟΡΙΘΜΟΣ ΠΡΟΒΛΗΜΑ ΑΛΓΟΡΙΘΜΟΣ ΛΥΣΗ
Πίνακες και αλφαριθμητικά
Αρχεσ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ Η/Υ ΤΑξη Β΄
1. Πώς ανοίγουμε ένα αποθηκευμένο βιβλίο εργασίας;
Μανασσάκης Βασίλης Καθηγητής Πληροφορικής
Εισαγωγή στην Πληροφορική μεγάλου όγκου δεδομένων
Εισαγωγή στην Πληροφορική μεγάλου όγκου δεδομένων
Επιμέλεια: Τίκβα Χριστίνα
Εντολές και δομές αλγορίθμου
ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ Η/Υ
Κανονικές εκφράσεις ή παραστάσεις (Regular Expressions)
Εντολές επεξεργασίας κειμένου (text) : sed (stream ή script editor), cut, paste, tr, sort, uniq Εντολές αναζήτησης : file, find 6ο ΕΡΓΑΣΤΗΡΙΟ ΛΕΙΤΟΥΡΓΙΚΑ.
Β.ΕΠΑΛ-Γενικής Παιδείας  ΜΑΘΗΜΑ: Εισαγωγή στης αρχές Επιστήμης των Η/Υ  ΚΕΦΑΛΑΙΟ 4: Γλώσσες Αναπαράστασης Αλγορίθμων  ΕΝΟΤΗΤΑ 4.2: Δομή Ακολουθίας 
Σημειώσεις : Μιχάλης Φίλης
Ερωτήματα Επιλογής σε ACCESS
Σημειώσεις : Μιχάλης Φίλης
Αναζήτηση στο Διαδίκτυο
Μεταγράφημα παρουσίασης:

Εισαγωγή στο Linux/Unix Εργαστηριακή Άσκηση 3 Η/Υ 1 ο έτος Γρ. Αμούτζιας

Egrep: Αναζήτηση με περισσότερα από ένα μοτίβα To egrep είναι μια εντολή προέκταση της grep για regular expressions. Θέλω να ψάξω στο αρχείο μου για γραμμές που έχουν κάποιο ή και τα δύο από τα ονόματα-μοτίβα ‘giannis’ ‘eleni’. Χρησιμοποιούμε το σύμβολο ‘|’ (pipe). Δημιουργείστε το παρακάτω αρχείο file1 με το vi και εκτελέστε την παρακάτω εντολή για βρείτε τις γραμμές που περιέχουν τα ονόματα giannis ή eleni: egrep ‘giannis|eleni’ file1 elenilarisa marialarisa giorgoslarisa giannisathina annaxanthi Giorgosvolos elenilarisa marialarisa giorgoslarisa giannisathina annaxanthi Giorgosvolos elenilarisa giannisathina file1 terminal Επίσης, είναι δυνατόν να κάνουμε αναζήτηση και με περισσότερα μοτίβα. Ποιά είναι η εντολή για να βρω γραμμές που περιέχουν τα ονόματα ‘giannis’ ‘eleni’ ή ‘giorgos’ ? Αν θέλω η αναζήτηση να μην είναι ευαίσθητη σε κεφαλαία/μικρά γράμματα, πώς θα τροποποιήσω την εντολή? Τι θα έκανα αν ήθελα να εκτελέσω το ίδιο πράγμα με την grep –f ? Α

Egrep: Αναζήτηση με περισσότερα από ένα μοτίβα elenilarisa marialarisa giorgoslarisa giannisathina annaxanthi Giorgosvolos elenilarisa marialarisa giorgoslarisa giannisathina annaxanthi Giorgosvolos file1 Ποιά είναι η εντολή για να βρω γραμμές που περιέχουν τα ονόματα ‘giannis’ ‘eleni’ ‘giorgos’ ? egrep ‘giannis|eleni|giorgos’ file1 Αν θέλω η αναζήτηση να μην είναι ευαίσθητη σε κεφαλαία/μικρά γράμματα, πώς θα τροποποιήσω την εντολή? egrep -i ‘giannis|eleni|giorgos’ file1 Τι θα έκανα αν ήθελα να εκτελέσω το ίδιο πράγμα με την grep –f ? Θα έπρεπε να γράψω τα τρία ονόματα σε ένα άλλο αρχείο (3 γραμμές) π.χ. file_names και μετά εκτελώ: grep –f file_names file1 giannis eleni giorgos giannis eleni giorgos file_names Α

Egrep: Αναζήτηση πιο γενικών μοτίβων με regular expressions Πολλές φορές δεν αναζητούμε μια συγκεκριμένη λέξη ή σειρά χαρακτήρων, αλλά ένα πιο γενικό μοτίβο χαρακτήρων. Π.χ. Μπορεί να αναζητάμε: Κάποιους χαρακτήρες που βρίσκονται στην αρχή μιας σειράς. Κάποιους χαρακτήρες που βρίσκονται στο τέλος μιας σειράς. Κάποιες λέξεις που σε μια συγκεκριμένη θέση τους μπορεί να υπάρχουν εναλλακτικά μια σειρά από κάποιους χαρακτήρες/νούμερα/σύμβολα. Για αυτό το λόγο κάνουμε χρήση των regular expressions. Θ

Egrep: μοτίβα που βρίσκονται στην αρχή μιας σειράς elenilarisa giannisathina annaxanthi Giorgoseleni elenilarisa giannisathina annaxanthi Giorgoseleni file1 Για να δηλώσουμε ότι το συγκεκριμένο μοτίβο πρέπει να βρίσκεται στην αρχή μιας σειράς χρησιμοποιούμε το σύμβολο ^ πριν το μοτίβο. Τροποποιείστε με το vi το file1 όπως στην παρακάτω εικόνα. Εκτελέστε την παρακάτω εντολή, για να βρείτε γραμμές όπου η λέξη ‘eleni’ βρίσκεται μόνο στην αρχή της γραμμής: egrep ‘^eleni’ file1 elenilarisa terminal Α

Egrep: μοτίβα που βρίσκονται στο τέλος μιας σειράς elenilarisa giannisathina annaxanthi Giorgoseleni elenilarisa giannisathina annaxanthi Giorgoseleni file1 Για να δηλώσουμε ότι το συγκεκριμένο μοτίβο πρέπει να βρίσκεται στο τέλος μιας σειράς χρησιμοποιούμε το σύμβολο $ μετά το μοτίβο. Εκτελέστε την παρακάτω εντολή για να βρείτε γραμμές όπου η λέξη ‘eleni’ βρίσκεται μόνο στο τέλος της γραμμής: egrep ‘eleni$’ file1 Giorgoseleni terminal Με ποιά εντολή θα βρούμε γραμμές που στην αρχή τους έχουν τη λέξη ‘eleni’ ή στο τέλος έχουν τη λέξη ‘athina’ ? Α

Egrep: μοτίβα που βρίσκονται στο τέλος μιας σειράς Με ποιά εντολή θα βρούμε γραμμές που στην αρχή τους έχουν τη λέξη ‘eleni’ ή στο τέλος έχουν τη λέξη ‘athina’ ? egrep ‘^eleni|athina$’ file1 Α

Egrep: λέξεις που σε μια συγκεκριμένη θέση τους μπορεί να υπάρχουν εναλλακτικά μια σειρά από κάποιους χαρακτήρες/νούμερα/σύμβολα. Για να δηλώσουμε μια σειρά από εναλλακτικούς χαρακτήρες/νούμερα σε μια συγκεκριμένη θέση του μοτίβου χρησιμοποιούμε: [a-z] για γράμματα από το a ως το z. [0-9] για νούμερα από το 0 έως και το 9. [ab89] σημαίνει ότι στη συγκεκριμένη θέση μπορεί να βρίσκεται οποιοσδήποτε από τους χαρακτήρες/νούμερα (a, b, 8, 9) που συναντάμε μέσα στις αγκύλες. [^ab89] το ^ μέσα στην αγκύλη, στην αρχή της σημαίνει ότι στη συγκεκριμένη θέση μπορεί να υπάρχει οποιοσδήποτε χαρακτήρας εκτός από αυτούς που συναντάμε μέσα στην αγκύλη. Θ

Egrep: λέξεις που σε μια συγκεκριμένη θέση τους μπορεί να υπάρχουν εναλλακτικά μια σειρά από κάποιους χαρακτήρες/νούμερα/σύμβολα. Για να δηλώσουμε μια σειρά από εναλλακτικούς χαρακτήρες/νούμερα σε μια συγκεκριμένη θέση του μοτίβου χρησιμοποιούμε: [a-z] για γράμματα από το a ως το z. [A-Z] για κεφαλαία γράμματα από το a ως το z. Τροποποιείστε το file1 όπως φαίνεται στην εικόνα. Θέλω να εντοπίσω τις γραμμές που ο κωδικός (1 η στήλη) ξεκινάει με κεφαλαίο γράμμα και ακολουθεί το 11. Εκτελώ: egrep ‘^[A-Z]11’ file1 A11larisa B11athina a11xanthi b11eleni A11larisa B11athina a11xanthi b11eleni file1 A11larisa B11athina terminal Με ποιά εντολή θα εντοπίσω τις γραμμές που ο κωδικός (1 η στήλη) ξεκινάει με μικρό γράμμα και ακολουθεί το 11; Α

Egrep: λέξεις που σε μια συγκεκριμένη θέση τους μπορεί να υπάρχουν εναλλακτικά μια σειρά από κάποιους χαρακτήρες/νούμερα/σύμβολα. A11larisa B11athina a11xanthi b11eleni A11larisa B11athina a11xanthi b11eleni file1 a11xanthi b11eleni terminal Με ποιά εντολή θα εντοπίσω τις γραμμές που ο κωδικός (1 η στήλη) ξεκινάει με μικρό γράμμα και ακολουθεί το 11; egrep ‘^[a-z]11’ file1 Α

Egrep: Κάποιες φορές το regular expression θέλουμε να επαναλαμβάνεται περισσότερες από μία φορές. Για να δηλώσουμε πόσες φορές θέλουμε να επαναλαμβάνεται, χρησιμοποιούμε: {Χ}, αμέσως μετά από το υπο-μοτίβο, όπου Χ το νούμερο/φορές που θέλουμε να επαναλαμβάνεται. {Χ,Υ}, αμέσως μετά από το υπο-μοτίβο, όπου Χ& Υ το νούμερο/φορές που θέλουμε να επαναλαμβάνεται από Χ έως Υ φορές. ? αμέσως μετά από το υπο-μοτίβο, για επανάληψη 0-1 φορές * αμέσως μετά από το υπο-μοτίβο, για επανάληψη 0 ή περισσότερες φορές + αμέσως μετά από το υπο-μοτίβο, για επανάληψη 1 ή περισσότερες φορές Το tab δηλώνεται με [^I] Το κενό δηλώνεται με [[:space:]] To οποιδήποτε γράμμα ή αριθμός δηλώνεται με \w Το \w είναι το ίδιο με [A-Za-z0-9] Το οποιοδήποτε σύμβολο δηλώνεται με την τελεία. Θ

Egrep: Θέλω να εντοπίσω τις γραμμές που ο κωδικός (1 η στήλη) ξεκινάει με δύο κεφαλαία γράμματα (οποιαδήποτε). Τροποποιείστε το file1 ανάλογα με την εικόνα. Εκτελέστε: egrep ‘^[A-Z][Α-Ζ]11’ file1 Ή egrep ‘^[A-Z]{2}11’ file1 AA11larisa B11athina aa11xanthi b11eleni abc321XXX AA11larisa B11athina aa11xanthi b11eleni abc321XXX file1 AA11larisa terminal Με ποιά εντολή θα εντοπίσω τις γραμμές που ο κωδικός (1 η στήλη) ξεκινάει με οποιαδήποτε 3 μικρά γράμματα μία φορά και ακολουθούν νούμερα; Α

Egrep: Με ποιά εντολή θα εντοπίσετε τις γραμμές που ο κωδικός (1 η στήλη) ξεκινάει με οποιαδήποτε 3 μικρά γράμματα μία φορά και ακολουθούν νούμερα; Εκτελέστε: egrep ‘^[a-z][a-z][a-z][0-9]+’ file1 Ή egrep ‘^[a-z]{3}[0-9]+’ file1 AA11larisa B11athina aa11xanthi b11eleni abc321XXX AA11larisa B11athina aa11xanthi b11eleni abc321XXX file1 abc321XXX terminal Α

Egrep: Στο παρακάτω παράδειγμα, θέλετε να εντοπίσετε τις γραμμές που ο κωδικός (1 η στήλη) ξεκινάει με ένα κεφαλαίο γράμμα, ακολουθεί ένα νούμερο, ακολουθεί ένα μικρό γράμμα. Εκτελέστε: egrep ‘^[A-Z][0-9][a-z]’ file1 A2a11larisa B11athina a11xanthi 1A2a11eleni A2a11larisa B11athina a11xanthi 1A2a11eleni file1 A2a11larisa terminal Αν δεν χρησιμοποιούσατε το ^ στην παραπάνω εντολή, τι θα συνέβαινε και γιατί; Α

Egrep: Αν δεν χρησιμοποιούσατε το ^ στην παραπάνω εντολή, τι θα συνέβαινε και γιατί; egrep ‘[A-Z][0-9][a-z]’ file1 Το egrep θα αναγνώριζε το μοτίβο και στην 1 η και στην 4 η γραμμή. A2a11larisa B11athina a11xanthi 1A2a11eleni A2a11larisa B11athina a11xanthi 1A2a11eleni file1 A2a11larisa 1A2a11eleni terminal Α

Συνδυαστική Άσκηση Δημιουργήστε το παρακάτω αρχείο (regulations.txt) που περιέχει ρυθμιστικές αλληλεπιδράσεις μεταξύ μεταγραφικών παραγόντων (transcription factors) και γονιδίων στα οποία συνδέονται (στους προαγωγείς τους) και ρυθμίζουν την έκφρασή τους (target). Στην 1η στήλη αναγράφεται το όνομα του μεταγραφικού παράγοντα Στην 2η στήλη αναγράφεται το όνομα του γονιδίου στο οποίο συνδέεται ο μεταγραφικός παράγοντας. Στην 3η στήλη αναγράφεται το είδος της ρύθμισης, δηλαδή αν η σύνδεση του μεταγραφικού παράγονται προάγει ή καταστέλει την έκφραση του γονιδίου Στην 4η στήλη αναγράφεται ο ιστός στον οποίο παρατηρήθηκε αυτή η ρυθμιστική αλληλεπίδραση. Είναι δυνατόν μια ρυθμιστική αλληλεπίδραση να έχει εντοπιστεί σε περισσότερους από έναν ιστούς. TF_nametarget_nameregulation_typetissue Gene_1Gene_2activateliver Gene_1Gene_2activatebrain Gene_1Gene_3activatemuscle Gene_3Gene_4suppressmuscle Gene_1Gene_4activateliver Gene_5Gene_1activateliver TF_nametarget_nameregulation_typetissue Gene_1Gene_2activateliver Gene_1Gene_2activatebrain Gene_1Gene_3activatemuscle Gene_3Gene_4suppressmuscle Gene_1Gene_4activateliver Gene_5Gene_1activateliver

Συνδυαστική Άσκηση Βρείτε με τις κατάλληλες εντολές στο αρχείο regulations.txt: 1.Πόσοι και ποιοί μεταγραφικοί παράγοντες υπάρχουν. 2.Πόσα και ποιά γονίδια στόχοι ρυθμίζονται από μεταγραφικούς παράγοντες. 3.Για πόσους και ποιούς ιστούς υπάρχουν δεδομένα. 4.Πόσα και ποιά γονίδια ρυθμίζει ο μεταγραφικός παράγοντας Gene_1. 5.Πόσες αλληλεπιδράσεις έχουν βρεθεί για το συκώτι (liver). 6.Πόσοι και ποιοί μεταγραφικοί παράγοντες είναι προαγωγείς έκφρασης. 7.Πόσοι και ποιοί μεταγραφικοί παράγοντες αναστέλουν την έκφραση. 8.Ποιοί μεταγραφικοί παράγοντες έχουν βρεθεί και ως γονίδια στόχοι. TF_nametarget_nameregulation_typetissue Gene_1Gene_2activateliver Gene_1Gene_2activatebrain Gene_1Gene_3activatemuscle Gene_3Gene_4suppressmuscle Gene_1Gene_4activateliver Gene_5Gene_1activateliver TF_nametarget_nameregulation_typetissue Gene_1Gene_2activateliver Gene_1Gene_2activatebrain Gene_1Gene_3activatemuscle Gene_3Gene_4suppressmuscle Gene_1Gene_4activateliver Gene_5Gene_1activateliver

Συνδυαστική Άσκηση – Λύσεις Βρείτε με τις κατάλληλες εντολές στο αρχείο regulations.txt: 1.Πόσοι και ποιοί μεταγραφικοί παράγοντες υπάρχουν. 2.Πόσα και ποιά γονίδια στόχοι ρυθμίζονται από μεταγραφικούς παράγοντες. 3.Για πόσους και ποιούς ιστούς υπάρχουν δεδομένα. awk ‘{print $1}’ regulations.txt | sort | uniq > TFs.txt awk ‘{print $2}’ regulations.txt | sort | uniq > targets.txt awk ‘{print $4}’ regulations.txt | sort | uniq > tissues.txt wc –l TFs.txt wc –l targets.txt wc –l tissues.txt TF_nametarget_nameregulation_typetissue Gene_1Gene_2activateliver Gene_1Gene_2activatebrain Gene_1Gene_3activatemuscle Gene_3Gene_4suppressmuscle Gene_1Gene_4activateliver Gene_5Gene_1activateliver TF_nametarget_nameregulation_typetissue Gene_1Gene_2activateliver Gene_1Gene_2activatebrain Gene_1Gene_3activatemuscle Gene_3Gene_4suppressmuscle Gene_1Gene_4activateliver Gene_5Gene_1activateliver

Συνδυαστική Άσκηση – Λύσεις Βρείτε με τις κατάλληλες εντολές στο αρχείο regulations.txt: 4. Πόσα και ποιά γονίδια ρυθμίζει ο μεταγραφικός παράγοντας Gene_1. grep ‘^Gene_1’ regulations.txt | awk ‘{print $2}’ | sort | uniq > G1_targets.txt wc -l G1_targets.txt TF_nametarget_nameregulation_typetissue Gene_1Gene_2activateliver Gene_1Gene_2activatebrain Gene_1Gene_3activatemuscle Gene_3Gene_4suppressmuscle Gene_1Gene_4activateliver Gene_5Gene_1activateliver TF_nametarget_nameregulation_typetissue Gene_1Gene_2activateliver Gene_1Gene_2activatebrain Gene_1Gene_3activatemuscle Gene_3Gene_4suppressmuscle Gene_1Gene_4activateliver Gene_5Gene_1activateliver

Συνδυαστική Άσκηση – Λύσεις Βρείτε με τις κατάλληλες εντολές στο αρχείο regulations.txt: 5. Πόσες αλληλεπιδράσεις έχουν βρεθεί για το συκώτι (liver). grep ‘liver$’ regulations.txt | wc -l TF_nametarget_nameregulation_typetissue Gene_1Gene_2activateliver Gene_1Gene_2activatebrain Gene_1Gene_3activatemuscle Gene_3Gene_4suppressmuscle Gene_1Gene_4activateliver Gene_5Gene_1activateliver TF_nametarget_nameregulation_typetissue Gene_1Gene_2activateliver Gene_1Gene_2activatebrain Gene_1Gene_3activatemuscle Gene_3Gene_4suppressmuscle Gene_1Gene_4activateliver Gene_5Gene_1activateliver

Συνδυαστική Άσκηση – Λύσεις Βρείτε με τις κατάλληλες εντολές στο αρχείο regulations.txt: 6. Πόσοι και ποιοί μεταγραφικοί παράγοντες είναι προαγωγείς έκφρασης. 7. Πόσοι και ποιοί μεταγραφικοί παράγοντες αναστέλουν την έκφραση. grep ‘activate’ regulations.txt | awk ‘{print $1}’ | sort | uniq > TF_activators.txt grep ‘suppress’ regulations.txt | awk ‘{print $1}’ | sort | uniq > TF_suppressors.txt wc -l TF_activators.txt wc -l TF_suppressors.txt TF_nametarget_nameregulation_typetissue Gene_1Gene_2activateliver Gene_1Gene_2activatebrain Gene_1Gene_3activatemuscle Gene_3Gene_4suppressmuscle Gene_1Gene_4activateliver Gene_5Gene_1activateliver TF_nametarget_nameregulation_typetissue Gene_1Gene_2activateliver Gene_1Gene_2activatebrain Gene_1Gene_3activatemuscle Gene_3Gene_4suppressmuscle Gene_1Gene_4activateliver Gene_5Gene_1activateliver

Συνδυαστική Άσκηση – Λύσεις Βρείτε με τις κατάλληλες εντολές στο αρχείο regulations.txt: 8. Ποιοί μεταγραφικοί παράγοντες έχουν βρεθεί και ως γονίδια στόχοι. comm -12 TFs.txt targets.txt TF_nametarget_nameregulation_typetissue Gene_1Gene_2activateliver Gene_1Gene_2activatebrain Gene_1Gene_3activatemuscle Gene_3Gene_4suppressmuscle Gene_1Gene_4activateliver Gene_5Gene_1activateliver TF_nametarget_nameregulation_typetissue Gene_1Gene_2activateliver Gene_1Gene_2activatebrain Gene_1Gene_3activatemuscle Gene_3Gene_4suppressmuscle Gene_1Gene_4activateliver Gene_5Gene_1activateliver

seq: Δημιουργία ακολουθίας αριθμών Με την εντολή seq δημιουργούμε μια ακολουθία αριθμών από το x έως το y με προσαύξηση κατά z. Αν δεν ορίσουμε την τιμή της προσαύξησης, τότε χρησιμοποιείται η τιμή 1. Μπορούμε να ορίσουμε τι διαχωρίζει το ένα νούμερο από το άλλο με την παράμετρο –s. Αν δεν ορίσουμε το διαχωριστή, τότε χρησιμοποιείται το \n (νέα γραμμή). Επίσης, με την παράμετρο –w μπορούμε να ζητήσουμε όλα τα νούμερα να έχουν τον ίδιο αριθμό ψηφίων, με την χρήση μηδενικών όποτε χρειαστεί μπροστά από ένα νούμερο. Θ

seq: Δημιουργία ακολουθίας αριθμών Θέλετε να δημιουργήσετε μια ακολουθία αριθμών, τον ένα δίπλα από τον άλλο που να διαχωρίζονται με : από το 1 μέχρι το 101, όπου ο κάθε αριθμός θα αυξάνει κατά 10. Επίσης, όλα τα νούμερα θα πρέπει να έχουν τον ίδιο αριθμό ψηφίων. Εκτελέστε την παρακάτω εντολή: seq –s “:” -w Θέλετε να δημιουργήσετε μια ακολουθία αριθμών τον ένα κάτω από τον άλλο, από το 101 έως το 1 με μείωση κατά 10, όπου τα νούμερα δεν θα έχουν τον ίδιο αριθμό ψηφίων. Εκτελέστε: seq Α

Συνδυαστική άσκηση Δημιουργείστε το παρακάτω αρχείο file1 με τα ονόματα γονιδίων, ένα μοναδικό γονίδιο σε κάθε γραμμή. Θέλετε να δημιουργήσετε ένα νέο αρχείο file2 και να προσθέσετε τον αύξοντα αριθμό στην αρχή της κάθε γραμμής. Οι αύξοντες αριθμοί θα πρέπει να έχουν τον ίδιο αριθμό ψηφίων. Ποιές εντολές θα εκτελέσετε; Gene1 Gene2 Gene3 Gene4 Gene5 Gene6 Gene7 Gene8 Gene9 Gene10 Gene1 Gene2 Gene3 Gene4 Gene5 Gene6 Gene7 Gene8 Gene9 Gene10 01Gene1 02Gene2 03Gene3 04Gene4 05Gene5 06Gene6 07Gene7 08Gene8 09Gene9 10Gene10 01Gene1 02Gene2 03Gene3 04Gene4 05Gene5 06Gene6 07Gene7 08Gene8 09Gene9 10Gene10 file1file2

Συνδυαστική άσκηση – Λύση Αρχικά πρέπει να δημιουργήσουμε ένα αρχείο tmp.txt που έχει τους αύξοντες αριθμούς, με τον ίδιο αριθμό ψηφίων: seq –w 1 10 > tmp.txt Μετά πρέπει να ενώσουμε τα δύο αρχεία, tmp.txt & file1 γραμμή προς γραμμή στο νέο αρχείο file2: paste tmp.txt file1 > file2 Gene1 Gene2 Gene3 … Gene10 Gene1 Gene2 Gene3 … Gene10 01Gene1 02Gene2 03Gene3 … 10Gene10 01Gene1 02Gene2 03Gene3 … 10Gene … … 10 tmp.txtfile1 file2

tr: αντικατάσταση χαρακτήρων Με την εντολή tr (που σημαίνει translate ή transliterate) μπορούμε να αντικαταστήσουμε ένα σετ χαρακτήρων με ένα άλλο σετ αντίστοιχων χαρακτήρων. Επίσης με αυτή την εντολή μπορούμε να διαγράψουμε μία ακολουθία χαρακτήρων (string), χρησιμοποιώντας την παράμετρο –d. Π.χ. Με την παρακάτω εντολή παίρνουμε τα δεδομένα από το αρχείο file1 και αντικαθιστούμε το γράμμα a με το γράμμα Α, το b με το B και σώζουμε το αποτέλεσμα στο αρχείο file2. tr “ab” “AB” file2 Για να αντικαταστήσουμε όλα τα μικρά με τα αντίστοιχα κεφαλαία τους γράμματα εκτελούμε: tr “a-z” “A-Z” file2 Για να διαγράψουμε τους χαρακτήρες m,o,u,s,e από το αρχείο file1 εκτελούμε: tr –d “mouse“ <file1 Η παραπάνω εντολή θα διαγράψει οποιονδήποτε από τους 5 χαρακτήρες βρει και όχι μόνο την λέξη mouse Θ

tr: αντικατάσταση χαρακτήρων Δημιουργείστε το παρακάτω αρχείο file1 με μια πρωτεϊνική ακολουθία. Θέλουμε: 1) να μετατρέψουμε όλους τους χαρακτήρες σε κεφαλαία γράμματα και να σώσουμε στο file2. 2) Να διαγράψουμε από το file2 τα κενά που συμβολίζονται με – και να σώσουμε στο file3 3) Να ενωθούν όλες οι γραμμές του file3 σε μία, διαγράφοντας το new line character \n και να σώσουμε στο file4 Εκτελούμε: tr “[a-z]” “[A-Z]” file2 tr -d “-” file3 tr -d “\n” file4 Α matygrakssppp lkdhlkl--idglhkp qertykklldsaaap matygrakssppp lkdhlkl--idglhkp qertykklldsaaap

sed: stream editor - Εισαγωγή Το sed είναι ένα πολύ ισχυρό πρόγραμμα/εργαλείο του Unix & Linux που μας επιτρέπει να χειριστούμε ποικιλοτρόπως το περιεχόμενο αρχείων. Εδώ θα αναφερθούμε σε κάποιες από τις πιο κοινές εφαρμογές του. Το sed μπορεί να αναγνωρίσει μοτίβα χαρακτήρων (regular expressions) όπως και η εντολή egrep ή να εκτελέσει μια πράξη σε συγκεκριμένες γραμμές ενός αρχείου. Π.χ.: Μπορεί να αντικαταστήσει μια λέξη ή ένα μοτίβο με ένα άλλο, οποτεδήποτε το συναντά, ή εντός ενός συγκεκριμένου εύρους γραμμών. Μπορεί να εκτυπώσει ή να διαγράψει συγκεκριμένες γραμμές ενός αρχείου, αρκεί να ορίσουμε το εύρος τιμών των γραμμών, ή το μοτίβο που πρέπει να συναντάται στις προς εκτύπωση/διαγραφή γραμμές. Μπορεί να μας πει σε ποιές γραμμές συναντάται ένα συγκεκριμένο μοτίβο χαρακτήρων. Οι βασικές εντολές εντός sed, όπως substitute, transliterate, print, delete συμβολίζονται με τα γράμματα s, y, p, d. Θ

sed: stream editor Κατά σύμβαση, το sed εκτυπώνει κάθε γραμμή του αρχείου που του ορίζουμε. Με την παράμετρο –n δεν εκτυπώνονται όλες οι γραμμές, αλλά μόνο αυτές που ορίζονται μέσα στα μονά εισαγωγικά. Θέλουμε να εκτυπώσουμε όλες τις γραμμές του παρακάτω αρχείου file1 στο terminal. Εκτελούμε: sed ‘’ file1 Θέλουμε να εκτυπώσουμε τις γραμμές 1-3 του αρχείου file1 στο terminal. Εκτελούμε: sed ‘1,3 p’ file1 Χρησιμοποιούμε στην εντολή το p για print. Το sed έχει μια κάπως περίεργη συμπεριφορά. Θα εκτυπώσει όλες τις γραμμές και επίσης θα εκτυπώσει ξανά εκείνες που ορίζονται μέσα στα μονά εισαγωγικά Για να το αποφύγουμε αυτό και να εκτυπωθούν μόνο οι γραμμές που ορίζονται μέσα στα μονά εισαγωγικά χρησιμοποιούμε την παράμετρο –n: sed –n ‘1,3 p’ file1 Gene1 Gene2 Gene3 Gene4 Gene5 Gene1 Gene2 Gene3 Gene4 Gene5 sed ‘1,3 p’ file1 Gene1 Gene2 Gene3 Gene4 Gene5 Gene1 Gene2 Gene3 Gene4 Gene5 Sed -n ‘1,3 p’ file1 file1 Gene1 Gene2 Gene3 Gene4 Gene5 Gene1 Gene2 Gene3 Α

sed: stream editor Θέλουμε να εκτυπώσουμε τις γραμμές 3 έως το τέλος του αρχείου file1 στο terminal. Εκτελούμε: sed -n ‘3,$ p’ file1 Το $ σημαίνει έως το τέλος. Gene1 Gene2 Gene3 Gene4 Gene5 Gene1 Gene2 Gene3 Gene4 Gene5 sed -n ‘3,$ p’ file1 file1 Gene3 Gene4 Gene5 Α

sed: stream editor Θέλουμε να πάρουμε τις γραμμές του αρχείου file1 και μετά να διαγράψουμε τις γραμμές 3 έως το τέλος και το υπόλοιπο να εμφανιστεί στο terminal. Εκτελούμε: sed ‘3,$ d’ file1 Για διαγραφή δεν χρειάζεται η παράμετρος -n. Με την παραπάνω εντολή ΔΕΝ τροποποιείται το file1, αλλά τα περιεχόμενα που φορτώθηκαν στην εντολή. Gene1 Gene2 Gene3 Gene4 Gene5 Gene1 Gene2 Gene3 Gene4 Gene5 sed ‘3,$ d’ file1 file1 Gene1 Gene2 Α

sed: stream editor Θέλουμε να πάρουμε το περιεχόμενο του παρακάτω file1 και να αντικαταστήσουμε την λέξη Gene με την λέξη Protein σε όλες τις γραμμές και στη συνέχεια το τροποποιημένο περιεχόμενο να εμφανιστεί στο terminal. Εκτελούμε: sed ‘s/Gene/Protein/’ file1 Η αντικατάσταση γίνεται με την εντολή substitute που συμβολίζεται με το s. Τα 3 / είναι οι διαχωριστές μέσα στους οποίους τοποθετούνται τα 2 μοτίβα προς τροποποίηση, πρώτα το μοτίβο στόχος και μετά το τελικό μοτίβο. Με την παραπάνω εντολή ΔΕΝ τροποποιείται το file1, αλλά τα περιεχόμενα που φορτώθηκαν στην εντολή και μετά την τροποποίηση εμφανίζονται στο terminal. Gene1 Gene2 Gene3 Gene1 Gene2 Gene3 sed ‘s/Gene/Protein/’ file1 Protein1 Protein2 Protein3 Α

sed: stream editor Αν το μοτίβο Gene εμφανίζεται περισσότερες από μία φορές σε μια γραμμή, η προηγούμενη εντολή θα τροποποιήσει μόνο την πρώτη εμφάνιση του μοτίβου. Αν θέλουμε να τροποποιηθούν όλες οι εμφανίσεις του μοτίβου, πρέπει να χρησιμοποιήσουμε το g που σημαίνει global, όπως παρακάτω: sed ‘s/Gene/Protein/g’ file1 Θ

sed: stream editor Θέλουμε να εκτυπώσουμε τα νούμερα των γραμμών στις οποίες εμφανίζεται το μοτίβο Gene2, στο αρχείο file1. Εκτελούμε: sed -n ‘/Gene2/ =’ file1 Το = το χρησιμοποιούμε για να εκτυπωθεί ο αριθμός της γραμμής στην οποία βρέθηκε το μοτίβο word1. Επίσης, δεν χρησιμοποιήθηκε το s γιατί δεν επιθυμούμε να κάνουμε αντικατάσταση. Παρόμοια εντολή είναι το: grep –n “Gene2” file1 A