Ανάγνωση από αρχεία, Δομές Επανάληψης. Hashes
Σε αυτήν την άσκηση θα χειριστούμε δομές κατακερματισμένων πινάκων (hashes) χτίζοντας πάνω στις γνώσεις που έχουμε από προηγούμενα μαθήματα για επαναληπτικές δομές.
Κατεβάστε τo αρχείo human.fa από την ιστοσελίδα του μαθήματος (προηγούμενη άσκηση) καθώς και το genetic_code.txt. Το τελευταίο περιέχει τον γενετικό κώδικα σε μια δομή που μπορεί να σας βοηθήσει.
Γράψτε ένα πρόγραμμα που θα διαβάζει το αρχείο κατευθείαν (χωρίς να το εισάγετε στο σώμα του προγράμματος δηλαδη) και στη συνέχεια μεταφράστε την αλληλουχία σε πρωτεΐνη ξεκινώντας από το πρώτο ATG. Tυπώστε την πρωτεϊνη, τo σημείο που εντοπίστηκε και το μήκος της σε ένα αρχείο.
Βοήθεια #1: Οργανώστε καλά τα αρχεία εξόδου στα οποίο θα αναγραφούν τα αποτελέσματα.
Βοήθεια #2: Χρησιμοποιείστε έναν hash πίνακα για τη μετάφραση τριπλετών σε αμινοξέα (θα περιέχει 64 γραμμές του τύπου "ATG" => "M").
Βοήθεια #3: Χρησιμοποιείστε έναν βρόχο επανάληψης και θυμηθείτε την συνάρτηση substr($string, θεση, μήκος) για να σπάσετε ένα string σε κομμάτια.
Βοήθεια #4: Χρησιμοποιείστε την εντολή πρόσθεσης string "$string .= $string_1" για να "χτίσετε την πρωτεϊνη" κομμάτι-κομμάτι.