Το εργαλείο MetaGraph δημιούργησε ψηφιακά ευρετήρια που καλύπτουν το 10% όλων των γνωστών αλληλουχιών DNA, RNA και πρωτεϊνών, καμαρώνουν οι δημιουργοί του στο Ομοσπονδιακό Τεχνολογικό Ινστιτούτο της Ζυρίχης (ETH Zürich).
Η μελέτη τους δεν έχει υποβληθεί ακόμα σε ανεξάρτητο έλεγχο και παρουσιάζεται ως προδημοσίευση στο αποθετήριο bioRxiv.
H ανάγκη για τέτοια εργαλεία γίνεται όλο και πιο πιεστική καθώς ο όγκος της αποθηκευμένης γενετικής πληροφορίας μεγαλώνει.
Η βάση δεδομένων SRA των αμερικανικών Εθνικών Ινστιτούτων Υγείας περιέχει σήμερα 50 χιλιάδες τρισεκατομμύρια ζεύγη βάσεων (50 petabase) από τον ανθρώπινο οργανισμό και χιλιάδες άλλα είδη ζώων, φυτών και μικροοργανισμών.
Τα σημερινά εργαλεία βιοπληροφορικής συχνά δεν μπορούν να διαχειριστούν αυτούς τους ωκεανούς δεδομένων και οι ερευνητές αναγκάζονται να περιορίζουν τις αναζητήσεις σε υποσύνολα αλληλουχιών.
Το Metagraph θα μπορούσε να δώσει λύση, καθώς οργανώνει τα γενετικά δεδομένα σε μια μαθηματική δομή που καταλαμβάνει πολύ λιγότερο αποθηκευτικό χώρο.
Η νέα βερσιόν του λογισμικού κάλυψε 5 petabase από το SRA και άλλες βάσεις δεδομένων και δημιούργησε ευρετήρια μέγιστου μεγέθους 10 gigabyte, αρκετά μικρά για να χωρούν σε έναν φορητό υπολογιστή.
Οι ερευνητές ελπίζουν τώρα να εξασφαλίσουν χρηματοδότηση για μια διαδικτυακή βερσιόν της μηχανής αναζήτησης.
Σε εξέλιξη βρίσκονται στο μεταξύ και άλλες παρόμοιες προσπάθειες. Τα αμερικανικά Εθνικά Ινστιτούτα Υγείας υλοποιούν δικό τους πρόγραμμα, ενώ το Ευρωπαϊκό Συμβούλιο Έρευνας ενέκρινε πέρυσι κονδύλι 2 εκατ. ευρώ για την ανάπτυξη εργαλείου που θα καλύπτει όλα τα δεδομένα της βάσης SRA.
Πηγή: in.gr