Πώς η μονάδα cloud της Amazon βοηθά τους ερευνητές να αναλύσουν τη γενετική

Καθώς η υγειονομική περίθαλψη ψηφιοποιείται ολοένα και περισσότερο, επιστήμονες, γιατροί και ερευνητές πρέπει να προσπαθήσουν να αποκρυπτογραφήσουν πρωτοφανείς ποσότητες δεδομένων για να εξατομικεύσουν επαρκώς τη φροντίδα. Η περίσσεια των πληροφοριών που είναι διαθέσιμες σε αυτούς τους ειδικούς συχνά ξεπερνά την ικανότητά τους να τις καταναλώνουν και να τις αναλύουν. ΑμαζόναΗ μονάδα cloud του εργάζεται για να καλύψει αυτό το κενό.

Υπηρεσίες Ιστού της Amazon κυκλοφόρησε πρόσφατα γενική διαθεσιμότητα για το Amazon Omics, το οποίο βοηθά τους ερευνητές να αποθηκεύουν και να αναλύουν ωμικά δεδομένα όπως αλληλουχίες DNA, RNA και πρωτεϊνών. Η υπηρεσία παρέχει στους πελάτες την υποκείμενη υποδομή που χρειάζονται για να κατανοήσουν μεγάλες ποσότητες δεδομένων, ώστε να μπορούν να αφιερώνουν περισσότερο χρόνο κάνοντας νέες επιστημονικές ανακαλύψεις.

Η AWS δημιουργεί ένα σημαντικό μέρος των εσόδων της Amazon, αντλώντας 20,5 δισεκατομμύρια δολάρια το τρίτο τρίμηνο. Η επιχείρηση του cloud computing επεκτείνεται στην υγειονομική περίθαλψη και ενώ η AWS δεν αποκαλύπτει προβλέψεις εσόδων για συγκεκριμένες υπηρεσίες, το παγκόσμιο μέγεθος της αγοράς ανάλυσης δεδομένων γονιδιώματος αναμένεται να φτάσει τα 2,15 δισεκατομμύρια δολάρια έως το 2030, σύμφωνα με έκθεση από Straits Research.

Ο Δρ Taha Kass-Hout, επικεφαλής ιατρός στο AWS, είπε ότι η συντριπτική πλειονότητα των δεδομένων υγειονομικής περίθαλψης είναι αδόμητα στη φύση, πράγμα που σημαίνει ότι περίπου το 97% από αυτά μένει αχρησιμοποίητο. Η ευρετηρίαση και η κατανόηση αυτών των πληροφοριών είναι μια πρόκληση, ειδικά όταν οι ερευνητές συλλέγουν ομικά δεδομένα από δεκάδες χιλιάδες ασθενείς.

Πριν από την θητεία του στην Amazon, ο Kass-Hout υπηρέτησε δύο θητείες υπό τον Πρόεδρο Μπαράκ Ομπάμα και ήταν ο πρώτος επικεφαλής πληροφοριών υγείας στην Υπηρεσία Τροφίμων και Φαρμάκων των ΗΠΑ.

Η αλληλουχία ενός ανθρώπινου γονιδιώματος μπορεί να απαιτεί από 80 έως 150 gigabyte αποθήκευσης, είπε ο Kass-Hout, και ορισμένα ερευνητικά προγράμματα ασχολούνται με petabyte και exabyte γονιδιωματικών πληροφοριών.

«Μιλάτε για σχεδόν εννέα αξίας Χάρι Πότερ αν θέλετε να το εκτυπώσετε σε εκτυπωτή», είπε η Κας-Χάουτ στο CNBC. «Και αυτό είναι μόνο για έναν άνθρωπο».

Το Amazon Omics βοηθά τους ερευνητές να ταξινομήσουν τα δεδομένα τους παρέχοντάς τους τρία στοιχεία που μπορούν να αξιοποιήσουν μεμονωμένα ή συλλογικά. Η αποθήκευση αντικειμένων με επίγνωση omics βοηθά τους ερευνητές να αποθηκεύουν και να μοιράζονται ακατέργαστα δεδομένα ακολουθίας. Οι ροές εργασίας Omics βοηθούν στην εκτέλεση ροών εργασίας που επεξεργάζονται ακατέργαστα δεδομένα ακολουθίας σε κλίμακα. και το Omics Analytics απλοποιεί την έξοδο της επεξεργασίας ακολουθίας.

Περισσότεροι από δώδεκα πελάτες και συνεργάτες δοκίμασαν μια έκδοση beta της υπηρεσίας και χρησιμοποιούν ήδη το Amazon Omics.

Για τον Jeffrey Pennington, επικεφαλής ερευνητή πληροφορικής στο Νοσοκομείο Παίδων της Φιλαδέλφειας, έχει ήδη κάνει αξιοσημείωτο αντίκτυπο.

Ο Pennington εργάζεται στο τμήμα βιοϊατρικής και πληροφορικής υγείας, το οποίο χρησιμοποιεί δεδομένα και τεχνολογία για την επίλυση ζητημάτων στην υγεία των παιδιών. Είπε ότι το τμήμα πέρασε πέντε χρόνια επεκτείνοντας την υποδομή για να αναλύσει δεδομένα omics και τώρα δεν είναι πλέον κάτι που χρειάζεται να χτίσουν ή να συντηρήσουν οι ίδιοι.

“Είμαστε ένα μεγάλο παιδιατρικό ακαδημαϊκό ιατρικό κέντρο, αλλά ακόμα δεν είμαστε αρκετά μεγάλοι για να μάθουμε και να δημιουργήσουμε όλα όσα απαιτούνται για την παραγωγική χρήση των omic δεδομένων”, δήλωσε ο Pennington. «Ο χρόνος και η ενέργειά μας, η προσπάθειά μας, τα οικονομικά μας μέσα ξοδεύονται πολύ καλύτερα για να συνθέσουμε το παζλ αντί για να δημιουργήσουμε αυτά τα κομμάτια εξαρχής».

Η Amazon Omics ενθαρρύνει επίσης τη συνεργασία μεταξύ μεγάλων ερευνητικών ομάδων, μικρότερων κλινικών ομάδων και εταιρειών πληροφοριών και φαρμακευτικών εταιρειών, δήλωσε ο Boris Oklander, συνιδρυτής και επικεφαλής τεχνολογίας της C2i Genomics.

Η C2i είναι μια εταιρεία βιοτεχνολογίας που εργάζεται για τη χρήση γονιδιωματικών δεδομένων για την ανάπτυξη εξατομικευμένων θεραπειών για τον καρκίνο. Ο Oklander είπε ότι η εταιρεία συμμετείχε στην έκδοση beta για το Amazon Omics αφού προσπάθησε να αναπτύξει τη δική της τεχνολογία ανάλυσης δεδομένων.

Είπε ότι η Amazon Omics έχει δημιουργήσει ένα οικοσύστημα για συνεργασία που εξαλείφει την ανάγκη των ερευνητών να κατασκευάσουν μια πολύπλοκη τεχνολογία από την αρχή.

«Απλώς εκδημοκρατιζόμαστε», είπε. «Αυτό το είδος υπηρεσίας είναι κάτι που επιτρέπει [us] για να ξεκλειδώσετε την αξία στις επενδύσεις που κάνουν διαφορετικοί παίκτες σε αυτόν τον χώρο».

Άλλες μεγάλες εταιρείες τεχνολογίας έχουν αναπτύξει παρόμοια εργαλεία. MicrosoftΗ πλατφόρμα υπολογιστών cloud της Azure κυκλοφόρησε το Microsoft Genomics το 2018 για να βοηθήσει τους ερευνητές να ερμηνεύσουν δεδομένα που δημιουργούνται από τεχνολογίες γονιδιώματος. GoogleΗ τεχνολογία του Cloud Life Sciences επιτρέπει επίσης στους ερευνητές να επεξεργάζονται βιοϊατρικά δεδομένα σε μεγάλη κλίμακα.

Ο Pennington είπε ότι το Broad Institute και το DNAnexus προσφέρουν επίσης δημοφιλείς υπηρεσίες ανάλυσης δεδομένων γονιδιώματος, αλλά είπε ότι μπορεί να είναι δύσκολο να διατηρηθούν και μπορούν να αναλύσουν λιγότερους τύπους δεδομένων από το Amazon Omics.

Δεδομένης της ευαίσθητης και βαθιάς προσωπικής φύσης των omic δεδομένων, η Kass-Hout είπε ότι το απόρρητο και η προστασία των δεδομένων ασθενών είναι «εργασία μηδέν» για το AWS. Είπε ότι το AWS χρησιμοποιεί περισσότερες από 300 υπηρεσίες ασφάλειας, συμμόρφωσης και διακυβέρνησης και υποστηρίζει 98 πρότυπα ασφαλείας και πιστοποιήσεις συμμόρφωσης. Με αυτόν τον τρόπο, το AWS υπερβαίνει τη συμμόρφωση με τους κανονισμούς, είπε ο Kass-Hout, και παρέχει επίσης πόρους βέλτιστων πρακτικών και εργαλεία κρυπτογράφησης στους πελάτες του.

Οι πελάτες είναι επίσης υπεύθυνοι για τη δημιουργία ασφαλών εφαρμογών πάνω από τις υπηρεσίες της Amazon Omics, οι οποίες προστατεύουν το AWS από το να βλέπει ή να αξιοποιεί τα δεδομένα.

Ο Kass-Hout είπε ότι τελικά, το Amazon Omics χρησιμεύει ως ένας τρόπος για την αποτελεσματική ευρετηρίαση των πληροφοριών, ώστε οι ερευνητές να μπορούν να επικεντρωθούν στην πραγματοποίηση πραγματικών προόδων στην ιατρική ακριβείας.

«Αν η τελευταία δεκαετία αφορούσε την ψηφιοποίηση που πέρασε η βιομηχανία της υγείας και της βιοεπιστήμης, πιστεύω πραγματικά ότι η επόμενη δεκαετία είναι να κατανοήσουμε αυτά τα δεδομένα με τρόπους τώρα [where] μπορούμε να βρούμε νέες θεραπείες, νέα διαγνωστικά, πιο στοχευμένες θεραπείες», είπε.