Η πρόβλεψη της πρωτεϊνικής δομής θεωρείται εδώ και καιρό το «Άγιο Δισκοπότηρο» της δομικής βιολογίας. Η πρόσφατη επιτυχία του AlphaFold εγκαινίασε μια νέα εποχή εξαιρετικά ακριβούς πρόβλεψης δομής, φέρνοντας στο φως τα μυστικά που κρύβονται στις τρισδιάστατες δομές των σφαιρικών πρωτεϊνών, αυξάνοντας την κατανόησή μας για τα δομικά τους χαρακτηριστικά και τη μοριακή τους λειτουργία. Ωστόσο, ένα μεγάλο ποσοστό των πρωτεωμάτων από όλους τους τομείς της ζωής είναι πλούσιο σε αλληλουχίες που δεν αναδιπλώνονται σε κανονικές δομές, κοινώς γνωστές ως μη σφαιρικές πρωτεΐνες (NGPs). Οι NGPs περιλαμβάνουν εγγενώς μη δομημένες περιοχές, επαναλήψεις, αλληλουχίες χαμηλής πολυπλοκότητας, αλληλουχίες επιρρεπείς σε συσσωμάτωση και διαχωρισμό φάσεων, και εμπλέκονται σε μια σειρά από ασθένειες που σχετίζονται με την ηλικία. Οι ετερογενείς δομικές τους καταστάσεις και η χαμηλή πολυπλοκότητα των αλληλουχιών τους προκαλούν τις τρέχουσες πειραματικές τεχνικές προσδιορισμού δομής και τις μεθόδους μηχανικής μάθησης (ML) για την πρόβλεψη δομής, καθιστώντας δύσκολη τη μοριακή κατανόηση της σχέσης αλληλουχίας-δομής-δυναμικής-λειτουργίας τους. Οι πρόσφατες βελτιώσεις των προσεγγίσεων ML και η πρόοδος στον προσδιορισμό των δομικών συνόλων των NGPs απαιτούν μια έγκαιρη επαναξιολόγηση της αλληλεπίδρασης μεταξύ πειραμάτων και υπολογισμών. Η Δράση ML4NGP στοχεύει στη δημιουργία ενός διεπιστημονικού πανευρωπαϊκού δικτύου που θα ευνοεί αυτή την αλληλεπίδραση, προωθώντας πειραματικά πλαίσια σχεδιασμένα να παρέχουν πληροφορίες σε υπολογιστικές μεθόδους, καθώς και νέες υπολογιστικές μεθόδους που αναπτύσσονται, εκπαιδεύονται και αξιολογούνται με πειραματικά δεδομένα. Το ML4NGP θα ενισχύσει την παραγωγή πρωτογενών πειραματικών δεδομένων (WG1), θα προωθήσει ολοκληρωμένες προσεγγίσεις δομικής βιολογίας (WG2), θα αξιολογήσει τις μεθόδους ML αιχμής (WG3) και θα βελτιώσει τον λειτουργικό χαρακτηρισμό των NGPs (WG4). Η Δράση θα υποστηρίξει τους επιστημονικούς της στόχους μέσω πολιτικών που ενισχύουν την ελεύθερη ανταλλαγή γνώσεων, τη συμπεριληπτικότητα και την εκπαίδευση νέων ερευνητών που θα ηγηθούν των μελλοντικών καινοτομιών σε αυτόν τον τομέα.
CA21160 – Non-globular proteins in the era of Machine Learning