AlphaFord, Protein Katlama Problemini Gerçekten Çözdü Mü?

Temmuz ayında dünyanın dört bir yanından insanlar, James Webb Uzay Teleskobu tarafından çekilen kozmosun en ayrıntılı resimlerine hayran kalırken, biyologlar, yaşam bilimleri araştırmalarında devrim yaratmaya yardımcı olabilecek farklı bir dizi görüntüye ilk bakışlarını aldılar.

Derin öğrenen bir yapay zeka sistemi olan AlphaFold, bu çizimde DNA'ya (mor) bağlanan östrojen reseptör proteininin yapısını öngördü. Tahmin edilen protein, belirli yapılara (pembe) katlanmış bazı kısımlara ve serbest akan spagettiye (sarı) benzeyen diğer alanlara sahiptir. VERONICA FALCONIERI HAYS/BİLİM KAYNAĞI
Derin öğrenen bir yapay zeka sistemi olan AlphaFold, bu çizimde DNA’ya (mor) bağlanan östrojen reseptör proteininin yapısını öngördü. Tahmin edilen protein, belirli yapılara (pembe) katlanmış bazı kısımlara ve serbest akan spagettiye (sarı) benzeyen diğer alanlara sahiptir. VERONICA FALCONIERI HAYS/BİLİM KAYNAĞI / AlphaFord, Protein Katlama Problemini Gerçekten Çözdü Mü?

Görüntüler, AlphaFold adlı yapay bir zekâ sistemi tarafından oluşturulan 200 milyondan fazla proteinin tahmin edilen 3 boyutlu şekilleridir. 26 Temmuz tarihli bir haber brifinginde Demis Hassabis, “Bunu tüm protein evrenini kapsıyor olarak düşünebilirsiniz” dedi. Hassabis, sistemi oluşturan Londra merkezli şirket DeepMind’in kurucu ortağı ve CEO’sudur. Birkaç derin öğrenme tekniğini birleştiren bilgisayar programı, elektron mikroskopları ve diğer yöntemler kullanılarak onlarca yıllık deneysel çalışmayla çözülmüş yapılardaki kalıpları tanıyarak protein şekillerini tahmin etmek için eğitilmiştir.

AI’nın ilk sıçraması 2021’de geldi ve neredeyse tüm bilinen insan proteinleri dahil olmak üzere 350.000 protein yapısı için tahminler yapıldı. DeepMind, yapıları kamuya açık bir veritabanında kullanılabilir hale getirmek için Avrupa Moleküler Biyoloji Laboratuvarı Avrupa Biyoinformatik Enstitüsü ile ortaklık kurdu.

Hassabis, Temmuz’un devasa yeni sürümünün kütüphaneyi “gezegen üzerinde genom dizilimi olan hemen hemen her organizmaya” genişlettiğini söyledi. “Bir proteinin 3 boyutlu yapısını neredeyse Google’da anahtar kelime araması yapmak kadar kolay bir şekilde arayabilirsiniz.”

Bunlar tahminler, gerçek yapılar değil. Yine de araştırmacılar, potansiyel yeni sıtma aşıları geliştirmek, Parkinson hastalığının daha iyi anlaşılmasını sağlamak, bal arısı sağlığının nasıl korunacağını bulmak, insan evrimi hakkında fikir edinmek ve daha fazlası için 2021 tahminlerinden bazılarını kullandılar. DeepMind ayrıca AlphaFold’u Chagas hastalığı ve leishmaniasis gibi tedavi edilmediği takdirde zayıflatıcı veya ölümcül olabilen ihmal edilen tropikal hastalıklara da odakladı.

Protein evrenini genişletmek

Onlarca yıl süren yavaş deneyler, tümü Protein Veri Bankasında bulunan 194.000’den fazla proteinin yapısını ortaya çıkardı. 2021’de AlphaFold projesi, neredeyse tüm bilinen insan proteinleri de dahil olmak üzere yaklaşık 1 milyon protein için öngörülen yapıları yayınladı. Bu yıl, AlphaFold veritabanı 200 milyondan fazla protein için öngörülen yapılarla patlama yaptı.

Tanımlanan ve tahmin edilen toplam protein yapısı sayısı:

Protein Veri Bankası (194.000+), 2021'deki AlphaFold veritabanı (~1 milyon) ve mevcut AlphaFold veritabanı (200+ milyon) tarafından tanımlanan ve tahmin edilen toplam protein yapılarının sayısını gösteren bir daire grafiği.
T. TİBBİTLER / AlphaFord, Protein Katlama Problemini Gerçekten Çözdü Mü?

Geniş veri setinin piyasaya sürülmesi birçok bilim insanı tarafından heyecanla karşılandı. Ancak diğerleri, araştırmacıların tahmin edilen yapıları proteinlerin gerçek şekilleri olarak alacaklarından endişe ediyor. AlphaFold’un hala yapamadığı ve yapmak için tasarlanmadığı şeyler var ve protein kozmosu tamamen odaklanmadan önce ele alınması gerekiyor.

Hasta Çocuklar Hastanesi ve Toronto Üniversitesi’nde protein biyofizikçisi olan Julie Forman-Kay, yeni kataloğun herkese açık olmasının “büyük bir fayda” olduğunu söylüyor. Pek çok durumda, başka bir AI araştırmacısı olan AlphaFold ve RoseTTAFold , deneylerden elde edilen protein profilleriyle iyi eşleşen şekilleri tahmin ediyor. Ancak, “genel olarak bu şekilde değil” diye uyarıyor.

Tahminler, bazı proteinler için diğerlerinden daha doğrudur. Hatalı tahminler, bazı bilim adamlarının bir proteinin nasıl çalıştığını gerçekten anlamadıkları halde anladıklarını düşünmelerine neden olabilir. Forman-Kay, proteinlerin nasıl katlandığını anlamak için özenli deneylerin çok önemli olduğunu söylüyor. “Artık insanların deneysel yapı belirlemesi yapmak zorunda olmadığı duygusu var, ki bu doğru değil.”

F20H23.2

F20H23.2'nin tahmini modeli
NOT: ALPHAFOLD’UN TAHMİNLERİNİN GÜVEN DÜZEYİ HER PROTEİN İÇİNDE FARKLILIK GÖSTERİR. ÖNGÖRÜLEN BİR YAPI ÜZERİNDEKİ KOYU MAVİ VE AÇIK MAVİ BÖLGELER, ALGORİTMANIN NİSPETEN EMİN OLDUĞU ANLAMINA GELİR. DAHA AZ KESİN TAHMİNLER SARI VE TURUNCU RENKLİDİR. / AlphaFord, Protein Katlama Problemini Gerçekten Çözdü Mü?
Kaynak organizma:

Thale tere (Arabidopsis thaliana)

Önem:

Bu bitki proteini, fosfatları diğer moleküllere bağlayan ve potansiyel olarak işlevlerini değiştiren bir kinazdır.

Ağır ilerleme

Proteinler, uzun amino asit zincirleri olarak başlar ve bir dizi kıvrım ve diğer 3 boyutlu şekillere katlanır. Bazıları 1980’lerin permasının sıkı tirbuşon halkalarına veya bir akordeonun kıvrımlarına benziyor. Diğerleri, bir çocuğun spiral çizen karalamalarıyla karıştırılabilir.

Bir proteinin mimarisi estetikten daha fazlasıdır; o proteinin nasıl çalıştığını belirleyebilir. Örneğin, enzim adı verilen proteinler, küçük molekülleri yakalayabilecekleri ve kimyasal reaksiyonları gerçekleştirebilecekleri bir cebe ihtiyaç duyarlar. Ve bir protein kompleksinde çalışan proteinler, yani bir makinenin parçaları gibi etkileşime giren iki veya daha fazla protein, ortaklarıyla birlikte şekillenmek için doğru şekillere ihtiyaç duyar.

Bir proteinin şeklinin kıvrımlarını, kıvrımlarını ve halkalarını bilmek, bilim adamlarının, örneğin bir mutasyonun, hastalığa neden olmak için bu şekli nasıl değiştirdiğini deşifre etmesine yardımcı olabilir. Bu bilgi, araştırmacıların daha iyi aşılar ve ilaçlar üretmesine de yardımcı olabilir.

Bilim adamları yıllarca protein kristallerini X-ışınları ile bombaladılar, donmuş hücreleri flaş ettiler ve onları yüksek güçlü elektron mikroskopları altında incelediler ve protein şekillerinin sırlarını keşfetmek için başka yöntemler kullandılar. Bu tür deneysel yöntemler “çok fazla personel zamanı, çok çaba ve çok para gerektirir. UCLA’daki David Geffen Tıp Fakültesi’nde membran biyofizikçisi ve Howard Hughes Tıp Enstitüsü araştırmacısı Tamir Gonen, bu yüzden yavaş oldu” diyor.

Buz çekirdeklenme proteini

buz çekirdeklenme proteininin tahmini modeli
DERİN DÜŞÜNCE / AlphaFord, Protein Katlama Problemini Gerçekten Çözdü Mü?
Kaynak organizma:

Pseudomonas bakterileri (Pseudomonas syringae)

Önem:

Nispeten yüksek sıcaklıklarda buz kristallerini tetikleyerek bitkilerde don hasarına yol açar. Bulutların tohumlanması ve gıdaların korunması için kullanılabilir.

Böyle titiz ve pahalı deneysel çalışmalar, 194.000’den fazla proteinin 3-D yapılarını ortaya çıkardı, bunların veri dosyaları Protein Veri Bankası’nda saklandı ve bir araştırma kuruluşları konsorsiyumu tarafından desteklendi. Ancak Harvard Tıp Fakültesi’nden sistem biyoloğu Nazım Bouatta, genetikçilerin protein yapmak için DNA talimatlarını deşifre etmelerinin hızlanan hızının, yapısal biyologların ayak uydurma yeteneklerini çok geride bıraktığını söylüyor. “Yapısal biyologlar için soru şuydu, açığı nasıl kapatabiliriz?” diyor.

Birçok araştırmacının hayali, bir genin DNA’sını inceleyebilen ve kodladığı proteinin 3 boyutlu bir şekle nasıl katlanacağını tahmin edebilen bilgisayar programlarına sahip olmaktı.

İşte AlphaFold geliyor

On yıllar boyunca, bilim adamları bu AI hedefine doğru ilerleme kaydettiler. Ancak, Maryland Üniversitesi’nin Rockville kampüsündeki bir hesaplamalı biyolog olan John Moult, “iki yıl öncesine kadar, iyi bir çözüm gibi herhangi bir şeyden gerçekten çok uzaktaydık” diyor.

Moult, bir yarışmanın organizatörlerinden biridir: Protein Yapısı Tahmininin Kritik Değerlendirmesi veya CASP. Organizatörler, makinelerin tahminlerini deneysel olarak belirlenmiş yapılara göre katlamak ve karşılaştırmak için rakiplere algoritmaları için bir dizi protein verir. Çoğu AI, proteinlerin gerçek şekillerine yaklaşamadı.

“Yapı size bir proteinin nasıl çalıştığı hakkında her şeyi söylemez.”

Jane Dyson

Ardından 2020’de AlphaFold büyük bir şekilde ortaya çıktı ve test proteinlerinin yüzde 90’ının yapılarını yüksek doğrulukla, üçte ikisi de dahil olmak üzere deneysel yöntemlerle rekabet eden doğrulukla tahmin etti.

Tek proteinlerin yapısının deşifre edilmesi, 1994’teki başlangıcından bu yana CASP yarışmasının çekirdeğini oluşturuyordu. Moult, AlphaFold’un performansıyla “aniden, bu esasen yapıldı” diyor.

Hassabis, haber brifinginde AlphaFold’un 2021 sürümünden bu yana yarım milyondan fazla bilim insanının veritabanına eriştiğini söyledi. Örneğin bazı araştırmacılar, AlphaFold’un tahminlerini büyük bir biyolojik bulmacayı tamamlamaya yaklaşmalarına yardımcı olmak için kullandı: nükleer gözenek kompleksi. Nükleer gözenekler, moleküllerin hücre çekirdeğine girip çıkmasına izin veren anahtar portallardır. Gözenekler olmadan hücreler düzgün çalışmaz. Göreceli olarak konuşursak, her bir gözenek devasadır ve yaklaşık 1000 parça 30 kadar farklı proteinden oluşur. Araştırmacılar daha önce parçaların yaklaşık yüzde 30’unu yapbozun içine yerleştirmeyi başarmıştı.

Nükleer gözenek

Araştırmacılar daha önce nükleer gözenek kompleksi olan 1000 parçalık yapbozun yaklaşık yüzde 30’unu çözmüştü. AlphaFold, yapının yüzde 60’ını tamamlamak için deneysel verilerin anlamlandırılmasına yardımcı oldu.

Önemli ölçüde daha büyük görünen mevcut modelin yanında nükleer gözenek kompleksinin önceki modelini gösteren çizim
S. MOSALAGANTİ VE DİĞERLERİ/SCİENCE 2022 / AlphaFord, Protein Katlama Problemini Gerçekten Çözdü Mü?

Araştırmacılar, 10 Haziran Bilim dergisinde, parçaların nasıl bir araya geldiğini anlamak için AlphaFold tahminlerini deneysel tekniklerle birleştirdikten sonra bu yapbozun neredeyse yüzde 60’ı tamamlandı

AlphaFold, tek proteinlerin nasıl katlanacağını hemen hemen çözdüğüne göre, bu yıl CASP organizatörleri ekiplerden bir sonraki zorluklar üzerinde çalışmalarını istiyor: RNA moleküllerinin yapılarını tahmin edin ve proteinlerin birbirleriyle ve diğer moleküllerle nasıl etkileşime girdiğini modelleyin.

Moult, bu tür görevler için derin öğrenme AI yöntemlerinin “umut verici göründüğünü ancak henüz malları teslim etmediğini” söylüyor.

AI’nın yetersiz kaldığı yer

Protein etkileşimlerini modelleyebilmek büyük bir avantaj olacaktır çünkü çoğu protein izole olarak çalışmaz. Hücrelerdeki diğer proteinler veya diğer moleküller ile çalışırlar. Ancak, Toronto Üniversitesi protein biyofizikçisi Forman-Kay, AlphaFold’un, proteinler etkileşime girdiğinde iki proteinin şeklinin nasıl değişebileceğini tahmin etmedeki doğruluğunun, bir dizi tek protein için tam isabetli projeksiyonlarının “hiçbir yerinde” olmadığını söylüyor. Bu, AlphaFold’un yaratıcılarının da kabul ettiği bir şey.

AI, bilinen yapıların dış hatlarını inceleyerek proteinleri katlamak için eğitildi. Ve tekli proteinlerden çok daha az sayıda multiprotein kompleksi deneysel olarak çözülmüştür.

Gametosit yüzey antijeni 48/45

tahmin edilen vitellogenin modeli
DERİN DÜŞÜNCE / AlphaFord, Protein Katlama Problemini Gerçekten Çözdü Mü?
Kaynak organizma:

Sıtma paraziti (Plasmodium falciparum)

Önem:

Parazitin erkek ve dişi gametlerinin kaynaşmasını sağlar. Potansiyel bir aşı olarak geliştirilmektedir.

Forman-Kay, belirli bir şekille sınırlandırılmayı reddeden proteinleri inceler. Bu özünde düzensiz proteinler tipik olarak ıslak erişteler kadar gevşektir. Bazıları, diğer proteinler veya moleküller ile etkileşime girdiklerinde tanımlanmış formlara katlanacaktır. Ve çeşitli işler yapmak için farklı proteinler veya moleküller ile eşleştirildiğinde yeni şekiller alabilirler.

Ekip, Şubat ayında bioRxiv.org’da yayınlanan bir ön çalışmada, AlphaFold’un tahmin edilen şekillerinin Forman-Kay ve meslektaşlarının incelediği kıpır kıpır proteinlerin yaklaşık yüzde 60’ı için yüksek bir güven düzeyine ulaştığını bildirdi. Program genellikle şekil değiştiricileri alfa sarmalları adı verilen uzun tirbuşonlar olarak tasvir eder.

Forman-Kay’in grubu, AlphaFold’un üç düzensiz protein için tahminlerini deneysel verilerle karşılaştırdı. Ekip, yapay zekanın alfa-sinüklein adı verilen bir proteine ​​atadığı yapının, proteinin lipidlerle etkileşime girdiğinde aldığı şekle benzediğini buldu. Ama protein her zaman böyle görünmüyor.

Ökaryotik translasyon başlatma faktörü 4E-bağlayıcı protein 2 olarak adlandırılan başka bir protein için AlphaFold, iki farklı partnerle çalışırken proteinin iki şeklinin bir karışımını öngördü. Forman-Kay ve meslektaşları, gerçek organizmalarda bulunmayan bu Frankenstein yapısının, proteinin nasıl çalıştığı konusunda araştırmacıları yanlış yönlendirebileceğini söylüyor.

Ökaryotik translasyon başlatma faktörü 4E-bağlayıcı protein 2

ökaryotik translasyon başlatma faktörü 4E-bağlayıcı protein 2'nin tahmini modeli
DERİN DÜŞÜNCE / AlphaFord, Protein Katlama Problemini Gerçekten Çözdü Mü?
Kaynak organizma:

İnsan

Önem:

Diğer proteinlerin üretimini kontrol etmeye yardımcı olur ve öğrenme ve hafızaya dahil olabilir. AlphaFold’un alt sarmal alan ve hemen üzerindeki şerit yapısıyla ilgili tahminlerinde yüksek güvenine (mavi) rağmen, ikisi asla aynı anda görünmezdi.

AlphaFold ayrıca tahminlerinde biraz fazla katı olabilir. La Jolla, Kaliforniya’daki Scripps Araştırma Enstitüsü’nde yapısal biyolog olan Jane Dyson, statik bir “yapı size bir proteinin nasıl çalıştığı hakkında her şeyi söylemez” diyor.Genel olarak iyi tanımlanmış yapılara sahip tek proteinler bile uzayda donmaz . Örneğin enzimler, kimyasal reaksiyonları yönetirken küçük şekil değişikliklerine uğrarlar.

Dyson, AlphaFold’dan bir enzimin yapısını tahmin etmesini isterseniz, bilim adamlarının X-ışını kristalografisi ile belirlediklerine çok benzeyebilecek sabit bir görüntü göstereceğini söylüyor. “Fakat [bu] size farklı ortaklar olarak değişen inceliklerin hiçbirini göstermeyecek” enzimle etkileşime girer.

Dyson, “Dinamik, Bay AlphaFold’un size veremeyeceği şeydir,” diyor.

Yapımında bir devrim

Bilgisayar görüntüleri, biyologlara, bir ilacın bir proteinle nasıl etkileşime girebileceği gibi sorunları çözme konusunda bir başlangıç ​​sağlar. Ancak bilim adamları bir şeyi hatırlamalı: UCLA’dan Gönen, deneysel olarak deşifre edilmiş yapılar değil, “Bunlar model” diyor.

Deneysel verileri anlamlandırmaya yardımcı olmak için AlphaFold’un protein tahminlerini kullanıyor, ancak araştırmacıların AI’nın tahminlerini müjde olarak kabul edeceğinden endişe ediyor. Bu olursa, “risk, deneysel bir yapıyı neden çözmeniz gerektiğini haklı çıkarmanın giderek daha da zorlaşmasıdır.” Bu, bilgisayarın çalışmasını kontrol etmek ve yeni bir zemin oluşturmak için gereken deney türleri için fon, yetenek ve diğer kaynakların azalmasına yol açabilir, diyor.

Vitellogenin

tahmin edilen vitellogenin modeli
DERN DÜŞÜNCE / AlphaFord, Protein Katlama Problemini Gerçekten Çözdü Mü?
Kaynak organizma:

Bal arısı (Apis mellifera)

Önem:

Bakteriyel enfeksiyonlara karşı korunmaya yardımcı olur.

Harvard Tıp Fakültesi’nden Bouatta daha iyimser. Araştırmacıların muhtemelen AlphaFold’un tahmin etmede iyi bir iş çıkardığı protein türlerine deneysel kaynaklara yatırım yapmasına gerek olmadığını düşünüyor, bu da yapısal biyologların zamanlarını ve paralarını nereye koyacaklarını belirlemelerine yardımcı olmalı.

Bouatta, “AlphaFold’un hala mücadele ettiği proteinler var” diye aynı fikirde. Araştırmacılar sermayelerini orada harcamalı, diyor. “Belki bu zorlu proteinler için daha fazla [deneysel] veri üretirsek, bunları başka bir AI sistemini yeniden eğitmek için kullanabiliriz” ve bu daha da iyi tahminler yapabilir.

O ve meslektaşları, OpenFold adlı bir versiyonu yapmak için AlphaFold’u tersine mühendislikle geliştirdiler ve araştırmacıların bu boğuk ama önemli protein kompleksleri gibi diğer sorunları çözmek için eğitebilecekleri.

İnsan Genom Projesi tarafından üretilen devasa miktarda DNA, çok çeşitli biyolojik keşifleri mümkün kıldı ve yeni araştırma alanları açtı. Bouatta, 200 milyon protein hakkında yapısal bilgiye sahip olmanın benzer şekilde devrimsel olabileceğini söylüyor.

Gelecekte AlphaFold ve yapay zeka benzeri sayesinde, “ne tür sorular soracağımızı bile bilmiyoruz” diyor.

Yazan: İlknur YEŞİLYURT

Referanslar

DeepMind ve EMBL-EBI. AlphaFold, bilimde bilinen hemen hemen her kataloglanmış proteinin yapısını tahmin eder. 28 Temmuz 2022’de yayınlandı.

Mosalaganti ve ark. AI tabanlı yapı tahmini, insan nükleer gözeneklerinin bütünleştirici yapısal analizini güçlendirir. Bilim. Cilt 376, 10 Haziran 2022, s. 6598.

K.-T. Ko et al. Sıtma aşısı adayı Pfs48/45’in yapısı ve transmisyon bloke edici antikorlar tarafından tanınması. bioRxiv.org. 25 Mayıs 2022.

TR Alderson ve ark. AlphaFold2 tarafından koşullu olarak katlanmış içsel olarak düzensiz bölgelerin sistematik olarak tanımlanması. bioRxiv.org. 18 Şubat 2022.

Jumper ve diğerleri. AlphaFold ile yüksek doğrulukta protein yapısı tahmini. Doğa. Cilt 596, 15 Temmuz 2021, s. 583.

Baek, et al. Üç yollu bir sinir ağı kullanarak protein yapılarının ve etkileşimlerinin doğru tahmini. Bilim. 15 Temmuz 2021’de çevrimiçi yayınlandı.

AlphaFord, Protein Katlama Problemini Gerçekten Çözdü Mü?

YouTube Kanalımız

Leave a reply

Please enter your comment!
Please enter your name here