Her zamankinden daha fazla hassasiyetle yeni proteinler için tasarımlar oluşturmak üzere difüzyon modellerini kullanan programlar duyuruldu. Boston merkezli bir girişim olan Generate Biomedicines, şirketin “biyolojinin DALL-E 2’si” olarak tanımladığı Chorama adlı bir program üretti.
Washington Üniversitesi’nde biyolog David Baker liderliğindeki bir ekip, RoseTTAFold Diffusion adlı benzer bir program oluşturdu. Baker ve meslektaşları, çevrim içi olarak yayımlanan bir ön makalede, modellerinin daha sonra laboratuvarda hayata geçirilebilecek yeni proteinler için kesin tasarımlar üretebileceğini gösteriyor. RoseTTAFold’un ortak geliştiricilerinden biri olan Brian Trippe, “Mevcut olanlarla gerçekten hiçbir benzerliği olmayan proteinler üretiyoruz.” diyor.
Bu protein üreteçleri, şekil, boyut veya işlev gibi belirli özelliklere sahip proteinler için tasarımlar üretmeye yönlendirilebilir. Aslında bu, talep üzerine belirli işleri yapmak için yeni proteinlerin ortaya çıkmasını mümkün kılar. Araştırmacılar, bunun sonunda yeni ve daha etkili ilaçların geliştirilmesine yol açacağını umuyorlar. Generate Biomedicines CEO’su Gevorg Grigoryan, “Milyonlarca yıl süren evrimi dakikalar içinde keşfedebiliriz.” diyor. Massachusetts, Cambridge’deki Microsoft Research’te biyofizikçi olan Ava Amini, “Bu çalışmayla ilgili dikkate değer olan, istenen kısıtlamalara göre proteinlerin üretilmesidir.” diyor.
Proteinler, canlı sistemlerin temel yapı taşı olarak bilinir. Hayvanlarda yiyecekleri sindirirler, kasları kasarlar, ışığı algılarlar, bağışıklık sistemini harekete geçirirler ve çok daha fazlasını yaparlar. İnsanlar hastalandığında proteinler önemli bir rol oynar. Bu nedenle ilaçlar için birincil hedefler proteinler olur. Ayrıca günümüzün en yeni ilaçlarının çoğu protein bazlıdır. Grigoryan, “Doğa, proteinleri esasen her şey için kullanır.” diyor. Ancak ilaç tasarımcıları şu anda doğal proteinlerden oluşan bir içerik listesi çizmek zorunda. Protein üretiminin amacı, listeyi bilgisayar tarafından tasarlanmış neredeyse sonsuz bir havuzla genişletmektir. Protein tasarımı için hesaplama teknikleri yeni değil. Ancak önceki yaklaşımlar yavaştı ve büyük proteinler veya protein kompleksleri (birbirine bağlanmış çok sayıda proteinden oluşan moleküler grupları) tasarlama konusunda pek iyi değildi. Bu tür proteinler genellikle hastalıkların tedavisi için büyük önem taşıyor.
RoseTTAFold Difüzyonu ile üretilen bir protein yapısı (solda) ve laboratuvarda oluşturulan aynı yapı resmi (sağda)
Duyurulan iki program da difüzyon modellerinin protein üretimi için ilk kullanımı değil. Son birkaç ay içinde Amini ve diğerleri tarafından yapılan bir avuç çalışma, difüzyon modellerinin umut verici bir teknik olduğunu gösterdi, ancak bunlar kavram kanıtı prototipleriydi. Chroma ve RoseTTAFold Diffusion, bu çalışmanın üzerine inşa edilmiş ve çok çeşitli proteinler için hassas tasarımlar üretebilen ilk tam teşekküllü programlardır. Mayıs 2022’de protein üretimi için ilk difüzyon modellerinden birini birlikte geliştiren Namrata Anand, Chroma ve RoseTTAFold Diffusion’ın büyük öneminin, daha fazla veri ve daha fazla bilgisayar üzerinde eğitim almaları olduğunu düşünüyor.
Difüzyon modelleri, girdilerinden “gürültüyü” (verilere eklenen rastgele pertürbasyonlar) çıkarmak için eğitilmiş sinir ağlarıdır. Rastgele bir piksel karmaşası verildiğinde, bir difüzyon modeli onu tanınabilir bir görüntüye dönüştürmeye çalışır. Chroma’da, bir proteinin yapıldığı amino asit zincirlerini çözerek gürültü eklenir. Bu zincirlerden rastgele bir yığın verildiğinde, Chroma onları bir protein oluşturmak için bir araya getirmeye çalışır. Sonucun nasıl görünmesi gerektiğine ilişkin belirli kısıtlamaların rehberliğinde, Chroma belirli özelliklere sahip yeni proteinler üretebilir.
Baker’ın ekibi, nihai sonuçlar benzer olsa da farklı bir yaklaşım benimsiyor. Difüzyon modeli daha da karmaşık bir yapıyla başlar. Diğer bir önemli fark, RoseTTAFold Diffusion’ın, protein yapısını tahmin etmek için eğitilmiş ayrı bir sinir ağı tarafından sağlanan (DeepMind’in AlphaFold’unun yaptığı gibi) proteinin parçalarının nasıl birbirine uyduğuna ilişkin bilgileri kullanması. Bu, genel üretim sürecini yönlendirir. Generate Biomedicines ve Baker’ın ekibi, etkileyici bir dizi sonuç sergiliyor. Dairesel, üçgen veya altıgen proteinler dahil olmak üzere çok sayıda simetri derecesine sahip proteinler üretebilirler.
Generate Biomedicines, programlarının çok yönlülüğünü göstermek için Latin alfabesinin 26 harfi ve 0’dan 10’a kadar rakamlar şeklinde proteinler üretti. Her iki ekip de yeni parçaları mevcut yapılarla eşleştirerek protein parçaları üretebilir. Gösterilen bu yapıların çoğu pratikte hiçbir amaca hizmet etmeyecek ancak bir proteinin işlevi şekli tarafından belirlendiği için talep üzerine farklı yapılar üretebilmek önemli.
Generate Biomedicines, Chroma’nın yapılabilecek tasarımlar üretip üretmediğini test etmek için bazı proteini oluşturan amino asit dizilerini aldı ve bunları başka bir yapay zeka programından geçirdi. Bunların %55’inin Chroma tarafından üretilen yapıya katlanacağının tahmin edildiğini buldular. Bu da bunların canlı proteinler için tasarımlar olduğunu gösteriyor. Baker’ın ekibi de benzer bir test yaptı. Ancak Baker ve meslektaşları, modellerini değerlendirirken Generate Biomedicines’tan çok daha ileri gittiler. RoseTTAFold Diffusion’ın bazı tasarımlarını laboratuvarlarında yarattılar.
Trippe, “Bu, kavramın kanıtlanmasından daha fazlası. Aslında bunu gerçekten harika proteinler yapmak için kullanıyoruz.” Baker için ana sonuç, kandaki kalsiyum seviyelerini kontrol eden paratiroid hormonuna bağlanan yeni bir proteinin üretilmesi. “Temel olarak modele hormonu verdik, başka bir şey vermedik ve ona bağlanan bir protein yapmasını söyledik” diyor. Laboratuvarda yeni proteini test ettiklerinde, hormona diğer hesaplama yöntemleri kullanılarak üretilebilecek her şeyden daha sıkı ve mevcut ilaçlardan daha sıkı bağlandığını buldular. Baker, “Bu protein tasarımı hiç yoktan ortaya çıktı.” diyor. Grigoryan, yeni proteinler icat etmenin pek çoğunun yalnızca ilk adımı olduğunu kabul ediyor. “Biz bir ilaç şirketiyiz. Günün sonunda önemli olan, işe yarayan ilaçlar yapıp yapamayacağımızdır.” diyor.
Protein bazlı ilaçların çok sayıda üretilmesi, ardından laboratuvarda ve son olarak da insanlarda test edilmesi gerekiyor. Bu yıllar alabilir. Ancak, şirketinin ve diğerlerinin de bu adımları hızlandırmanın yollarını bulacağını düşünüyor. Baker, “Bilimsel ilerlemenin hızı uyum içinde gelir ve başlar. Ancak şu anda sadece teknolojik devrim olarak adlandırılabilecek bir şeyin ortasındayız.” diyor.
Derleyen: Ceren Korkmaz