Çinli ekip tarafından geliştirilen dünyanın ilk gen madenciliği modeli SYMPLEX piyasaya sürüldü
Güncellenme tarihi: 16-0-0 0:0:0

IT之家 4 月 14 日消息,随着生物测序技术突破,全球天然基因库已积累数十亿量级序列,其中蕴藏海量高价值功能基因。然而,当前仅有少数明星基因被深度挖掘,绝大多数仍处于“沉睡”状态。

4 月 9 日,中国科学院深圳先进技术研究院定量合成生物学全国重点实验室、合成生物学研究所娄春波团队与北京大学定量生物学中心钱珑团队合作在国际学术期刊 Science Advances 上发表研究论文,Sentetik biyoloji bileşen madenciliği ve biyoüretim uygulamaları için dünyanın ilk büyük dil modeli olan "SYMPLEX"i bildirdive SYMPLEX modelini mRNA kapaklayan enzim genlerinin madenciliğine uygulayarak, biyoüretimi güçlendirmek için büyük dil modellerinin büyük potansiyelini gösterdi.

Model, etki alanı büyük dil modeli eğitimini, sentetik biyoloji uzmanı bilgi hizalamasını ve büyük ölçekli biyoinformatik analizini bütünleştirir.Fonksiyonel gen elementlerinin büyük literatürden otomatik madenciliğini gerçekleştirir ve mühendislik uygulama potansiyellerini doğru bir şekilde değerlendirir

Araştırma ekibi, mRNA aşılarının biyoüretiminde önemli bir enzim olan kapatma enzimlerinin madenciliğine SYMPLEX'i uyguladı ve çeşitli yüksek performanslı yeni kapatma enzimlerini başarıyla elde etti. Üçüncü taraf bir şirket tarafından yapılan deneysel doğrulama, bu enzimlerin, katalitik verimlilik açısından uluslararası lider bir şirket olan New England Biolabs'ın (NEB) ticarileştirilmiş kapaklı enzimlerinden 2 kat daha verimli olduğunu ve mRNA aşılarının üretkenliğini ve maliyet etkinliğini önemli ölçüde artırdığını göstermiştir.

Araştırma ekibi, büyük dil modellerini (LLM'ler) yapılandırılmış biyolojik bilgi tabanlarıyla yaratıcı bir şekilde entegre etti, SYMPLEX akıllı gen madenciliği platformunu geliştirdi.

SYMPLEX, on milyonlarca biyolojik literatürün okunmasını ve anlaşılmasını otomatikleştirerek, genetik, işlevsel ve bilgi düzeylerinde literatür içeriğini çıkarıp analiz ederek ve uzman veri tabanları ile gelişmiş biyoinformasyon teknolojisine dayalı kavramsal hizalama, etkileşim ve istatistiksel model oluşturma gerçekleştirerek eksiksiz bir kanıt zinciri ile yüksek kaliteli aday genlerin eksiksiz bir koleksiyonunu sağlayan güçlü bir işlevsel gen arama motorudur.

SYMPLEX, YALNIZCA BÜYÜK DIL MODELI HALÜSINASYONLARINI ETKILI BIR ŞEKILDE ATLATMAKLA KALMAZ, AYNI ZAMANDA OTOMATIK OLARAK GEN IŞLEVIYLE ILGILI INCE TANELI BILGI AĞAÇLARI OLUŞTURUR VE BILIM INSANLARINA ÇOK ÇEŞITLI BIYOLOJIK MEKANIZMALARI VE MOLEKÜLER SÜREÇLERI KEŞFETMELERI IÇIN REHBERLIK EDER.

▲ SYMPLEX büyük modelinin teknik rotası ve geleneksel gen madenciliği süreci ile karşılaştırılması

Karşılaştırmalı sonuçlar, SYMPLEX büyük modelinin genlerin derinliğini, miktarını ve çeşitliliğini araştırabildiğini göstermektedirHepsi geleneksel biyoinformatik yöntemlerinden önemli ölçüde daha iyidirÇıkardığı genetik çeşitlilik, mevcut protein fonksiyonu tahmin modellerinin sınırlarının da ötesine geçiyor.

▲ SYMPLEX madencilik sonuçlarının çeşitlilik karşılaştırması ve ayrıntılı bilgi ağacı oluşturma

SYMPLEX çevrimiçi etkileşimli platformu artık araştırmacıların ücretsiz olarak kullanması için hazır. Platform modülerdir ve üç temel işlev sağlar:

  • (1) PubEngine: yüksek verimli akıllı literatür alımını, analizini ve görsel etkileşimi destekler.

  • (2) Gen fonksiyon etiketleme sistemi GeneTagger: Moleküler mekanizmalardan biyolojik süreçlere kadar ince taneli otomatik gen ve fonksiyon ekstraksiyonunu gerçekleştirin.

  • (3) Standartlaştırılmış bilgi merkezi GeneNorm: Uzman bilgi tabanı ile kavram hizalamasını ve standardizasyonunu gerçekleştirin ve bilgi ağacı oluşturmayı ve işlevsel örüntü tanımayı destekleyin.

Kağıt bağlantılı IT Home: