バクテリア トレンド
0post
2025.11.25 11:00
:0% :0% (-/-)
人気のポスト ※表示されているRP数は特定時点のものです
AIが『文脈』を読んで、未知の遺伝子をゼロから発明。、「王様が ____ を抜いた」という文脈があれば、空欄に入るのは「剣」ではないかと推測するような、意味論的デザイン。
具体的には、大規模ゲノム言語モデル(gLM)である「Evo」を用い、プロンプトエンジニアリングによって機能的な de novo 遺伝子(自然界の配列と相同性を持たない新規遺伝子)を設計・生成する手法「Semantic Design(意味論的デザイン)」を確立。
既存のタンパク質配列の類似性(ホモロジー)や立体構造予測に依存していたのに対し、本研究で提唱される「意味論的デザイン(Semantic Design)」は、ゲノム上の文脈(コンテキスト)情報を活用。
ある機能を持つ遺伝子がゲノム上のどのような「近傍」に存在する傾向があるかという分布意味論に基づき、AIが未知の機能的遺伝子配列をゼロから生成(オートコンプリート)する手法。
課題
「幻覚(ハルシネーション)」と反復配列:生成された配列の中には、生物学的に意味をなさない単純な反復配列(リピート)や、開始コドンや終止コドンが欠落した壊れたORF(Open Reading Frame)が含まれており、これらをフィルタリングすることができず、成功率が17-50%であるということは、裏を返せば50-83%は失敗作。
また、Evo 1.5は原核生物(バクテリア・アーキア)とファージのゲノムで学習されています。そのため、この「意味論的デザイン」のアプローチは、現時点では真核生物(ヒトや植物など)には直接適用できない。
今後は、
真核生物の巨大な遺伝子間領域や、遠隔にあるエンハンサーとプロモーターの関係性をも捉える。DNA配列だけでなく、クロマチンアクセシビリティ(DNAが読み取り可能かどうかの情報)などのエピゲノム情報を学習に統合
生物学、特にバイオインフォマティクスは長らく「ホモロジー(配列の類似性)」に依存。未知の遺伝子の機能を知りたければ、既知の遺伝子と似ているかどうかを調べるのが定石だったのが、Evoの成功は、「配列が似ていなくても、文脈が似ていれば機能は同じである」ということを証明
生物学における歴史的な転換点
https://t.co/arSiqLKyxt November 11, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



