Akselerate Protein Struktur Inferensi Lebih dari 100x dengan NVIDIA RTX Pro 6000 Blackwell Server Edition


Perlombaan untuk memahami struktur protein tidak pernah lebih kritis. Dari mempercepat penemuan obat hingga mempersiapkan pandemi masa depan, kemampuan untuk memprediksi bagaimana protein lipatan menentukan kapasitas untuk menyelesaikan tantangan biologis yang paling mendesak dari umat manusia. Sejak pelepasan alphafold2, inferensi AI untuk menentukan struktur protein telah meroket. Alat yang tidak dioptimalkan untuk inferensi struktur protein dapat membebankan biaya jutaan karena kehilangan waktu penelitian dan pemanfaatan komputasi yang berkepanjangan.

GPU NVIDIA RTX Pro 6000 Blackwell Edition edisi yang baru secara mendasar mengubah ini. Terlepas dari terobosan Alphafold2, generasi penyelarasan beberapa urutan ganda yang terikat CPU dan inferensi GPU yang tidak efisien tetap menjadi langkah pembatas laju. Membangun upaya kolaboratif sebelumnya, akselerasi baru yang dikembangkan oleh NVIDIA Digital Biology Research Labs memungkinkan inferensi struktur protein yang lebih cepat dari sebelumnya menggunakan OpenFold tanpa biaya akurasi dibandingkan dengan Alphafold2.

Dalam posting ini, kami akan menunjukkan cara menjalankan analisis protein skala besar menggunakan GPU Edisi Blackwell Server Edisi Blackwell, memberikan kinerja inferensi struktur protein yang belum pernah terjadi sebelumnya untuk platform perangkat lunak, penyedia cloud, dan lembaga penelitian.

Video 1. GPU NVIDIA RTX Pro 6000 Blackwell Server Edition menetapkan tolok ukur baru untuk inferensi struktur protein

Mengapa kecepatan dan skala materi dalam prediksi struktur protein?

Lipatan protein berada di persimpangan beban kerja yang paling komputasi dalam biologi komputasi. Pipa penemuan obat modern memerlukan menganalisis ribuan struktur protein. Pada saat yang sama, proyek-proyek rekayasa enzim menuntut siklus iterasi yang cepat untuk mengoptimalkan fungsi biologis, dan aplikasi biotektan pertanian memerlukan penyaringan pustaka protein besar untuk mengembangkan tanaman yang tahan iklim.

Tantangan komputasi dapat menjadi sangat besar: prediksi struktur protein tunggal dapat melibatkan MSA skala metagenomik, langkah-langkah penyempurnaan iteratif, dan perhitungan ensemble yang biasanya membutuhkan waktu penghitungan waktu. Ketika diskalakan di seluruh proteom atau pustaka target obat, beban kerja ini menjadi sangat memakan waktu pada infrastruktur berbasis CPU.

Misalnya, dalam perbandingan langsung alat penyelarasan multi-urutan, MMSEQS2-GPU menyelesaikan penyelarasan 177x lebih cepat pada L40-an tunggal daripada jackhmmer berbasis CPU pada CPU 128-core dan hingga 720X lebih cepat ketika didistribusikan pada delapan GPU NVIDIA L40S. Speedup ini menyoroti bagaimana revolusi GPU secara dramatis mengurangi kemacetan komputasi dalam bioinformatika protein.

Bagaimana NVIDIA memungkinkan AI struktur protein tercepat yang tersedia?

Membangun rilis baru-baru ini seperti CueQuivariance dan Boltz-2 NIM Microservice, NVIDIA Digital Biology Research Lab memvalidasi peningkatan kinerja terobosan untuk openfold menggunakan RTX Pro 6000 Blackwell Server Edition dan NVIDIA TensorRT di seluruh tolok ukur standar industri (Gambar 1).

Grafik ini menggambarkan proses melewati urutan asam amino ke MMSEQS2-GPU untuk menghasilkan penyelarasan urutan berganda, yang kemudian diteruskan ke model AI OpenFold2 untuk memprediksi struktur protein.Grafik ini menggambarkan proses melewati urutan asam amino ke MMSEQS2-GPU untuk menghasilkan penyelarasan urutan berganda, yang kemudian diteruskan ke model AI OpenFold2 untuk memprediksi struktur protein.
Gambar 1. Prediksi struktur protein dengan MMSEQS2-GPU dan OpenFold2

Memanfaatkan instruksi baru dan TensorRT, MMSEQS2-GPU, dan OpenFold pada RTX Pro 6000 Blackwell memberikan kinerja transformasional untuk prediksi struktur protein, mengeksekusi lipatan lebih dari 138x lebih cepat daripada Alphafold2 dan sekitar 2,8x lebih cepat daripada colabfold, sambil mempertahankan skor TM yang identik.

Pertama, kecepatan inferensi yang lebih cepat diaktifkan dengan MMSEQS2-GPU pada RTX Pro 6000 Blackwell, yang berjalan sekitar 190x lebih cepat dari Jackhmmer dan HHBlits pada CPU Dual-Socket AMD 7742. Selain itu, optimasi Tensorrt yang dipesan lebih dahulu menargetkan lipatan terbuka meningkatkan kecepatan inferensi 2,3x dibandingkan dengan lipatan terbuka awal. Divalidasi pada 20 target protein CASP14, tolok ukur ini menetapkan RTX Pro 6000 Blackwell sebagai solusi terobosan untuk prediksi struktur protein end-to-end.

Menghilangkan hambatan memori

Selain itu, 96 GB memori bandwidth tinggi (1,6 tb/s) memungkinkan RTX Pro 6000 Blackwell untuk melipat seluruh ansambel protein dan MSA besar, memungkinkan alur kerja penuh tetap menjadi residen GPU. Fungsionalitas GPU multi-instance (MIG) memungkinkan RTX Pro 6000 Blackwell tunggal untuk bertindak seperti empat GPU, masing-masing cukup kuat untuk mengungguli GPU inti Tensor NVIDIA L4. Ini memungkinkan banyak pengguna atau alur kerja untuk berbagi server tanpa mengurangi kecepatan atau akurasi.

Berikut adalah contoh lengkap yang menunjukkan cara memanfaatkan kinerja RTX Pro 6000 untuk prediksi struktur protein cepat. Langkah pertama adalah menggunakan OpenFold2 NIM pada mesin lokal Anda.

# See https://build.nvidia.com/openfold/openfold2/deploy for
# instructions to configure your docker login, NGC API Key, and
# environment for running the OpenFold NIM on your local system.

# Run this in a shell, providing the username below and your NGC API Key
$ docker login nvcr.io
Username: $oauthtoken
Password: <PASTE_API_KEY_HERE>

export NGC_API_KEY=<your personal NGC key>

# Configure local NIM cache directory so the NIM model download can be reused
export LOCAL_NIM_CACHE=~/.cache/nim
mkdir -p "$LOCAL_NIM_CACHE"
sudo chmod 0777 -R "$LOCAL_NIM_CACHE"

# Then launch the NIM container, in this case using GPU device ID 0.
docker run -it \
    --runtime=nvidia \
    --gpus='"device=0"' \
    -p 8000:8000 \
    -e NGC_API_KEY \
    -v "$LOCAL_NIM_CACHE":/opt/nim/.cache \
    nvcr.io/nim/openfold/openfold2:latest

# It can take some time to download all model assets on the initial run.
# You can check the status using the built-in health check.  This will
# return {"status": "ready"} when the NIM endpoint is ready for inference.
curl http://localhost:8000/v1/health/ready

Setelah NIM digunakan secara lokal, Anda dapat membangun permintaan inferensi dan menggunakan titik akhir lokal untuk menghasilkan prediksi struktur protein.

#!/usr/bin/env python3

import requests
import os
import json
from pathlib import Path

# ----------------------------
# parameters
# ----------------------------
output_file = Path("output1.json")
selected_models = [1, 2]

# SARS-CoV-2 proteome example
# Spike protein (1273 residues) — critical for vaccine development
sequence = (
"MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFAST
EKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNL
REFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVD
CALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLC
FTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCY
FPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITP
CSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARS
VASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQV
KQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWT
FGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLD
KVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHD
GKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQK
EIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT"
)

data = {
    "sequence": sequence,
    "selected_models": [1, 2],
    "relax_prediction": False,
}
print(data)

# ---------------------------------------------------------
# Submit
# ---------------------------------------------------------
url = "http://localhost:8000/biology/openfold/openfold2/predict-structure-from-msa-and-template"
print("Making request...")
response = requests.post(url=url, json=data)

# ---------------------------------------------------------
# View response
# ---------------------------------------------------------
if response.status_code == 200:
    output_file.write_text(response.text)
    print(f"Response output to file: {output_file}")

else:
    print(f"Unexpected HTTP status: {response.status_code}")
    print(f"Response: {response.text}")

Mulailah Akselerasi Protein AI Workflows

Sedangkan Alphafold2 pernah membutuhkan node komputasi kinerja tinggi yang heterogen, akselerasi NVIDIA untuk prediksi struktur protein-termasuk komponen modular dalam CueQuivariance, Tensorrt, dan MMSEQS2-GPU-ON RTX Pro 6000 Blackwell, memungkinkan pelipat pada server tunggal di dunia. Ini membuat lipat skala proteome dapat diakses oleh laboratorium atau platform perangkat lunak apa pun, dengan waktu-ke-prediksi tercepat hingga saat ini.

Apakah Anda mengembangkan platform perangkat lunak untuk penemuan obat, membangun solusi biotektan pertanian, atau melakukan penelitian kesiapsiagaan pandemi, kinerja RTX Pro 6000 Blackwell yang belum pernah terjadi sebelumnya akan mengubah alur kerja biologi komputasi Anda. Kekuatan RTX Pro 6000 Blackwell Server Edition tersedia saat ini di server NVIDIA RTX Pro dari Global System Makers serta dalam contoh cloud dari penyedia layanan cloud terkemuka.

Siap Memulai? Temukan mitra untuk NVIDIA RTX Pro 6000 Blackwell Server Edition dan pengalaman lipat protein dengan kecepatan dan skala yang belum pernah terjadi sebelumnya.

Ucapan Terima Kasih

We'd like to thank the researchers from NVIDIA, University of Oxford, and Seoul National University who contributed to this research, including Christian Dallago, Alejandro Chacon, Kieran Didi, Prashant Sohani, Fabian Berressem, Alexander Nesterovskiy, Robert Ohannessian, Mohamed Elbalkini, Jonathan Cogan, Ania Kukushkina, Anthony Costa, Arash Vahdat, Bertil Schmidt, Milot Mirdita, dan Martin Steinegger.



Akselerate Protein Struktur Inferensi Lebih dari 100x dengan NVIDIA RTX Pro 6000 Blackwell Server Edition

Leave a Reply

Your email address will not be published. Required fields are marked *