Blog Pengembang Android: Pengembang Android

Pemrosesan video yang dipercepat perangkat keras di Python menjadi lebih mudah. Pynvvideocodec adalah perpustakaan yang berbasis di NVIDIA Python untuk pengkodean video, decoding, dan transcoding yang dipercepat GPU. Dibangun langsung di atas NVIDIA Video Codec SDK tingkat rendah, Pynvvideocodec ringan, berlisensi MIT, dan mudah dipasang menggunakan PIP. Kinerja setara dengan SDK asli.

Pynvvideocodec 2.0 adalah peningkatan besar pada bagaimana pengembang, peneliti, dan insinyur membangun jaringan pipa video berkinerja tinggi menggunakan bahasa Python yang akrab dan fleksibel.

Apakah Anda sedang mengerjakan analisis video, preprocessing AI, transcoding media, atau streaming waktu-nyata, Pynvvideocodec 2.0 memberikan kecepatan C ++ dan kemudahan Python-sekarang dengan lebih banyak fitur, kinerja yang lebih baik, dan dukungan CODEC yang diperluas. Baca terus untuk mempelajari lebih lanjut.

Diagram yang menunjukkan pipa pemrosesan video. Aliran dimulai dengan input video, diteruskan ke API decode pynvvideocodec. Bingkai yang didekodekan melewati blok pemrosesan yang menangani pra-pemrosesan, pelatihan, menyimpulkan, dan pasca pemrosesan. Hasilnya diteruskan ke PYNVVideOcodec Encode API, dan akhirnya output sebagai video. — *Gambar 1. Pipa pemrosesan video pynvvideocodec memungkinkan decode yang dipercepat GPU dan menyandikan operasi di sekitar AI atau tahap pemrosesan sinyal*

*Gambar 2. Tumpukan perangkat lunak untuk pemrosesan video yang dipercepat GPU dengan pynvvideocodec*

Model Streamer		Safetensors Loader
Concurrency	Time to load model to GPU (sec.)	Time to load model to GPU (sec.)
1	47.56	47.99
4	14.43
8	14.42
16	14.34

Tensorizer
Number of readers	Time to load model to GPU (sec.)
1	50.74
4	17.38
8	16.49
16	16.11
32	17.18
64	16.44
100	16.81

Model Streamer		Safetensors Loader
Concurrency	Time to load model to GPU (sec.)	Time to load model to GPU (sec.)
1	43.71	47
4	11.19
8	7.53
16	7.61
20	7.62

Tensorizer
Number of readers	Time to load model to GPU (sec.)
1	43.85
4	14.44
8	10.36
16	10.61
32	10.95

Model Streamer
Concurrency	Time to load model to GPU (sec.)
4	28.24
16	8.45
32	4.88
64	5.01

Month: September 2025

Blog Pengembang Android: Pengembang Android

Blog Pengembang Android

Blog Pengembang Android

Blog Pengembang Android: Pengujian Aplikasi

Autodesk Research membawa kecepatan warp ke dinamika fluida komputasi pada NVIDIA GH200

XLB oleh Autodesk Research: Scaling CFD murni dalam python

NVIDIA WARP: Tulis pemecah dengan kecepatan warp

Menjembatani kesenjangan antara kinerja dan produktivitas

Jelajahi lebih lanjut tentang XLB & NVIDIA WARP

Blog Pengembang Android

Apa yang Baru di Pynvvideocodec 2.0 untuk pemrosesan video yang dipercepat GPU Python

Apa yang baru di Pynvvideocodec 2.0?

Peningkatan Decode

Encode Peningkatan

Peningkatan Transcode

Instalasi dan Kustomisasi Mudah

Mulailah dengan Pynvvideocodec 2.0

Blog Pengembang Android

Reducing Cold Start Latency for LLM Inference with NVIDIA Run:ai Model Streamer

How is a model loaded to a GPU for inference?

How does the Model Streamer work?

How does the HF Safetensors Loader work?

How does the CoreWeave Tensorizer work?

Where loading meets inference engines: Loading weights with vLLM

Comparing model loader performance across three storage types

Experiment setup

Experiment #1 results: GP3 SSD

Experiment #2: IO2 SSD

Experiment #3: S3

‍Experiment #4: vLLM with all loaders

Get started with NVIDIA Run:ai Model Streamer

Blog Pengembang Android

vLLM with different loaders
Loader	Total time until vLLM engine is ready for requests (sec.)
Safetensors Loader	66.13
Model Streamer	35.08
Tensorizer	36.19