Pengembang sekarang bisa mendapatkan CUDA langsung dari platform pihak ketiga favorit mereka

[ad_1]

Membangun dan menggunakan aplikasi dapat menjadi tantangan bagi pengembang, mengharuskan mereka untuk menavigasi hubungan kompleks antara kemampuan perangkat keras dan perangkat lunak dan kompatibilitas. Memastikan bahwa setiap komponen perangkat lunak yang mendasarinya tidak hanya diinstal dengan benar tetapi juga cocok dengan versi yang diperlukan untuk menghindari konflik dapat menjadi tugas yang memakan waktu, dan sering mengarah pada penundaan penyebaran dan inefisiensi operasional dalam alur kerja aplikasi.

Itulah sebabnya NVIDIA memudahkan pengembang untuk menggunakan tumpukan perangkat lunak CUDA di berbagai sistem operasi (OS) dan manajer paket.

Perusahaan ini bekerja dengan ekosistem platform distribusi untuk memungkinkan redistribusi CUDA. Penyedia OS Canonical, CIQ, dan SUSE, dan Manajer Lingkungan Pengembang Flox – yang memungkinkan manajer paket NIX – akan mendistribusikan kembali perangkat lunak CUDA secara langsung. Mereka sekarang dapat menyematkan CUDA ke dalam feed paket mereka, menyederhanakan instalasi dan resolusi ketergantungan. Ini sangat bermanfaat untuk memasukkan dukungan GPU ke dalam aplikasi kompleks seperti Pytorch dan perpustakaan seperti OpenCV.

Upaya ini memperluas akses CUDA dan kemudahan penggunaan untuk semua pengembang. Ini menambah cara yang ada mereka memiliki akses dengan membiarkan mereka mendapatkan semua perangkat lunak yang mereka butuhkan di satu lokasi. Distributor tambahan akan segera hadir.

Setiap platform distribusi yang mendistribusikan ulang CUDA akan memberikan beberapa hal penting untuk membantu pengembang dan perusahaan tetap selaras dengan perangkat lunak CUDA yang didistribusikan NVIDIA.

Penamaan toolkit CUDA yang konsisten: Paket pihak ketiga akan cocok dengan konvensi penamaan NVIDIA untuk menghindari kebingungan dalam dokumentasi dan tutorial.
Pembaruan CUDA tepat waktu: Paket pihak ketiga akan diperbarui tepat waktu setelah rilis resmi NVIDIA untuk memastikan kompatibilitas dan mengurangi overhead QA.
Akses gratis lanjutan: CUDA sendiri akan tetap tersedia secara bebas – bahkan ketika dikemas dalam perangkat lunak berbayar. Distributor dapat mengenakan biaya untuk akses ke paket atau perangkat lunak mereka tetapi tidak akan memonetisasi CUDA secara khusus.
Opsi Dukungan Komprehensif: Anda dapat mengakses dukungan melalui distributor dan juga dapat menemukan bantuan melalui forum NVIDIA atau situs pengembang NVIDIA, seperti biasa.

Mendapatkan perangkat lunak CUDA dari NVIDIA selalu gratis, dan semua jalan saat ini untuk membuat CUDA tetap ada (mereka termasuk mengunduh toolkit CUDA, menarik wadah CUDA, menginstal Python menggunakan PIP atau Conda).

Tetapi kemampuan untuk platform distribusi untuk mengemas CUDA dalam penyebaran perusahaan yang lebih besar dan aplikasi perangkat lunak memungkinkan kami untuk memastikan pengalaman Anda sebagai pengembang sederhana. Anda mengunduh dan menginstal aplikasi Anda, dan di bawah sampulnya, versi CUDA yang benar diinstal juga.

Bekerja dengan ekosistem NVIDIA dengan cara ini merupakan tonggak penting dalam misi kami untuk mengurangi gesekan dalam penyebaran perangkat lunak GPU. Dengan berkolaborasi dengan pemain kunci di seluruh OS dan lansekap manajemen paket, NVIDIA memastikan bahwa CUDA tetap dapat diakses, konsisten, dan mudah digunakan – tidak ada masalah di mana atau bagaimana pengembang memilih untuk membangun.

Tetap disini untuk pembaruan lebih lanjut karena platform pihak ketiga tambahan diumumkan dan ekosistem CUDA terus berkembang.

[ad_2]

Pengembang sekarang bisa mendapatkan CUDA langsung dari platform pihak ketiga favorit mereka

Menyebarkan inferensi AI yang dapat diskalakan dengan operator NVIDIA NIM 3.0.0

[ad_1]

Model AI, cadangan mesin inferensi, dan kerangka kerja inferensi terdistribusi terus berkembang dalam arsitektur, kompleksitas, dan skala. Dengan laju perubahan yang cepat, menyebarkan dan mengelola pipa inferensi AI secara efisien yang mendukung kemampuan canggih ini menjadi tantangan kritis.

Operator NVIDIA NIM dirancang untuk membantu Anda skala dengan cerdas. Ini memungkinkan administrator kluster Kubernetes untuk mengoperasikan komponen dan layanan perangkat lunak yang diperlukan untuk menjalankan layanan microser nim nim nim untuk model LLM dan multimodal AI terbaru, termasuk penalaran, pengambilan, visi, bicara, biologi, dan banyak lagi.

Rilis terbaru NIM Operator 3.0.0 memperkenalkan kemampuan yang diperluas untuk menyederhanakan dan mengoptimalkan penyebaran layanan mikro NVIDIA NIM dan layanan mikro NVIDIA NEMO di seluruh lingkungan Kubernetes. Operator NIM 3.0.0 mendukung pemanfaatan sumber daya yang efisien dan mengintegrasikan dengan mulus dengan infrastruktur Kubernetes yang ada, termasuk penyebaran KServe.

Pelanggan dan mitra NVIDIA telah menggunakan operator NIM untuk mengelola pipa inferensi secara efisien untuk berbagai aplikasi dan agen AI, termasuk chatbots, agen rag, dan penemuan obat virtual.

NVIDIA baru -baru ini berkolaborasi dengan Red Hat untuk memungkinkan penyebaran NIM di KServe dengan operator NIM. “Red Hat berkontribusi pada operator Open Source Open Source Github Repo untuk memungkinkan penyebaran NIM NIM di Kserve,” kata direktur teknik Red Hat Babak Mozaffari. Fitur ini memungkinkan operator NIM untuk menggunakan NIM Microservices yang mendapat manfaat dari manajemen siklus hidup KServe dan menyederhanakan penyebaran NIM yang dapat diskalakan menggunakan layanan NIM. Dukungan kserve asli di operator NIM juga memungkinkan pengguna untuk mendapatkan manfaat dari cache NIM dan leverage yang dipercayai seperti NEMO.

Posting ini menjelaskan kemampuan baru dalam rilis NIM Operator 3.0.0, termasuk:

Grafik yang menunjukkan arsitektur operator NIM dengan bagian horizontal (atas ke bawah): Contoh AI generatif NVIDIA; Nemo Microservices dan NIM Microservices; Operator NIM; Layanan Infrastruktur; Kubernetes; Distribusi Linux. — *Gambar 1. Arsitektur Operator NIM*

Feature	SMPTE VC-6 (ST 2117)
Core architecture	Hierarchical, S-Tree Predictive, Parallel.
Selective data recall	Native support. The bitstream structure allows for fetching only the bytes required for a partial request.
Selective resolution (LoQ) decode	Native support. Intrinsic to the hierarchical LoQ structure, produce surface near target size without full decode + resize.
RoI decode	Native support. Intrinsic to the navigable S-tree structure, pull just the tiles that matter for the model stage.
Parallel decode capability	Massively parallel. Plane/LoQ/tiled residuals independence enables fine‑grained GPU parallelism.
Max bit depth	Up to 31 bits per component.
Multi-plane support	Native, up to 255 planes (e.g., RGB, alpha, depth).

Penyebaran NIM Fleksibel: Kompatibel Multi-Llm dan Multi-Node

Pemanfaatan GPU yang efisien dengan DRA

Penempatan mulus di kserve

Mulailah menskalakan inferensi AI dengan operator NIM 3.0.0

Mengapa kecepatan dan skala materi dalam prediksi struktur protein?

Bagaimana NVIDIA memungkinkan AI struktur protein tercepat yang tersedia?

Menghilangkan hambatan memori

Mulailah Akselerasi Protein AI Workflows

Ucapan Terima Kasih

What is Quantization Aware Training?

How to apply QAT with Model Optimizer

What is Quantization Aware Distillation?

How to apply QAD with Model Optimizer

Evaluating the Impact of QAT and QAD

Summary

What happens during the recon stage of the AI Kill Chain?

How do attackers poison AI systems in this stage?

How do attackers hijack AI model behavior once poisoning succeeds?

How do attackers persist their influence across sessions and systems?

How do attackers iterate or pivot to expand their control in agentic systems?

What kinds of impacts do attackers achieve through compromised AI systems?

How can the AI Kill Chain be applied to a real-world AI system example?

Conclusion

What is VC-6?

I/O reduction with partial data recall

Mapping VC-6 to GPU: a natural fit for parallelism

VC-6 Python library with CUDA acceleration

Installation and usage

GPU memory output

Performance benchmarks: CPU compared to OpenCL and CUDA

Profiling with Nsight and the road ahead

Upsampling chains

Kernel-level parallelism

Conclusions

Menyebarkan dengan sgang

Menyebarkan dengan VLLM

Penempatan siap-produksi dengan NVIDIA NIM

Membangun Kekuatan Open Source AI

Mulailah hari ini