SUDUT Silikon - Hardware Dan SoftWare Komputer

Ledakan memori konteks menghantam dinding penyimpanan

Inferensi kecerdasan buatan memasuki era baru yang tidak ditentukan oleh komputasi saja, namun oleh meningkatnya permintaan akan memori konteks yang tidak pernah dirancang untuk ditangani oleh arsitektur penyimpanan tradisional.

Inferensi tidak mengenai dinding komputasi — melainkan mengenai dinding memori konteks. Seiring dengan berkembangnya beban kerja AI dari perintah satu kali ke sesi agen multi-turn dengan jendela konteks jutaan token, volume data cache nilai kunci membengkak hingga petabyte, melampaui jumlah yang dapat diserap oleh tingkat memori GPU dan DRAM. Kekurangan NAND global telah berubah dari isu rantai pasokan menjadi risiko operasional yang material bagi organisasi dengan beban kerja AI yang tinggi. Tantangannya adalah mengubah cara perusahaan penyimpanan mendekati desain pabrik AI, menurut Betsy Chernoff (gambar, kiri), kepala AI dan manajer pemasaran produk di WekaIO Inc.

“Jika Anda memikirkannya dari tingkat awal kami bahkan setahun yang lalu, orang-orang hanya melakukan satu tembakan saja,” kata Chernoff. “Tetapi seiring dengan perkembangan kami, Anda telah melihat hal-hal seperti multi-turn, konkurensi, banyak pengguna, banyak putaran percakapan yang berbeda. Selain itu, panjang konteksnya sendiri juga telah bertambah. Semua ini telah meningkatkan jumlah memori yang diperlukan untuk sistem ini secara eksponensial.”

Chernoff dan Ace Stryker (kanan), direktur pemasaran dan ekosistem AI di Solidigm, merek dagang SK hynix NAND Product Solutions Corp., berbicara dengan Gemma Allen dari CUBE di Nvidia GTC AI Conference & Expo, selama siaran eksklusif di theCUBE, studio streaming langsung SiliconANGLE Media. Mereka membahas bagaimana memori konteks menciptakan tingkat penyimpanan yang benar-benar baru dalam klaster AI dan mengapa kekurangan NAND saat ini menjadikan efisiensi menjadi lebih penting dari sebelumnya. (* Pengungkapan di bawah.)

Memori konteks menciptakan tingkat penyimpanan baru

Di GTC 2026, Nvidia mengumumkan BlueField-4 STX, arsitektur referensi modular yang menyisipkan lapisan memori konteks khusus antara GPU dan penyimpanan tradisional. Implementasi skala rak pertama mencakup platform penyimpanan memori konteks Nvidia CMX baru, yang memperluas memori GPU dengan lapisan konteks berkinerja tinggi untuk sistem inferensi dan agen yang dapat diskalakan. Pengumuman tersebut memvalidasi arah yang telah dibangun oleh Weka dan Solidigm, menurut Stryker.

“Rasanya penyimpanan mendapat promosi tahun ini,” katanya. “Pekerjaan ketiga tersebut adalah node khusus baru yang dikhususkan untuk menyimpan memori konteks atau cache KV. Ini adalah tingkat penyimpanan yang benar-benar baru dalam klaster AI. Dan, sejujurnya, pasar telah dikepung dan merasakan permintaan yang kuat sebelum pengumuman tersebut.”

Weka telah mempersiapkan perubahan ini sejak meluncurkan Augmented Memory Grid di GTC 2025. Pada pameran tahun ini, Chernoff menunjukkan bukti konsep tingkat produksi dengan Firmus yang menghasilkan peningkatan token per detik hingga 6x, yang menggarisbawahi dampak dunia nyata dari penyimpanan cache KV yang persisten.

“Ketika kita berbicara tentang angka throughput token, dan kita berbicara tentang hal-hal seperti pelanggan tidak perlu menghitung ulang token lain jika tidak perlu, semua ini berdampak pada ROI Anda,” kata Chernoff. “Dan itu termasuk kemitraan kami dengan Solidigm juga, karena kami tidak dapat melakukan ini tanpa kalian.”

Berikut video wawancara selengkapnya, bagian dari liputan SiliconANGLE dan CUBE di Nvidia GTC AI Conference & Expo:

(* Pengungkapan: Solidigm mensponsori segmen theCUBE ini. Baik Solidigm maupun sponsor lainnya tidak memiliki kendali editorial atas konten di theCUBE atau SiliconANGLE.)

Foto: SiliconANGLE

Dukung misi kami untuk menjaga konten tetap terbuka dan gratis dengan terlibat dalam komunitas CUBE. Bergabunglah dengan Jaringan Kepercayaan Alumni theCUBEtempat para pemimpin teknologi terhubung, berbagi intelijen, dan menciptakan peluang.

15 juta+ pemirsa video CUBEmendukung percakapan seputar AI, cloud, keamanan siber, dan banyak lagi
11.4k+ alumni CUBE — Terhubung dengan lebih dari 11.400 pemimpin teknologi dan bisnis yang membentuk masa depan melalui jaringan unik berbasis tepercaya.

Tentang Media SiliconANGLE

SiliconANGLE Media adalah pemimpin yang diakui dalam inovasi media digital, yang menyatukan teknologi terobosan, wawasan strategis, dan keterlibatan audiens secara real-time. Sebagai perusahaan induk dari SiliconANGLE, theCUBE Network, theCUBE Research, CUBE365, theCUBE AI dan theCUBE SuperStudios — dengan lokasi utama di Silicon Valley dan New York Stock Exchange — SiliconANGLE Media beroperasi di persimpangan antara media, teknologi, dan AI.

Didirikan oleh visioner teknologi John Furrier dan Dave Vellante, SiliconANGLE Media telah membangun ekosistem dinamis merek media digital terkemuka di industri yang menjangkau 15+ juta profesional teknologi elit. TheCUBE AI Video Cloud milik kami yang baru menjadi terobosan dalam interaksi audiens, memanfaatkan jaringan saraf theCUBEai.com untuk membantu perusahaan teknologi membuat keputusan berdasarkan data dan tetap menjadi yang terdepan dalam percakapan industri.

Ledakan memori konteks menghantam dinding penyimpanan

Anthropic dilaporkan mengakuisisi startup AI medis Coefisien Bio seharga $400M+

Anthropic PBC dilaporkan telah mengakuisisi Coefisien Bio Inc., penyedia perangkat lunak kecerdasan buatan untuk peneliti medis.

Setengah dari saham startup tersebut dimiliki oleh perusahaan modal ventura yang berfokus pada layanan kesehatan bernama Dimension. Dana tersebut memberi tahu investor tentang akuisisi tersebut melalui surat diterbitkan hari ini oleh jurnalis Eric Newcomer. Menurut dokumen tersebut, Anthropic membayar lebih dari $400 juta dalam bentuk saham untuk perusahaan tersebut.

Koefisien didirikan sekitar delapan bulan lalu oleh sekelompok mantan eksekutif dan peneliti farmasi. Menurut Newcomer, perusahaan mengembangkan model AI yang dioptimalkan untuk penelitian biologi. Di sebuah postingan bulan Januari di X, salah satu pendiri perusahaan menyatakan bahwa teknologi perusahaan akan “mengubah segalanya tentang cara industri belajar dan mengambil keputusan.” Hal ini mengisyaratkan bahwa model Coefisien dibuat untuk mengotomatisasi tugas-tugas penelitian yang berdampak tinggi.

Salah satu alur kerja penelitian medis terpenting yang diterapkan AI oleh startup adalah penemuan molekul kecil. Molekul kecil adalah bahan penyusun biologis berukuran sekitar satu nanometer yang menjadi dasar sebagian besar obat-obatan. Manas AI Inc., sebuah startup yang aktif di bidang tersebut, perkiraan AI dapat mempercepat aspek tertentu dari alur kerja penemuan hingga 100 kali lipat.

Salah satu cara peneliti menentukan apakah suatu molekul kecil memiliki aplikasi terapeutik adalah dengan memeriksa kemampuannya untuk menempel pada patogen. Jika molekul kecil tidak dapat menempel pada patogen, maka ia tidak dapat menetralisirnya. Proses evaluasi memakan waktu karena molekul biologis secara teratur mengubah bentuknya, yang berarti permukaan dockingnya juga berubah. AI dapat mempercepat tugas.

Startup juga menerapkan teknologi ini pada banyak tugas penelitian klinis lainnya. Bioptimus Inc., misalnya, punya dilepaskan model transformator yang memudahkan mempelajari biomarker. Itu adalah molekul yang dapat digunakan untuk mendiagnosis penyakit dan mengukur efektivitas pengobatan. Para pemain terbesar di industri teknologi juga ikut serta dalam persaingan dengan model AI mempercepat tugas seperti memetakan sifat-sifat protein.

Keputusan Anthropic untuk mengakuisisi startup AI yang berfokus pada layanan kesehatan tidak sepenuhnya mengejutkan. Tahun lalu, perusahaan diperkenalkan bundel fitur yang meningkatkan kemampuan Claude untuk mengotomatiskan tugas penelitian medis. Pada bulan Januari, itu ditambahkan integrasi dengan beberapa database klinis dan alat penelitian pihak ketiga.

Anthropic dapat menindaklanjuti pembaruan terkini yang berfokus pada layanan kesehatan dengan fitur-fitur yang ditujukan untuk para peneliti di bidang lain. Bulan lalu, perusahaan diluncurkan sebuah blog yang berfokus pada aplikasi ilmiah Claude. PBC Grup OpenAI baru-baru ini diungkapkan Rencana untuk meluncurkan “peneliti yang sepenuhnya otomatis” mungkin memberi Anthropic alasan lain untuk membangun fitur ilmiah baru.

Koefisien adalah perusahaan ketiga yang dibeli Anthropic dalam enam bulan terakhir. Itu sebelumnya diperoleh startup otomatisasi tugas Vercept Inc. dan pengembang Bun, alat sumber terbuka populer untuk membangun aplikasi JavaScript.

Gambar: Antropis

15 juta+ pemirsa video CUBEmendukung percakapan seputar AI, cloud, keamanan siber, dan banyak lagi
11.4k+ alumni CUBE — Terhubung dengan lebih dari 11.400 pemimpin teknologi dan bisnis yang membentuk masa depan melalui jaringan unik berbasis tepercaya.

Tentang Media SiliconANGLE

Anthropic dilaporkan mengakuisisi startup AI medis Coefisien Bio seharga $400M+

Tren serangan AI membentuk kembali keamanan siber di RSAC 2026

Tema pertemuan RSAC tahun ini di San Francisco adalah “Kekuatan Komunitas.” Berdasarkan presentasi dan dialog yang berlangsung selama empat hari, komunitas keamanan siber semakin mandiri dan rentan terhadap serangan AI.

Hasil survei yang diberikan kepada SiliconANGLE dari Enterprise Technology Research menunjukkan bahwa ketika organisasi beralih ke sistem kebersihan yang lebih ketat dan lapisan perlindungan yang lebih mendalam, AI menjadi bagian utama dari platform perusahaan, seringkali dengan mengorbankan investasi cloud. Namun, adopsi agen AI juga bergerak lebih cepat dibandingkan kemampuan organisasi untuk mengendalikannya, dan serangan yang dihasilkan AI menambah lapisan kompleksitas baru pada gambaran keamanan yang sudah menantang.

“Ini pertama kalinya kami melihat perlindungan LLM dan gen AI menjadi pemain nomor satu. Keamanan cloud telah menjadi pemain nomor satu selama dua tahun terakhir,” menurut Erik Bradley, kepala strategi dan direktur riset di Enterprise Technology Research, dalam analisisnya di theCUBE, studio streaming langsung SiliconANGLE Media. “Saya tidak berpikir ada orang yang memiliki menara kendali saat ini. Saya pikir itu akan menjadi sebuah perpaduan. Itu sebabnya saya terus mengatakan kedalaman pertahanan. Ini adalah istilah yang biasa kami gunakan 10, 20 tahun yang lalu dan saya pikir sekarang lebih penting daripada sebelumnya.”

Bradley dan pakar industri lainnya bergabung dengan Jon Oltsik, Christophe Bertrand, dan Dave Vellante dari CUBE Research selama Konferensi RSAC 2026 untuk memberikan komentar eksklusif tentang bagaimana keamanan perusahaan dibentuk ulang oleh fragmentasi identitas, ancaman otonom, dan sistem AI. (* Pengungkapan di bawah.)

Berikut analisis video lengkap theCUBE bersama Erik Bradley dan Dave Vellante:

Berikut tiga wawasan yang mungkin Anda lewatkan:

Wawasan #1: Dunia lateral akan memainkan peran penting dalam bertahan melawan serangan AI, dan ketahanan dunia maya kini menuntut pertahanan bertenaga AI dengan kecepatan mesin.

Beberapa serangan keamanan siber yang paling merusak dapat terjadi ketika pelaku ancaman berhasil menembus bagian jaringan yang tidak dijaga dengan baik dan kemudian menggunakan akses tersebut untuk bernavigasi secara lateral di seluruh sistem TI.

Paparan inilah yang ditangani oleh Broadcom Inc., melalui kerangka penerapan preskriptif empat langkah, dan kontrol yang diposisikan lebih dekat dengan beban kerja. Kuncinya adalah melakukan penegakan hukum, pencegahan dan mitigasi – bukan hanya deteksi – menurut Prashant Gandhi (gambar, kiri), wakil presiden produk untuk divisi jaringan aplikasi dan keamanan di Broadcom.

“Jika Anda benar-benar melihat serangan apa pun yang disebabkan oleh AI, pada akhirnya yang terjadi adalah perimeter dilanggar, penyerang masuk, mendarat di aset dengan perlindungan lemah, lalu bergerak ke samping,” jelas Gandhi saat wawancara dengan theCUBE. “Penyebaran lateral adalah tempat kita masuk, karena kita memasang perangkap di dunia lateral, dan di sanalah kita tidak mendorong rasa percaya.”

Organisasi-organisasi sedang bergulat dengan kenyataan baru di mana serangan terjadi jauh lebih cepat. Laporan “M-Trends 2026” Google Mandiant mendokumentasikan bahwa waktu rata-rata dari akses awal penyerang hingga meneruskan tindakan lebih lanjut ke serangkaian tindakan ancaman sekunder telah turun dari delapan jam menjadi hanya 22 detik. Respons yang hanya dilakukan oleh manusia sudah tidak mungkin lagi dilakukan.

“Waktu diukur dalam hitungan detik dan menit,” kata Francis deSouza, chief operating officer dan presiden produk keamanan di Google Cloud, dalam percakapan dengan theCUBE. “Tidak mungkin memasang pertahanan yang hanya dilakukan oleh manusia terhadap serangan AI. Model lama yang menggunakan pertahanan manusia atau pertahanan human-in-the-loop harus benar-benar berubah. Sekarang yang kita lihat terutama adalah pertahanan agen – menggunakan AI untuk melawan AI – sehingga Anda dapat bergerak dengan kecepatan mesin juga, dan Anda dapat meminta manusia mengawasi prosesnya, membuat pagar pembatas, membuat kebijakan dan strategi, serta memantau apa yang terjadi.”

Berikut video wawancara lengkap theCUBE dengan Prashant Gandhi dan Umesh Mahajan (gambar, kanan) dari Broadcom:

Wawasan #2: Ancaman kuantum semakin mendekati perusahaan, dan inilah saatnya untuk mengambil langkah menuju perlindungan bawaan.

Kemampuan komputasi kuantum untuk secara cepat mendekripsi algoritma yang telah melindungi sistem penting selama beberapa dekade mungkin akan segera memaksa perusahaan untuk mengadopsi serangkaian tindakan pencegahan baru, menurut Mark Hughes, mitra pengelola global layanan keamanan siber di IBM Corp. Satu-satunya pertanyaan sekarang adalah berapa banyak waktu yang tersedia sebelum perlindungan perlu dilakukan.

“Saran pertama saya adalah jangan panik, karena ada banyak hal yang sudah kita ketahui bagaimana melakukannya, yang secara intrinsik mendasari penggunaan AI yang aman dan diperkenalkannya AI ke dalam perusahaan. Namun terlepas dari 'jangan panik', hal ini tetap 'sibuk dan bergerak sangat cepat,'” kata Hughes kepada theCUBE. “Prinsipnya sama [around governance and deployment] dapat diterapkan dalam hal cara kami melakukan hal tersebut dengan AI dan cara Anda menerapkannya dalam perusahaan, namun kami perlu mempercepatnya.”

Hughes percaya bahwa hikmah dari ancaman kuantum ini adalah bahwa hal ini akan mendorong perusahaan untuk menjadi lebih disiplin dalam pengelolaan sertifikat, kunci, dan alur kerja kriptografi yang lebih luas. Hal ini juga dapat menghilangkan hambatan yang semakin besar dalam penerapan AI karena banyaknya pekerjaan yang diperlukan tidak dapat dilakukan oleh manusia saja.

IBM telah mengembangkan empat algoritme tahan kuantum, dan Institut Standar dan Teknologi Nasional Departemen Perdagangan AS telah merilis tiga standar enkripsi pasca-kuantum pertama yang telah diselesaikan untuk diadopsi oleh organisasi.

“Mengorganisir kriptografi saat ini sangatlah penting – bukan hanya karena peristiwa kuantum, meskipun hal ini mutlak diperlukan,” kata Hughes. “Anda harus melakukan hal itu sekarang sehingga kita dapat mencapai apa yang kami jelaskan di IBM [as] 'kelincahan kripto', yang mana kami beralih dari cara kami mengelola ruang bawah tanah secara tradisional, yaitu ruang bawah tanah yang dikodekan secara keras. Ini berhasil, dan berhasil dengan sangat baik bagi kami, namun hal itu tidak relevan lagi di lingkungan saat ini.”

Berikut video wawancara lengkap theCUBE dengan Mark Hughes dari IBM:

Wawasan #3: Agen AI mentransformasi saluran identitas dan membantu menutup kesenjangan keterampilan dalam keamanan siber.

Kepercayaan nol (zero trust) adalah salah satu prinsip penting dalam sistem perusahaan, dan prinsip ini berhasil dengan baik jika melibatkan perilaku manusia. Namun, pengenalan agen AI ke dalam proses kerja umum telah mengubah sifat identitas, di mana setiap tindakan kini perlu disahkan secara real-time berdasarkan konteks nyata.

Untuk mengatasi dinamika baru ini, penyedia keamanan akses perusahaan Ping Identity Inc. telah meluncurkan platform Identity for AI yang dirancang untuk meningkatkan visibilitas agen di seluruh lingkungan guna memastikan mereka tidak beroperasi di luar batas untuk tugas tertentu.

“Dengan adanya agen yang bertindak dalam sistem kami, tidak ada konsekuensi yang setara untuk sesuatu yang kami anggap… merugikan perusahaan,” kata Andre Durand, pendiri dan CEO Ping Identity, saat tampil di theCUBE. “Oleh karena itu, pagar pembatas harus diperketat.”

Meskipun diperlukan kontrol yang lebih ketat, agen AI terbukti menjadi solusi di saat yang tepat bagi industri keamanan siber. Menurut “Studi Tenaga Kerja Keamanan Siber ISC2” tahun 2025, industri keamanan siber mengalami kekurangan tenaga kerja profesional secara global pada tahun lalu.

Kemampuan untuk memindahkan tugas-tugas “tingkat satu” seperti triase phishing ke agen AI akan memungkinkan para profesional keamanan mendapatkan kembali ratusan jam setiap bulan dan fokus pada upaya pencegahan ancaman, menurut Scott Woodgate, manajer umum untuk perlindungan ancaman di Microsoft Corp.

“Agen memberikan peluang nyata untuk membawa otomatisasi ke tingkat berikutnya dan secara mendasar meningkatkan keterampilan peran yang dimiliki orang-orang sehingga [the] kesenjangan lapangan kerja sebenarnya dapat diisi melalui kemitraan antara masyarakat dan agen,” kata Woodgate kepada theCUBE.

Berikut video wawancara lengkap theCUBE dengan Andre Durand dari Ping Identity:

Untuk menyaksikan lebih banyak liputan theCUBE tentang RSAC 2026, berikut playlist video lengkap kami:

https://www.youtube.com/watch?v=videoseries

(* Pengungkapan: TheCUBE adalah mitra media berbayar untuk Konferensi RSAC 2026. Sponsor liputan acara theCUBE tidak memiliki kendali editorial atas konten di theCUBE atau SiliconANGLE.)

Foto: SiliconANGLE

15 juta+ pemirsa video CUBEmendukung percakapan seputar AI, cloud, keamanan siber, dan banyak lagi
11.4k+ alumni CUBE — Terhubung dengan lebih dari 11.400 pemimpin teknologi dan bisnis yang membentuk masa depan melalui jaringan unik berbasis tepercaya.

Tentang Media SiliconANGLE

Tren serangan AI membentuk kembali keamanan siber di RSAC 2026

Deepfakes dan malware: Menu AI menjadi lebih panjang bagi pelaku ancaman, sehingga menyulitkan para pembela HAM

Kecerdasan buatan telah meningkatkan sejumlah teknologi secara signifikan dalam waktu singkat. Sayangnya, teknologi ini juga dimanfaatkan oleh berbagai pelaku jahat.

Salah satu contoh bagaimana hal ini menjadi masalah yang signifikan dapat ditemukan dalam bidang phishing suara yang sedang berkembang, penipuan berbasis telepon atau video dimana penyerang menyamar sebagai manusia yang dipercaya. Perangkat lunak pengubah suara AI real-time tersedia secara gratis di repositori sumber terbuka di GitHub, dan peneliti keamanan terkejut melihat betapa efektifnya alat ini.

Tom Cross dari GetReal Security berbicara tentang pengaturan ulang kredensial selama Cyphercon.

Ada anggapan bahwa biometrik suara akan membantu mengidentifikasi mana yang palsu dan mana yang asli. Namun, hal tersebut belum tentu terjadi, menurut Tom Cross, kepala penelitian ancaman di GetReal Security Inc., yang secara pribadi telah menguji alat pengubah suara AI terbaru.

“Tidak hanya terdengar seperti saya, tetapi juga terdengar seperti saya pada biometrik suara tercanggih yang pernah kami coba,” kata Cross. “Orang-orang tidak memahami apa yang mungkin terjadi saat ini.”

Penargetan pengaturan ulang kredensial

Cross mempresentasikan hasil penelitiannya di Cyphercon, sebuah pertemuan minggu ini di Milwaukee yang terdiri dari para peneliti keamanan siber dan kepala petugas keamanan informasi. Acara ini memberikan pandangan masyarakat mengenai apa yang dilihat oleh beberapa pakar keamanan terkemuka di negara ini dalam lanskap ancaman yang terus berkembang.

Ini bukan gambaran yang bagus. Cross merinci hasil karyanya baru-baru ini untuk menilai serangan baru-baru ini terhadap siklus hidup kredensial, dan mencatat bahwa AI telah memicu peningkatan nyata dalam alat suara dan wajah yang menipu.

Penyetelan ulang kredensial saat ini merupakan metode utama yang digunakan oleh pelaku kejahatan, sebuah tren yang diperburuk oleh kenyataan kerja jarak jauh yang disebabkan oleh pandemi Covid pada tahun 2020. Jika sebelumnya karyawan diharuskan hadir sendiri di kantor untuk membuktikan identitas mereka untuk proses kredensial ulang, era pascapandemi telah menyebabkan lebih banyak karyawan yang tidak pernah menginjakkan kaki di kantor sama sekali.

“Jumlah orang yang bekerja secara jarak jauh meningkat lebih dari dua kali lipat,” kata Cross. “Kami mengubah manusia menjadi kunci pribadi.”

Salah satu peretasan paling signifikan yang melibatkan pengaturan ulang kredensial terjadi pada tahun 2023 ketika MGM Resorts Inc. dan Caesars Entertainment Inc. terkena serangan ransomware. Eksploitasi tersebut, dilakukan oleh kelompok penjahat dunia maya yang dikenal sebagai Scattered Spider, menargetkan vendor teknologi informasi pihak ketiga melalui serangan rekayasa sosial yang membujuk teknisi meja layanan untuk mengatur ulang faktor otentikasi untuk pengguna dengan hak istimewa tinggi.

Cross memperingatkan bahwa alat berbasis AI memudahkan penjahat dunia maya untuk menghasilkan serangan rekayasa sosial yang meyakinkan, serupa dengan eksploitasi yang menghancurkan mesin slot dan sistem reservasi di Las Vegas tiga tahun lalu. Dia merekomendasikan sejumlah teknik pengendalian agar organisasi dapat menerapkannya sesegera mungkin. Hal ini termasuk mengharuskan persetujuan dari dua karyawan pusat bantuan untuk mengatur ulang kredensial, melakukan panggilan konferensi video dengan pemohon yang melarang latar belakang virtual atau pemburaman, dan memiliki manajer di bagan organisasi yang dapat bergabung dalam panggilan atau menjamin mereka.

“Mereka memilih karyawan yang bekerja di bidang IT, orang tersebut memiliki hak admin super,” kata Cross. “Tidak diperlukan banyak informasi dibandingkan informasi yang tersedia untuk umum untuk menargetkan proses ini.”

Memanfaatkan alat video deepfake

Persenjataan alat deepfake AI yang semakin berkembang juga meluas ke video. Gelombang penipuan “penangkapan digital” saat ini sedang melanda India, menurut James McQuiggan, kepala teknologi informasi di Quilligence dan direktur pendidikan di Florida Cyber Alliance.

James McQuiggan dari Quilligence menjelaskan munculnya alat deepfake video AI kepada peserta di Cyphercon.

Dia menggambarkan bagaimana pelaku kejahatan sering menggunakan nomor telepon palsu untuk memberikan surat perintah palsu melalui saluran video WhatsApp. Video yang dihasilkan AI, dengan orang-orang yang dibuat secara digital meniru hakim sungguhan dalam beberapa kasus, muncul di layar pengguna dalam suasana ruang sidang yang dapat dipercaya dan mengancam penangkapan atas berbagai kejahatan kecuali jika pembayaran dilakukan.

“Mereka menyimpannya secara online sehingga mereka harus membayar atau mereka akan ditangkap,” kata McQuiggan. “Kami melihat penipuan penangkapan palsu terjadi di India dan negara-negara Asia lainnya. Saya tidak akan terkejut jika kita mulai melihat hal ini [in the U.S.] dalam enam bulan ke depan atau bahkan lebih cepat.”

Kemajuan pesat dalam alat video AI tidak diragukan lagi akan mempermudah pelaku ancaman. McQuiggan mendemonstrasikan video deepfake realistis berdurasi 30 detik yang dia buat dari pembicara sebelumnya di konferensi hari itu yang hanya membutuhkan waktu empat menit untuk diproduksi. Mungkin yang lebih mengejutkan adalah alat yang ia tunjukkan di atas panggung bernama Decart Video AI yang menggunakan kamera ponselnya untuk mengirimkan gerakan seluruh tubuh dalam aksi langsung. Itu adalah wajah dan tubuh orang lain dalam video tersebut.

“Membuat deepfake ini tidak membutuhkan banyak usaha, terutama jika Anda sudah memiliki layanannya,” kata McQuiggan kepada audiens Cyphercon. “Beberapa harganya hanya beberapa dolar.”

Malware yang mengkode sendiri muncul

Meskipun deepfake adalah manifestasi nyata dari bagaimana aktor jahat menggunakan AI untuk meningkatkan permainan mereka, para peneliti ancaman juga memperingatkan adanya perangkat lunak baru yang beroperasi secara diam-diam dalam bayang-bayang digital.

Malware AI polimorfik mulai muncul dalam serangan otonom dan adaptif, menurut laporan ancaman terbaru dari Google Mandiant. Malware ini menggunakan antarmuka pemrograman aplikasi model AI untuk menghasilkan kode berbahaya sesuai permintaan selama eksekusi, dengan kemampuan untuk mengubah tanda tangan dan perilakunya untuk menghindari sistem deteksi tradisional berbasis tanda tangan.

Peneliti Google Mandiant telah menemukan versi malware dalam serangan yang didukung pemerintah Rusia terhadap Ukraina. Dalam presentasi tentang AI polimorfik, peneliti keamanan Stephen Sam mengatakan bahwa meskipun malware ini memiliki kemampuan yang tidak biasa untuk memodifikasi dirinya sendiri “tepat pada waktunya”, malware tersebut tetap harus mengikuti aturan dasar pemrograman yang pada akhirnya memungkinkan penemuan.

“Baca-tulis yang persisten dalam memori yang tidak didukung oleh file adalah sebuah senjata api,” kata Sam. “Bahkan malware yang menulis sendiri pada akhirnya harus menyentuh disk. Kita berada dalam perlombaan senjata, namun hal ini bukan berarti tidak ada harapan. Para pengubah bentuk itu cepat dan cerdas, namun mereka tetap harus mengikuti aturan yang tidak dapat diubah.”

Tantangan yang dihadapi para profesional keamanan siber saat ini adalah bahwa meskipun protokol pengkodean mungkin memaksa beberapa pelaku ancaman untuk bertindak sesuai aturan, mereka kemungkinan besar tidak akan melakukan hal tersebut dalam jangka panjang, dan mereka kini memiliki akses ke serangkaian alat AI yang canggih untuk membuat hidup para pembela HAM menjadi lebih sulit. Hal ini pada akhirnya dapat menyebabkan perubahan dalam cara pandang keamanan, di mana para praktisi tidak lagi berpikir seperti pembela HAM dan lebih berpikir seperti peretas.

“Hacker CISO” Mishaal Khan menyampaikan keynote tentang intelijen sumber terbuka di Cyphercon di Milwaukee.

Contoh dari pola pikir ini dapat dilihat dalam karier Mishaal Khan, yang menyebut dirinya sebagai “Hacker CISO” yang telah membangun reputasi sebagai peretas etis untuk membantu orang lain dengan menggunakan informasi yang tersedia secara online. Pendekatan Khan, yang dikenal sebagai OSINT atau Open-Source Intelligence, telah berperan dalam penyelesaian peretasan seperti pelanggaran aplikasi parkir tanpa uang tunai ParkMobile, dan penyelidikan yang lebih kecil telah mengungkap kedok penguntit, pemerkosa seks, dan orang-orang di balik ancaman bom online.

Dalam pidato utamanya di Cyphercon minggu ini, Khan menggambarkan sebuah filosofi yang mungkin terbukti menjadi jalan ke depan bagi banyak orang yang berupaya memerangi musuh bersenjata AI yang mengepung jaringan dan warga negara saat ini.

“Banyak remah roti di internet yang membuat profil tentang Anda,” kata Khan. “Saya merasa saya memberdayakan dan mempersenjatai orang untuk menggunakan keterampilan mereka untuk berbuat baik. Kita memikul banyak tanggung jawab untuk melakukan sesuatu dengan benar. Ini adalah tugas besar. Segala sesuatunya berubah dengan cepat dan kita perlu bergerak sesuai dengan itu.”

Gambar: SiliconANGLE/ObrolanGPT

15 juta+ pemirsa video CUBEmendukung percakapan seputar AI, cloud, keamanan siber, dan banyak lagi
11.4k+ alumni CUBE — Terhubung dengan lebih dari 11.400 pemimpin teknologi dan bisnis yang membentuk masa depan melalui jaringan unik berbasis tepercaya.

Tentang Media SiliconANGLE

Deepfakes dan malware: Menu AI menjadi lebih panjang bagi pelaku ancaman, sehingga menyulitkan para pembela HAM

Laporan: Startup chip Edge AI Hailo akan go public melalui merger SPAC

Pembuat chip Hailo Technologies Ltd. dilaporkan sedang bersiap untuk mencatatkan sahamnya melalui merger dengan perusahaan akuisisi bertujuan khusus.

Calcalist mengungkapkan rencana tersebut hari ini, mengutip pengajuan peraturan dari investor Hailo, Delek Automotive. Penawaran ini dilaporkan dirancang untuk menopang keuangan pembuat chip tersebut di tengah “kebutuhan mendesak akan likuiditas.” Hailo memberhentikan hampir 10% tenaga kerjanya pada bulan Januari dan mengambil pinjaman $9 juta pada waktu yang hampir bersamaan.

Perusahaan, yang membuat chip kecerdasan buatan untuk perangkat yang terhubung, bernilai $1,2 miliar pada tahun 2024. Pengajuan peraturan Delek menunjukkan bahwa rencana pencatatan saham akan mengurangi penilaian Hailo menjadi di bawah $500 juta.

SPAC adalah sarana investasi yang dibuat dengan tujuan membawa bisnis lain ke publik. Bekerja sama dengan perusahaan semacam itu memberikan jalur yang lebih cepat menuju pasar publik dibandingkan pencatatan tradisional. Hal ini juga menghilangkan kebutuhan bagi startup untuk menyelenggarakan roadshow, serangkaian acara yang dirancang untuk menarik investor institusi.

Chip Hailo digunakan pada kamera, robot industri, dan berbagai perangkat lainnya. Mereka didasarkan pada desain yang digambarkan perusahaan sebagai arsitektur aliran data berbasis struktur. Hailo mengatakan bahwa teknologi ini dapat menjalankan beban kerja inferensi dengan lebih efisien dibandingkan pendekatan pemrosesan pesaing.

Neuron buatan jaringan saraf disusun menjadi kelompok yang disebut lapisan. Lapisan pertama melakukan perhitungan awal yang terlibat dalam menjawab perintah AI dan mengirimkan hasilnya ke lapisan kedua untuk diproses lebih lanjut. Lapisan kedua tersebut menyelesaikan rangkaian perhitungan kedua, membagikan hasilnya dengan lapisan ketiga dan seterusnya.

Setiap lapisan berjalan pada bagian berbeda dari prosesor perangkat host. Arsitektur aliran data berbasis struktur Hailo menempatkan lapisan pada bagian chip yang berdekatan, sehingga mengurangi jarak yang harus ditempuh data saat berpindah di antara keduanya. Mengurangi pergerakan data akan mengurangi latensi pemrosesan dan penggunaan daya.

Salah satu chip tercanggih Hailo, Hailo-10H, dapat melakukan 40 triliun kalkulasi per detik saat memproses data INT4. Ia menggunakan daya sekitar 2,5 watt dan dapat menahan suhu hingga 221 derajat Fahrenheit. Hailo juga menawarkan beberapa chip yang dioptimalkan khusus untuk kamera bersama dengan kartu PCIe yang dapat dipasang ke server.

Perusahaan mengirimkan chipnya dengan seperangkat alat perangkat lunak yang dirancang untuk memudahkan proyek AI pelanggan. Ada runtime yang disebut HailoRT yang dapat menghubungkan hingga 16 perangkat Hailo ke dalam sebuah cluster inferensi. Selain itu, Hailo menawarkan serangkaian model AI terlatih yang dioptimalkan untuk dijalankan pada chipnya.

Calcalist tidak merinci SPAC yang akan menjadi mitra perusahaan dalam pencatatannya atau jumlah pendanaan yang diharapkan dapat dikumpulkan. Namun, laporan tersebut menyatakan bahwa Hailo berencana untuk melepas sahamnya dalam beberapa bulan mendatang di bursa AS.

Gambar: Halo

15 juta+ pemirsa video CUBEmendukung percakapan seputar AI, cloud, keamanan siber, dan banyak lagi
11.4k+ alumni CUBE — Terhubung dengan lebih dari 11.400 pemimpin teknologi dan bisnis yang membentuk masa depan melalui jaringan unik berbasis tepercaya.

Tentang Media SiliconANGLE

Laporan: Startup chip Edge AI Hailo akan go public melalui merger SPAC