Uncategorized - Hardware Dan SoftWare Komputer

Generalist merilis model dasar AI kecerdasan robotik GEN-1 yang berkemampuan tinggi

[ad_1]

Startup kecerdasan buatan Generalis AI Inc.sebuah startup yang berfokus pada perwujudan kecerdasan robotika, telah merilis GEN-1model dasar yang sangat mumpuni untuk pembelajaran robot dan penguasaan tugas fisik.

Model baru, yang memulai debutnya pada hari Jumat, tiba hanya lima bulan setelah perusahaan tersebut meluncurkan GEN-0model dasar robotika kelas baru yang memungkinkan perusahaan melatih model AI dengan melatih langsung data pergerakan mentah.

Menurut perusahaan, GEN-1 mewakili lompatan maju yang luar biasa dalam kecerdasan robotik. Hal ini memungkinkan mesin menguasai tugas dengan cepat, belajar dari interaksi, bereaksi dengan cepat, dan mengatasi tantangan dengan kecepatan yang belum pernah ada sebelumnya. Pada banyak tugas, tingkat keberhasilannya melebihi 99%. Ia juga dapat menjalankan tugas hampir tiga kali lebih cepat dibandingkan model tercanggih saat ini dan pulih dari gangguan lebih cepat.

Para peneliti mengatakan mereka berupaya meningkatkan tiga bidang inti: keandalan, kecepatan, dan improvisasi.

Meskipun sebagian besar model sudah dapat mengulangi tugas di dunia nyata dengan andal, model tersebut terbatas pada gerakan berulang yang spesifik pada tugas, dan mengalami pengurangan kompleksitas karena melakukan tindakan yang lebih sederhana. GEN-1 dirancang untuk mengelola tugas-tugas langkah demi langkah yang lebih panjang, seperti merakit barang, melipat beberapa potong cucian, dan tugas-tugas lain yang membutuhkan pemikiran rumit dari waktu ke waktu dan ruang tanpa menjadi bingung.

Kecepatan juga sering menjadi masalah dalam robotika, yang sering kali melambat ketika terlalu banyak objek yang terlihat atau bergerak terlalu cepat. Salah satu masalah bagi sebagian besar model adalah menghadirkan apa yang dilihatnya ke mesin penalaran dengan cukup cepat, menerjemahkan visi ke bahasa, dan data pelatihan. Hal ini sering kali memperlambat gerakan, yang dapat menyebabkan jeda dan kegagapan. Seperti disebutkan di atas, tim berhasil mempercepat hampir tiga kali lipat, sehingga menghasilkan gerakan yang lebih lancar.

Misalnya, model tersebut dapat merakit sebuah kotak dalam waktu sekitar 12,1 detik, menurut perusahaan, ini sekitar 2,8 kali lebih cepat daripada model tercanggih terdekat di industri. GEN-0 dan pi-0, model kecerdasan robotika terkenal lainnya dari Physical Intelligence, membutuhkan waktu 34 detik untuk membuat kotak yang sama.

Kedua inovasi ini selaras dengan hasil ketiga, yang paling penting: kemampuan pulih dari gangguan, belajar dari perubahan lingkungan, kesalahan, dan perubahan. Dalam istilah manusia, ini adalah improvisasi.

Ketika sesuatu tidak sepenuhnya masuk akal, ada bagian yang keluar dari lubang, kotak meleset dari sasarannya, atau pintu tidak terkunci, manusia biasanya kembali dan menyelesaikan tindakan tersebut. AI dapat menimbulkan berbagai reaksi berbeda, termasuk penilaian ulang yang dipaksakan, kerusakan pola, atau kegagalan menyelesaikan tugas. Bahkan mungkin tidak ingat bagaimana harus bereaksi terhadap peristiwa yang sama di masa depan. Manusia akan melakukannya.

Para peneliti mengatakan bahwa GEN-1 dapat bereaksi secara kreatif terhadap faktor-faktor ini dengan cepat beradaptasi terhadap “gangguan” di lingkungan, seperti benda tergelincir, kait rusak, benda berubah bentuk, atau benda tidak berjalan sesuai rencana. Ia akan mendekati sesuatu dari sudut yang berbeda, menyesuaikan pemikirannya dan mencoba pola yang berbeda sampai sesuatu berhasil.

Contoh klasiknya adalah melipat baju. Membuat kain sesuai dengan keinginan Anda tidak selalu mudah – kain bisa terjatuh, menggulung, melengkung, dan kusut. Kadang-kadang bajunya bahkan terbalik. Ketika situasi ini terjadi, AI akan beradaptasi dengan cepat untuk memperbaiki kekacauan dan menanganinya tanpa menimbulkan masalah yang lebih buruk.

Para peneliti mengatakan model tersebut merencanakan dan mengatasi pelatihannya dengan cara yang tidak sekaku data pelatihannya. Dengan kata yang lebih manusiawi: Ia berpikir di luar kotak.

Meskipun para peneliti di Generalist mengatakan hal-hal menarik tentang GEN-1, mereka menambahkan bahwa tidak semua tugas mencapai tingkat keberhasilan 99%. Beberapa tugas rumit tidak dapat mencapai standar ambisius tersebut, terutama pada kecepatan dan keandalan yang wajar agar berguna dalam situasi sehari-hari.

Gambar: AI Generalis

Dukung misi kami untuk menjaga konten tetap terbuka dan gratis dengan terlibat dalam komunitas CUBE. Bergabunglah dengan Jaringan Kepercayaan Alumni theCUBEtempat para pemimpin teknologi terhubung, berbagi intelijen, dan menciptakan peluang.

15 juta+ pemirsa video CUBEmendukung percakapan seputar AI, cloud, keamanan siber, dan banyak lagi
11.4k+ alumni CUBE — Terhubung dengan lebih dari 11.400 pemimpin teknologi dan bisnis yang membentuk masa depan melalui jaringan unik berbasis tepercaya.

Tentang Media SiliconANGLE

SiliconANGLE Media adalah pemimpin yang diakui dalam inovasi media digital, yang menyatukan teknologi terobosan, wawasan strategis, dan keterlibatan audiens secara real-time. Sebagai perusahaan induk dari SiliconANGLE, theCUBE Network, theCUBE Research, CUBE365, theCUBE AI dan theCUBE SuperStudios — dengan lokasi utama di Silicon Valley dan New York Stock Exchange — SiliconANGLE Media beroperasi di persimpangan antara media, teknologi, dan AI.

Didirikan oleh visioner teknologi John Furrier dan Dave Vellante, SiliconANGLE Media telah membangun ekosistem dinamis merek media digital terkemuka di industri yang menjangkau 15+ juta profesional teknologi elit. TheCUBE AI Video Cloud milik kami yang baru menjadi terobosan dalam interaksi audiens, memanfaatkan jaringan saraf theCUBEai.com untuk membantu perusahaan teknologi membuat keputusan berdasarkan data dan tetap menjadi yang terdepan dalam percakapan industri.

[ad_2]

Generalist merilis model dasar AI kecerdasan robotik GEN-1 yang berkemampuan tinggi

Q-Factor hadir dengan pendanaan sebesar $24 juta dan taruhan besar berikutnya untuk mencapai keunggulan komputasi kuantum

[ad_1]

Startup komputasi kuantum yang berbasis di Tel Aviv, Q-Factor, mengumumkan dirinya kepada dunia hari ini setelah menyelesaikan putaran pendanaan awal senilai $24 juta.

Misi perusahaan adalah mengembangkan komputer kuantum berbasis atom netral yang dapat mencapai skala satu juta qubit atau lebih. Putaran kelebihan permintaan hari ini dipimpin oleh NFX dan TPY Capital, dan diikuti oleh Intel Capital, Korea Investment Partners, Deep33, dan keluarga Matias. Dana juga disediakan oleh Otoritas Inovasi Israel melalui hibah, serta Institut Teknologi Technion Israel dan Institut Sains Weizmann.

Q-Factor menangani masalah penskalaan “qubit”, yang merupakan unit dasar komputasi dalam mesin kuantum. Komputer kuantum diperkirakan telah ada selama bertahun-tahun dan menjanjikan revolusi di bidang-bidang seperti penemuan obat, prakiraan cuaca, dan pemodelan keuangan, namun kemajuan industri ini masih sangat lambat. Saat ini, komputer kuantum paling kuat yang beroperasi saat ini hanya memiliki beberapa ratus atau ribuan qubit, namun mereka perlu ditingkatkan hingga jutaan agar benar-benar berguna.

Untuk melewati “dinding” penskalaan ini, Q-Factor bertaruh pada pendekatan yang disebut atom netral, di mana setiap atom terperangkap dan dimanipulasi oleh sinar laser, yang sering disebut sebagai “penjepit optik”. Ini sangat berbeda dengan metode yang digunakan oleh pionir kuantum seperti IBM Corp. dan Google LLC, yang mengandalkan qubit superkonduktor yang harus dijaga pada suhu mendekati nol mutlak dan memerlukan infrastruktur kriogenik yang sangat mahal. Ini juga berbeda dari teknik “ion terperangkap” yang digunakan oleh IonQ Inc., yang berjuang mengatasi kemacetan kabel yang sangat rumit.

Sebaliknya, atom netral secara alami bersifat inert, yang berarti atom tersebut sangat stabil dan dapat mempertahankan “keadaannya” untuk jangka waktu yang lama. Q-Factor bukan satu-satunya perusahaan yang meneliti atom netral, namun sistem ini pun kesulitan untuk melampaui beberapa ratus qubit.

Sistem atom netral yang ada dibatasi oleh hambatan arsitektural yang membuatnya hampir tidak mungkin mengelola volume atom dan laser yang diperlukan untuk komputasi skala besar. Namun para pendiri Q-Factor yakin mereka telah menemukan cara untuk mengatasi masalah ini. Dengan memanfaatkan penelitian puluhan tahun terhadap fisika Rydberg dan atom ultradingin, mereka telah merancang sebuah sistem yang mereka klaim dapat diukur dengan mudah.

Mengatasi hambatan kuantum

Salah satu pendiri dan Kepala Eksekutif Guy Raz (gambar, kedua dari kanan) mengatakan penskalaan sistem berbasis atom netral merupakan tantangan karena kesulitan dalam mempertahankan kontrol yang tepat terhadap masing-masing qubit seiring dengan bertambahnya ukuran prosesor. Pada skala yang lebih besar, optik, kalibrasi, pembacaan, dan sumber daya yang diperlukan untuk menjaga semuanya tetap stabil menjadi sangat menuntut, dan arsitektur untuk melakukan semua ini tidak ada, jelasnya.

Raz mengatakan dia belum dapat mengungkapkan rincian pendekatan yang dilakukan perusahaan tersebut, namun mengatakan bahwa pihaknya fokus pada penskalaan atom netral pada tingkat arsitektur. “Daripada secara bertahap memperluas desain skala kecil saat ini dan mengandalkan interkoneksi kuantum, kami membangun arsitektur atom netral yang ditujukan untuk sistem yang jauh lebih besar sejak hari pertama,” katanya. “Kami yakin inilah yang diperlukan untuk beralih dari demonstrasi laboratorium ke mesin kuantum yang benar-benar berskala besar dan berguna.”

Salah satu tantangan utama dalam menjaga stabilitas kuantum adalah kebisingan dan “crosstalk,” atau risiko masing-masing qubit saling mengganggu, dan Q-Factor telah memberikan perhatian khusus terhadap masalah ini sejak awal, tambah Raz. “Koreksi kesalahan kuantum yang efisien merupakan bagian integral dari desain itu,” katanya. “Kami belum dapat membagikan implementasinya secara detail, namun intinya adalah kami menangani penskalaan pada tingkat arsitektural sehingga sistem dapat berkembang tanpa kehilangan kendali, ketepatan, atau kepraktisan.”

Mengejar keunggulan kuantum

Langkah Q-Factor selanjutnya adalah mengembangkan penelitian laboratoriumnya dan membuat prototipe fungsional berskala besar dari arsitektur komputasi kuantum barunya. Dukungan dari Intel Capital bisa menjadi signifikan, karena perusahaan tersebut memiliki keahlian dalam manufaktur dan penskalaan perangkat keras eksperimental.

Pertanyaannya adalah apakah Q-Factor pada akhirnya akan memberikan apa yang disebut “keunggulan kuantum”, yaitu titik di mana mesin kuantum mencapai skala yang memungkinkannya melampaui kemampuan komputer klasik. Perusahaan-perusahaan seperti IBM, Google, IonQ dan banyak lainnya telah berjuang selama bertahun-tahun untuk mencapai tujuan ini, namun sejauh ini tidak berhasil.

Q-Factor kemungkinan akan kesulitan untuk melangkah lebih jauh, namun ada beberapa hal yang menguntungkannya. Salah satu alasannya adalah atom netral dikenal sebagai salah satu pendekatan yang paling menjanjikan untuk mencapai jumlah qubit yang lebih tinggi, karena atom netral tidak sekompleks sistem lain.

Selain itu, para pendirinya dianggap sebagai salah satu pakar fisika atom terkemuka di dunia. Misalnya, Raz adalah seorang ahli fisika dengan pengalaman 20 tahun dalam mengembangkan startup teknologi yang mendalam. Kepala Ilmuwan Ofer Firstenberg (kanan) adalah profesor di Institut Weizmann dan pakar optik kuantum dan atom Rydberg, sementara Nir Davidson (kiri) dianggap sebagai salah satu pakar atom ultradingin terkemuka di dunia, yang telah menerbitkan lebih dari 280 makalah tinjauan sejawat tentang topik tersebut. Terakhir, Yoav Sagi (kedua dari kiri), profesor di Technion, ahli dalam manipulasi atom netral.

Lisa Cohen dari Intel Capital mengatakan tim pendiri Q-Factor memiliki “pemahaman yang jelas” tentang apa yang diperlukan untuk membangun komputer kuantum yang layak secara komersial berdasarkan atom netral. “Mereka telah menyaksikan bidang ini berkembang, belajar dari tantangan yang dihadapi pihak lain, dan mengumpulkan keahlian yang tepat untuk mengatasi masalah tersulit yang tersisa dalam komputasi kuantum: skala,” katanya.

Foto: Faktor Q

15 juta+ pemirsa video CUBEmendukung percakapan seputar AI, cloud, keamanan siber, dan banyak lagi
11.4k+ alumni CUBE — Terhubung dengan lebih dari 11.400 pemimpin teknologi dan bisnis yang membentuk masa depan melalui jaringan unik berbasis tepercaya.

Tentang Media SiliconANGLE

[ad_2]

Q-Factor hadir dengan pendanaan sebesar $24 juta dan taruhan besar berikutnya untuk mencapai keunggulan komputasi kuantum

Cursor menyegarkan platform pengkodean getarannya dengan fokus pada agen AI

[ad_1]

Startup Cursor hari ini meluncurkan versi baru dari platform pengkodean kecerdasan buatan yang populer.

Rilis ini mencakup fitur-fitur yang akan memudahkan pengembang untuk mengotomatisasi tugas pemrograman menggunakan agen AI. Hal ini juga memperkenalkan perbaikan di bidang lain.

Cursor telah mengumpulkan dana lebih dari $3 miliar dari Nvidia Corp., Google LLC, dan pendukung terkemuka lainnya. Ini menyediakan editor kode yang menggunakan AI untuk mengotomatisasi tugas-tugas seperti membangun fitur aplikasi baru dan men-debug yang sudah ada. Alat ini didukung tidak hanya oleh model bahasa besar yang tersedia seperti Claude tetapi juga algoritma yang dikembangkan sendiri oleh Cursor.

Cursor 3, rilis platform baru yang memulai debutnya hari ini, menambahkan antarmuka chatbot. Hal ini memungkinkan pengembang untuk memasukkan deskripsi bahasa alami dari fitur yang ingin mereka bangun dan menentukan LLM yang harus melaksanakan tugas tersebut. Kursor 3 menghasilkan kode yang diminta bersama dengan video demo yang menunjukkan cara kerjanya.

Antarmuka chatbot baru menggunakan beberapa agen AI untuk menyelesaikan tugas yang ditentukan pengguna. Beberapa dari agen tersebut berjalan di cloud, sementara yang lain diinstal pada mesin lokal pengguna. Pengembang dapat mengelola kedua jenis agen secara terpusat melalui sidebar yang baru ditambahkan.

Agen berbasis cloud Cursor memiliki akses ke lebih banyak sumber daya perangkat keras dibandingkan yang berjalan di stasiun kerja. Hasilnya, sejumlah besar dari mereka dapat berjalan secara paralel untuk mempercepat tugas-tugas yang memakan waktu. Agen desktop lebih lambat, tetapi memungkinkan pengembang untuk membuka kode yang dihasilkan secara lokal, mengeditnya secara manual, dan menjalankan pengujian.

Kursor 3 memungkinkan pengguna untuk beralih di antara dua mode. Pengembang dapat meminta sekumpulan agen berbasis cloud untuk menghasilkan sepotong kode dan kemudian mengirimkannya ke agen berbasis desktop untuk pengeditan lokal. Cursor mengatakan bahwa Komposer 2, LLM yang dikembangkan secara internal yang memulai debutnya bulan lalu, sangat cocok untuk tugas-tugas tersebut. Model ini lebih hemat biaya dibandingkan beberapa LLM lain yang didukung oleh platform ini.

Saat pengembang menggunakan Kursor untuk mengedit antarmuka pengguna, mereka dapat mengaktifkan Mode Desain yang baru ditambahkan untuk mempercepat alur kerja. Fitur ini memungkinkan untuk memilih elemen antarmuka dan menambahkan teks bahasa alami yang menjelaskan cara mengubahnya. Agen AI Cursor secara otomatis menerapkan modifikasi yang diminta.

Platform ini menampilkan ikhtisar langkah demi langkah dari setiap tugas yang diselesaikannya. Kursor memberikan penjelasan bahasa alami untuk setiap sublangkah, menyoroti kesalahan apa pun yang mungkin muncul, dan memberikan tangkapan layar dari pekerjaannya. Pengembang dapat menyesuaikan alur kerja dengan mengetikkan masukan.

Kursor 3 juga memperkenalkan beberapa perbaikan lainnya. Menurut perusahaan, pintasan baru memungkinkan pengembang mengirim permintaan ke beberapa LLM dan memilih respons terbaik. Peningkatan lainnya mempercepat proses peninjauan perubahan kode sebelum meluncurkannya ke produksi.

Gambar: Kursor

15 juta+ pemirsa video CUBEmendukung percakapan seputar AI, cloud, keamanan siber, dan banyak lagi
11.4k+ alumni CUBE — Terhubung dengan lebih dari 11.400 pemimpin teknologi dan bisnis yang membentuk masa depan melalui jaringan unik berbasis tepercaya.

Tentang Media SiliconANGLE

[ad_2]

Cursor menyegarkan platform pengkodean getarannya dengan fokus pada agen AI

Peralihan Inside Capital One ke model operasi 'yang mengutamakan tanpa server'

[ad_1]

Misi lima tahun Capital One Financial Corp. untuk mentransformasikan operasi teknologi informasinya ke model “yang mengutamakan tanpa server” membuahkan hasil dalam peningkatan produktivitas pengembang, penurunan biaya operasional, dan peralihan dari fokus infrastruktur ke hasil yang berhubungan dengan pelanggan.

Langkah ini bukan sekedar migrasi teknologi, melainkan pendefinisian ulang tentang bagaimana aplikasi dibangun, dioperasikan, dan diatur pada skala perusahaan, kata para eksekutif. Mengurangi kebutuhan untuk mengelola infrastruktur mengharuskan raksasa jasa keuangan tersebut melepaskan sebagian kendalinya, namun kecepatan dalam menerapkan aplikasi baru sudah cukup untuk mengimbangi hal tersebut.

Komputasi tanpa server adalah model eksekusi cloud di mana penyedia cloud secara otomatis menangani penyediaan kapasitas, penskalaan, dan pemeliharaan, hanya mengenakan biaya untuk sumber daya yang digunakan selama eksekusi kode. Janji komputasi tanpa server untuk memangkas biaya komputasi awan, meningkatkan skalabilitas, dan mengurangi kebutuhan pengembang untuk mengelola infrastruktur telah menyebabkan adopsi yang cepat di seluruh perusahaan. Pasar komputasi tanpa server global diperkirakan akan tumbuh lebih dari 15% per tahun dari $21,9 miliar pada tahun 2025 menjadi $44,7 miliar pada tahun 2029, menurut MarketsandMarkets Research Private Ltd.

Misi lima tahun

Capital One telah menjalankan misi selama lima tahun untuk menjadikan tanpa server sebagai model default untuk pengembangan baru, dengan Lambda dari Amazon Web Services sebagai platform pilihannya. Inti dari strategi ini adalah perubahan filosofis, “untuk melihat para insinyur kami lebih fokus dalam memberikan nilai kepada pelanggan kami daripada mengelola infrastruktur,” kata Brian McNamara (gambar di bawah), insinyur terkemuka di grup Cloud Operations and Resiliency Engineering Capital One.

Meskipun nilai komputasi tanpa server sering kali ditentukan oleh biaya konsumsi cloud yang lebih rendah, Capital One menemukan bahwa efisiensi teknis adalah variabel yang lebih signifikan.

“Orang sering mengindeks biaya cloud dan mengatakan bahwa Lambda bisa jadi mahal untuk dijalankan dalam skala besar,” kata McNamara. “Komputasinya jauh lebih murah dibandingkan dengan waktu rekayasa.”

Hal ini menghasilkan peningkatan produktivitas yang terukur. Tim yang mengadopsi layanan tanpa server “memiliki biaya pengoperasian yang jauh lebih rendah,” kata McNamara. “Pengembang tidak melakukan perbaikan pada server. Mereka memecahkan masalah bagi pelanggan.”

Capital One memperkirakan tim teknik menghemat sekitar 30% waktu mereka dalam merawat infrastruktur, namun menghilangkan tugas-tugas seperti membangun kembali citra sistem operasi. “Anda dapat fokus pada hal-hal spesifik aplikasi,” kata McNamara.

Pergeseran pikiran

Transisi ini memerlukan perubahan tidak hanya pada perangkatnya namun juga pola pikirnya. “Bukan berarti seluruh tanggung jawab operasional Anda hilang,” kata McNamara. “Hanya saja mereka beralih dari pengelolaan infrastruktur ke pengoperasian aplikasi Anda.”

Meskipun tanpa server adalah sebuah tujuan, Capital One mengakui bahwa hal ini tidak cocok untuk semua beban kerja. Strateginya yang “mengutamakan tanpa server, tetapi bukan hanya tanpa server” menyadari bahwa beban kerja yang sangat besar sering kali dapat dijalankan dengan lebih hemat di server yang disediakan.

Hal yang sama berlaku untuk aplikasi yang memerlukan kontrol sistem operasi yang mendalam. “Kami diatur oleh penyetelan OS penyedia cloud,” kata McNamara. “Kami tidak memiliki akses ke shell,” yang dapat digunakan untuk menyesuaikan atau mengubah perilaku sistem saat runtime atau boot.

Demikian pula, beban kerja dengan latensi sangat rendah atau beban kerja yang sangat berat mungkin merupakan kandidat yang buruk untuk beban kerja tanpa server karena penundaan dalam mengaktifkan fungsi menganggur. “Jika Anda memerlukan latensi milidetik satu digit, Lambda tidak akan menjadi pilihan Anda,” katanya.

Katalis yang digerakkan oleh peristiwa

Keunggulan tanpa server adalah dalam kasus penggunaan berbasis peristiwa yang semakin penting dalam desain aplikasi modern. Peristiwa adalah tindakan yang memicu perubahan status seperti klik atau pesanan.

Fleksibilitas tanpa server dalam menentukan peristiwa adalah salah satu faktor yang menjadikannya target dominan untuk pengembangan baru, kata McNamara. “Sungguh luar biasa apa yang bisa disebut sebagai sebuah peristiwa,” katanya. “Ini bisa berupa permintaan HTTP atau mengunggah objek ke bucket S3. Anda tidak perlu menyiapkan server admin untuk memulai tugas.”

Arsitektur ini juga menyederhanakan ketahanan dengan memungkinkan penyebaran beban kerja ke beberapa zona ketersediaan. “Karena Lambda adalah layanan tanpa kewarganegaraan, layanan ini mudah digunakan di mana pun Anda membutuhkannya,” kata McNamara.

Ekonomi aplikasi

Komputasi tanpa server membatasi fleksibilitas pengguna berdasarkan desain. “Hanya ada satu tombol yang harus diputar: memori yang telah Anda alokasikan ke suatu fungsi,” kata McNamara. Pembatasan tersebut dapat dikelola ketika Lambda digabungkan dengan alternatif yang menawarkan kontrol lebih besar seperti AWS Fargate, mesin tanpa server untuk kontainer perangkat lunak.

Perusahaan juga meningkatkan fokusnya pada instrumentasi dan observabilitas, karena lingkungan tanpa server tidak mengizinkan akses langsung ke infrastruktur. Peralatan untuk memungkinkan visibilitas yang lebih baik telah matang secara signifikan, kata McNamara.

AWS CloudWatch menyediakan akses ke log, metrik, dan metrik khusus, serta standar OpenTelemetry mendukung integrasi data dengan platform pihak ketiga.

Kekhawatiran awal bahwa tanpa server tidak dapat ditingkatkan skalanya sebagian besar telah dibantah dalam praktiknya. “Saya telah melihat Lambda mencapai puluhan ribu eksekusi secara bersamaan,” kata McNamara. “Yang penting adalah menyadari sifat penskalaannya.”

Hampir lima tahun setelah inisiatif ini dimulai, pengalaman Capital One menunjukkan bahwa tanpa server bukanlah pengganti universal untuk infrastruktur tradisional, namun merupakan lapisan dasar untuk aplikasi modern yang digerakkan oleh peristiwa.

Foto: Wikimedia Commons, Capital One

15 juta+ pemirsa video CUBEmendukung percakapan seputar AI, cloud, keamanan siber, dan banyak lagi
11.4k+ alumni CUBE — Terhubung dengan lebih dari 11.400 pemimpin teknologi dan bisnis yang membentuk masa depan melalui jaringan unik berbasis tepercaya.

Tentang Media SiliconANGLE

[ad_2]

Peralihan Inside Capital One ke model operasi 'yang mengutamakan tanpa server'

Bagaimana fleksibilitas dan duta besar dapat mengamankan perusahaan yang mendukung AI

[ad_1]

Saat ini sudah diterima secara luas bahwa kecerdasan buatan akan mempengaruhi hampir setiap aspek kehidupan kita. Hal ini menghadirkan tantangan baru terkait ancaman AI, manajemen AI perusahaan, dan penyesuaian program keamanan untuk dunia yang semakin didorong oleh AI.

Hal yang paling penting dalam menilai paparan risiko Anda adalah memahami jenis AI yang digunakan. Terdapat korelasi langsung: AI generatif dan agen yang lebih modern dapat membuat kita menghadapi ancaman yang lebih besar. Kurangnya transparansi pada aplikasi generasi AI mempersulit tim keamanan untuk mendapatkan visibilitas yang diperlukan mengenai kemana perginya data yang berpotensi sensitif.

Kenyamanan dan aksesibilitas alat AI seringkali melebihi risiko keamanan yang dirasakan pengguna, sehingga menciptakan siklus adopsi dan potensi paparan. Untuk secara efektif melawan ancaman yang terus berkembang ini, organisasi harus menyesuaikan program keamanan mereka. Dengan mengingat hal tersebut, mari kita jelajahi strategi untuk mencegah tantangan ini terjadi di berbagai bidang organisasi.

Menumbuhkan fleksibilitas

Area utama dalam transformasi adalah memikirkan kembali alur kerja persetujuan untuk penggunaan AI. Model keamanan tradisional, sering kali ditandai dengan keputusan biner ya/tidak atau izinkan/blokir, terlalu kaku untuk sifat dinamis AI. Sebaliknya, tim keamanan perlu menerapkan pendekatan yang lebih fleksibel, yang mungkin mencakup model opt-in/opt-out untuk fungsi AI tertentu, terutama ketika data pelanggan atau data yang diatur terlibat.

Salah satu strategi yang saya terapkan bersama tim saya adalah menetapkan parameter yang jelas tentang apa yang bisa dan tidak bisa digunakan pengguna. Tujuannya adalah untuk mengubah keamanan dari hambatan yang menghambat inovasi menjadi pendorong adopsi AI yang aman, dengan jalur yang jelas antara aktivitas di dalam dan di luar batas.

Ya, akan selalu ada lapisan AI bayangan dan AI agen yang harus diwaspadai seiring dengan meluasnya serangan Anda, namun ada juga kebutuhan untuk menanggapi permintaan sah dari unit bisnis. Penting untuk memiliki sistem yang mengurangi hambatan dalam memproses dan mengaudit permintaan alat baru yang datang dari tim lain dalam organisasi.

Saya memulai dengan mencari platform dan mitra tepercaya, serta menemukan cara untuk memproses dan menyetujui permintaan alat tersebut dengan lebih cepat. Saya menyebutnya proses “lampu kuning”, di mana Anda mempunyai keputusan untuk mempercepat atau menginjak rem. Ini berarti menemukan dua pertanyaan yang mutlak perlu dijawab tentang alat agar platform atau mitra tepercaya ini disetujui. Misalnya, kita mungkin bertanya, “Apakah Anda belajar dari data saya?” dan “Kontrol apa yang Anda miliki agar kami dapat mengaktifkan atau menonaktifkan alat ini jika diperlukan?”

Hal ini memungkinkan kami mempercepat peninjauan yang tadinya memakan waktu berhari-hari menjadi hanya 15 menit. Kini, tim memiliki tingkat fleksibilitas untuk menggunakan alat yang mereka inginkan tanpa mengorbankan lapisan keamanan yang diperlukan.

Kekuatan duta AI

Banyak di antara kita yang akrab dengan konsep “pemimpin keamanan” dalam suatu organisasi, namun saya juga merupakan pendukung besar “duta AI”. Program-program ini berupaya untuk melibatkan dan memberdayakan unit bisnis agar dapat mengambil tanggung jawab tata kelola AI yang lebih besar.

Duta AI adalah orang-orang dari berbagai tim dan departemen, yang mengetahui peraturan seputar alat AI, dan dapat mendorong tim mereka untuk mengikutinya. Pada dasarnya, mereka beroperasi sebagai perpanjangan tangan dari tim keamanan, memberikan lapisan akuntabilitas yang memastikan kolega mereka mengikuti prosedur yang benar dalam memilih dan menggunakan alat AI. Mereka dapat menginventarisasi aplikasi timnya dan meminta peninjauan terhadap proses persetujuan, sehingga memberi mereka lebih banyak investasi untuk memastikan cara tim mereka menggunakan AI aman dan sejalan dengan kebijakan keamanan yang lebih luas.

Dengan melatih dan membekali duta AI di berbagai departemen, organisasi dapat mendesentralisasikan beberapa proses tinjauan keamanan awal. Para duta besar bertanggung jawab untuk memahami dan mematuhi kebijakan tata kelola AI, memastikan bahwa pertimbangan keamanan terintegrasi sejak awal dengan alat baru apa pun yang dibawa ke dalam organisasi.

Juara Keamanan dan Duta AI tidaklah sama. Membedakan tim satu sama lain akan menumbuhkan budaya tanggung jawab bersama, memungkinkan penerapan solusi AI lebih cepat sambil mempertahankan tata kelola yang berfokus pada pelanggan dan postur keamanan yang kuat.

AI pada akhirnya tidak memerlukan perubahan besar, melainkan penyesuaian strategis yang lebih kecil terhadap strategi yang ada untuk mengurangi beberapa hambatan bagi pengguna akhir dan menumbuhkan budaya keamanan yang lebih baik.

Dengan memahami sifat sebenarnya dari ancaman yang dipicu oleh AI, mengatasi sifat unik pengelolaan AI, dan menumbuhkan budaya tanggung jawab keamanan bersama, organisasi tidak hanya memitigasi risiko tetapi juga memanfaatkan potensi teknologi secara penuh.

James Robinson adalah kepala petugas keamanan informasi di Netskope Inc. Dia menulis artikel ini untuk SiliconANGLE.

Gambar: SiliconANGLE/Ideogram

15 juta+ pemirsa video CUBEmendukung percakapan seputar AI, cloud, keamanan siber, dan banyak lagi
11.4k+ alumni CUBE — Terhubung dengan lebih dari 11.400 pemimpin teknologi dan bisnis yang membentuk masa depan melalui jaringan unik berbasis tepercaya.

Tentang Media SiliconANGLE

[ad_2]

Bagaimana fleksibilitas dan duta besar dapat mengamankan perusahaan yang mendukung AI

Alien mengumpulkan $7,1 juta untuk membangun infrastruktur identitas bagi manusia dan agen AI

[ad_1]

Alien, sebuah startup yang ingin membangun infrastruktur kepercayaan untuk internet seiring dengan era agen kecerdasan buatan yang mengubah cara orang berinteraksi dengan bisnis dan satu sama lain, hari ini mengumumkan bahwa mereka telah mengumpulkan dana awal sebesar $7,1 juta.

“Alien sedang membangun infrastruktur kepercayaan untuk ekonomi agen,” kata pendiri dan Kepala Eksekutif Kirill Avery (foto) kepada SiliconANGLE dalam sebuah wawancara eksklusif.

Aplikasi ini memverifikasi pengguna tanpa menyimpan data biometrik secara permanen atau memerlukan identifikasi pemerintah. Ia menggunakan pengenalan wajah melalui perangkat iOS dan Android, kata Avery, namun menyimpan informasi tersebut hanya selama diperlukan untuk mengonfirmasi bahwa orang tersebut adalah nyata.

Namun telepon saja tidak cukup untuk membuktikan kemanusiaan. Alien malah mengandalkan apa yang digambarkan Avery sebagai verifikasi manusia yang berkelanjutan, memanfaatkan aktivitas grafik sosial, hubungan dengan orang lain, dan penilaian probabilistik dari waktu ke waktu untuk menentukan apakah manusia tetap memegang kendali. Selama proses orientasi, proses tersebut memberi pengguna apa yang disebut perusahaan sebagai ID Alien.

Agen AI menerima kredensial yang disebut ID Agen, namun intinya bukan tentang mengidentifikasi agen demi kepentingan mereka sendiri, melainkan mengikat mereka kembali ke manusia. Avery berargumentasi bahwa kebutuhan sebenarnya bukan sekedar membiarkan masyarakat mendaftarkan agen, namun memberikan layanan dari luar cara yang cepat untuk memutuskan apakah mereka dapat mempercayai mereka. Di internet, reputasi adalah segalanya.

Kelemahan dalam banyak sistem reputasi agen yang baru muncul, menurutnya, adalah bahwa sistem tersebut bergantung pada akumulasi riwayat perilaku yang lambat. Jawaban Alien adalah dengan mengaitkan agen ke manusia atau sekelompok manusia yang dikenal, sehingga menciptakan hambatan yang lebih rendah terhadap reputasi dan akuntabilitas dibandingkan menunggu berbulan-bulan untuk membangun ketertelusuran.

“Anda tidak bisa membiarkan agen tanpa reputasi melakukan apa pun di situs web Anda,” kata Avery.

Munculnya AI agen

Saat ini, AI agen sedang populer. Browser AI agen yang tersedia untuk konsumen dapat bekerja atas nama pengguna seperti ChatGPT Atlas dari OpenAI Group PBC dan Comet dari Perplexity AI Inc. Aktivitas ini dapat melampaui penelitian sederhana, seperti menemukan produk di halaman e-niaga, menambahkan item ke keranjang belanja, memasukkan informasi kartu kredit, dan melakukan pembelian.

Selain browser agen, lanskapnya terus berubah. Agen sumber terbuka yang berpusat pada pengembang seperti OpenClaw, yang menyediakan kerangka kerja berfokus pada privasi yang dapat dijalankan pengguna langsung dari komputer mereka, memungkinkan siapa pun meluncurkan sekretaris AI langsung di meja mereka.

Di masa lalu, gagasan memiliki asisten digital terasa seperti fiksi ilmiah. Tentu saja, ponsel dapat melakukan hal ini dengan Siri dari Apple Inc. dan “Hey, Google,” dengan kemampuan suara, namun agen AI saat ini lebih canggih. Mereka dapat secara mandiri mengakses web, menelusuri internet, belajar, membeli kaus kaki, merencanakan perjalanan, membeli tiket pesawat, dan banyak lagi.

Industri ini berkembang pesat menuju masyarakat yang mengutamakan pengguna di mana orang-orang biasa suatu hari nanti dapat duduk, mengklik aplikasi, dan memiliki agen AI — atau bahkan puluhan atau ratusan agen — yang siap sedia. Pertanyaannya adalah: Bagaimana orang-orang di pihak lain mengetahui bahwa seseorang dengan reputasi baik memegang komando dan kendali atas agen-agen tersebut?

Masa depan ini bisa berdampak buruk bagi umat manusia. Avery telah melihatnya sendiri.

Dia membangun perusahaan itu sebagian karena alasan pribadi. Misinformasi dan apa yang disebutnya misinformasi dan propaganda “bot Kremlin” seputar perang Ukraina membuat keluarganya terpisah di Rusia sementara dia menonton dari Amerika Serikat. Evolusi era AI agen berarti bahwa individu tidak perlu lagi duduk di media sosial mengetik kalimat secara manual; pasukan bot dapat masuk ke layar doomscroll untuk menjerat mereka yang tidak menyadarinya.

Industri identitas agen yang lebih luas

Alien tidak sendirian dalam mencoba memecahkan identitas dan akuntabilitas untuk web agen yang akan datang. Vouched Identity Inc. telah mengatasi masalah ini dari sisi verifikasi dan kontrol perusahaan, sementara Billions Network SA juga membangun infrastruktur identitas yang menjaga privasi untuk manusia dan agen AI.

“Saya pikir ruang peluang yang lebih luas dari infrastruktur dasar untuk identitas agen, reputasi, dan pertukaran nilai adalah salah satu subjek paling mendesak dalam evolusi internet,” kata Chief Executive Billions Network, Evin McMullen, kepada SiliconANGLE dalam wawancara sebelumnya.

Putaran pendanaan Alien mencakup Initialized Capital, Finality, Mantaray, Commonmetal, Scenius, Lvna Capital, Pioneer, dan lainnya. Dengan modal baru, Avery mengatakan uang tersebut akan digunakan untuk mendorong protokol, aplikasi, dan ID agen dengan cepat.

Sistem ini dibangun di atas blockchain, yang menyediakan tulang punggung operasinya. Hal ini juga memungkinkan aplikasi untuk melakukan desentralisasi di seluruh perangkat dan melacak reputasi. Saat pengguna mendaftar di klien seluler, mereka mendapatkan akses ke dompet, perpesanan, dan pasar aplikasi mini yang ditujukan untuk manusia terverifikasi. Di sana pengembang mendapat kesempatan untuk membangun model distribusi baru untuk mata uang kripto, pasar data robotika bernama Alien Work yang mirip dengan tugas Mechanical Turk milik Amazon Inc. dengan pemeriksaan keunikan dan pengalaman seperti permainan.

Saat ini, Alien ingin menjadi bukti bahwa ada manusia unik, memungkinkan manusia mendelegasikan reputasi kepada agen, dan memberikan situs web atau platform cara untuk mengetahui bahwa agen dapat dipercaya dan bertanggung jawab.

Hal ini akan membuka jalan bagi pengguna untuk memberikan pembayaran dan kredensial melalui Alien ID kepada agen, sementara perusahaan menyediakan dasar-dasar reputasi agen dan komunitas pengembang yang berkembang untuk menggunakannya.

Foto: Asing

15 juta+ pemirsa video CUBEmendukung percakapan seputar AI, cloud, keamanan siber, dan banyak lagi
11.4k+ alumni CUBE — Terhubung dengan lebih dari 11.400 pemimpin teknologi dan bisnis yang membentuk masa depan melalui jaringan unik berbasis tepercaya.

Tentang Media SiliconANGLE

[ad_2]

Alien mengumpulkan $7,1 juta untuk membangun infrastruktur identitas bagi manusia dan agen AI

Kepercayaan terhadap keamanan siber AI menjadi sangat penting, kata EY

[ad_1]

Persaingan berikutnya dalam keamanan siber bukanlah apakah perusahaan akan menggunakan AI, namun apakah mereka dapat menggunakan AI percayalah pada apa yang mereka bangun dengannya. Itulah sebabnya diskusi mengenai kepercayaan keamanan siber AI menjadi agenda utama industri.

AI tidak lagi menjadi pembicaraan sampingan, namun AI menjadi landasan bagi cara kerja pertahanan siber modern, menurut para profesional risiko di Ernst & Young LLP. Pertanyaan terbesar yang kini ditanyakan organisasi adalah bagaimana menerapkannya dalam skala besar dan bagaimana membangun kepercayaan yang diperlukan untuk menggunakannya dengan percaya diri, menurut Kapish Vanvaria (gambar, kiri), EY Global dan Americas Risk Consulting Leader. Jalur tersebut kini mencakup segala hal mulai dari pengujian penetrasi hingga pusat operasi keamanan.

“Saya rasa Anda tidak bisa melewatkan satu stan tanpa melihat kata AI,” kata Vanvaria kepada theCUBE. “Sejujurnya, menurut saya ini adalah hal yang baik. Menurut saya ini adalah gambaran tentang arah masa depan dari sudut pandang keamanan. Saya menghabiskan banyak waktu dengan klien kami – kemarin, pagi ini, tepat sebelum ini – dan banyak pertanyaan yang mereka ajukan [are around] penyebaran skala. Dan yang kedua: Bagaimana mereka menjawab email atas dasar kepercayaan?”

Vanvaria dan Dan Mellen (kanan), EY Global dan US Cyber Chief Technology Officer, berbicara dengan theCUBE Dave Vellante Dan Christophe Bertrand di Konferensi RSAC 2026selama siaran eksklusif di theCUBE, studio streaming langsung SiliconANGLE Media. Mereka membahas semakin besarnya kebutuhan untuk membangun kepercayaan keamanan siber AI ke dalam sistem sejak awal. (* Pengungkapan di bawah.)

Kepercayaan terhadap keamanan siber AI beralih dari konsep menjadi keharusan

Postur EY Consulting sendiri secara konsisten menyatakan bahwa para pemimpin dunia maya tidak dapat lagi memperlakukan AI sebagai tambahan pada model keamanan yang ada. Kecepatan penerapan mempersulit organisasi untuk mengimbanginya karena strategi dan ekspektasi terus berkembang, menurut Mellen.

“Saya kira siklus perubahan yang dulunya enam bulan, kini menjadi enam minggu,” ujarnya. “Saya bercanda dengan rekan-rekan saya di Eropa ketika mereka keluar pada bulan Agustus, mereka melewatkan satu siklus penuh. Anda harus mengejar semua itu.”

Menurut EY Consulting studi peta jalan penelitian cyber baru96% responden mengatakan AI adalah jawabannya sekarang menjadi bagian dari strategi pertahanan dunia maya mereka. Kata “strategi” sangat penting karena dapat menggambarkan berbagai tahap kematangan implementasi, terutama mengingat 95% organisasi mengatakan bahwa mereka sudah menerapkan AI di seluruh bisnis yang lebih luas, kata Mellen.

“Anda menghadapi situasi di mana AI sedang diterapkan [and] dunia maya mencoba untuk mengejar ketertinggalan,” katanya. “Kami melihat sedikit perilaku buruk yang berulang dari cloud, di mana keamanan hanya meningkatkan kemampuan untuk mencoba mengamankan hal-hal tersebut. [systems]. Namun bisnis ini melampaui tata kelola – melampaui kendali; ini melampaui kemampuan dunia maya untuk melatih orang.”

Survei tersebut menunjukkan bahwa banyak organisasi telah memasukkan AI ke dalam strategi mereka, namun pertanyaan yang lebih besar adalah di mana ambisi tersebut masih gagal dalam pelaksanaan sehari-hari. Seringkali strategi kepercayaan keamanan siber AI tersebut masih bersandar pada ide-ide yang sudah dikenal tanpa sepenuhnya menerjemahkannya ke dalam praktik operasional, tambah Vanvaria.

“Kami akan memiliki hal-hal seperti ketertelusuran [and] penjelasannya, tapi sungguh, itu adalah metode yang tepat karena Anda mengambil kepatuhan dan tata kelola dan menerapkannya pada sesuatu yang sudah ada, “katanya. “Saat kami mencoba mendorong pasar dan orang-orang — sekadar mengubah kerangka acuan mereka — adalah memikirkan kepercayaan pada desain.”

Posisi tersebut konsisten dengan pesan EY Consulting yang mempercayai keamanan siber AI harus diatur dengan kuatdengan kepatuhan yang tertanam dalam sistem sejak awal. Saat produk bergerak melalui desain dan pengembangan, pertanyaan penting adalah apakah tim keamanan siber, peraturan, hukum, dan kepatuhan dilibatkan sejak dini untuk membantu membentuknya, menurut Vanvaria. Hal ini penting terutama ketika perusahaan membangun agen AI dan alat lain yang dimaksudkan untuk meningkatkan pengalaman pelanggan dan karyawan. Sehubungan dengan itu, EY Consulting juga menekankan bahwa AI harus mendukung pengambilan keputusan tanpa menggantikan penilaian manusia, sebuah sikap yang menekankan penggunaan teknologi untuk membantu orang bergerak lebih efisien.

“Saya pikir ada pernyataan yang digunakan banyak organisasi tentang 'manusia dalam lingkaran'. Saya pikir organisasi yang paling diuntungkan di luar sana adalah organisasi yang memanfaatkan manusia dan memberdayakan mereka dengan kekuatan teknologi agar bisa berjalan lebih cepat,” kata Vanvaria.

Berikut video wawancara selengkapnya, bagian dari liputan SiliconANGLE dan theCUBE Konferensi RSAC 2026:

(* Pengungkapan: EY mensponsori segmen theCUBE ini. Baik EY maupun sponsor lain tidak memiliki kendali editorial atas konten di theCUBE atau SiliconANGLE.)

Foto: SiliconANGLE

15 juta+ pemirsa video CUBEmendukung percakapan seputar AI, cloud, keamanan siber, dan banyak lagi
11.4k+ alumni CUBE — Terhubung dengan lebih dari 11.400 pemimpin teknologi dan bisnis yang membentuk masa depan melalui jaringan unik berbasis tepercaya.

Tentang Media SiliconANGLE

[ad_2]

Kepercayaan terhadap keamanan siber AI menjadi sangat penting, kata EY

Pertumbuhan: Pencarian Kerja di Era AI

[ad_1]

Dapatkan pekerjaan Anda berikutnya di era AI. Mengakali bot resume, menguasai wawancara AI, dan menggunakan strategi cerdas untuk menonjol dalam proses perekrutan berbasis teknologi saat ini.

[ad_2]

Pertumbuhan: Pencarian Kerja di Era AI

Pengoptimalan memori AI menjadi raja baru

[ad_1]

Perlombaan AI hebat berikutnya mungkin dimenangkan bukan pada komputasi mentah, namun pada memori. Dengan kekurangan yang memperlihatkan batasan yang sulit di seluruh pusat data, pengoptimalan memori AI menjadi pusat perhatian sebagai cara untuk membuka lebih banyak token, lebih banyak efisiensi, dan lebih banyak nilai dari infrastruktur yang sama.

Apa yang tadinya merupakan masalah infrastruktur di balik layar kini menjadi keunggulan kompetitif utama, menurut Val Bercovici (gambar, kiri), chief AI officer di WekaIO Inc. Dalam pembuktian konsep yang dilakukan bersama Firmus Technologies Pty Ltd, Weka menggunakan penghematan penyimpanan untuk memperluas memori — melestarikan konteks alih-alih memprosesnya berulang kali di GPU — untuk menunjukkan bagaimana organisasi dapat secara dramatis meningkatkan keluaran token tanpa meningkatkan konsumsi energi.

“Hasilnya sesuai dengan apa yang kami harapkan [that] Anda bisa mendapatkan — dari Belanja Modal dan OpEx yang sama, GPU dan biaya energi yang sama — token 6,5 kali lebih banyak, jadi 550% lebih banyak, “kata Bercovici. “Seolah-olah dalam skenario makro, Anda baru saja membuat lima setengah pusat data baru begitu saja.”

Bercovici dan Daniel Kearney (kanan), chief technology officer Firmus Technologies Pty Ltd., berbicara dengan CUBE Gemma Allen di Konferensi & Ekspo AI Nvidia GTCselama siaran eksklusif di theCUBE, studio streaming langsung SiliconANGLE Media. Mereka membahas optimalisasi memori AI, munculnya agen, dan bagaimana POC gabungan antara Weka dan Firmus menunjukkan lebih banyak token menggunakan anggaran daya yang sama. (* Pengungkapan di bawah.)

Pengoptimalan memori AI berupaya menghilangkan pajak penghitungan ulang

Tantangan signifikan dalam infrastruktur AI saat ini adalah redundansi data “pengisian awal”, menurut Bercovici. Ketika jendela memori terbatas, GPU sering kali membuang perintah lama untuk memberi ruang bagi perintah baru, sehingga memaksa sistem untuk memproses ulang informasi berulang kali. Penghitungan ulang pajak ini sangat bermasalah bagi agen yang sudah berjalan lama dan memerlukan konteks mendalam agar tetap efektif selama berjam-jam atau berhari-hari.

“Kemampuan untuk menghadirkan silikon yang lebih spesifik atau konteks yang lebih luas agar sesuai dengan beban kerja, bahkan secara retrospektif, terus memperluas kegunaan investasi Belanja Modal yang terjadi sebelumnya – hal ini sangat besar,” kata Kearney. “Kami dapat merekayasa keluar dari keusangan. Kini kami dapat menghadirkan sistem berbasis GPU yang sudah ada ke pasar dan siap untuk beban kerja generasi berikutnya tanpa harus menerapkan ulang dan membuang sistem lama untuk menghadirkan sistem yang benar-benar baru.”

Hubungan tersebut merupakan perpaduan antara teknologi ekstensi memori dan infrastruktur pabrik AI: Weka menyediakan pendekatan perangkat lunak dengan Augmented Memory Grid pada NeuralMesh, sementara Firmus menyediakan lingkungan dan sumber daya GPU untuk membuktikannya dalam kondisi nyata. Dalam pengujian, kombinasi tersebut memungkinkan agen mempertahankan konteks alih-alih terus-menerus melakukan pra-pengisian ulang, sehingga membuka lebih banyak keluaran token dari GPU dan selubung daya yang sama. Peningkatan tersebut penting karena beban kerja jangka panjang yang intensif memori semakin menentukan AI agen, jelas Bercovici.

“Manfaat gabungan dari pergantian agen yang semakin cepat – tersebar di puluhan ribu pergantian agen – berarti obat-obatan ditemukan lebih cepat. Obatnya ditemukan lebih cepat. Perdagangan dioptimalkan dengan lebih baik. Ada begitu banyak kasus penggunaan saat ini yang memiliki nilai bisnis yang sangat besar,” katanya. “Pemenang dan pecundang akan ditentukan oleh siapa yang memanfaatkan momen saat ini.”

Berikut video wawancara selengkapnya, bagian dari liputan SiliconANGLE dan CUBE di Nvidia GTC AI Conference & Expo:

(* Pengungkapan: Weka mensponsori segmen theCUBE ini. Baik Weka maupun sponsor lainnya tidak memiliki kendali editorial atas konten di theCUBE atau SiliconANGLE.)

Foto: SiliconANGLE

15 juta+ pemirsa video CUBEmendukung percakapan seputar AI, cloud, keamanan siber, dan banyak lagi
11.4k+ alumni CUBE — Terhubung dengan lebih dari 11.400 pemimpin teknologi dan bisnis yang membentuk masa depan melalui jaringan unik berbasis tepercaya.

Tentang Media SiliconANGLE

[ad_2]

Pengoptimalan memori AI menjadi raja baru

Keuangan: Hal Cerdas yang Dapat Dilakukan dengan Warisan

[ad_1]

Maksimalkan warisan Anda dengan strategi cerdas. Pelajari cara melunasi utang, berinvestasi dengan bijak, menghindari jebakan, dan membangun keamanan finansial jangka panjang untuk masa depan.

[ad_2]

Keuangan: Hal Cerdas yang Dapat Dilakukan dengan Warisan