[ad_1]
PewDiePie telah membangun UI web khusus untuk model AI yang dihosting sendiri yang disebut “ChatOS” yang berjalan di PC kustomnya dengan 2x kartu RTX 4000 Ada, bersama dengan 8x RTX 4090 yang dimodifikasi dengan VRAM 48 GB. Menjalankan model sumber terbuka dari Baidu dan OpenAI, PewDiePie membuat “dewan” bot yang memilih respons terbaik, lalu membangun “The Swarm” untuk pengumpulan data yang akan menjadi landasan modelnya sendiri yang akan dirilis bulan depan.
Pernah menjadi bintang poster game di YouTube, dia telah menjalani kehidupan semi-pensiun di Jepang bersama istrinya, Marzia. Meskipun ia tidak lagi sering mengupload video, dan kontennya telah berubah dari video bergaya saluran reaksi yang berlebihan menjadi vlog keluarga, tampaknya kecintaannya pada komputasi telah muncul kembali. Felix tidak pernah dikenal sebagai orang yang sangat paham teknologi, namun akhir-akhir ini dia mengalami hal yang gila — menghabiskan hidupnya di Google, membuat PC gaming pertamanya, dan belajar cara menulis kode. Tindakan terbarunya adalah desentralisasi: model AI yang dihosting sendiri dan akhirnya dibuat sendiri.
Tonton Aktif
Dalam video YouTube barunya, Felix menjelaskan bagaimana “pusat data mini” miliknya membantu mendorong penelitian medis. Dia mendonasikan komputasi dari sistem 10 GPU miliknya ke Lipat@rumah sehingga para ilmuwan dapat menggunakannya untuk menjalankan simulasi pelipatan protein, dan dia membuat tim sehingga orang lain dapat bergabung dengan komputer mereka untuk berkontribusi juga. Ini adalah tujuan yang mulia, namun PewDiePie ingin menjelajah ke wilayah yang belum diketahui dan menjelajahi hal lain yang jelas dapat Anda lakukan jika Anda memiliki banyak GPU — menjalankan AI.
Komputer Felix memiliki 2x kartu RTX 4000 Ada, bersama dengan 8x RTX 4090 yang dimodifikasi dengan VRAM 48 GB, sehingga total kumpulan memorinya menjadi sekitar 256 GB, yang cukup untuk menjalankan banyak model terbesar saat ini. Itulah tepatnya yang dia lakukan, memulai dengan LLaMA 70B Meta, lalu beralih ke GPT-OSS-120B OpenAI, yang menurutnya berjalan dengan sangat baik dan terasa “seperti ChatGPT tetapi jauh lebih cepat.” Di sinilah dia pertama kali mendeskripsikan UI webnya yang disebut ChatOS, yang dia buat khusus untuk berinteraksi dengan model menggunakan vLLM.
media=”https://cdn.mos.cms.futurecdn.net/UaEEvXKu4ZLN4BaFoWLYbn.png”/>
Untuk benar-benar “memaksimalkan”, ia mencoba Qwen 2.5-235B, salah satu model terbaru Baidu, yang biasanya memerlukan VRAM lebih dari 300 GB dengan presisi penuh. Felix berhasil menjalankannya dengan menggunakan kuantisasi, yang secara dinamis mengurangi presisi bit setiap lapisan, mengompresi model tanpa memengaruhi fungsionalitas. Hal ini memungkinkan dia menangani jendela konteks hingga 100.000 token — yang pada dasarnya sepanjang buku teks — sesuatu yang sangat jarang terjadi pada LLM yang dijalankan secara lokal.
Di sinilah Felix dengan bercanda mengatakan bahwa model tersebut memiliki kekuatan yang terlalu besar, karena model tersebut dikodekan di depannya dengan sangat cepat sehingga membuatnya merasa tidak aman dalam mempelajari pemrograman. Namun dia membalikkan ketakutan itu dan memanfaatkannya untuk rencananya sendiri. “Mesin yang membuat mesin,” klaim Pewds, karena kini dia meminta kode untuk menambahkan fitur tambahan ke ChatOS.
Felix mendemonstrasikan UI webnya, menambahkan pencarian, audio, RAG, dan memori ke Qwen. Segera setelah model mendapatkan akses ke internet, diharapkan jawabannya menjadi lebih akurat. Dia menambahkan RAG (Retrieval-Augmented Generation), yang memungkinkan AI melakukan penelitian mendalam — pada dasarnya mencari satu hal dan kemudian mengembangkan cabang untuk menemukan informasi terkait, meniru cara manusia menggunakan Google. Tapi ini bukanlah bagian paling keren dari AI-nya; penghargaan itu menjadi kenangan.
Pewds menyinggung tentang bagaimana data kita sebenarnya bukan milik kita dan bahwa dia sering dibuat takut oleh AI yang mengetahui hal-hal tentang dirinya dalam obrolan yang dia bicarakan sebelumnya. Meskipun obrolan telah dihapus, datanya tetap ada dan masih digunakan untuk melatih model kecuali Anda secara aktif menghapusnya dari server perusahaan. Di sinilah menghubungkan data lokal Anda ke AI menjadi sebuah terobosan. Melalui RAG, Felix mendemonstrasikan bahwa model tersebut dapat mengambil informasi secara lokal dari komputernya, bahkan hingga mengetahui hal-hal seperti alamat atau nomor teleponnya.
PewDiePie baru saja mengkodekan UI Obrolannya sendiri, membangun pasukan chatbot untuk pemungutan suara mayoritas dan memberi mereka semua RAG, DeepResearch, dan keluaran audio. tentu saja, dia hanya menggunakan model Qwen Cina dan menjalankannya di PC lokalnya dengan 8x 48GB 4090s Cina yang dimodifikasi dan 2x RTX 4000 Ada pasukannya… pic.twitter.com/vS6DlPFwdQ31 Oktober 2025
Di sinilah eksperimen umum berhenti, dan beberapa menit terakhir video beralih ke apa yang mungkin disebut oleh penguasa AI kita di masa depan sebagai “dipertanyakan secara moral.” Felix membangun pasukan chatbot yang semuanya berkumpul untuk memberikan jawaban atas satu pertanyaan. Respons tersebut kemudian akan dipilih dalam proses demokratis, dengan chatbot yang paling lemah akan dieliminasi dari “dewan.”
Akhirnya, dewan mengetahui bahwa anggotanya akan dikeluarkan jika mereka gagal, dan AI menjadi sangat pintar sehingga berkolusi melawan Pewds, menyusun strategi untuk mempermainkan sistem dan menghindari penghapusan. Solusinya sederhana: beralih ke model yang lebih kecil dengan parameter yang lebih sedikit, dan bot sekali lagi menjadi korban sirkus.
Dari sinilah muncul ide “The Swarm” – kumpulan lusinan AI yang berjalan sekaligus menggunakan model parameter 2B. Pewds mengatakan dia tidak menyadari bahwa dia dapat menjalankan lebih dari satu AI pada satu GPU, yang menyebabkan terciptanya 64 AI di seluruh tumpukannya. Itu sangat berlebihan sehingga UI web akhirnya mogok. Di sisi lain, hal ini memberi Felix ide untuk membuat modelnya sendiri.
Swarm sangat hebat dalam mengumpulkan data, yang menurut Pewds akan dia gunakan untuk “membuat Palantirnya sendiri,” sebuah proyek yang dia goda untuk video mendatang. Hal ini memunculkan kesadaran bahwa model yang lebih kecil seringkali lebih efisien; mereka cepat dan ringan, dan, jika dikombinasikan dengan pencarian dan RAG, dapat menghasilkan kinerja yang jauh melebihi bobotnya. Felix mengakhiri videonya dengan mengingatkan pemirsa bahwa Anda tidak memerlukan PC monster untuk menjalankan model AI, dan ia berharap dapat segera membagikan miliknya sendiri agar siapa pun dapat melakukan self-host.
Mengikuti Perangkat Keras Tom di Google Beritaatau tambahkan kami sebagai sumber pilihanuntuk mendapatkan berita, analisis, & ulasan terbaru kami di feed Anda.

