
Model pemeriksaan AI open source baru DeepSeek, R1, memicu penjualan saham Nvidia dan membuat aplikasi konsumennya melonjak ke puncak toko aplikasi.
Bulan lalu, DeepSeek mengatakan bahwa mereka melatih sebuah model menggunakan pusat data sekitar 2.000 GPU Nvidia H800 dalam waktu sekitar dua bulan dengan biaya sekitar $5,5 juta. Minggu lalu, mereka menerbitkan makalah yang menunjukkan bahwa kinerja model terbaru mereka sejajar dengan model pemeriksaan paling canggih di dunia. Model-model ini sedang dilatih di pusat data yang menghabiskan miliaran dolar untuk chip AI Nvidia yang lebih cepat dan sangat mahal.
Reaksi di seluruh industri teknologi terhadap model kinerja tinggi dan biaya rendah dari DeepSeek telah luar biasa. Pat Gelsinger, misalnya, dengan senang hati mengunggah di X, "Terima kasih tim DeepSeek."
Kebijaksanaan adalah belajar pelajaran yang kita pikir sudah kita ketahui. DeepSeek mengingatkan kita tentang tiga pembelajaran penting dari sejarah komputasi:
— Pat Gelsinger (@PGelsinger) 27 Januari 2025
1) Komputasi mengikuti hukum gas. Membuatnya jauh lebih murah akan memperluas pasar untuk itu. Pasar salah memahami ini, hal ini akan membuat AI…
Gelsinger adalah mantan CEO Intel, seorang insinyur perangkat keras, dan ketua saat ini dari perusahaan rintisan IPO-nya sendiri, Gloo, platform pesan dan keterlibatan untuk gereja. Ia meninggalkan Intel pada bulan Desember setelah empat tahun dan mencoba mengejar Nvidia dengan memperkenalkan GPU AI alternatif Intel, Gaudi 3 AI.
Gelsinger menulis bahwa DeepSeek seharusnya mengingatkan industri teknologi tentang tiga pelajaran terpentingnya: biaya yang lebih rendah berarti adopsi yang lebih luas; kreativitas berkembang di bawah kendala; dan "'Open Wins'. DeepSeek akan membantu mengatur kembali dunia yang semakin tertutup dari pekerjaan model AI yang mendasar," tulisnya. OpenAI dan Anthropic keduanya bersifat closed source.
Gelsinger memberitahu TechCrunch bahwa R1 begitu mengesankan, Gloo sudah memutuskan untuk tidak mengadopsi dan membayar OpenAI. Gloo sedang membangun layanan AI bernama Kallm, yang akan menawarkan chatbot dan layanan lainnya.
"Insinyur Gloo saya sedang menjalankan R1 hari ini," katanya. "Mereka bisa menjalankan o1 — hmm, mereka hanya bisa mengakses o1, melalui API."
Sebaliknya, dalam dua minggu, Gloo berharap telah membangun kembali Kallm dari awal "dengan model dasar kami sendiri yang semuanya open source," katanya. "Itu menarik."
Ia berkata bahwa ia yakin DeepSeek akan membuat AI menjadi sangat terjangkau, AI tidak hanya akan ada di mana-mana. AI yang bagus akan ada di mana-mana. "Saya ingin AI yang lebih baik di Oura Ring saya. Saya ingin AI yang lebih baik di alat bantu dengar saya. Saya ingin lebih banyak AI di ponsel saya. Saya ingin AI yang lebih baik di perangkat tersemat saya, seperti pengenalan suara di mobil listrik saya," katanya.
Reaksi bahagianya mungkin bertentangan dengan yang lain yang kurang senang bahwa model pemeriksaan mendasar sekarang memiliki pesaing yang lebih unggul dan jauh lebih terjangkau. AI semakin mahal, bukan semakin murah.
Yang lain merespons dengan menyiratkan bahwa DeepSeek pasti telah memanipulasi angka-angka mereka dengan cara tertentu dan pelatihan pasti lebih mahal. Ada yang berpikir bahwa mereka tidak bisa mengatakan bahwa mereka menggunakan chip yang lebih baik karena adanya pembatasan ekspor chip AI AS ke China. Yang lain mengkritik kinerjanya, menemukan tempat-tempat di mana model lain lebih unggul. Ada juga yang percaya bahwa model berikutnya OpenAI, o3, akan sangat mengungguli R1 ketika dirilis sehingga status quo akan diperbaiki.
Gelsinger mengabaikan semua itu. "Anda tidak akan pernah memiliki transparansi penuh, mengingat sebagian besar pekerjaan dilakukan di China," katanya. "Tetapi masih, semua bukti menunjukkan bahwa biaya pelatihannya 10-50 kali lebih murah daripada o1."
DeepSeek membuktikan bahwa AI dapat dipercepat "dengan kreativitas rekayasa, bukan dengan menambah daya perangkat keras dan sumber daya komputasi pada masalah tersebut. Jadi itu sangat menggembirakan," ujarnya.
Adalah pengembang China dengan semua yang diimplikasikan, seperti kekhawatiran atas privasi dan sensor. Gelsinger secara kiasan menggelengkan kepalanya.
“Mengingatkan kita akan kekuatan ekosistem terbuka oleh China mungkin sedikit memalukan bagi komunitas kita, bagi dunia Barat,” katanya.
TechCrunch memiliki buletin berfokus pada AI! Mendaftar di sini untuk menerimanya di kotak masuk Anda setiap hari Rabu.