Masa depan kecerdasan buatan mungkin melibatkan lebih banyak pengambilalihan perusahaan daripada pemberontakan robot. Hal ini, menurut CEO perusahaan AI Anthropic, Dario Amodei.
Amodei baru-baru ini membahas masa depan AI dalam sebuah wawancara dengan Noah Smith dan Erik Torenberg di podcast Econ 102. Ketiganya membahas berbagai hal mulai dari penggunaan AI oleh militer hingga pekerja manusia yang digantikan oleh mesin yang lebih efisien.
Namun, yang mungkin paling menarik adalah Amodei membahas upaya internal perusahaan untuk mengembangkan struktur hierarki yang efisien untuk menyelesaikan tugas melalui jaringan model kecerdasan buatan.
Jaringan di dalam jaringan
AI yang paling dikenal masyarakat saat ini hadir dalam bentuk chatbot dan generator gambar. ChatGPT milik OpenAI dan Claude milik Anthropic adalah sistem AI canggih yang, secara terpisah, telah menghabiskan biaya puluhan miliar dolar untuk pengembangannya.
Namun, sebagian besar aplikasi yang berguna untuk teknologi yang mendukung sistem ini tidak memerlukan kemampuan penuhnya. Misalnya, jika Anda menggunakan Claude untuk membantu menghasilkan kode Python untuk aplikasi Web3, Anda mungkin tidak memperoleh manfaat apa pun dari kemampuan model tersebut untuk menghasilkan puisi dalam bahasa Prancis.
Sebagaimana Amodei uraikan dalam wawancaranya, pemikiran perusahaan saat ini tampaknya melibatkan gagasan tentang kumpulan AI yang mampu berjejaring untuk menyelesaikan tugas-tugas tertentu.
Premis dasarnya melibatkan “model-model besar yang mengatur model-model kecil.” Amodei menambahkan bahwa model-model yang lebih besar akan menciptakan hingga ratusan model yang lebih kecil, lebih cepat, dan lebih efisien untuk melakukan tugas-tugas.
Sementara Amodei menggunakan analogi lebah pekerja yang mendukung ratunya, apa yang ia gambarkan terdengar sangat mirip dengan infrastruktur perusahaan pada umumnya.
Di bagian atas akan ada model inti Claude, sistem Anthropic yang paling kuat. Dan di bawahnya akan ada beberapa model dasar yang mahal yang dilatih dalam domain area yang luas seperti matematika, pemrograman, dan analisis sentimen. Di bawah mesin-mesin C-suite tersebut akan ada serangkaian model khusus yang didedikasikan untuk menyelesaikan tugas-tugas tertentu. Dan, akhirnya, di bawah spesialis manajer menengah, kita akan menemukan model-model sekali pakai tingkat pemula yang dirancang untuk penggunaan jangka pendek.
Manfaat dari desain ini berpotensi berarti bahwa pengguna akhir di setiap level akan memiliki akses ke kemampuan spesifik yang mereka butuhkan melalui satu antarmuka pengguna yang sederhana.