
Anda mungkin sering mendengar tentang “model bahasa besar” (Large Language Model/LLM) seperti ChatGPT. Ada perdebatan menarik yang sedang terjadi, tentang siapa yang akan menjadi “bintang utama” untuk masa depan kecerdasan buatan atau akal imitasi (AI).
Sebuah laporan terbaru dari NVIDIA, perusahaan yang dikenal sebagai pemimpin di industri chip, mengemukakan pandangan yang cukup berani: Model Bahasa Kecil (Small Language Model/SLM), bukan LLM, adalah masa depan AI agen. Mengapa demikian?
Untuk memudahkan memahami laporan NVIDIA tersebut, mari kita bedah perbandingannya dengan bahasa sederhana: Analogi profesor vs mahasiswa.
LLM: Profesor Serba Tahu
Bayangkan LLM sebagai seorang profesor serba tahu. Ia telah membaca miliaran buku dan artikel dari seluruh dunia, menjadikannya sangat pintar dan mampu menjawab hampir semua pertanyaan. Keunggulannya, fleksibilitas; ia bisa menulis puisi, membuat kode, menganalisis data, dan bahkan bercakap-cakap layaknya manusia.
Namun, kecerdasan yang luar biasa ini datang dengan harga yang mahal:
- Ukuran Besar: LLM membutuhkan “otak” yang sangat besar. Ini berarti mereka butuh perangkat keras (hardware) yang canggih dan mahal untuk beroperasi, seperti server superkomputer yang dipenuhi chip khusus.
- Lambat dan Mahal: Karena ukurannya, setiap kali Anda mengajukan pertanyaan, ia butuh waktu untuk memprosesnya. Biaya operasionalnya juga sangat tinggi, baik dari segi listrik maupun infrastruktur.
SLM: Mahasiswa Spesialis yang Tangkas
Sebaliknya, SLM bisa diibaratkan sebagai mahasiswa spesialis. Ia tidak tahu segalanya, tetapi ia sangat ahli dalam satu bidang tertentu. Contohnya, satu SLM bisa dilatih khusus untuk menganalisis dokumen keuangan, sementara yang lain dilatih untuk mengelola pertanyaan pelanggan.
Keunggulan SLM adalah efisiensi:
- Ukuran Kecil: SLM dapat berjalan di perangkat keras yang lebih sederhana, bahkan di laptop, ponsel, atau perangkat pintar di rumah Anda. Tapi performa dan sifat perangkat keras akan memengaruhi kinerja.
- Cepat dan Murah: Karena hanya fokus pada satu tugas, ia bisa memberikan respons dengan sangat cepat dan dengan biaya yang jauh lebih rendah.
Mengapa Model Bahasa Kecil Menguntungkan?
Inilah poin yang sangat penting, terutama bagi mereka yang tidak memiliki akses ke infrastruktur teknologi termutakhir. Penggunaan SLM membawa manfaat besar dari sisi infrastruktur:
- Aksesibilitas Perangkat Keras: Anda tidak perlu menjadi perusahaan raksasa dengan gudang penuh server untuk bisa memanfaatkan kekuatan AI. SLM dapat berjalan pada perangkat keras yang umum, membuat teknologi AI lebih mudah diakses oleh individu, startup kecil, atau negara berkembang.
- Efisiensi Biaya: Biaya operasional yang rendah berarti Anda bisa menjalankan aplikasi AI tanpa harus khawatir akan biaya listrik dan server yang membengkak.
- Respons yang Instan: Latensi yang sangat rendah dari SLM menjadikannya pilihan ideal untuk aplikasi yang butuh respons cepat, seperti asisten suara di mobil atau sistem pengawasan keamanan.
Masa Depan AI: Kemitraan Profesor dan Spesialis
Menurut pandangan NVIDIA dan para ahli, masa depan AI bukanlah tentang memilih satu model di atas yang lain, melainkan tentang mengkombinasikan keduanya.
Bayangkan sebuah AI Agen—sebuah sistem yang dirancang untuk menyelesaikan tugas kompleks. Agen ini bisa menggunakan profesor (LLM) untuk tugas-tugas yang butuh pemikiran mendalam dan kreatif, misalnya merancang strategi pemasaran.
Setelah strategi disetujui, agen bisa membagikan tugas-tugas kecil kepada mahasiswa spesialis (SLM). Misalnya, satu SLM membuat draf iklan, satu SLM lain mengelola data pelanggan, dan satu lagi memantau respons di media sosial.
Dengan model kerja seperti ini, kita bisa mendapatkan yang terbaik dari kedua dunia: Kecerdasan dan fleksibilitas LLM digabungkan dengan kecepatan dan efisiensi SLM. Ini adalah arah yang akan membawa AI menjadi lebih murah, lebih cepat, dan lebih terintegrasi dalam kehidupan kita sehari-hari.
Potensi Transformasi Aplikasi Berbasis LLM
Bila banyak aplikasi AI saat ini adalah sebuah profesor tunggal, di masa depan, mereka bisa saja bertransformasi menjadi sebuah tim yang cekatan. Cara kerjanya tidak lagi mengandalkan satu model besar, melainkan menjadi sebuah sistem yang kompleks, di mana:
- Ada seorang “Manajer” (LLM) yang Bertugas Menganalisis Permintaan. Ketika Anda mengajukan pertanyaan atau memberikan perintah, manajer ini akan membaca dan memahami niat Anda. Misalnya, ia mengenali bahwa pertanyaan Anda membutuhkan kemampuan “penulisan kode” atau “pembuatan ringkasan”.
- Manajer akan Meneruskan Tugas ke “Tim Spesialis” (Kumpulan SLM). Setelah niat Anda teridentifikasi, manajer akan memanggil SLM yang paling sesuai untuk tugas tersebut. SLM khusus untuk kode akan menerima permintaan dan mulai bekerja dengan cepat.
- Hasilnya Dikembalikan dan Disajikan oleh Manajer. Setelah SLM selesai, ia akan mengembalikan hasilnya kepada manajer. Manajer akan memastikan hasilnya sesuai dan menyajikannya kepada Anda dengan format yang rapi dan mudah dibaca.
Kelebihan dan Kekurangan Sistem Agen
Perubahan fundamental ini tentu memiliki dampak yang signifikan. Berikut adalah beberapa kelebihan dan kekurangan yang bisa kita antisipasi:
Kelebihan:
- Respons Relatif Lebih Cepat: Meskipun ada langkah tambahan yang melibatkan “manajer” untuk mengarahkan permintaan, waktu pemrosesan oleh SLM yang terspesialisasi jauh lebih cepat daripada LLM. Secara keseluruhan, sistem ini dapat memberikan respons yang lebih cepat, terutama untuk tugas-tugas rutin.
- Biaya Lebih Efisien: Menjalankan banyak SLM yang ringan jauh lebih murah daripada menjalankan satu LLM yang sangat besar dan haus daya. Hal ini akan menurunkan biaya operasional secara drastis bagi perusahaan teknologi. Tapi, tergantung kondisi deployment tertentu.
- Lebih Modular dan Fleksibel: Jika ada kebutuhan untuk meningkatkan kemampuan penulisan kode, perusahaan hanya perlu memperbarui atau mengganti SLM khusus kode tanpa harus melatih ulang seluruh sistem. Ini membuat pengembangan dan pemeliharaan menjadi lebih lincah.
- Lebih Andal: Jika satu SLM mengalami masalah, hanya fungsi spesifik tersebut yang terpengaruh. Seluruh sistem tetap bisa beroperasi, dan “manajer” dapat mengalihkan tugas atau memberikan pemberitahuan. Tapi ini dugaan saja, karena kalau butuh seluruh rantai proses, berarti ada yang putus mata rantainya.
Kekurangan:
- Kompleksitas Manajemen: Mengelola banyak model kecil dan memastikan mereka dapat berkomunikasi dengan lancar adalah tantangan teknis yang besar. Ini membutuhkan sistem orkestrasi yang canggih.
- Potensi Latensi Awal: Ada sedikit penundaan yang terjadi saat “manajer” menganalisis permintaan dan memilih SLM yang tepat. Meskipun kecil, ini bisa menjadi faktor dalam beberapa kasus yang membutuhkan kecepatan ultra-tinggi.
- Kurang dalam Pengetahuan Umum: Jika permintaan Anda bersifat sangat umum atau tidak dapat dikategorikan ke dalam salah satu spesialisasi SLM, sistem agen mungkin tidak seefektif LLM tunggal. “Manajer” mungkin akan kesulitan dan tidak dapat memberikan respons yang komprehensif.
Alih-alih menjadi ahli di segala hal, produk AI masa depan bisa menjadi platform yang mengelola dan mengkoordinasi banyak model spesialis. Ini perubahan fundamental yang membawa manfaat besar: Respons lebih cepat, biaya lebih rendah, dan sistem modular yang mudah diperbarui.
*Photo by Growtika via Unsplash
Komentar Anda?