
Perlombaan global membangun kecerdasan buatan, dikuasai model bahasa besar yang lahir dari perusahaan teknologi tertutup. Swiss mengklaim LLM paling beradab di dunia akan lahir dari kaki pegunungan Alpen, tempat yang berjarak 9.500 kilometer dari Silicon Valley.
OpenAI dengan ChatGPT, Google DeepMind dengan Gemini, Anthropic dengan Claude, dan Meta dengan Llama, semuanya produk menakjubkan, tetapi menyisakan pertanyaan dari sisi etika, transparansi, dan keadilan.
Di balik kecanggihan mereka tersembunyi dilema: Dari mana data latihannya? Apakah penulis, seniman, dan programmer tahu karya mereka dikunyah mesin? Siapa yang mengakses model ini, dan atas dasar apa?
Di tengah krisis kepercayaan ini, Swiss melangkah ke arah sebaliknya. Alih-alih memperkuat kepemilikan korporat atas kecerdasan buatan, Swiss mengusulkan gagasan radikal: Membangun LLM yang sepenuhnya terbuka, akuntabel, dan dirancang untuk kepentingan publik.
Pada Juli 2025, tiga institusi besar—ETH Zürich, EPFL, dan CSCS—mengumumkan peluncuran model bahasa yang bukan hanya terbuka kode dan parameternya, tetapi juga dataset pelatihannya, lisensinya, serta proses pengembangannya.
Ada dua versi yang tersedia, berukuran 8 miliar dan 70 miliar parameter—skala yang menyaingi model komersial saat ini. Namun yang membuatnya istimewa bukanlah performa, melainkan prinsip yang mendasarinya.
Inisiatif ini seiring dengan gerakan open source yang makin masif, terutama di Amerika Serikat dan Tiongkok. Meski begitu, dari sekian banyak inisiatif, tidak semua menggunakan lisensi yang benar-benar terbuka, bahkan untuk penggunaan komersial.
Apa dan Mengapa Model AI Ini Radikal
Pertama-tama, model ini mengedepankan keterbukaan. Semua elemen teknisnya dirilis di bawah lisensi Apache 2.0. Pihak universitas, pemerintah, hingga komunitas pengembang—dapat menggunakan, meneliti, atau mengadaptasinya tanpa biaya lisensi atau batasan legal.
Transparansi semacam ini langka, bahkan di antara model yang mengklaim sebagai open source. Lebih penting lagi, model ini dilatih dengan menghormati hak cipta: Hanya menggunakan data yang secara eksplisit memperbolehkan penggunaan publik.
Selain itu, mereka mematuhi sinyal opt-out dari situs web yang tidak ingin datanya diserap oleh mesin. Ini menjawab salah satu kritik terbesar terhadap LLM komersial: Praktik pengambilan data tanpa izin yang melanggar hak pembuat konten.
Dari segi linguistik, model ini juga jauh lebih inklusif. Didesain untuk mengenali lebih dari seribu bahasa, tidak terpaku pada dominasi bahasa Inggris seperti kebanyakan model. Sekitar 40 persen data berasal dari non-Inggris, mencerminkan ambisi untuk membuat AI yang inklusif.
Ini bukan hanya soal representasi, melainkan soal kekuasaan—sebab dalam era digital, siapa yang didengar dan diabaikan oleh AI turut menentukan siapa yang berkuasa di ranah pengetahuan dan percakapan global.
Yang tak kalah penting, pelatihan model ini dilakukan di superkomputer Alps milik Swiss National Supercomputing Centre (CSCS), menggunakan listrik dari sumber energi terbarukan. Proses komputasi intensif tersebut berjalan dengan jejak karbon minimal, menjadikannya ramah lingkungan.
Dalam konteks krisis iklim, langkah ini menjadi argumen kuat bahwa efisiensi dan tanggung jawab ekologis dapat dan harus menjadi bagian dari inovasi teknologi.
Model ini tidak lahir dari perusahaan, melainkan dari kerja sama institusi publik. ETH Zürich adalah universitas teknik terkemuka dunia, almamater Albert Einstein, dan pusat riset global dalam bidang sains komputasi.
EPFL (École Polytechnique Fédérale de Lausanne), mitra federalnya di Swiss bagian barat, dikenal luas sebagai pelopor dalam bidang machine learning dan etika AI. Sementara itu, CSCS menyediakan infrastruktur superkomputer berkelas dunia.
Kerja sama ini memungkinkan pelatihan model dalam skala besar dengan sumber daya bersih. Mereka menciptakan model yang secara teknis kuat dan secara etis lebih unggul dari banyak model komersial yang dominan; dan paling ramah lingkungan.
Apa Manfaat Buat Indonesia
Apa relevansinya bagi Indonesia? Indonesia adalah negara dengan ratusan bahasa lokal dan keragaman budaya digital yang belum sepenuhnya terwakili dalam ekosistem AI global.
Selama ini, LLM yang tersedia lebih mengakomodasi bahasa-bahasa besar dunia. Sementara bahasa Indonesia—apalagi bahasa daerah—sering terpinggirkan. Ketersediaan bahasa Indonesia pun, dalam beberapa model, tidak sepenuhnya aplikatif.
Dengan keterbukaan penuh dari model Swiss ini, peneliti dan pengembang di Indonesia memiliki kesempatan untuk mengadaptasi model ini, melatih ulang dengan data lokal, atau bahkan menggunakannya untuk membangun sistem AI dalam bahasa Indonesia dan bahasa daerah.
Lembaga pemerintah, universitas, komunitas jurnalis, dan organisasi masyarakat sipil bisa menggunakannya untuk membangun chatbot pelayanan publik, pelacak hoaks, atau sistem pendukung pembelajaran, tanpa harus tergantung pada vendor asing atau bayar lisensi mahal.
Model ini membuka kemungkinan bagi Indonesia untuk memiliki dan mengendalikan infrastrukturnya sendiri dalam bidang kecerdasan buatan, dengan standar etika yang tinggi dan keberlanjutan jangka panjang.
Ini langkah kecil secara teknis, tetapi lompatan besar secara politik: Dari pengguna AI global pasif, menuju partisipasi aktif dalam pengembangan teknologi pengetahuan masa depan.
LLM Lokal, Bukankah Sudah Ada?
Bukankah Indonesia sudah punya model LLM yang mengakomodir bahasa daerah, seperti buatan Indosat dkk? Yup, tapi model itu tidak benar-benar open source, karena tidak bisa dikembangkan lebih lanjut oleh komunitas.
Hingga sekarang, dokumentasi resmi lisensinya belum dijelaskan secara rinci di situs Hugging Face. Situs memang menyediakan akses untuk mengunduh model, tapi tidak mencantumkan lisensi terbuka seperti Apache atau MIT secara eksplisit (setidaknya per Agustus 2025).
Indosat Ooredoo Hutchison, bersama NVIDIA dan Nodeflux, mengembangkan LLM untuk bahasa daerah Indonesia. Fokusnya inklusivitas digital dan perluasan akses layanan berbasis AI bagi penutur bahasa daerah, terutama dalam layanan pelanggan, penyuluhan, dan pengenalan suara.
Berbeda dengan modesl Swiss yang terbuka sepenuhnya, Indosat belum mengungkap seluruh bahasa yang digunakan, tapi mereka menyebutkan fokus awal pada bahasa Jawa, Sunda, Minang, dan Bugis, terutama untuk pengenalan suara dan dialog.
Indosat juga belum membuka bagaimana data dikumpulkan, apakah mereka melibatkan komunitas penutur atau hanya mengandalkan scraping dari YouTube, subtitle, atau media sosial. Setidaknya, dalam berbagai publikasi hal ini belum dijelaskan secara detail.
Model Indosat bisa jadi langkah awal yang penting, tapi tanpa keterlibatan komunitas dan dokumentasi terbuka, ia berisiko menjadi alat bisnis, bukan warisan budaya digital.
LLM Bahasa Daerah tanpa disertai dokumentasi, partisipasi komunitas, dan audit terbuka, rawan menjadi proyek ‘pemanenan bahasa’ tanpa imbal balik. Bahasa jadi alat bantu otomatisasi—bukan entitas budaya yang dihargai.
AI untuk Bersama
Inilah mengapa inisiatif dari Swiss bukan hanya soal inovasi teknologi. Ia adalah pernyataan politik bahwa AI bisa dan seharusnya dibangun sebagai milik bersama. Di dunia yang makin dikendalikan algoritma, penting untuk memastikan siapa yang mengendalikan, dan untuk siapa ia bekerja.
Tentu saja mereka tidak lepas dari kritik. Misalnya, model Swiss ini “hanya” 70B parameter, jauh lebih kecil dari Claude Opus (300B–1.8T). Meski begitu, ia memang tidak dirancang untuk bersaing head-to-head. secara bisnis.
Tujuannya bukan performa tertinggi secara komersial, tapi aksesibilitas, auditabilitas, dan etika data. Model Swiss ditujukan untuk aplikasi sosial: riset iklim, kesehatan, pendidikan, dan robotika. Bahkan proyek Indosat fokus pada pelestarian bahasa lokal, bukan performa generalis.
Tapi kalau tujuannya difokuskan ke NLP lokal dan budaya, justru kecil dan modular itu keunggulan. Model yang terlalu generalis akan membuka banyak celah, membuat masalah di sana-sini sehingga tidak akan pernah mencapai kualitas yang ideal.
Kritik lain adalah, dengan data terbatas karena etika, apakah berdampak pada performa lebih rendah Pihak pengembang mengklaim tidak ada degradasi performa berarti. Tapi klaim ini belum diuji di konteks lain seperti dialog sehari-hari, narasi budaya lokal, atau pengolahan emosi.
Setidaknya, saat perusahaan berlomba menjual AI sebagai produk, Swiss membuktikan AI juga bisa menjadi infrastruktur publik. Jika proyek ini berhasil—publik menggunakannya, komunitas mendukungnya, dan negara-negara lain mengikutinya—maka sejarah akan mencatat:
LLM paling beradab di dunia lahir dari kaki pegunungan Alpen, mengalir ke tempat-tempat yang selama ini tak disapa oleh algoritma Silicon Valley.
*Gambar tangkapan layar dari video SwissaiWeeks
Komentar Anda?