Beranda  »  Artikel » Teknologi Digital   »   Panduan UNESCO untuk Open Data AI

Panduan UNESCO untuk Open Data AI

Oleh: Melekmedia -- 11 November, 2025 
Tentang:  –  Komentar Anda?

a close up of a window with a building in the background

Ketika pandemi COVID-19 melanda dunia, respons global menunjukkan kekuatan luar biasa dari data terbuka. Dalam waktu singkat, negara-negara berbagi data kesehatan, peneliti berkolaborasi melintasi batas, dan vaksin dikembangkan dalam tempo yang belum pernah terjadi sebelumnya.

Namun, di balik kesuksesan ini, tersimpan pertanyaan krusial: bagaimana kita bisa menerapkan pola kerja sama data ini untuk tantangan global lainnya?

UNESCO, melalui dokumen “Open Data for AI: What now?” yang diterbitkan pada 2023, memberikan panduan komprehensif tentang bagaimana data terbuka (open data) dapat memaksimalkan potensi kecerdasan buatan (AI) untuk pembangunan berkelanjutan.

Dokumen ini menjadi pengingat penting bahwa di era digital, data bukan hanya aset—tetapi juga tanggung jawab. Namun, penting untuk memahami perbedaan mendasar antara open data dan open source dalam konteks AI, karena keduanya sering disalahpahami.

Open data atau data terbuka merujuk pada data mentah atau terproses yang dibuka untuk publik, seperti dataset gambar untuk melatih sistem pengenalan wajah, data cuaca dari stasiun meteorologi, atau rekaman suara dalam berbagai bahasa.

Data ini adalah “bahan bakar” yang memberi makan sistem AI. Sementara itu, open source adalah kode program atau algoritma yang dibuka untuk publik, seperti TensorFlow atau PyTorch, yang menjadi “mesin” atau “alat” untuk memproses data tersebut.

Untuk memahami hubungan keduanya, bayangkan Anda hendak membuat kue. Data terbuka adalah bahan-bahan seperti tepung, gula, dan telur yang dibagikan secara gratis. Open source adalah resep dan alat masak seperti mixer dan oven yang juga dibagikan secara cuma-cuma.

Tanpa bahan, resep tidak berguna. Tanpa resep dan alat, bahan hanya akan mengendap sia-sia. Dalam dunia AI, Anda memerlukan keduanya untuk menghasilkan model yang berkualitas dan dapat dipertanggungjawabkan.

Inilah mengapa dokumen UNESCO ini sangat penting. Saat ini, banyak sistem AI canggih menggunakan open source namun dilatih dengan data yang tertutup dan tidak terdokumentasi. GPT-3 dari OpenAI, misalnya, menggunakan arsitektur yang dipublikasikan sehingga orang bisa memahami cara kerjanya, tetapi data pelatihannya dirahasiakan.

Akibatnya, sulit bagi peneliti independen untuk mereproduksi hasil atau mengaudit bias yang mungkin tersembunyi dalam model tersebut. Sebaliknya, ada juga model komersial yang dilatih menggunakan dataset publik seperti Wikipedia, namun kode dan arsitektur modelnya rahasia, sehingga komunitas tidak bisa memodifikasi atau memperbaikinya.

Kombinasi ideal yang didorong UNESCO adalah keterbukaan penuh: data terbuka yang terdokumentasi dengan baik, kode terbuka untuk transparansi, model weights yang dapat digunakan, dan dokumentasi lengkap tentang cara pelatihan, evaluasi, serta keterbatasan sistem.

Hanya dengan keterbukaan menyeluruh inilah AI dapat dikembangkan secara inklusif, dapat diaudit untuk keadilan, dan benar-benar melayani kepentingan publik. Dokumen ini menekankan bahwa tanpa data terbuka, demokratisasi AI hanyalah slogan kosong—terutama bagi negara-negara berkembang yang tidak memiliki sumber daya untuk mengumpulkan dataset besar sendiri.

Mengapa Open Data Penting untuk AI?

Definisi dan Prinsip

Open data, menurut Open Knowledge Foundation, adalah data yang “dapat digunakan, dimodifikasi, dan dibagikan secara bebas oleh siapa saja untuk tujuan apa pun.” Namun, keterbukaan saja tidak cukup. Data juga harus memenuhi prinsip FAIR:

  • Findable (Dapat Ditemukan): Data memiliki identifikasi unik dan metadata yang kaya
  • Accessible (Dapat Diakses): Tersedia melalui protokol standar yang terbuka
  • Interoperable (Dapat Beroperasi Bersama): Dapat diintegrasikan dengan data lain
  • Reusable (Dapat Digunakan Kembali): Memiliki lisensi jelas dan dokumentasi lengkap

Untuk komunitas adat, prinsip CARE juga penting: Collective benefit (manfaat kolektif), Authority to control (otoritas untuk mengontrol), Responsibility (tanggung jawab), dan Ethics (etika).

Sinergi AI dan Open Data

Perkembangan AI, khususnya machine learning dan generative AI, sangat bergantung pada ketersediaan data berkualitas dalam jumlah besar. Namun, realitasnya:

  • Banyak data belum dikumpulkan atau disimpan dalam silo yang terpisah
  • Data yang ada sering kali tidak dalam format yang dapat dibaca mesin
  • Data seringkali tidak diperbarui atau tidak akurat
  • Banyak data tidak memiliki label lisensi yang jelas

UNESCO menekankan bahwa open data tidak hanya mendukung transparansi dan akuntabilitas pemerintah, tetapi juga menjadi bahan bakar untuk sistem AI yang dapat mengidentifikasi pola tersembunyi dan memberikan informasi yang dapat ditindaklanjuti.

Tantangan dan Risiko

Kesenjangan Data Global

Dokumen UNESCO mengidentifikasi masalah serius: 120 negara masih tidak memiliki kebijakan open data. Kesenjangan ini menciptakan bias dalam sistem AI, karena komunitas dan wilayah yang datanya tidak tersedia akan “tidak terlihat” oleh teknologi.

Contoh konkret: sistem penerjemahan antara bahasa Inggris dan Prancis sangat canggih karena tersedia korpus data yang besar, sementara banyak bahasa daerah di Afrika dan Asia tidak mendapat perhatian serupa.

Dilema Privasi vs Keterbukaan

Salah satu perdebatan utama adalah keseimbangan antara membuka data dan melindungi privasi individu. Selama pandemi COVID-19, beberapa negara mengalami kebocoran data pasien, menunjukkan bahwa keterbukaan tanpa perlindungan yang memadai bisa berbahaya.

Bahaya Data (Data Hazards)

Nick Bostrom, yang dikutip dalam dokumen, mendefinisikan “data hazard” sebagai data spesifik—seperti urutan genetik patogen mematikan atau cetak biru senjata termonuklir—yang jika disebarluaskan dapat menciptakan risiko. Ini menjadi pertimbangan penting dalam konteks AI, saat teknologi yang sama bisa digunakan untuk tujuan baik atau jahat.

Panduan 12 Langkah UNESCO

UNESCO menyusun panduan praktis dalam tiga fase dengan total 12 langkah:

Fase Persiapan

  1. Menyusun Kebijakan Manajemen dan Berbagi Data: Negara perlu komitmen formal dengan prinsip “seterbuka mungkin, setertutup seperlunya”
  2. Mengumpulkan Data Berkualitas Tinggi: Data harus akurat, komprehensif, dan terdisagregasi berdasarkan pendapatan, jenis kelamin, usia, ras, etnis, status migrasi, disabilitas, dan lokasi geografis
  3. Membangun Kapasitas Open Data: Pelatihan literasi data untuk pejabat pemerintah dan calon pengguna data
  4. Membuat Data Siap untuk AI: Data harus dalam format yang dapat dibaca mesin, dibersihkan, dan diberi label untuk pembelajaran terawasi (supervised learning)

Fase Pembukaan Data

  1. Memilih Dataset yang Akan Dibuka: Pertimbangkan permintaan publik, praktik negara lain, serta isu privasi dan keamanan nasional
  2. Membuka Dataset Secara Legal: Pilih lisensi yang tepat (seperti Creative Commons) dengan pertimbangan atribusi, penggunaan komersial, dan turunan
  3. Membuka Dataset Secara Teknis: Publikasikan di portal yang mudah diakses dengan metadata yang lengkap, idealnya mencapai “5 bintang” dalam skala keterbukaan data Berners-Lee
  4. Menciptakan Budaya Berbasis Data: Ubah mentalitas silo dalam institusi pemerintah dan jadikan data sebagai dasar pengambilan keputusan

Fase Tindak Lanjut

  1. Mendukung Keterlibatan Warga: Kampanye advokasi, konsultasi pengguna, hackathon, dan kompetisi pemanfaatan data
  2. Mendukung Keterlibatan Internasional: Kemitraan Selatan-Selatan dan Utara-Selatan untuk berbagi kapasitas dan pengetahuan
  3. Mendukung Penggunaan AI yang Bermanfaat: Dorong pengembang menggunakan data untuk AI yang bertanggung jawab, dengan lisensi seperti Responsible AI Licences (RAIL)
  4. Memelihara Data Berkualitas: Pembaruan rutin untuk menjaga relevansi dan akurasi

Inisiatif dan Platform Global

Dokumen mencatat berbagai inisiatif penting:

  • Open Data Institute (2012): Didirikan Tim Berners-Lee untuk ekosistem data yang terbuka dan terpercaya
  • International Open Data Charter (2015): Prinsip global untuk penerbitan data terbuka
  • Research Data Alliance: Inisiatif komunitas untuk infrastruktur data penelitian
  • Open SDG Data Hub: Platform PBB untuk memantau Tujuan Pembangunan Berkelanjutan

Untuk COVID-19 sendiri, tercatat puluhan platform seperti Johns Hopkins Dashboard, GISAID untuk genom virus, dan Global.health untuk data epidemiologi tingkat individu (yang dianonimkan).

Implikasi untuk Indonesia

Sebagai negara dengan populasi besar dan keragaman tinggi, Indonesia menghadapi tantangan sekaligus peluang dalam open data:

  1. Kesenjangan Digital: Infrastruktur data tidak merata antara Jawa dan luar Jawa, perkotaan dan pedesaan
  2. Bahasa dan Budaya: Data lokal dalam bahasa daerah masih minim, padang ini penting untuk AI yang inklusif
  3. Kapasitas Institusi: Banyak instansi pemerintah belum memiliki budaya berbagi data
  4. Privasi dan Keamanan: Perlu kerangka hukum yang jelas untuk melindungi data pribadi sambil mendorong keterbukaan

Saran untuk Indonesia

Untuk Pemerintah

  • Segera susun dan implementasikan Kebijakan Nasional Open Data yang komprehensif
  • Investasi dalam infrastruktur data dan pelatihan literasi data untuk aparatur
  • Prioritaskan pembukaan data terkait SDGs, kesehatan, pendidikan, dan lingkungan
  • Bangun portal data nasional yang terintegrasi dengan standar internasional

Untuk Peneliti dan Akademisi

  • Adopsi prinsip FAIR dalam pengelolaan data penelitian
  • Kolaborasi dengan pemerintah untuk mengidentifikasi data prioritas
  • Kembangkan model AI yang dapat bekerja dengan data lokal yang terbatas
  • Edukasi mahasiswa tentang etika data dan AI

Untuk Sektor Swasta

  • Pertimbangkan “data philanthropy” dengan berbagi data non-sensitif untuk kepentingan publik
  • Dukung inisiatif open data melalui CSR atau kemitraan
  • Kembangkan produk dan layanan yang memanfaatkan open data pemerintah

Untuk Masyarakat Sipil dan Media

  • Lakukan advokasi untuk transparansi dan akuntabilitas melalui open data
  • Latih kemampuan data literacy untuk memverifikasi informasi dan melawan disinformasi
  • Manfaatkan data terbuka untuk investigasi jurnalistik dan monitoring kebijakan
  • Partisipasi dalam hackathon dan kompetisi inovasi berbasis data

Kesimpulan: Data sebagai Barang Publik

UNESCO menyimpulkan bahwa manfaat utama open data adalah membangun kepercayaan dan solidaritas. Di era di mana fake news dan disinformasi merajalela, transparensi data menjadi benteng demokrasi.

Visi dokumen ini jelas: negara-negara anggota UNESCO harus tidak hanya mengukur berbagai aspek dunia, tetapi juga membuat data tersebut terbuka (dengan tetap menghormati privasi) sehingga dapat diproses dan dianalisis untuk kebaikan sosial oleh siapa pun, termasuk melalui sistem AI.

Seperti yang dikatakan dalam UNESCO Recommendation on the Ethics of Artificial Intelligence (2021), open data bukan sekadar kebijakan teknis—ini adalah komitmen etis untuk memastikan AI dikembangkan secara inklusif, adil, dan untuk kepentingan seluruh umat manusia.

Pesan penutup dari dokumen ini sederhana namun mendesak: “Jadikan data Anda findable, accessible, interoperable, dan reusable serta AI-ready, singkatnya FAIR, sehingga dapat diproses dan dianalisis lebih lanjut untuk kebaikan sosial oleh siapa pun.”

*Photo by Claudio Schwarz via Unsplash

Artikel lain sekategori:

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Situs ini menggunakan Akismet untuk mengurangi spam. Pelajari bagaimana data komentar Anda diproses

```

Topik
Komentar
Materi Kursus