Pelajari kenapa pemerintah dan institusi publik lebih cocok pakai Small Language Models (SLMs) dibanding LLM besar, plus cara implementasinya yang aman dan efisien.

AI lagi booming di semua industri, dan organisasi sektor publik juga ikut tertekan untuk cepat adopsi. Tapi pemerintah punya kendala khusus soal keamanan, tata kelola, dan operasional yang beda sama dunia bisnis.

Nah, di sinilah Small Language Models (SLMs) masuk sebagai solusi menarik. Model kecil yang dibuat khusus ini bisa bantu operationalize AI di lingkungan yang terbatas.

Studi Capgemini menemukan 79% eksekutif sektor publik global khawatir soal keamanan data AI. Wajar sih, data pemerintah itu sensitif dan punya kewajiban hukum ketat.

Advertisement

Han Xiao, VP AI di Elastic, bilang agensi pemerintah harus sangat hati-hati soal data yang dikirim ke jaringan luar. Ini bikin banyak batasan dalam cara mereka kelola data.

Kebutuhan dasar untuk kontrol informasi sensitif ini salah satu faktor yang bikin deployment AI jadi rumit, terutama kalau dibandingkan dengan asumsi operasional di sektor swasta.

Ketika perusahaan swasta expand AI, mereka biasanya asumsi ada koneksi cloud terus-menerus, infrastruktur terpusat, dan data bisa bebas bergerak. Buat institusi negara, kondisi ini bisa berbahaya atau bahkan mustahil.

Agensi pemerintah harus pastikan data tetap di bawah kontrol mereka, informasi bisa diverifikasi, dan gangguan operasional diminimalisir. Seringkali mereka juga harus jalanin sistem di tempat dengan koneksi internet terbatas atau nggak ada sama sekali.

Kompleksitas ini mencegah banyak pilot AI sektor publik keluar dari tahap eksperimen. Xiao bilang banyak orang underestimate operating challenge AI.

Survei Elastic ke pemimpin sektor publik menemukan 65% kesulitan pakai data secara kontinu real-time dan dalam skala besar. Infrastruktur juga jadi masalah tambahan.

Organisasi pemerintah sering kesulitan dapetin GPUs yang dipakai buat train dan akses model AI kompleks. Xiao jelaskan pemerintah nggak biasa beli dan kelola infrastruktur GPU, jadi ini jadi bottleneck.

Kebutuhan non-negotiable yang banyak di sektor publik bikin large language models (LLMs) jadi nggak feasible. Tapi SLMs bisa di-host secara lokal, kasih keamanan dan kontrol lebih baik.

SLMs itu model AI spesialis yang biasanya pakai miliaran parameter, bukan ratusan miliar. Jadi jauh lebih hemat komputasi daripada LLM terbesar.

Studi empiris menemukan SLMs perform sama bagus atau lebih baik dari LLMs. SLMs bikin informasi sensitif bisa dipakai efektif dan efisien tanpa kompleksitas operasional maintain model besar.

Xiao bilang gampang pakai ChatGPT buat proofreading, tapi susah jalanin LLM sendiri se-smooth itu di lingkungan tanpa akses jaringan.

SLMs dibuat khusus untuk kebutuhan departemen atau agensi yang akan menggunakannya. Data disimpan aman di luar model, cuma diakses waktu di-query.

Prompt yang dirancang dengan hati-hati pastikan cuma informasi paling relevan yang di-retrieve, kasih respons lebih akurat. Metode kayak smart retrieval, vector search, dan verifiable source grounding bisa bangun sistem AI yang sesuai kebutuhan sektor publik.

Fase berikutnya adopsi AI di sektor publik mungkin adalah bawa tool AI ke data, bukan kirim data ke cloud. Gartner prediksi tahun 2027, model AI kecil spesialis akan dipakai tiga kali lebih sering daripada LLMs.

Xiao bilang orang di sektor publik mungkin denger AI langsung pikir ChatGPT, tapi kita bisa jauh lebih ambisius. AI bisa revolusi cara pemerintah search dan kelola data besar yang mereka punya.

Di balik chatbot, ada opportunity AI yang langsung: search yang jauh lebih baik. Sektor publik punya gunung data unstructured—laporan teknis, dokumen procurement, notulen, invoice.

AI sekarang bisa deliver hasil dari mixed media: PDF readable, scan, gambar, spreadsheet, rekaman, dalam multiple languages. Semua ini bisa di-index sistem berbasis SLM buat kasih respons tailored dan draft teks kompleks dalam bahasa apapun, sambil pastikan output legally compliant.

Xiao jelaskan sektor publik punya banyak data tapi nggak selalu tahu cara pakai atau apa kemungkinannya. Lebih powerful lagi, AI bisa bantu pegawai pemerintah interpretasi data yang mereka akses.

SLM yang well-trained bisa interpretasi norma hukum, ekstrak insight dari konsultasi publik, support executive decision-making berbasis data, dan improve akses publik ke layanan dan informasi administratif.

Fokus ke SLMs mindahin percakapan dari seberapa komprehensif modelnya ke seberapa efisien. LLMs punya cost performa dan komputasi signifikan, butuh hardware spesialis yang banyak entitas publik nggak mampu.

Meski butuh capital expense, SLMs less resource-intensive daripada LLMs, jadi cenderung lebih murah dan reduce environmental impact.

Agensi sektor publik sering hadapi audit requirements ketat, dan algoritma SLM bisa didokumentasi dan disertifikasi sebagai transparan. Beberapa negara, terutama di Eropa, punya privacy regulations kayak GDPR yang SLMs bisa didesain untuk penuhi.

Training data yang tailored produce hasil lebih targeted, reduce errors, bias, dan hallucinations yang AI rentan. Xiao bilang LLMs generate text berdasarkan apa yang mereka trained on, ada cut-off date. Kalau ditanya soal sesuatu setelah itu, bakal hallucinate.

Ini bisa di-solve dengan force model kerja dari verified sources. Risiko juga diminimalisir dengan keep data di local servers, atau bahkan di specific device.

Ini bukan tentang isolasi, tapi strategic autonomy buat enable trust, resilience, dan relevance. Dengan prioritaskan task-specific models yang didesain untuk lingkungan process data secara lokal, organisasi sektor publik bisa bangun AI capabilities yang lasting.

Xiao kasih advice praktis: jangan mulai dari chatbot, mulai dari search. Banyak dari apa yang kita anggap sebagai AI intelligence sebenarnya tentang finding the right information.

Technology lagi bergerak cepat, jadi jangan cuma lihat headline.

MIT Technology Review

Catatan redaksi

Kalau lo cuma ambil satu hal dari artikel ini

Technology update dari MIT Technology Review.

Sumber asli

Artikel ini merupakan rewrite editorial dari laporan MIT Technology Review.

Baca artikel asli di MIT Technology Review
#Technology#MITTechnologyReview#rss