Inovasi Polindra: Dataset Bahasa Indonesia untuk Sistem Tanya Jawab Knowledge Graph Siap Bersaing di Kancah Internasional
Tim peneliti dari Politeknik Negeri Indramayu (Polindra) telah menorehkan prestasi membanggakan dengan keberhasilan mengembangkan dataset berbahasa Indonesia yang dirancang khusus untuk sistem Knowledge Graph Question Answering (KGQA). Penelitian inovatif ini telah menghasilkan publikasi berjudul “Indo-WDSimpleQuAD20: an Indonesian Benchmark Dataset for Question Answering Systems” dan berhasil diterima oleh jurnal internasional bereputasi.
Keberhasilan ini disampaikan langsung oleh Kepala Pusat Penelitian dan Pengabdian Kepada Masyarakat Politeknik Negeri Indramayu, Dr. Mohammad Yani, S.T., M.T., M.Sc., kepada awak media pada Selasa, 17 Februari 2026. Beliau menjelaskan bahwa pengembangan dataset ini merupakan hasil kolaborasi para dosen Polindra dari berbagai program studi, yang juga didukung oleh mitra kerja eksternal.
“Penelitian pengembangan dataset berbahasa Indonesia untuk sistem Knowledge Graph Question Answering ini dilakukan oleh kami, para dosen Polindra, dari satu program studi dan dosen Polindra lainnya. Kami juga bekerja sama dengan mitra kerja eksternal, yaitu dosen dari Universitas Indonesia (UI), serta berkolaborasi dengan dosen dari Uniska Karawang dan Sekolah Tinggi BSI yang ada di Bekasi,” ujar Dr. Mohammad Yani.
Motivasi di Balik Penelitian Krusial Ini
Keputusan untuk mengembangkan dataset KGQA berbahasa Indonesia ini dilandasi oleh beberapa faktor krusial. Dr. Mohammad Yani memaparkan, topik mengenai Knowledge Graph dan sistem tanya jawab yang cerdas merupakan bidang yang sangat populer dan banyak dikerjakan oleh para peneliti di seluruh dunia.
“Mengapa kami bersama teman-teman dosen melakukan penelitian dataset untuk sistem Knowledge Graph Question Answering? Karena ini adalah topik yang sangat populer dan diangkat oleh banyak peneliti. Untuk itu, kami merasa sangat perlu untuk melakukan penelitian dan mengembangkannya. Jika kita lihat, untuk bahasa asing selain bahasa Inggris, seperti bahasa Jerman, sudah ada dataset yang tersedia. Namun, untuk bahasa Indonesia, ketersediaannya masih terbatas. Itulah yang mendasari kami untuk melakukan penelitian ini, dan kami yakin ini memiliki potensi besar untuk pengembangan penelitian lebih lanjut,” jelasnya.
Prestasi yang Mendunia
“Alhamdulillah, penelitian dari dosen Polindra dalam mengembangkan dataset berbahasa Indonesia untuk sistem Knowledge Graph Question Answering ini berhasil diterima oleh jurnal internasional. Makalah penelitian kami sudah dapat dipublikasikan pada Desember tahun 2025 lalu,” ungkap Dr. Mohammad Yani dengan penuh rasa syukur.
Penerimaan di jurnal internasional ini bukan hanya sekadar pengakuan atas kualitas penelitian, tetapi juga membuka pintu bagi kontribusi signifikan dalam komunitas riset global, khususnya dalam ranah pemrosesan bahasa alami (NLP) berbahasa Indonesia.
Tindak Lanjut dan Harapan ke Depan
Menyikapi keberhasilan ini, tindak lanjut penelitian akan terus dilakukan. Fokusnya adalah pada pengembangan penelitian lain yang relevan dan berkaitan erat dengan riset yang telah dicapai.
“Adapun tindak lanjutnya setelah penelitian ini adalah akan dilanjutkan kepada penelitian yang lain yang relevan dengan penelitian tersebut,” tegas Dr. Mohammad Yani.
Harapan terbesar dari tim peneliti Polindra adalah agar hasil penelitian ini dapat terus meningkat tingkat kemanfaatannya dan memberikan dampak positif yang lebih luas bagi masyarakat.
“Harapannya adalah semakin naik level Tingkat Komponen Dalam Negeri (TKT)-nya dan semakin bermanfaat untuk masyarakat. Untuk ke depannya, kita tingkatkan TKT-nya, tidak hanya konsep yang dibuat, tetapi dapat dimanfaatkan oleh masyarakat pada umumnya,” tutup Dr. Mohammad Yani.
Pengembangan dataset KGQA berbahasa Indonesia ini menjadi tonggak penting dalam upaya memajukan teknologi kecerdasan buatan di Indonesia, khususnya dalam bidang pemahaman bahasa dan penyediaan informasi yang lebih akurat dan efisien bagi penutur bahasa Indonesia.





