IMPLEMENTASI PERINGKAS DOKUMEN BERBAHASA INDONESIA MENGGUNAKAN METODE TEXT TO TEXT TRANSFER TRANSFORMER (T5)

I Nyoman Purnama,Ni Nengah Widya Utami
DOI: https://doi.org/10.36002/jutik.v9i4.2531
2023-08-11
Jurnal Teknologi Informasi dan Komputer
Abstract:Dengan banyaknya informasi yang terdapat pada sebuah berita digital, membuat pembaca terkadangmengalami kesulitan untuk mengetahui intisari dari kumpulan teks ini. Untuk itu dibutuhkan sebuahsistem yang bisa meringkas berita digital berbahasa Indonesia secara otomatis. Peringkasan dokumenadalah proses mengambil teks dari sebuah dokumen, menggali dan menyajikan informasi penting bagiuser atau aplikasi dalam bentuk rangkuman yang singkat dan padat. Ketika kita dihadapkan pada strukturbahasa yang cukup kompleks, seperti pada Bahasa manusia, kemudian menangkap ide dan makna utamateks asli. Disinilah digunakan model Transformer yang merupakan model peringkas yang berkinerjatinggi. T5 merupakan contoh model transformer abstraktif yang menulis ulang kembali kalimatnyadaripada hanya mengambil kalimat langsung dari teks aslinya. Pada penelitian ini dilakukan prosesperingkasan dokumen berita berbahasa Indonesia dengan metode transformer T5. Penelitian inidikerjakan dengan tiga skenario. Bagian yang membedakan masing-masing skenario adalah pada bagianpreprocessing katanya. Pada skenario 1 diimplementasikan stemming dan stopwords removal, padaskenario 2 diimplementasikan stemming tanpa stopwords removal, dan pada skenario 3 tidakdiimplementasikan keduanya. Adapun kesimpulan yang dapat diambil pada penelitian ini adalahpengujian terbaik yang didapatkan adalah pengujian dengan skenario 2, yaitu denganmengimplementasikan stemming tanpa stopwords removal dengan nilai evaluasi ROUGE-1 0.17568.
What problem does this paper attempt to address?