Pengukuran Kemiripan Makna Kalimat dalam Bahasa Indonesia Menggunakan Metode Path

Authors

  • Yessy Caterina Teknik Informatika Universitas Islam Negeri Maulana Malik Ibrahim Malang
  • Muhammad Ainul Yaqin Teknik Informatika Universitas Islam Negeri Maulana Malik Ibrahim Malang
  • Syahiduz Zaman Teknik Informatika Universitas Islam Negeri Maulana Malik Ibrahim Malang

DOI:

https://doi.org/10.21111/fij.v6i2.4844

Abstract

AbstrakPengukuran kemiripan makna kalimat bertujuan untuk didapatkan nilai kemiripan antar satu kalimat dengan kalimat yang lain. Nilai kemiripan yang didapatkan tersebut kemudian dapat diimplementasikan untuk pengembangan sistem yang berbasis matching sentence, misalnya search engine. Pada beberapa penelitian yang dilakukan sebelumnya, membahas mengenai efektivitas algoritma semantik dalam mengukur kemiripan makna kalimat dalam bahasa Inggris. Sedangkan, penelitian ini mencari kemiripan makna antar kalimat dalam bahasa Indonesia. Dataset  dalam pencarian dan pengukuran makna kalimat pada penelitian ini menggunakan sinonimkata.com yang berupa node atau percabangan. Pada perhitungan kemiripan makna kalimat menggunakan WordNet, pendekatan  yang digunakan ialah Wu Palmer, Lin, Path, Resnik, dan Hirst-St (HSO). Pada penelitian ini menggunakan pendekatan path karena paling sesuai untuk menghitung jumlah node atau relasi yang terhubung antar node lain dalam sinonimkata.com. Pengukuran ini dilakukan dengan 5 eksperimen yakni, berdasarkan susunan kalimat kata kerja – kata benda,  kalimat aktif – kalimat pasif (makna sama), 2 kalimat aktif, 2 kalimat pasif, dan kalimat aktif – kalimat pasif (makna berbeda). Menghitung nilai kemiripan kata diurai dengan kriteria kelas kata kerja, dan kata benda kemudian dihitung berdasarkan contextual menggunakan pendekatan path yang kemiripan katanya dicari menggunakan sinonimkata.com. Dari proses perhitungan kelima eksperimen tersebut, dapat dihasilkan kemiripan kalimat dalam bahasa Indonesia yang memiliki tingkat kemiripan yang tinggi bernilai 0,875 pada eksperimen kriteria kalimat dengan susunan kata kerja – kata benda.Kata kunci: kemiripan makna kalimat, sinonimkata.com, path Abstract[Measurement of the sentence similarity in Indonesian using the path method] Measurement of the sentence similarity aims to obtain the value of similarity between one sentence and another sentence. The similarity value obtained can be implemented for the development of a based system on matching sentences, for example, search engines. In several previous studies, discussed the effectiveness of semantic algorithms in measuring the sentence similarity meanings in English. Meanwhile, this research looks for similarities of the meaning of one sentence to another in Indonesian. The dataset in the search and measurement of the sentence similarity in this study using sinonimkata.com in the form of nodes or branches. In the calculation of the sentence similarity meanings using WordNet, the approach used is Wu Palmer, Lin, Path, Resnik, and Hirst-St (HSO). This study uses a path approach because it is best suited to calculate the number of nodes or relationships connected between other nodes in sinonimkata.com. This measurement was done with 5 experiments, based on the composition of verb sentences – nouns, active sentences – passive sentences (same meaning), 2 active sentences, 2 passive sentences, and active sentences – passive sentences (different meanings). Calculating the likeness value of a word is parsed with the criteria of a verb class, and the noun is then calculated based on contextual using a path approach whose similarity is searched using sinonimkata.com. From the calculation process of the five experiments, it can be produced a sentences similarity in Indonesian that has a high level of similarity worth 0.875 in the experiment of sentence criteria with the arrangement of verbs – nouns.Keywords: sentence similarity, sinonimkata.com, path

References

[1]A. W. Prasetya, M. A. Yaqin dan S. Zaman, “Common Process Extraction pada Scalable Model Proses Bisnis,” Konferensi Nasional Sistem Informasi (KNSI) 2018, 2018.[2]A. Ali, F. Alfayez dan H. Alquhayz, “Semantic Similarity Measures Between Words: A Brief Survey,” Sci. Int (Labore), vol. 30, pp. 907-914, 2018.[3]S. Christina, “Kinerja Cosine Similarity dan Semantic Similarity Dalam Pengidentifikasian Relevansi Nomor Halaman Pada Daftar Indeks Istilah,” Sentika 2014, no. 2089-9813, 2014.[4]P. Kharismadita dan F. Rahutomo, “Implementasi Tokenizing Plus pada Sistem Pendeteksi Kemiripan Jurnal Skripsi,” Jurnal Informatika Polinema, vol. 2, no. 1, p. 24, 2017.[5]D. Guessoum, M. Miraoui dan C. Tadj, “A Modification of Wu and Palmer Semantic Similarity Measure,” pp. 42-46, 2016.[6]L. D, “An information-theoretic definition of similarity,” Proceeding of International, Canada, 1998.[7]T. Slimani, “Description and Evaluation of Semantic Similarity Measure Approaches,” International Journal of Computer Applications, vol. 80, pp. 25-33, 2013.[8]H. Thamrin dan A. Sabardilla, “Evektivitas Algoritma Semantik dengan Keterkaitan Kata dalam Mengukur Kemiripan Teks Bahasa Indonesia,” Khazanah Informatika, vol. 1, p. 1, 2015.[9]G. U. Abriani dan M. A. Yaqin, “Implementasi Metode Semantic Similarity untuk Pengukuran Kemiripan Makna antar Kalimat,” Ilkomnika, vol. 1, p. 2, 2019.[10]B. Mcinnes dan T. Pedersen, “Evaluating Measure of Semantic Similarity and Relatedness to Disambiguate Terms in Biomedical Text,” International Journal of Biodemical Informatics, vol. 46, 2013.

Downloads

Submitted

2020-09-11

Accepted

2021-03-10

Published

2024-08-20

Issue

Section

Articles