Berasal<br>Berbagai bentuk kata sering berkomunikasi pada dasarnya arti yang sama. Pertimbangkan sebuah<br>contoh mesin pencari ketika pengguna mencari sepatu atau ketika mereka mencari sepatu. Tje<br>maksud pengguna adalah sama dan hasil pencarian masih akan menjadi sepatu dari berbagai<br>Merek. Tapi kehadiran kedua kata dapat membingungkan model. Jadi untuk akurasi yang lebih baik, kita perlu<br>untuk mengubah berbagai bentuk kata dalam format baris. Stemming mengkonversi<br>kata dalam teks ke dalam format mentah. Misalnya, pengenalan, memperkenalkan, dan memperkenalkan<br>Semua berubah menjadi memperkenalkan setelah berasal. Tujuan dari metode ini adalah untuk menghapus berbagai<br>untuk mengurangi jumlah kata. Juga, ini membantu model untuk menghindari kebingungan<br>sementara mendapatkan pelatihan. Ada banyak algoritma yang berasal, seperti Porter yang bertangkai,<br>bola salju yang berasal, dan Lancaster yang berasal. Sebagian besar algoritma berasal dalam<br>Bagian berikut tersedia dalam beberapa bahasa alami.<br>Porter berasal<br>Porter berasal adalah salah satu bentuk dari algoritma berasal yang menghilangkan sufiki dari dasar<br>kata atau istilah dalam Kamus bahasa Inggris. Seluruh tujuan Porter Stemmer adalah<br>meningkatkan kinerja dari pelatihan model NLP latihan. Ia melakukannya dengan menghapus<br>sufiki dari sebuah kata dan membawanya ke bentuk dasar. Dengan cara ini, jumlah istilah<br>dikurangi dan jejak memori dan kompleksitas ruang istilah Anda juga diminimalkan.<br>Porter tidak berbasis Kamus. Ini tidak menggunakan Kamus Stem untuk mengidentifikasi sufiki yang<br>harus dihapus. Hal ini didasarkan pada seperangkat aturan generik. Beberapa orang melihat ini sebagai kelemahan<br>sebagai bekerja cukup sederhana dan tidak mengurus tingkat yang lebih rendah<br>kontekstual nitty-Gritty kata bahasa Inggris. Porter berasal digunakan untuk kesederhanaan dan<br>Kecepatan. Porter berasal memiliki lima langkah yang diterapkan pada kata tersebut sampai salah satunya<br>Memenuhi. Sebagai contoh, pertimbangkan langkah 1 di Porter yang berasal, seperti yang dijelaskan<br>blok berikut:
Sedang diterjemahkan, harap tunggu..
