sistem pengantar informasiSistem Pengantar Informasi 

Macam-macam teknik indexing dalam pencarian data

Pengertian

Sistem temu-kembali informasi pada prinsipnya adalah suatu sistem yang sederhana. Misalkan ada sebuah kumpulan dokumen dan seorang user yang memformulasikan sebuah pertanyaan (request atau query). Jawaban dari pertanyaan tersebut adalah sekumpulan dokumen yang relevan dan membuang dokumen yang tidak relevan. Secara matematis hal tersebut dapat dituliskan sebagai berikut :

Rumus temu kembali informasi

Sistem temu-kembali informasi pada dasarnya dibagi dalam dua komponen utama yaitu sistem pengindeksan (indexing) yang menghasilkan basis data sistem dan temukembali merupakan terdiri dari gabungan user interface dan look-up-table.

A. Teknik Indexing

Indexing merupakan sebuah proses untuk melakukan pengindeksan terhadap kumpulan dokumen yang akan disediakan sebagai informasi kepada pemakai. Dalam proses indexing bisa dilakukan secara manual maupun otomatis.

Tahapan – tahapan indexing

Parsing Dokumen yaitu proses pengambilan kata-kata dari kumpulan dokumen.

Stoplist yaitu proses pembuangan kata buang seperti: tetapi, yaitu, sedangkan, dan sebagainya.

Stemming yaitu proses penghilangan / pemotongan dari suatu kata menjadi bentuk dasar. Kata “disesuaikan” mejadi kata “sesuai” sebagai istilah.

Term Weighting dan Inverted File yaitu proses pemberian bobot pada istilah.

B. Teknik Pembobotan

Teknik pembobotan bekerja berdasarkan frekuensi kemunculan istilah pada satu pencarian di dalam dokumen / database. Pada teknik pembobotan mempunyai cara kerja yang cukup sederhana, dimana bobot suatu kata / istilah pada sebuah dokumen / Basis data berdasarkan jumlah total kemunculan pada dokumen / basis data tersebut. Berikut merupakan rumus dari teknik pembobotan :

teknik pembobotan

Dimana :
Wik  = Bobot istilah k pada dokumen i.
tfik   = Frekuensi dari istilah k dalam dokumen i.
n     = Jumlah dokumen dalam kumpulan dokumen.
dfk  = Jumlah dokumen yang mengandung istilah k.
Max j tf ij  = Frekuensi istilah terbesar pada satu dokumen.

C. Teknik temu kembali informasi

Ada beberapa teknik yang sudah di kembangkan dalam implementasi teknik temu kembali informasi, antara lain teknik Boolean sederhana, Boolean berperingkat dan Extended Boolean. Berikut penjelasan dari  teknik yang paling sering digunakan :

Teknik Extended Boolean

pada Teknik Extended Boolean berdasarkan P-norm model merupakan pengembangan lebih lanjut dari model Boolean. Teknik ini berdasarkan rumus Savoy, sebagai berikut :

Teknik extention Boolean

D. Sistem Pencarian Web

Area Terkait

⊗ Manajemen Basis Data

⊗ Ilmu Perpustakaan dan Informasi

⊗ Kecerdasan Buatan

⊗ Pemrosesan bahasa alamai

⊗ Pembelajaran Mesin

Relevansi

Relevansi merupakan suatu judgment (keputusan) subyektif dan dapat didasarkan pada:

⊗ opik yang tepat.

⊗ Waktu (informasi terbaru).

⊗ Otoritatif (dari suatu sumber terpercaya).

⊗ Kebutuhan informasi dari pengguna.

Kriteria relevansi utama adalah suatu sistem IR sebaiknya (harus) memenuhi kebutuhan informasi pengguna.

E. Indexing Otomatis

Indexing Otomatis yaitu membangun index dan meretrieve informasi tanpa melibatkan manusia secara langsung. sebagai contoh jika informasi yang akan dicari adalah teks maka yang paling efektif digunakan adalah metode automatic indexing. Penelitian Indexing Otomatis/automatic indexing fundamental pertama kali dilakukan oleh Gerald Salton, seorang Professor of Computer Science di Cornell & beberapa mahasiswa Pasca-Sarjananya (Sistem SMART).

Demikian artikel terkait materi kuliah yang berjudul “Macam-macam teknik indexing dalam pencarian data”. Untuk mendapatkan materi seputar Pengantar sistem informasi secara lengkap, dapat didownload pada link berikut ini MatKul SPI Semoga bermanfaat

Related posts

Leave a Comment