Kamis, 14 Februari 2013

Information retrieval UAS 2013



NO.1
Metode untuk melakukan IR
1. Metode Pencocokan (Boolean)
2. Nilai kesamaan query (vector space model)
3. Nilai kecocokan berdasar kepentingan dokumen (PageRank)
4. Metode Kombinasi


NO.2
Perbedaan cara kerja Precision dan Recall

Precision dapat diartikan sebagai kepersisan atau kecocokanantara permintaan informasi dengan jawaban terhadap permintaan itu
Rumus :
Jumlah dokumen relevan yang ditemukan / Jumlah semua dokumen yang ditemukan








Recall adalah proporsi jumlah dokumen yang dapat ditemukan-kembali oleh sebuah proses pencarian di sistem IR.
Rumus :
Jumlah dokumen relevan yang ditemukan / Jumlah semua dokumen relevan di dalam koleksi








 CONTOH:
Jika ada 1000judul buku di dalam sebuah sistem perpustakaan
Dan seorang user ingin mencari buku dengan tema “Sistem Informasi”, Ternyata sistem berhasil menemukan 50 buku yang mengandung tema “Sistem Informasi”

IDEAL Search :  Sistem akan menampilkan 50 judul buku tersebut

ACTUAL Search :  Sistem mendapat 30 judul buku, 15 judul relevan, 15 judul tidak

Maka nilai :
Precision
: Jumlah dokumen relevan yang ditemukan / Jumlah semua dokumen yang ditemukan
: 15 / 30 * 100 = 50%

Recall      
: Jumlah dokumen relevan yang ditemukan / Jumlah semua dokumen relevan di dalam koleksi
: 15 / 50 * 100 = 30%




NO.3
Algoritma Web-Crawler


web crawler adalah Program atau script yang dapat mengambil sejumlah besar halaman Web dengan menelususri World Wide Web(www) dengan cepat. Lalu menyimpannya ke dalam suatu tempat penyimpanan lokal dan mengindeksnya berdasar sejumlah kata kunci.




Algoritma sederhana web-crawler:

1. Program crawler mengunduh (download) *.html dari url website yang diinginkan.

2. Program crawler menyimpan *.html dari url tersebut, kemudian mengekstrak semua url yang ada di html dengan menggunakan filtering yang dikehendaki

3. Url-url yang telah terekstrak disimpan dalam sebuah list

4. Program akan mengambil 1 url lagi dari list, dan url yang belum dijelajahi akan diterapkan lagi langkah ke langkah 1



CONTOH:

Jika ada 10 page (Home, Produk, Profile, Content, dll) dalam sebuah website, maka program web crawler akan menyimpan pertama kali adalah indeks *htmlnya (biasanya page Home). Program akan mengekstraknya dan mengambil semua url dari page yang ada di page Home tersebut. Selanjutnya url-url yang didapat akan kembali dijelajah dan didownload seperti di langkah awal. Sehingga otomatis page lainnya (page Produk, Profile, Content, dll) akan terjelajah dan terdownload juga.

 

Information retrieval UTS 2013





NO.1
Definisi IR menurut saya
IR (information retrieval ) adalah ilmu atau teknik pencarian informasi pada dokumen dalam suatu sistem atau database sesuai keinginan / query yang diinginkan pengguna. Teknik ini pada intinya berusaha menghitung kemiripan antara dokumen yang ditemukan terhadap query yang diinputkan pengguna. Akhirnya akan dihasilkan index yang telah tersusun dari seluruh dokumen pada koleksi.












Contoh cara kerja IR pada mesin pencarian
Query :
inputan kata kunci pencarian yang diberikan pengguna kepada
Mesin pencarian : 
google, yahoo, Ask, dll

Pada saat seorang pengguna menginputkan sebuah kata/kalimat sebagai kata kunci di mesin pencarian (misalnya Google). Maka mesin pencarian tersebut dengan berbagai metode (termasuk metode crawling) melacak semua website yang ada di dunia. Lalu melakukan penyusunan indeks berdasar kata kunci yang relevan dari semua dokumen dari website di dunia.

Setelah semua website yang berkaitan dengan kata kunci di temukan. Mesin pencarian akan menyusun ranking dari dokumen-dokumen website yang berkaitan tersebut berdasarkan beberapa hal, seperti seberapa besar kemiripannya, frekuensi kemunculan website tersebut, mengandung tag khusus, atau royalti yang dikeluarkan pengelola website kepada penyedia mesin pencarian





NO.2
Masa depan IR dan Kebutuhan Manusia
Informasi merupakan kebutuhan pokok bagi semua manusia yang hidup di dunia ini. Untuk memenuhi kebutuhan hidup, manusia membutuhkan informasi, misalnya informasi untuk mendapatkan makanan sampai informasi untuk mengolahnya.

Kebutuhan informasi seseorang tergantung pada manfaat informasi tersebut, kapan dibutuhkannya, dan ketepatan informasi tersebut.

Di era yang serba maju ini informasi sudah berkembang luas dalam bentuk internet. Kebutuhan akan informasi dari internet tidak bisa di tanggulangi lagi. Tentu saja diperlukan IR  dalam mesin pencarian yang dapat memberikan informasi kepada pengguna setepat mungkin dengan apa yang diinginkan oleh pengguna tersebut secara cepat dan powerfull. 
















“Masa depan IR akan terus berkembang dan akan terus berusaha memberikan kemudahan akan informasi bagi manusia”





NO.3
Manfaat IR dalam Perusahaan
Setiap perusahaan pasti mempunyai saingan. Untuk pemasaran dan marketingnya agar dapat bersaing dengan perusahaan lainnya, pastinya diperlukan informasi yang akurat untuk melihat perkembangan perusahaannya dibandingkan perusahaan lainnya.

Misalnya saja dengan media yang menyediakan mesin pencarian, sebuah perusahaan dapat melihat sejauh mana popularitas website perusahaan yang ia miliki dibandingkan dengan perusahaan lain. Dengan tingginya ranking website yang dimilikinya dalam mesin pencarian, diharapkan customer yang mengunjungi mesin pencarian tersebut minimal dapat langsung melihat profil perusahaan tersebut.

Bahkan dengan adanya IR, sebuah perusahaan dapat melihat bahkan mengumpulkan data sejauh mana produk atau jasa yang di tawarkannya diminati masyrakat dalam beberapa bulan, untuk memproyeksi dan merencanakan rencana marketing kedepannya.

Misalnya saja sebuah perusahaan yang bergerak di bidang penjualan sembako mendapatkan informasi bahwa pada musim panas penjulan buah jeruk sangatlah besar, maka perusahaan tersebut harus meningkatkan stok buah jeruknya di musim panas berikutnya.