Selama ini dari sekian artikel Deface
yang ada ternyata banyak diantaranya yang memanfaatkan Paman Google
untuk menentukan target. Bukan hanya deface saja, bahkan jika si user
cukup expert dalam “Google Hacking”, ia bisa mendapatkan account orang
lain dan menemukan halaman-halaman yang “dirahasiakan” dalam suatu
situs. Mungkin artikel ini akan sedikit membantu bagi kamu-kamu para
webmaster yang ingin merahasiakan suatu halaman tertentu (mungkin kamu
memiliki halaman tertentu yang berisi informasi rahasia yang hanya boleh
dilihat oleh orang tertentu saja – misalkan khusus member saja – ) dari
scanning search engine khususnya Paman Google yang udah terkenal “ampuh
banget!!” hehehe…
Apa saja yang akan kita bahas kali ini?
- Mencegah Google dan search engine lain melakukan pengindexan terhadap situs anda.
- Mencegah scanning terhadap halaman tertentu.
- Menghapus Snippet (Potongan-potongan)
- Menghapus halaman-halaman yang sudah di-Cache
- Menghapus gambar dari pencarian gambar Google
//——- Pembahasan——–//
1. Mencegah Google dan search engine lain melakukan pengindexan terhadap situs anda.
Untuk mencegah Google dan search engine lain melakukan pengindexan
terhadap situs anda, copy-pastekan script berikut pada text editor kamu
dan simpan dengan nama robots.txtUser-Agent: * Disallow: /
Inilah protokol standar yang diperiksa
oleh hampir semua mesin pengindeks web untuk mengecualikan suatu server
atau direktori web dari pengindeksan. info lebih lanjut bisa kamu
dapatkan di:
http://www.robotstxt.org/wc/norobots.html
2. Mencegah scanning terhadap halaman tertentu.
Kalau anda tidak menginginkan semua
robot melakukan indexing terhadap website anda, maka anda dapat
menyimpan meta tag dibawah ini kedalam program HTML anda:
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
Kalau anda tidak menginginkan robots
Google’s meng-index website anda, sehingga anda mau memakai robots lain,
pakailah tag dibawah ini:
<META NAME="GOOGLEBOT" CONTENT="NOINDEX, NOFOLLOW">
Informasi tambahan mengenai standard meta tag element tersedia disini:
http://www.robotstxt.org/wc/exclusion.html#meta
Snippet adalah text yang diambil dari
halaman website anda dimana semua query di bold. Dari hasil proses ini,
pemakai bisa melihat isi dari pencarian (search) yang nongol di webpage
anda, sebelum meng-click hasil. Biasanya pemakai akan meng-click didalam
hasil pencarian (search result) kalau hasil itu mempunyai snippet.
Kalau anda tidak mau Google mengeluarkan snippet dihalaman anda, pakailah tag dibawah ini:
<META NAME="GOOGLEBOT" CONTENT="NOSNIPPET">
Ingat: menghapus snippet juga akan menghapus cache memori halaman.
4. Menghapus halaman-halaman yang sudah di-Cache
Google menyimpan teks dari kebanyakan
dokumen-dokumen yang dirangkaknya ke dalam cache. Dengan begini, versi
halaman web yand diarsip, atau di-”cache”, dapat diperlihatkan kepada
pengunjung-pengunjung situs anda apabila halaman yang sebelumnya tidak
tersedia lagi (disebabkan oleh kegagalan sementara dari halaman di
jaringan server). Halaman yang di-cache terlihat kepada
pengunjung-pengunjung persis seperti waktu Google merangkaknya. Halaman
yang di-cache ini juga mencantum pesan (di bagian atas halaman) untuk
menunjukkan bahwa halaman ini adalah versi yang di-cache.
Bila anda ingin menghindarkan semua
robot dari mengarsip isi situs anda, gunakan meta tag NOARCHIVE.
Tempatkan tag ini di bagian > dari halaman-halaman anda sebagai
berikut:
<META NAME="ROBOTS" CONTENT="NOARCHIVE">
Bila anda ingin memperbolehkan
robot-robot pendaftar lain untuk mengarsip isi halaman anda,
menghindarkan robot-robot Google saja untuk menyimpan halaman itu,
gunakan tag berikut:
<META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">Perhatian: tag ini hanya menghapus kaitan yand di-”cache” di dalam halaman berikut. Google akan terus mengindeks halaman ini dan menampilkan sebagian kecil.
5. Menghapus gambar dari pencarian gambar Google
Tempatkan file robots.txt di direktory root. Misalkan file imagemu beralamatkan http://situsku.com/images/gambarku.jpg maka kamu harus menempatkan file robots.txt di lokasi http://situsku.com/robots.txt tempatkan text berikut pada file robots.txt :
User-Agent: Googlebot-Image Disallow: /images/dogs.jpgUntuk menghapus semua gambar di dalam situs anda dari indeks google, tempatkan text berikut:
User-Agent: Googlebot-Image Disallow: /
Setelah anda menambahkan file
robots.txt, segera kirimkan email pemberitahuan ke googlebot@google.com
serta menyatakan perubahan dan lokasi dari file tersebut. Admin Google
akan segera menghapus file gambar tersebut dalam 48 jam.
sumber: http://www.spyrozone.net
sumber: http://www.spyrozone.net
Tidak ada komentar:
Posting Komentar