Bagaimana Bisa Google Ubah Nama Foke Jadi Ahok saat "Ditanya" Soal Sungai Bersih Jakarta?

Ade Sulaeman

Penulis

Bagaimana Bisa Google Ubah Nama Foke Jadi Ahok saat

Intisari-Online.com - Beberapa hari lalu banyak netizen Indonesia, khususnya Jakarta, yang membicarakan screenshot pencarian di Google dengan kata kunci “sungai bersih karena foke”. Hal paling menarik dari gambar tersebut adalah bagaiman Google justru merekomendasikan kata “foke” diganti dengan kata “ahok” menjadi “sungai bersih karena ahok.” Bagaimana itu bisa terjadi?

Pertama, mari kita pelajari bagaiamana cara search engine Google mencari informasi yang bertebaran di situs web internet? Perusahaan ini memulai dengan membangun database besar lewat proses crawling dan indexing.

Crawling adalah mencari dan mencatat aneka situs web dengan program khusus bernama Googlebot, juga dikenal dengan sebutan robot, bot, atau spider.

“Googlebot menggunakan proses algoritmik: program komputer menentukan mana situs yang harus ditelusuri (crawling), seberapa sering, dan sebanyak apa laman yang diambil dari sebuah situs,” tulis Google dalam laman penjelasannya.

Googlebot dijalankan secara otomatis oleh komputer-komputer powerful yang dimiliki oleh Google. Cara kerjanya mirip dengan kegiatan browsing web oleh pengguna biasa, yakni dengan mengunjungi situs, lalu mengikuti satu tautan ke tautan lain. Begitu seterusnya sehingga makin lama situs yang didata semakin banyak dan sebarannya makin luas.

Biasanya mesin crawling Google butuh waktu beberapa lama sebelum menemukan situs web baru. Pemilik situs web bisa mengatur untuk membatasi kerja Googlebot dalam menelusuri situs, misalnya dengan menolak kunjungan Googlebot atau memberikan instruksi khusus soal pemrosesan informasi di dalamnya.

Laman-laman web yang dikumpulkan oleh tadi kemudian diatur melalui proses indexing. Fungsinya mirip dengan bagian “index” pada sebuah buku, yakni mencatat informasi tentang tiap kata, judul, dan hal-hal lain berikut lokasinya di dalam database index.

Google juga mengatur indeks laman web ini berdasarkan jenis konten ada. Hal tersebut diperlukan karena pengguna yang mencari dengan kata kunci “sungai” mungkin tidak mencari konten teks dengan kata “sungai” saja, melainkan juga foto atau video dari obyek yang bersangkutan.

Dengan kata lain, saat pengguna melakukan pencarian di Google, sebenarnya ia tidak menelusuri sendiri seisi jagat maya, tetapi mencari konten yang sudah terdaftar di database index milik sang raksasa internet.

Tahapan berikutnya setelah crawling dan indexing adalah menyajikan hasil search pada pengguna. Database Google berukuran luar biasa besar. Jumlah situs web yang terindeks mencapai 60 triliun dengan besar ukuran file mencapai 100 juta gigabyte.

Bagaimana Google menelusuri basis data sebesar itu ketika pengguna memasukkan keyword di kolom search? Kalau sekedar menyajikan laman-laman yang mengandung kata kunci terkait, tentu hasilnya akan kacau balau dan bisa membuat bingung. Untuk mencegah hal tersebut, Google punya mekanisme penyajian hasil search yang dinilai paling relevan.

Caranya adalah dengan mengumpulkan semua laman yang berkaitan dengan kata kunci, lalu menyusun urutannya di laman hasil search berdasarkan lebih dari 200 kriteria, seperti tingkat kebaruan, kualitas situs, jumlah tautan dari situs lain yang terhubung, serta kesesuaian dengan konteks permintaan pengguna. Situs-situs yang dinilai sebagai laman spam atau berbahaya ikut disaring.

Dengan begini, diharapkan hasil search yang tersaji di urutan-urutan awal bakal sesuai dengan kebutuhan pengguna. Semua proses penelusuran database dan pemilahan informasi di atas terjadi dengan sangat cepat. Hanya dibutuhkan waktu 1/8 detik dari penekanan tombol “enter” hingga penyajian hasil search.

Google selalu ubah Foke jadi Ahok?

Nah, perkara Google yang menyarankan pengguna supaya mengganti nama “Foke” dengan “Ahok” sebenarnya berakar dari niat Google mempermudah pengguna sekaligus menyodorkan hasil search yang lebih sesuai dengan kebutuhan.

Google menggunakan beberapa cara untuk melakukan ini, seperti mengoreksi salah ketik dan menggunakan machine learning untuk coba mengerti maksud pertanyaan pengguna.

Satu cara lainnya adalah menyodorkan saran berupa kata kunci alternatif yang dinilai lebih tepat dan bisa membuahkan hasil pencarian yang lebih mengena.

Dalam hal ini, ketika pengguna coba mencari dengan keyword “sungai bersih karena Foke”, Google menyarankan untuk mengganti nama “Foke” dengan “Ahok”. Mungkin pertimbangannya didasarkan pada popularitas kata kunci yang bersangkutan.

Kata kunci “sungai bersih karena Foke” membuahkan sekitar 199.000 hasil search, sementara “sungai bersih karena Ahok” menampilkan sekitar 844.000 hasil.

Algoritma Google boleh jadi turut menimbang kesamaan antara “Foke” dengan “Ahok” yang pernah atau sedang menjabat sebagai kepala daerah DKI Jakarta. Sedangkan, kata-kata lain di luar "foke" tidak disarankan untuk diganti dan dibiarkan apa adanya.

"Kedekatan" kata kunci Foke dan Ahok ini terus melekat di sejumlah pencarian di Google.

Coba saja googling "sungai bandung bersih karena foke", Google akan memberi saran apakah yang ingin dicari sebenarnya "sungai bandung bersih karena ahok". Begitu pula dengan pencarian "rumah digusur karena foke" akan disarankan jadi "rumah digusur karena ahok".

Jadi di sejumlah besar pencarian dengan kata kunci "foke", Google akan memberi saran ke pengguna ke pencarian kata kunci "ahok".

Fitur "Mungkin maksud Anda?"

Fitur pemberian saran berupa kata kunci alternatif yang dinilai lebih tepat ini dikenal dengan istilah saran pengejaan (spelling suggestion) dan telah diimplemetasikan sejak lama oleh Google.

Saran biasanya dimulai dengan pertanyaan “Did you mean?” atau “Mungkin maksud Anda?” dalam bahasa Indonesia yang diletakkan di bagian atas laman hasil pencarian.

Bagaimana cara Google mencari saran kata kunci alternatif? Ketika pengguna memasukkan kata kunci, sebuah algoritma khusus akan membandingkan kata kunci dimaksud dengan kata-kata lain yang mirip.

Faktor-faktor yang dijadikan kriteria perbandingan dalam memberi saran ini antara lain bahasa yang digunakan, lokasi geografis pengguna, dan popularitas search tadi.

Dari perbandingan, kalau algoritma tersebut menyimpulkan bahwa sebuah alternatif kata kunci bisa membuahkan hasil yang lebih relevan ketimbang kata awal yang diketikkan oleh pengguna, maka alternatif kata kunci itu bakal ditampilkan di atas hasil search dengan pertanyaan “Did you mean?”

Jika algoritma Google menyakini bahwa kata kunci alternatif pasti bisa membuahkan hasil lebih relevan, maka kata kunci alternatif tersebut secara otomatis akan digunakan dalam pencarian, alih-alih kata kunci awal yang diketik oleh pengguna.

Pengguna masih bisa memilih untuk menampilkan hasil pencarian berdasar kata kunci awal dengan mengklik opsi berbunyi “Search instead for” yang terpampang di atas layar.

Cara kerja spelling sugestion Google mirip dengan spell checker di software kantoran. Hanya saja, karena mengambil data dari seantero internet, spelling suggestion Google mampu memberi saran dengan lebih tepat dan sesuai konteks.

Bisa ngawur

Pada 2010, Google memasukkan kemampuan spelling correction ke dalam Google Suggest (fitur untuk menyajikan prediksi kata kunci dan opsi autocomplete ketika pengguna sedang mengetik di kolom search), masih dalam rangka memudahkan pengguna dalam mencari hasil search sesuai kebutuhan.

Dengan begitu, mesin pencari Google diharapkan bisa memprediksi apa yang hendak dicari pengguna dengan akurat, bahkan sebelum pengguna selesai mengetik kata kunci.

Meski berguna, kerjanya tak selalu mulus. Algoritma prediksi Google sering membuahkan saran kata kunci yang berpotensi menimbulkan salah pengertian seperti dalam hal “sungai bersih karena Ahok”.

Ada juga yang mengandung muatan SARA atau pornografi, terdengar aneh atau konyol. Google secara rutin menyaring dan membuang prediksi-prediksi yang ngawur ini supaya tidak menjebak pengguna di kemudian waktu.

Sang raksasa internet menambahkan disclaimer untuk menjelaskan bahwa prediksi dan saran alternatif kata kunci agar tak disangka sebagai sikap resmi dari Google. Semua hanya dimunculkan berdasar apa yang sering dicari pengguna internet lewat layanannya.

“Prediksi search bukan jawaban untuk sesuatu yang Anda cari, bukan pula pernyataan dari orang lain atau Google mengenai pencarian Anda,” tulis Google dalam laman penjelasan terknologi terkait.

Mungkin Google tidak benar-benar ingin membantah pernyataan Anies soal siapa yang berjasa membersihkan sungai di Jakarta.

(Oik Yusuf/kompas.com)