Gemini adalah model artificial intelligence baru dan canggih dari Google yang tidak hanya dapat memahami teks tetapi juga gambar, video, dan audio. Sebagai model multimodal, Gemini dikatakan mampu menangani dengan cemerlang tugas-tugas yang kompleks dalam bidang matematika, fisika, serta disiplin lainnya. Selain itu, Gemini dapat memahami dan menghasilkan kode yang berkualitas tinggi dalam beragam bahasa pemrograman. Saat ini tersedia melalui integrasi dengan Google Bard dan Google Pixel 8 dan secara bertahap akan digabungkan ke layanan Google lainnya. Mari lebih jauh mengenal ‘Gemini’ – produk besutan google yang siap ramaikan dunia AI.
Diklaim akan Lebih Baik dari ChatGPT
Dalam perilisan Gemini, Google dengan tegas membandingkan Gemini secara langsung dengan GPT-4.
Di berbagai pengujian, Gemini Ultra terbukti lebih unggul dalam tujuh dari delapan kriteria yang menitikberatkan pada teks, termasuk kemampuan penalaran, matematika, dan pengkodean.
Selain itu, pengujian multimodal juga menunjukkan keunggulan Gemini dalam 10 aspek yang meliputi gambar, video, dan audio.
Tak hanya itu, Gemini juga terbukti mengungguli para ahli manusia dalam tugas-tugas MMLU (pemahaman bahasa multitask yang masif), dengan menggabungkan 57 mata pelajaran untuk menguji pengetahuan dunia dan kemampuan pemecahan masalah.
Google mengatakan, Gemini akan mengalahkan GPT-4 dalam 30 dari 32 benchmark.
Dalam kriteria tersebut, yang hampir mendekati kesempurnaan, kelebihan utama Gemini terletak pada kemampuannya dalam memahami dan berinteraksi dengan video serta audio.
Hal ini bukan tanpa sengaja, karena kemampuan multimodal telah menjadi bagian integral dari rencana Gemini sejak awal.
Google belum melatih model terpisah untuk gambar dan suara, seperti cara OpenAI membuat DALL-E dan Whisper, di mana mereka membangun satu model multisensori sejak awal.
Google selalu tertarik pada sistem yang sangat umum. Mereka sangat tertarik pada proses memadukan semua cara tersebut, termasuk mengumpulkan data sebanyak mungkin dari sejumlah masukan dan indra, lalu memberikan tanggapan dengan variasi yang sama banyaknya.
Saat ini, model dasar Gemini hanya menerima teks sebagai input dan menghasilkan teks sebagai outputnya, namun varian yang lebih canggih seperti Gemini Ultra dapat memproses gambar, video, dan audio.
Menurut perkembangannya, seiring waktu, Gemini diharapkan akan menjadi lebih sensitif, memiliki kesadaran yang lebih baik, meningkatkan tingkat akurasi, serta menguatkan koneksi dengan konteks dunia nyata dalam prosesnya.
Model-model ini tentu saja masih sebatas angan-angan dan masih memiliki bias serta masalah lainnya.
Namun semakin banyak yang mereka ketahui, menurut pihak Google, semakin baik pula manfaatnya.
Model AI pertama yang bisa mengalahkan manusia
Klaim ini mungkin bisa jadi benar, jika kita lihat dari performa Gemini yang Google jelaskan. Ada 3 versi AI Gemini, Gemini Nano, Pro, dan Ultra.
Dalam hal kinerja, Google mengklaim bahwa Gemini Ultra berhasil mengungguli model AI paling canggih, termasuk GPT-4 yang menjadi basis ChatGPT, dalam 30 dari 32 tes benchmark.
Sementara itu, Gemini Pro juga diklaim berhasil mengungguli GPT-3.5, model AI yang menjadi dasar ChatGPT versi gratis, dalam enam dari delapan tes benchmark seperti yang telah dituliskan di atas.
Menurut Google, Gemini Ultra merupakan model AI pertama yang mampu melampaui kinerja manusia. Model AI ini dapat mencapai skor 90% dalam tes multitasking bernama MMLU yang meliputi 57 subjek seperti matematika, fisika, hukum, kedokteran, dan etika.
Gemini Ultra juga diharapkan untuk menjadi pilar layanan penulisan kode bernama AlphaCode2. Google mengklaim layanan pengkodean ini mampu melebihi kemampuan 85% programmer manusia, seperti dilansir oleh The Guardian.
Beberapa Versi AI Gemini
Google menggambarkan Gemini sebagai model yang fleksibel, mampu beroperasi mulai dari pusat data Google hingga perangkat seluler.
Untuk memastikan kemampuan dalam skala yang luas ini, Gemini diluncurkan dalam tiga varian: Gemini Nano, Gemini Pro, dan Gemini Ultra. Berikut masing-masing penjelasan dari 3 versi AI Gemini:
- Gemini Nano
Model Gemini Nano didesain agar dapat beroperasi pada ponsel pintar, terutama pada Google Pixel 8. Model ini dibuat untuk menjalankan tugas-tugas di perangkat yang membutuhkan pemrosesan kecerdasan buatan (AI) yang efisien tanpa memerlukan koneksi ke server eksternal. Contohnya adalah memberikan saran balasan dalam aplikasi obrolan atau melakukan ringkasan teks.
- Gemini Pro
Berjalan di pusat data Google, Gemini Pro dirancang untuk mendukung versi terbaru chatbot AI perusahaan, Bard. Gemini mampu memberikan respons dengan cepat terhadap permintaan dan memahami pertanyaan yang kompleks.
- Gemini Ultra
Walaupun belum tersedia untuk digunakan secara luas, Google menggambarkan Gemini Ultra sebagai model yang paling canggih, melebihi “kemajuan terbaru dalam 30 dari 32 tolok ukur akademis yang sering digunakan dalam penelitian model bahasa besar (LLM) serta pengembangannya.” Model ini dirancang untuk menangani tugas-tugas yang sangat kompleks dan akan dirilis setelah menyelesaikan tahap pengujian saat ini.
Berusaha Menggeser Dominasi ChatGPT
Google, melalui perilisan Google Gemini, bertekad bersaing dengan ChatGPT OpenAI dan berambisi menggeser dominasi ChatGPT.
Meskipun mengalami penundaan beberapa hari dan indikasi awal peluncuran pada tahun depan, implementasi kecerdasan buatan Google Gemini akhirnya menjadi kenyataan.
Perusahaan yang telah lama fokus pada pengembangan kecerdasan buatan ini kini memunculkan pesaing serius bagi OpenAI, yang telah mencuri perhatian dunia lewat ChatGPT.
CEO Google, Sundar Pichai, menegaskan dalam sebuah blog post, bahwa pihaknya harus berkomitmen untuk melakukan riset dan mengejar peluang yang akan memberikan manfaat besar bagi manusia dan masyarakat, sambil membangun perlindungan dan bekerja sama dengan pemerintah dan para ahli untuk menangani ancaman yang muncul seiring dengan kemajuan AI.
Peluncuran Gemini AI akan dilakukan secara bertahap dengan versi “Nano” dan “Pro” yang akan segera diadopsi pada chatbot Google Bard dan ponsel cerdas Pixel 8 Pro.
Google berkomitmen untuk meningkatkan keintuisian dan efisiensi Bard dalam tugas perencanaan melalui bantuan Gemini.
Walaupun versi dasar akan segera digunakan oleh pengguna awal, versi lanjutan “Ultra” dari Gemini AI baru akan tersedia pada awal tahun depan, dengan peluncuran “Bard Advanced”.
Perusahaan dan pengembang akan dapat mengakses Gemini Pro melalui Google Generative AI Studio atau Vertex AI di Google Cloud mulai 13 Desember.
Meskipun ambisi Google sangat besar untuk menyaingi ChatGPT OpenAI, pertanyaan seputar kemampuan Gemini dalam bersaing dengan ChatGPT masih menjadi tanda tanya besar.
Manajemen Google belum memberikan detail teknis, seperti jumlah parameter, untuk membandingkannya dengan GPT-4.
Gemini diharapkan dapat meningkatkan kemampuan multitasking dengan tingkat kecerdasan buatan yang belum pernah terjadi sebelumnya, termasuk dalam pengenalan dan pemahaman teks, foto, dan video.
Rencana Integrasi Dengan Mesin Pencarian Google
Teknologi ini akan diintegrasi ke mesin pencari Google, namun, jadwal transisi belum diputuskan.
Menurut Demis Hassabis, CEO Google DeepMind, divisi AI di balik Gemini, ini merupakan tonggak penting dalam pengembangan kecerdasan buatan dan awal era baru bagi mereka di Google.
Meskipun diakui sebagai teknologi yang canggih dalam bidang matematika dan fisika, muncul kekhawatiran bahwa kecerdasan buatan bisa melebihi kecerdasan manusia dan menyebabkan kerugian besar dalam lapangan pekerjaan.
Kehadiran Gemini akan meningkatkan persaingan di ranah kecerdasan buatan yang semakin ketat.
Google, bersaing dengan OpenAI dan Microsoft, menghasilkan persaingan yang semakin sengit dalam dunia AI. Sementara OpenAI telah meluncurkan GPT-4, kehadiran Google Gemini AI menandai langkah penting dalam evolusi teknologi kecerdasan buatan.