Malang Posco Media – Peningkatan dalam bidang kecerdasan buatan terus mengejutkan umat manusia dengan kapabilitasnya yang terus berkembang. Sekarang, ChatGPT dari OpenAI bukan hanya mampu berinteraksi melalui teks, namun juga melalui suara dan pengenalan gambar.
Ya, “ChatGPT kini bisa melihat, mendengar, dan bicara,” kata OpenAI mengutip pengumuman resmi peluncuran kemampuan baru ChatGPT di laman resminya, Selasa (26/9).
OpenAI telah meningkatkan kapabilitas ChatGPT dengan menambahkan fungsionalitas suara dan gambar, sehingga menciptakan sebuah antarmuka yang lebih mendalam dan menyeluruh.
Dengan fitur ini, pengguna dapat berinteraksi dengan ChatGPT tidak hanya melalui teks, tapi juga dengan suara dan visual. Sebagai contoh, pengguna dapat memotret isi kulkas dan dapur mereka, lalu bertanya kepada ChatGPT mengenai rekomendasi hidangan untuk makan malam.
Setelah makan malam, anda juga bisa membantu anak mengerjakan soal matematika dengan mengambil foto, melingkari kumpulan soal, dan minta ChatGPT berbagi petunjuk mengenai menemukan jawabannya.
Kini Anda dapat berinteraksi dengan ChatGPT melalui suara, menjadikannya rekan bicara yang sempurna selama perjalanan, pembaca cerita sebelum tidur yang menenangkan, atau bahkan penyelesai debat santai.
Untuk memulai percakapan suara, Anda hanya perlu mengakses Pengaturan di aplikasi seluler Anda, kemudian memilih opsi Fitur Baru. Saat ingin berbicara, cukup ketuk ikon headphone di pojok kanan atas layar Anda dan pilih dari salah satu dari lima opsi suara yang tersedia.
Kemampuan suara baru ini didukung oleh model text-to-speech baru, yang mampu menghasilkan audio mirip manusia hanya dari teks dan contoh ucapan beberapa detik.
OpenAI telah bekerja sama dengan para ahli suara profesional untuk mengembangkan suara-suara yang tersedia. “Untuk mengubah ucapan Anda menjadi teks, kami memanfaatkan Whisper, teknologi pengenalan suara milik kami yang bersifat open source,” ungkap OpenAI.
Untuk memulai interaksi berbasis gambar, Anda cukup mengetuk ikon kamera untuk memotret atau memilih gambar yang sudah ada. Jika Anda menggunakan perangkat iOS atau Android, Anda harus mengetuk ikon plus terlebih dahulu. Jika Anda ingin membahas sejumlah gambar atau ingin memberi arah khusus pada ChatGPT, Anda bisa memanfaatkan fitur alat menggambar yang kami sediakan.
Pemahaman gambar ChatGPT didukung oleh multimodal GPT-3.5 dan GPT-4. Model ini menerapkan keterampilan penalaran bahasanya pada berbagai macam gambar, seperti foto, tangkapan layar, dan dokumen yang berisi teks dan gambar.
OpenAI menyadari pentingnya privasi dan akurasi, sehingga mereka telah mengimplementasikan langkah-langkah tertentu untuk memastikan bahwa ChatGPT tidak secara sembrono membuat pernyataan tentang individu. Mengingat sistem ini mungkin tidak selalu sempurna dalam analisisnya, membatasi kemampuannya untuk berkomentar langsung tentang orang-orang dianggap penting untuk menghargai privasi setiap individu.
OpenAI akan memperkenalkan fitur suara dan gambar ini kepada pengguna dengan paket Plus dan Perusahaan dalam kurun waktu dua minggu mendatang. Bagi mereka yang menggunakan iOS dan Android, fitur suara akan segera tersedia. Sedangkan fitur gambar dapat diakses di semua jenis platform. (ntr/mpm)