Google hari ini mengumumkan empat telefon pintar baharu daripada siri Pixel 9, Pixel Watch baharu dalam dua saiz untuk kali pertama, dan Pixel Buds baharu. Walaupun perkakasan kelihatan seperti program malam penuh, bintang sebenar adalah yang sama sekali berbeza: Gemini—dan terutamanya Gemini Live. Adakah ini detik pendaratan di bulan untuk kecerdasan buatan?
Apakah Gemini-dan Sejauh Mana Ia Boleh Pergi?
Mari kita melangkah ke belakang: Google mengumpulkan beberapa perkara yang agak mengelirukan di bawah payung Gemini. Di satu pihak, terdapat model AI generatif Gemini Nano, Gemini Flash, Gemini Pro dan Gemini Ultra. Model ini maju dalam versi menaik; model paling berkuasa pada masa ini ialah “Gemini 1.5 Pro”, yang mengatasi persaingan daripada OpenAI & Co. dalam pelbagai penanda aras AI.
Walau bagaimanapun, Gemini juga telah dipanggil chatbot Google, dahulunya dikenali sebagai Bard, sejak awal tahun 2024. Dan chatbot itu kini mendapat versi bahasa yang dipanggil “Gemini Live” dalam gaya Mod Suara legenda ChatGPT 4o, yang diumumkan. sehari sebelum Google I/O pada Mei 2024. Ia masih belum tersedia sebagai beta yang luas, menjadikan tajuk berita lebih banyak untuk kegagalan yang menyeramkan daripada untuk penampilan mengejut.
Dengan cara ini, Gemini juga merujuk kepada pelbagai model langganan. “Gemini” sahaja ialah akses percuma kepada Google AI yang dipanggil Gemini berdasarkan model “Gemini Pro”. Walau bagaimanapun, anda hanya mempunyai akses kepada “Gemini 1.5 Pro” yang disebutkan di atas dengan model langganan “Gemini Advanced” dengan harga $19.99 sebulan—atau anda boleh melanggan Google One AI Premium. Saya tidak akan bermula dengan Perniagaan Gemini pada ketika ini. Tetapi sekarang ke pendaratan bulan yang sepatutnya.
- Baca lebih lanjut: Google Pixel Watch 3—berapa besar perbezaan dengan Watch 2?
Gemini Live: “Bintang” Rancangan
Sebagai tambahan kepada tiga puluh empat Gemini yang berbeza, terdapat satu lagi ciri dengan nama yang sama yang menunjukkan jalan ke tahun-tahun akan datang: Gemini Live. Ini ialah model perbualan yang dipanggil yang membolehkan perbualan semula jadi—bukannya sekadar bertukar-tukar mesej suara berasaskan giliran dengan model AI, yang setiap satunya ditranskripsikan sebagai teks atau output melalui output suara. Perbezaan dalam dinamik adalah seperti membandingkan catur dengan perlumbaan pecut.
Dalam demo langsung di acara “Made by Google”, Jenny Blackburn meminta aktiviti yang menyeronokkan dan mendidik untuk anak saudara dan anak saudaranya dalam bidang kimia, termasuk sentuhan sihir. Cadangannya ialah gunung berapi ajaib, lampu lava buatan sendiri atau dakwat ajaib yang tidak kelihatan.
Jenny memilih dakwat ajaib, yang semasa perbualan berikut berkembang menjadi dakwat cahaya hitam, diberi nama projek “Makmal Mesej Rahsia” dan jaminan untuk tidak membuat terlalu banyak huru-hara semasa bereksperimen.
Kurang daripada hasil tulen, yang boleh digoogle dengan mudah, ia adalah perjalanan yang sangat mengagumkan. Dengan Gemini Live, Internet menjadi rakan perbualan anda—dan pada masa hadapan, kehidupan anda sendiri juga, yang kini boleh juga dicari menggunakan Gemini AI berkat beberapa ciri baharu.
Fungsi “Nota Panggilan”, sebagai contoh, menyalin panggilan telefon anda selepas pembayang untuk rakan perbualan anda dan membolehkan anda mencari melaluinya selepas itu. “Tangkapan Skrin Pixel” mengubah koleksi tangkapan skrin anda yang diabaikan bagi perkara yang dikatakan penting kepada pangkalan data nota peribadi yang boleh dicari. Dan dengan Sambungan Ruang Kerja, anda boleh bercakap dengan Kalendar Google anda serta data anda daripada e-mel, tugasan atau Google Keep.
“Masalah”: Gemini Live memerlukan model bahasa yang berkuasa Gemini 1.5 Pro, yang berjalan di awan. Jika anda menggunakan model AI untuk mengekstrak butiran daripada alam semesta data peribadi Google Workspace, transkripsi, dsb., maka ini hanya dilakukan secara setempat—dengan Gemini Nano. Walau bagaimanapun, terdapat jurang perlindungan data yang besar dengan Gemini 1.5 Pro berasaskan awan. Kami telah meminta Google memberikan kenyataan tentang perkara ini dan akan mengemas kini artikel itu sebaik sahaja kami menerima maklum balas.
Gemini dan Jurang Perlindungan Data
Walaupun Gemini, Latin untuk “kembar”, sebenarnya bermaksud perkongsian antara dua makmal AI Google, DeepMind dan Brain, nama itu juga boleh dilihat sebagai perihalan sukarela bagi pembahagian tempatan-ke-awan.
Dalam bahasa mudah: Jika anda mula berbual dengan Gemini Live dalam bahasa Inggeris dalam apl Gemini untuk Android (ya, sudah tentu apl itu dipanggil demikian), model AI yang dijalankan di sini tidak mempunyai akses kepada data peribadi anda daripada e-mel, kalendar dan lain-lain. Dan ini tidak mungkin berubah apabila Gemini Live tersedia dalam bahasa lain dan juga untuk iOS dalam beberapa minggu dan bulan akan datang.
Jika anda ingin bertanya kepada Gemini sama ada anda boleh menghadiri konsert berdasarkan gambar poster, anda perlu menaip pertanyaan anda seperti pada Zaman Batu atau menggunakan input suara. Kerana walaupun model Gemini Nano yang dijalankan secara tempatan mempunyai akses kepada data peribadi anda, ia tidak mempunyai kuasa yang mencukupi untuk perbualan masa nyata.
- Juga menarik: Google Pixel 9, Pixel 9 Pro (XL) dan Pixel 9 Pro Fold sebagai perbandingan
Adakah Gemini Live the Moon Landing dalam “Perlumbaan AI”?
Dalam perlumbaan angkasa lepas tahun 60-an dan 70-an, NASA mempunyai program angkasa lepas yang dipanggil “Gemini”, yang membuka jalan untuk pendaratan bulan pertama pada tahun 1969 dengan program Apollo berikutnya. Kebetulan? Hampir tidak, kerana sepuluh suara yang tersedia untuk Gemini Live semasa pelancaran diberi nama bahasa Inggeris untuk buruj bintang: Vega, Dipper, Ursa & Co.
Jadi sementara Google sedang mencari bintang dan juga mempunyai bekas jurutera NASA di atas pentas pada majlis selepasnya, masih terdapat satu bahagian yang hilang dari pendaratan di bulan. Pautan yang dipalsukan dengan teliti antara data pengguna paling peribadi dalam model Gemini yang dijalankan secara tempatan dan model awan berkuasa yang membolehkan perbualan yang kelihatan semula jadi.
Google telah pun mengumumkan langkah seterusnya dengan Project Apollo Astra: Di sini, Gemini Live akan diberikan akses kepada kamera seperti yang telah ditunjukkan di Google I/O dan kemudian juga menyepadukan apl seperti Kalendar Google secara beransur-ansur.