Bagaimana jika PDF anda boleh bercakap? Gemini menghidupkan dokumen ke dalam podcast AI

30
Samsung Galaxy A35 dengan papan kekunci Gemini AI
© NextPit

Google telah mengalami kebelakangan ini dengan pengembangan Gemini. Berikutan pengenalan model baru, syarikat kini melancarkan dua ciri baru: Gambaran Keseluruhan Audio, yang menjadikan dokumen dan PDF menjadi perbincangan gaya podcast, dan Canvas, ruang kerja kolaboratif untuk interaksi berkuasa AI yang lancar.

Gambaran Keseluruhan Audio dikuasakan oleh model NotebookLM Google, pembantu AI khusus dengan keupayaan dokumen yang lebih maju dan keupayaan analisis web daripada Gemini. Model ini juga menguasai rekap Spotify 2024.

Gambaran Keseluruhan Audio berkembang menjadi penyelidikan yang mendalam

Google pertama kali memperkenalkan gambaran audio tahun lepas dengan rekap harian, yang membolehkan pengguna menghasilkan ringkasan gaya podcast AI dari sumber dan artikel web. Sekarang, ciri ini berkembang untuk menyokong dokumen, termasuk PDF dan kertas penyelidikan, melalui penyelidikan yang mendalam, yang baru -baru ini diintegrasikan ke Gemini.

Pengguna boleh mengakses gambaran audio dari penyelidikan mendalam secara langsung dalam aplikasi Gemini di Mobile. Selepas menghasilkan dokumen kajian atau penyelidikan, mengetuk fail dan memilih “menghasilkan gambaran keseluruhan audio” dalam menu memulakan ciri tersebut. Fungsi yang sama juga boleh didapati melalui penyelidikan mendalam di web.

Pada masa ini, menjana gambaran keseluruhan audio dari dokumen adalah terhad kepada penyelidikan mendalam mengenai mudah alih dan web. Kami menguji ciri dalam aplikasi Gemini, tetapi ia tidak berfungsi sepenuhnya, walaupun mesej menunjukkan bahawa gambaran audio sedang dibuat. Mungkin Google akan mengembangkan sokongan dalam masa terdekat. Ciri ini sudah dilancarkan kepada pengguna Advanced Gemini dan Gemini tetapi kini boleh didapati dalam bahasa Inggeris.

Gemini menjadi kerjasama

Kanvas adalah tambahan utama kepada Gemini, ruang kerja kolaboratif yang direka untuk penyuntingan dokumen masa nyata, pengekodan interaktif, dan pratonton berkuasa AI.

Untuk projek berasaskan teks, pengguna boleh merangka dan mengedit dokumen sambil memanfaatkan alat penalaan Gemini, yang membolehkan pelarasan nada, pemendekan kalimat, dan pengubahsuaian gaya. Di samping itu, Gemini menyediakan suntingan yang dicadangkan untuk meningkatkan kualiti penulisan. Output kanvas juga boleh dikongsi untuk kerjasama melalui Google Docs.

Penjelasan kod CSS untuk antara muka permainan tic-tac-toe dengan pilihan untuk pemain vs komputer.

Gemini memperoleh kanvas yang membolehkan pengekodan kolaboratif dan interaktif. / © Google

Google juga meningkatkan keupayaan pengekodan Gemini dengan kanvas. Ruang kerja membolehkan pengguna menjana, pratonton, dan menguji kod secara langsung, menghapuskan keperluan untuk simulator atau aplikasi pengekodan berasingan. Format yang disokong termasuk aplikasi web seperti HTML dan React, skrip Python, permainan, dan simulasi lain.

Di samping itu, kanvas boleh menjadi alat yang berharga untuk belajar kod, kerana ia memberikan pandangan masa nyata dan penjelasan mengenai rentetan kod dan coretan tertentu.

Kanvas kini boleh didapati di Web Gemini untuk pengguna asas dan premium. Ia menyokong semua bahasa di mana aplikasi Gemini kini ditawarkan.

Walaupun peningkatan Gemini yang baru menjadikannya AI yang lebih fleksibel, mereka juga menambah kerumitan kepada pengalaman keseluruhan, menjadikannya kurang diselaraskan berbanding dengan chatbot tunggal seperti chatgpt. Walau bagaimanapun, ciri -ciri ini membawa fungsi yang berharga. Tetapi apa pendapat anda? Kami ingin mendengar pendapat anda mengenai penambahan baru ini!

Sumber:
Google