Американская Alphabet Inc., материнская компания Google, представила новую версию своей флагманской модели искусственного интеллекта (ИИ) Gemini.
Новая модель Gemini Pro 1.5 способна обрабатывать в несколько раз больше аудио, видео и текста, чем модель GPT-4, на которой основан популярный чат-бот ChatGPT, пишет Wired.
В частности, Gemini Pro 1.5 может одномоментно обработать 1 час видео, 11 часов аудио, 700 тыс. слов или 30 тыс. строк программного кода.
В рамках демонстрации она проанализировала расшифровку переговоров с членами экипажа космического корабля «Аполлон-11», представленную в виде 402-страничного PDF-файла, и по запросу нашла в ней несколько смешных моментов, включая слова астронавтов о том, что выход на связь задержался в связи с перерывом на употребление сэндвичей.
Google рассчитывает, что новые возможности модели позволят разработчикам создавать на ее базе новые виды приложений.
Новая версия Gemini уже доступна им на платформе AI Studio и через облачный интерфейс программирования приложений (API) Vertex AI.
О сроках выпуска модели для широкого круга лиц не сообщается.