Выпуск Gemini 2.0 Flash: новый прорыв Google в области искусственного интеллекта
Google официально положил начало эре Gemini 2.0, выпустив совершенно новую модель Gemini 2.0 Flash.
Google официально положил начало эре Gemini 2.0, выпустив совершенно новую версию Gemini 2.0 Flash. Компания утверждает, что Gemini 2.0 Flash даже превосходит Gemini 1.5 Pro в ключевых тестах, а также почти в 2 раза быстрее своего предшественника.
Таким образом, Gemini 2.0 Flash станет флагманской моделью искусственного интеллекта Google, напрямую конкурируя с предложениями OpenAI и других громких имен на рынке. Помимо улучшенной производительности и низкой задержки, Gemini 2.0 Flash также имеет встроенную поддержку мультимодального вывода, включая собственные изображения в сочетании с управляемым преобразованием текста в речь (TTS) многоязычным звуком и текстом. Усовершенствованная модель также поддерживает мультимодальные входные данные, такие как изображения, видео и аудио, и тесно интегрирована с собственными инструментами, включая поиск Google, выполнение кода и многое другое.
Проще говоря, Gemini 2.0 Flash выделяется своей способностью обрабатывать несколько типов входных данных (текст, изображения, видео, аудио) для создания разнообразных выходных данных (включая изображения и голос). В предыдущем поколении Flash 1.5 мог создавать только текст и не подходил для задач с высокими требованиями. Google утверждает, что эта модель Flash 2.0 не только быстрая, но и чрезвычайно гибкая благодаря возможности использовать такие инструменты, как поиск Google, и подключаться к внешним API.
Разработчики могут опробовать бета-версию Gemini 2.0 Flash в AI Studio и Vertex AI уже сегодня. Кроме того, Google выпускает бесплатную бета-версию нового Multimodal Live API со звуком в реальном времени, потоковым вводом видео и возможностью использования нескольких инструментов композитинга.
Новая модель Gemini 2.0 Flash будет доступна пользователям через интерфейс Gemini на ПК, в Интернете и вскоре в мобильных приложениях. Google планирует объявить о доступности Gemini 2.0 Flash в январе 2025 года.
Наряду с Gemini 2.0 Flash, Google также анонсировала ряд прототипов, исследующих эксплуатационные возможности Gemini 2.0.
- Project Astra теперь поддерживает многоязычное и смешанное общение. В настоящее время Project Astra предлагает до 10 минут хранения сеансов и может использовать Google Search, Lens и Maps.
- Project Mariner — это агент искусственного интеллекта, который может понимать и интерпретировать информацию на экране браузера пользователя для выполнения задач. Google утверждает, что Project Mariner достигал результатов в 83,5% случаев в качестве одного агента.
- Jules — это агент кода на базе искусственного интеллекта, который напрямую интегрируется в рабочие процессы GitHub для устранения неполадок, планирования и выполнения в соответствии с этим планом.
Благодаря мультимодальным возможностям и встроенной интеграции инструментов Gemini 2.0 Flash открывает потрясающие возможности как для разработчиков, так и для пользователей.
Лесли Монтойя
Обновление от 12 декабря 2024 г.