ChatGPT получил обновление Deep Research для создания отчетов экспертного уровня
OpenAI представила новую функцию под названием Deep Research в ChatGPT, предназначенную для решения сложных, многоэтапных задач интернет-исследований. По словам компании, эта расширенная возможность позволяет ChatGPT выполнять “за десятки минут то, на что у человека ушло бы много часов”.
Что такое Deep Research (углубленное исследование)?
Deep Research — это автономный агент, который может самостоятельно осуществлять поиск, анализировать и обобщать сотни онлайн-источников для создания подробных отчетов на уровне аналитиков.
Он работает на базе новой модели OpenAI o3 и оптимизирован для просмотра веб-страниц и анализа данных. Эта функция использует расширенные возможности для интерпретации и анализа огромных объемов текста, изображений и PDF-файлов, адаптируя свой подход на основе информации, с которой она сталкивается.
В OpenAI подчеркивают, что способность синтезировать знания является решающим шагом в развитии общего искусственного интеллекта (AGI), который, по их мнению, способен проводить новые научные исследования.
Почему OpenAI создал Deep Research
OpenAI разработала комплексные исследования для профессионалов в таких областях, как финансы, наука, политика и инженерия, которым необходимы тщательные, точные и надежные исследования. Сервис также предназначен для потребителей, которым требуются персонализированные рекомендации по покупкам, таким как автомобили, бытовая техника и мебель.
Каждый результат, полученный в результате глубокого исследования, полностью документирован, снабжен четкими цитатами и кратким изложением аргументов, что упрощает проверку. Этот инструмент отлично подходит для поиска узкоспециализированной, неинтуитивной информации, которая обычно требует тщательного разбирательства. OpenAI подчеркивает, что Deep Research экономит драгоценное время, решая сложные и трудоемкие исследовательские задачи с помощью одного запроса.
Как работает Deep Research (углубленное исследование)
Команда Deep Research прошла обучение с использованием сквозного обучения с подкреплением для решения сложных задач поиска и рассуждения в нескольких областях. Она может планировать и выполнять многоэтапные исследовательские траектории, корректируя свой подход по мере необходимости на основе новой информации.
Модель также может просматривать загруженные пользователем файлы, строить графики с помощью Python и вставлять в свои ответы изображения или графики, полученные с веб-сайтов. Кроме того, она цитирует конкретные предложения или отрывки из своих источников, обеспечивая прозрачность.
На последнем тесте, тщательном тестировании ИИ по более чем 3000 вопросам экспертного уровня по более чем 100 предметам, модель, лежащая в основе Deep Research, достигла впечатляющей точности в 26,6%. Этот показатель превосходит другие модели, такие как GPT-4o (3,3%) и OpenAI o3-mini (13%), что свидетельствует о значительных улучшениях в таких предметах, как химия, гуманитарные, социальные науки и математика.
Это также установило новый уровень в общедоступной таблице лидеров GAIA по решению реальных проблем, показав превосходство в рассуждениях, просмотре веб-страниц и умении пользоваться инструментами.
Как использовать углубленное исследование
Чтобы использовать углубленное исследование в ChatGPT, просто выберите опцию «углубленное исследование» в компоновщике сообщений и введите свой запрос. Пользователи могут запросить что угодно — от конкурентного анализа стриминговых платформ до персонализированного отчета о лучшем пригородном велосипеде. Вы также можете прикрепить файлы или электронные таблицы для дополнительного контекста.
Как только процесс начнется, на боковой панели отобразится краткое описание выполненных шагов и использованных источников. Обычно исследование занимает от 5 до 30 минут, в течение которых пользователи могут продолжить выполнение других задач. По завершении в чате предоставляется окончательный отчет. В ближайшие недели OpenAI планирует добавить встроенные изображения, визуализацию данных и другие аналитические материалы для повышения наглядности.
Углубленное исследование в сравнении с GPT-4
Хотя GPT-4 отлично подходит для мультимодальных разговоров в режиме реального времени, углубленное исследование лучше подходит для многогранных, специфичных для предметной области запросов, требующих глубины и детализации.
Например, на вопрос “Каков средний возраст выхода на пенсию для игроков НФЛ?” специалисты Deep Research проводят тщательный анализ, который включает статистический контекст, подтверждающие примеры и факторы, влияющие на продолжительность жизни игроков, а не просто предлагают одну цифру.
Результаты в тестах
В GAIA, публичном тесте, оценивающем ИИ в реальных задачах, компания Deep Research добилась самых современных результатов (SOTA), возглавив список внешних лидеров. Это также продемонстрировало значительные улучшения в задачах экспертного уровня, автоматизировав многочасовые ручные исследования в различных областях.
Ограничения Deep Research
Хотя глубокие исследования открывают впечатляющие возможности, у них есть некоторые ограничения. Иногда он может искажать факты или делать неверные выводы, хотя его частота ошибок ниже, чем у существующих моделей ChatGPT.
Ему также может быть сложно отличить авторитетные источники от недостоверной информации и он не всегда может точно передать неопределенность. При запуске в отчетах и цитатах могут быть незначительные ошибки форматирования. OpenAI ожидает, что со временем эти проблемы будут устранены.
Доступ и выпуск обновления
Подробное исследование доступно в веб-версии ChatGPT и будет распространено на мобильные и настольные приложения в течение месяца. Из-за высокой вычислительной нагрузки доступ к нему в настоящее время ограничен для профессиональных пользователей, которые могут выполнять до 100 запросов в месяц.
Следующими доступ получат пользователи Plus и Team, за ними — корпоративные пользователи. OpenAI также работает над расширением доступа для пользователей в Великобритании, Швейцарии и Европейской экономической зоне.
- В ближайшие недели OpenAI планирует выпустить более быструю и экономичную версию Deep Research на базе уменьшенной модели, предлагающую более высокие лимиты запросов для всех платных пользователей.