Все новости
20 мая 2025

НИУ ВШЭ и Росприроднадзор оценили профессионализм ИИ-моделей в сфере экологии

Ученые НИУ ВШЭ и эксперты Федеральной службы по надзору в сфере природопользования впервые в России провели исследование, в рамках которого оценили способность современных моделей искусственного интеллекта решать задачи в сфере экологии и ESG-управления.


Рейтинг поможет бизнесу, государственным органам и гражданам выбрать большую языковую модель, которая показала наибольшую эффективность  в решении задач экологического спектра. На момент проведения исследования (апрель 2025) 1-е место из шести занял Grok Ai, в тройку лидеров эксперты также включили «китайцев»: Qwen и DeepSeek. Отечественные модели Yandex GPT и GigaChat, которые тоже вошли в исследование, заняли 4-е и 5-е места по знаниям в экологическом законодательстве РФ и пониманию экологической повестки. В выборке были протестированы исключительно те модели, к которым имеется свободный доступ через сеть Интернет, а также отсутствуют правовые и технические ограничения для установки в закрытом контуре пользователя. 

«В 2023 году только в центральный аппарат Росприроднадзора, согласно данным службы, поступило более 8200 обращений, причем более половины касались вопросов загрязнения окружающей среды. Использование ИИ позволит значительно сократить время обработки таких запросов и повысить доступность экспертных сведений в сфере экологии для бизнеса, государственных органов и населения», — отмечает один из руководителей исследования, доцент департамента менеджмента НИУ ВШЭ — Санкт-Петербург Максим Сторчевой.

Ученые из петербургского и пермского кампусов НИУ ВШЭ оценивали языковые модели на основании концепции когерентности ответов. Для тестирования был отобран 81 запрос разного уровня сложности — от простых бинарных (с ответом «да» или «нет») до сложных, требующих развернутого ответа. Ответы моделей сравнивались с мнениями экспертов. Оценивалось, насколько логично, точно и содержательно большая языковая модель (LLM) передает суть темы.

Мы не просто проверяли наличие правильного ответа, но и анализировали, насколько полно и точно модель передает смысл эталонного ответа, подготовленного экспертами Росприроднадзора. В исследовании идет речь о том, что все модели в какой-то степени ошибаются, поэтому безоговорочно доверять им нельзя.

Исследование показало, что искусственный интеллект может эффективно использоваться для консультирования сотрудников компаний по вопросам экологического законодательства, ускорения подготовки экологической отчетности, помощи и формирования рекомендаций по ESG-стратегиям. Полученные результаты будут использованы Росприроднадзором для совершенствования систем автоматизированной обработки запросов, а также лягут в основу рекомендаций для бизнеса по внедрению ИИ в экологический менеджмент.

«Внедрение современных моделей искусственного интеллекта в сферу экологии и ESG-управления — не просто преимущество, а важное условие для выработки корректных решений в условиях глобальных вызовов. Доступные сегодня инструменты в реальном времени обрабатывают и анализируют огромные объемы данных. Таким образом можно точнее прогнозировать экологические изменения, детальнее оценивать последствия человеческой деятельности и разрабатывать более эффективные стратегии по управлению ресурсами и рисками. Мы смотрим на этот инструмент в первую очередь с точки зрения минимизации нагрузки на компоненты окружающей среды. 

Что касается интеграции ИИ в ESG-практики, очевидно следующее: прозрачность и обоснованность инвестиционных решений повышает доверие как со стороны инвесторов, так и клиентов.  Это, в свою очередь, укрепляет рыночные позиции компаний», — отметил соавтор исследования, заместитель руководителя Росприроднадзора Владимир Чернышев. Подобную оценку предполагается обновлять один раз в полгода с учетом обучаемости текущих моделей, появления новых моделей и внесения изменений в законодательство. Следующая версия выйдет в ноябре 2025 года.

Исследование выполнено междисциплинарной командой ученых НИУ ВШЭ, специализирующихся на применении методов искусственного интеллекта для решения практических задач в области экологии и устойчивого развития, совместно с практикующими экспертами из Росприроднадзора. Руководителем исследования выступил Максим Сторчевой, ключевым участником –— доцент НИУ ВШЭ в Перми Леонид Мыльников. Работа проводилась в рамках научного проекта по программе фундаментальных исследований ВШЭ.

Рейтинг LLM моделей в сфере экологии по состоянию на апрель 2025 года


Рейтинг

LLM

Итоговый балл
 (в условных единицах)

1

Grok AI

2.636218

2

Qwen

2.054098

3

DeepSeek

1.912428

4

Yandex GPT

1.660196

5

GigaChat

1.331862

6

Mistral

1.265062




Возврат к списку