НИУ ВШЭ и Росприроднадзор оценили профессионализм ИИ-моделей в сфере экологии

Главная

Новости

Разное

Все новости

20 мая 2025

НИУ ВШЭ и Росприроднадзор оценили профессионализм ИИ-моделей в сфере экологии

Ученые НИУ ВШЭ и эксперты Федеральной службы по надзору в сфере природопользования впервые в России провели исследование, в рамках которого оценили способность современных моделей искусственного интеллекта решать задачи в сфере экологии и ESG-управления.

Рейтинг поможет бизнесу, государственным органам и гражданам выбрать большую языковую модель, которая показала наибольшую эффективность в решении задач экологического спектра. На момент проведения исследования (апрель 2025) 1-е место из шести занял Grok Ai, в тройку лидеров эксперты также включили «китайцев»: Qwen и DeepSeek. Отечественные модели Yandex GPT и GigaChat, которые тоже вошли в исследование, заняли 4-е и 5-е места по знаниям в экологическом законодательстве РФ и пониманию экологической повестки. В выборке были протестированы исключительно те модели, к которым имеется свободный доступ через сеть Интернет, а также отсутствуют правовые и технические ограничения для установки в закрытом контуре пользователя.

«В 2023 году только в центральный аппарат Росприроднадзора, согласно данным службы, поступило более 8200 обращений, причем более половины касались вопросов загрязнения окружающей среды. Использование ИИ позволит значительно сократить время обработки таких запросов и повысить доступность экспертных сведений в сфере экологии для бизнеса, государственных органов и населения», — отмечает один из руководителей исследования, доцент департамента менеджмента НИУ ВШЭ — Санкт-Петербург Максим Сторчевой.

Ученые из петербургского и пермского кампусов НИУ ВШЭ оценивали языковые модели на основании концепции когерентности ответов. Для тестирования был отобран 81 запрос разного уровня сложности — от простых бинарных (с ответом «да» или «нет») до сложных, требующих развернутого ответа. Ответы моделей сравнивались с мнениями экспертов. Оценивалось, насколько логично, точно и содержательно большая языковая модель (LLM) передает суть темы.

Мы не просто проверяли наличие правильного ответа, но и анализировали, насколько полно и точно модель передает смысл эталонного ответа, подготовленного экспертами Росприроднадзора. В исследовании идет речь о том, что все модели в какой-то степени ошибаются, поэтому безоговорочно доверять им нельзя.

Исследование показало, что искусственный интеллект может эффективно использоваться для консультирования сотрудников компаний по вопросам экологического законодательства, ускорения подготовки экологической отчетности, помощи и формирования рекомендаций по ESG-стратегиям. Полученные результаты будут использованы Росприроднадзором для совершенствования систем автоматизированной обработки запросов, а также лягут в основу рекомендаций для бизнеса по внедрению ИИ в экологический менеджмент.

«Внедрение современных моделей искусственного интеллекта в сферу экологии и ESG-управления — не просто преимущество, а важное условие для выработки корректных решений в условиях глобальных вызовов. Доступные сегодня инструменты в реальном времени обрабатывают и анализируют огромные объемы данных. Таким образом можно точнее прогнозировать экологические изменения, детальнее оценивать последствия человеческой деятельности и разрабатывать более эффективные стратегии по управлению ресурсами и рисками. Мы смотрим на этот инструмент в первую очередь с точки зрения минимизации нагрузки на компоненты окружающей среды.

Что касается интеграции ИИ в ESG-практики, очевидно следующее: прозрачность и обоснованность инвестиционных решений повышает доверие как со стороны инвесторов, так и клиентов. Это, в свою очередь, укрепляет рыночные позиции компаний», — отметил соавтор исследования, заместитель руководителя Росприроднадзора Владимир Чернышев. Подобную оценку предполагается обновлять один раз в полгода с учетом обучаемости текущих моделей, появления новых моделей и внесения изменений в законодательство. Следующая версия выйдет в ноябре 2025 года.

Исследование выполнено междисциплинарной командой ученых НИУ ВШЭ, специализирующихся на применении методов искусственного интеллекта для решения практических задач в области экологии и устойчивого развития, совместно с практикующими экспертами из Росприроднадзора. Руководителем исследования выступил Максим Сторчевой, ключевым участником –— доцент НИУ ВШЭ в Перми Леонид Мыльников. Работа проводилась в рамках научного проекта по программе фундаментальных исследований ВШЭ.

Рейтинг LLM моделей в сфере экологии по состоянию на апрель 2025 года

Рейтинг	LLM	Итоговый балл (в условных единицах)
1	Grok AI	2.636218
2	Qwen	2.054098
3	DeepSeek	1.912428
4	Yandex GPT	1.660196
5	GigaChat	1.331862
6	Mistral	1.265062

Печать

Возврат к списку