В НГУ создали ИИ-систему для анализа инвестпроектов
В Новосибирском госуниверситете собрали рабочую связку из четырёх нейросетевых модулей, которая прогоняет открытые интернет-источники и выдаёт структурированный срез по инвестпроектам: стадия реализации, перспективность, объём вложений, текстовое описание.

Архитектура: четыре модуля вместо одной модели
Главное в разработке — модульность. Это не монолитный запрос к LLM «расскажи мне всё про проект», а конвейер с чёткой разделкой задач:
- Классификатор стадии проекта. На входе — сырой текст с сайта, новости или тендерной площадки, на выходе — метка стадии реализации. Задача сводится к supervised-классификации с применением трансферного обучения.
- Модель оценки инвестиционной перспективности. NLP-модель на методах машинного и глубокого обучения, которая выдаёт оценку перспективности проекта.
- Генератор описаний. Отдельная генеративная модель собирает связную аннотацию — для дашбордов, отчётов и карточек в базе.
- Гибридный модуль определения объёма инвестиций. Комбинация подходов, чтобы извлекать цифры из текста, а не угадывать их.
Вся обвязка стоит на веб-парсинге открытых источников и обработке естественного языка. По описанию разработчиков, архитектура — не про «один промпт к большой модели», а про связку узкоспециализированных модулей под конкретные параметры задачи.
Скорость итераций: неделя → четыре часа
Главный параметр для бизнеса — время обработки. Неделю ручного мониторинга система сжимает до трёх–четырёх часов. Это ускорение на порядок и более: при регулярном потоке новых проектов лимит человеческого ресурса перестаёт быть узким местом пайплайна, а аналитик подключается уже на этапе верификации, а не первичного сбора.
Дополнительный плюс — за счёт выделенных моделей под каждый параметр снижается риск галлюцинаций: генератор описаний отвечает только за нарратив, а цифры и стадии выдают классификаторы. Классический приём — разделить генерацию и фактологию по разным контурам и не мешать их в одной LLM.
Где применимо и что отслеживать
Заявленные пользователи — исследовательские центры, органы управления и аналитические подразделения, то есть мониторинг инвестиционной активности и актуализация баз данных. Для бизнеса это сигнал в сторону скоринговых сервисов и автоматизации разведочного анализа рынка: до того как платить аналитику за отчёт, можно прогнать массив открытых источников и получить черновую карту проектов для дальнейшего геоинформационного анализа.
Что стоит проверить на следующих итерациях:
- Открытость решения. Пока разработка описана на уровне пресс-релиза — есть ли API, лицензия, пилотные кейсы.
- Точность по каждому модулю отдельно, а не сводная формулировка «система работает».
- Устойчивость парсинга к неструктурированным сайтам и региональным источникам.
Если НГУ выведет систему в пилот с региональными инвестиционными агентствами, это будет один из немногих отечественных кейсов прикладного ИИ в инвестиционной аналитике с заявленной промышленной метрикой, а не демо-видео.