Медицинский AI-помощник СберЗдоровья на базе GigaChat продемонстрировал высокую точность постановки диагнозов

Российский AI-помощник по здоровью в ходе теста продемонстрировал 93% точности диагностики против 85% у зарубежного сервиса

Медицинский AI-помощник СберЗдоровья на базе GigaChat продемонстрировал высокую точность постановки диагнозов

Эксперимент, проведённый специалистами Института AIRI, показал: российский AI-помощник по здоровью на базе нейросетевой модели GigaChat в тестах на 30 реальных клинических случаях (отобраны из 200 случайным образом) из авторитетного журнала New England Journal of Medicine показал 93% точности (28 верных заключений). Тестирование было проведено по методике, аналогичной эксперименту компании Microsoft по проверке решения Microsoft AI Diagnostic Orchestrator (MAI-DxO).

Искусственный интеллект работал вслепую, начиная с базовых данных о пациенте — пола, возраста и симптомов. Далее модель последовательно запрашивала анализы, визуализацию и консультации, чтобы прийти к диагнозу. Медианное число диалоговых ходов составило три: информация от пациента — комментарий или вопрос врача — ответ пациента. Это говорит о высокой скорости принятия решений.

Сергей Жданов, директор Центра индустрии здоровья Сбербанка:

— Эксперимент показал, что наша технология не просто конкурентоспособна, но и может задавать стандарты в медицинской диагностике для всего мира. Мы видим, как мультиагентная архитектура ускоряет и улучшает процесс постановки диагноза. Особенно важно, что система демонстрирует гибкость: она пересматривает гипотезы, запрашивает дополнительные данные и даже реагирует на эмоциональную подачу клинических сценариев. В будущем это открывает двери для консилиумов, где AI станет надёжным помощником врача.

Все клинические случаи были маркированы тремя типами сложности. Искусственный интеллект (AI) успешно распознал такие редкие патологии, как болезнь Уиппла (за один ход), ацерулоплазминемию (за шесть ходов) и метгемоглобинемию, вызванную расбуриказой. 

Помощник продемонстрировал несколько ключевых преимуществ. Он работает быстро — в среднем за три хода. Мыслит логически, успешно диагностируя редкие и комплексные патологии. Сочетает клиническую строгость с гибкой диалоговой логикой и умеет работать с человекоориентированной подачей. Неожиданным эффектом эксперимента стала эмоциональная вовлечённость: драматические сценарии, как это часто происходит в реальной жизни, повысили диагностическую внимательность алгоритма.

Иван Оселедец, генеральный директор Института AIRI: 

— Сегодня мультиагентные системы способны уверенно разыскивать редкие, маскирующиеся патологии за пределами типовых алгоритмов приёмного отделения. Способен ли медицинский AI-ассистент вовремя перестроить гипотезу, отбросив наиболее вероятную, но ложную дорогу? AI-помощник показал, что способен, и делал это быстрее, чем ожидал эксперт-наблюдатель с 15-летним стажем в медицине.

Эксперимент носит пилотный характер и продолжается в данный момент. Исследователи AIRI планируют расширить выборку, включив кейсы из других медицинских журналов. Однако уже сейчас технология демонстрирует потенциал не только для практической медицины, но и для обучения врачей, предлагая им реалистичные симуляции сложных случаев.

AI-помощник был разработан учеными Института AIRI и специалистами СберМедИИ и впервые представлен на конференции AI Journey 2024, после чего прошел пилотное тестирование в приложении медицинской компании «СберЗдоровье», где успешно функционирует и помогает людям. На данный момент им воспользовались уже более 160 тысяч раз.

Реклама. ПАО «Сбербанк России» ИНН 7707083893. Erid: 2SDnjcN8yDg


Нашли ошибку - выделите текст с ошибкой и нажмите CTRL+ENTER