Сможет ли ИИ превзойти врачей в медицинской диагностике? Новое исследование изучает возможности и риски

15

В условиях критической напряженности отделения неотложной помощи самая опасная ошибка врача — это не выбор неправильного лечения, а неспособность поставить верный диагноз в самом начале. Недавнее исследование показывает, что новое поколение искусственного интеллекта может вскоре стать жизненно важным инструментом защиты от подобных критических просчетов.

Расцвет «рассуждающих» моделей

Медицинская сфера находится на пороге технологического сдвига, вызванного развитием передовых больших языковых моделей (LLM). В отличие от предыдущих итераций ИИ, новые «рассуждающие модели» (такие как o1-preview от OpenAI) спроектированы для решения сложных задач с помощью последовательной, пошаговой логики.

Этот технологический скачок отвечает на значительный запрос медицинского сообщества. Согласно опросу более 2000 клиницистов, каждый пятый врач и медсестра в мире уже используют ИИ для получения «второго мнения» по сложным случаям, а более половины выражают желание еще глубже интегрировать эти технологии в свою практику.

Исследование: ИИ против врачей

Исследование под руководством специалиста по биомедицинским данным из Гарвардского университета Арджуна Манраи, опубликованное в журнале Science, сравнило диагностические способности модели o1-preview с возможностями врачей. Исследователи использовали два различных набора данных:
1. Классические наборы симптомов из программ медицинского обучения.
2. Реальные данные 76 пациентов, проходивших лечение в отделении неотложной помощи в Бостоне.

Результаты оказались поразительными: модель ИИ с функциями рассуждения превзошла как врачей, так и специализированное диагностическое ПО, правильно определяя диагноз (или предлагая крайне точный вариант) почти в 80% случаев.

Один из примечательных примеров, приведенных соавтором исследования Адамом Родманом, касался пациента с иммунодефицитом после трансплантации, у которого наблюдались обычные респираторные симптомы. В то время как врачи могли не заметить серьезности ситуации, модель ИИ значительно раньше медицинской команды заподозрила наличие опасной для жизни инфекции, вызывающей разрушение тканей.

Контраргументы: Логика против нюансов

Несмотря на эти впечатляющие цифры, научное сообщество сохраняет осторожность. Критики утверждают, что существует фундаментальное различие между «вычислительным рассуждением» и «клиническим мышлением».

«Когда мы говорим о клиническом мышлении, мы не имеем в виду то же самое, что и моральное рассуждение», — предупреждает Арья Рао, исследователь из Гарвардской медицинской школы.

Команда Рао недавно провела отдельное исследование, оценив 21 модель ИИ, и выявила устойчивую слабость: неспособность работать в условиях неопределенности. В то время как рассуждающие модели отлично справляются с прокладыванием логического пути к выводу, они часто пасуют перед нюансами, возникающими, когда возможны сразу несколько диагнозов.

Основные выявленные риски включают:
«Хрупкость» рассуждений: ИИ склонен слишком быстро приходить к окончательным выводам.
Отсутствие гибкости: Моделям трудно, когда необходимо одновременно взвешивать несколько неопределенных вариантов.
Отсутствие человеческого суждения: ИИ лишен морального и контекстуального восприятия, необходимого для комплексного ухода за пациентами.

Будущее: Ассистент, а не замена

Исследователи сходятся во мнении, что ИИ должен не заменять врачей, а служить мощным диагностическим дополнением. Цель состоит в том, чтобы использовать ИИ для обнаружения того, что может упустить человеческий глаз, создавая своего рода «страховочную сетку» для клиницистов.

По мере совершенствования технологий фокус смещается с вопроса «может ли ИИ диагностировать» на вопрос «как безопасно интегрировать его в клиническую работу». При правильном подходе эта технология может стать «великим уравнителем», предоставляя высокоуровневую диагностическую поддержку в регионах с ограниченным доступом к узкопрофильной медицинской помощи.


Заключение
Хотя модели ИИ с функциями рассуждения продемонстрировали превосходную способность определять правильные диагнозы в контролируемых исследованиях, они все еще сталкиваются с трудностями, связанными с нюансами и неопределенностью, которые присущи человеческой медицине. Следующий рубеж для медицинского ИИ — это клинические испытания, направленные на интеграцию этих инструментов в качестве надежных помощников, а не автономных лиц, принимающих решения.