Чи може ШІ допомогти лікарям уникнути пропущених діагнозів? Нове дослідження показує, що так

12

Чи зможе ІІ перевершити лікарів у медичній діагностиці? Нове дослідження вивчає можливості та ризики

У разі критичної напруженості відділення невідкладної допомоги найнебезпечніша помилка лікаря — це вибір неправильного лікування, а нездатність поставити правильний діагноз на самому початку. Нещодавнє дослідження показує, що нове покоління штучного інтелекту може стати життєво важливим інструментом захисту від подібних критичних прорахунків.

Розквіт «розсудливих» моделей

Медична сфера знаходиться на порозі технологічного зсуву, викликаного розвитком передових великих мовних моделей (LLM). На відміну від попередніх ітерацій ІІ, нові моделі, що «розмірковують» (такі як o1-preview від OpenAI) спроектовані для вирішення складних завдань за допомогою послідовної, покрокової логіки.

Цей технологічний стрибок відповідає на значний запит медичної спільноти. Згідно з опитуванням понад 2000 клініцистів, кожний п’ятий лікар та медсестра у світі вже використовують ІІ для отримання «другої думки» зі складних випадків, а більше половини висловлюють бажання ще глибше інтегрувати ці технології у свою практику.

Дослідження: ІІ проти лікарів

Дослідження під керівництвом фахівця з біомедичних даних з Гарвардського університету Арджуна Манраї, опубліковане в журналі Science, порівняло діагностичні здібності моделі o1-preview з можливостями лікарів. Дослідники використовували два різні набори даних:
1. Класичні набори симптомів із програм медичного навчання.
2. Реальні дані 76 пацієнтів, які проходили лікування у відділенні невідкладної допомоги у Бостоні.

Результати виявилися разючими: модель ІІ з функціями міркування перевершила як лікарів, так і спеціалізоване діагностичне ПЗ, правильно визначаючи діагноз (або пропонуючи вкрай точний варіант) майже у 80% випадків.

Один із чудових прикладів, наведених співавтором дослідження Адамом Родманом, стосувався пацієнта з імунодефіцитом після трансплантації, у якого спостерігалися звичайні респіраторні симптоми. У той час як лікарі могли не помітити серйозності ситуації, модель ІІ значно раніше за медичну команду запідозрила наявність небезпечної для життя інфекції, що викликає руйнування тканин.

Контраргументи: Логіка проти нюансів

Незважаючи на ці вражаючі цифри, наукова спільнота зберігає обережність. Критики стверджують, що існує фундаментальна різниця між «обчислювальною міркою» і «клінічним мисленням».

«Коли ми говоримо про клінічне мислення, ми маємо на увазі те саме, як і моральне міркування», — попереджає Арья Рао, дослідник з Гарвардської медичної школи.

Команда Рао нещодавно провела окреме дослідження, оцінивши 21 модель ІІ, та виявила стійку слабкість: нездатність працювати в умовах невизначеності. У той час як моделі, що міркують, відмінно справляються з прокладанням логічного шляху до висновку, вони часто пасують перед нюансами, що виникають, коли можливі відразу кілька діагнозів.

Основні виявлені ризики включають:
– ** «Крихкість» міркувань: ** ІІ схильний занадто швидко приходити до остаточних висновків.
Відсутність гнучкості: Моделям важко, коли необхідно одночасно зважувати кілька невизначених варіантів.
Відсутність людського судження: ІІ позбавлений морального та контекстуального сприйняття, необхідного для комплексного догляду за пацієнтами.

Майбутнє: Асистент, а не заміна

Дослідники сходяться на думці, що ІІ повинен не замінювати лікарів, а служити потужним діагностичним доповненням. Мета полягає в тому, щоб використовувати ІІ для виявлення того, що може прогаяти людське око, створюючи свого роду «страхування» для клініцистів.

У міру вдосконалення технологій фокус зміщується з питання * «Чи може ІІ діагностувати» * на питання * «як безпечно інтегрувати його в клінічну роботу» *. За умови правильного підходу ця технологія може стати «великим зрівнювачем», надаючи високорівневу діагностичну підтримку в регіонах з обмеженим доступом до вузькопрофільної медичної допомоги.


Висновок
Хоча моделі ІІ з функціями міркування продемонстрували чудову здатність визначати правильні діагнози в контрольованих дослідженнях, вони все ще стикаються з труднощами, пов’язаними з нюансами та невизначеністю, які притаманні людській медицині. Наступний рубіж для медичного ІІ – це клінічні випробування, спрямовані на інтеграцію цих інструментів як надійні помічники, а не автономні особи, які приймають рішення.