Чому вам не варто покладатися на нейромережу у питаннях здоров'я: розуміємось з педіатром Федором Катасоновим.

Чат-бот може дати гарну пораду і навіть правильно поставити діагноз. Але є нюанси.

Раніше ми гуглили свої симптоми, а сьогодні звертаємося за діагнозом та порадою до нейромереж. Це швидко та безкоштовно, але далеко не завжди корисно та безпечно.

Чи може нейромережа правильно поставити діагноз

Іноді штучний інтелект непогано справляється із діагностикою. В одному дослідженні вчені відправили 100 клінічних випадків зі скаргами та симптомами до чат-боту програми Babylon Health і дали цю ж інформацію лікарям. ІІ правильно визначив захворювання у 80% історій хвороби, а лікарі – у 84% випадків.

Автори іншого дослідження перевірили вісім додатків для діагностики та з'ясували, що деякі з них — Ada, Babylon та Buoy — хоч і не наздогнали лікарів точно, принаймні до них наблизилися.

Можливо, у майбутньому нейромережі не лише стануть добрими помічниками для лікарів, а й повністю замінять деяких фахівців.

Федір Катасонов

Педіатр, популяризатор доказового підходу до медицини, автор телеграм-каналу «Федіатрія».

Багато лікарів користуються нейромережами для роботи з текстами та презентаціями. Я, треба сказати, не з них: я не можу отримати ту точність, яку хочу, і волію поки що працювати вручну.

Сертифікованих ІІ для практичних медичних завдань я поки що не бачив. Але варіантів застосування штучного інтелекту дуже багато. Найбагатший — це документообіг. Якщо ІІ заповнюватиме всі форми, напрямки та історії хвороби, це вже сильно звільнить лікаря для спілкування з пацієнтом.

Крім того, ІІ можуть добре оцінювати зображення, якщо їх заточити на це. Це означає опис усієї візуальної діагностики (рентген, МРТ та інше), опис ЕКГ та інших графічних методів. Вже зараз комп'ютер може це робити краще за людину.

Можливо, ІІ незабаром освоїть і первинну інтерпретацію аналізів, аналіз формально зібраного анамнезу та багато інших технічних дій, включаючи, наприклад, створення індивідуального календаря щеплень, яким я зараз займаюся вручну.

У майбутньому ІІ точно замінить поліклініку, впевнений, що замінить психотерапевтів, а згодом і хірургів. Загалом я цілком вірю в кібермедицину, як у сай-фай-фільмах, коли роботи проводять всю діагностику та лікування.

Крім того, сучасні технології дозволяють винести багато медичних подій за межі клінік. За допомогою датчиків і систем аналізу в реальному часі, а також систем доставки ліків ІІ зможуть надавати частину допомоги прямо вдома.

З точки зору ефективності медичної системи в цілому, я думаю, що вона виграє від повної заміни лікарів на ІІ, коли ІІ стане точніше більше половини лікарів. Якщо цей момент ще не настав, він близький.

Однак все це, можливо, відбудеться в майбутньому і стосуватиметься спеціальних інструментів, розроблених для медичної діагностики. Зараз же чат-боти, популярні у звичайних користувачів, не такі гарні у розпізнаванні хвороб та виборі методів лікування.

Чому не варто довіряти нейромережі постановку діагнозу та вибір лікування

Є кілька причин не довіряти штучному інтелекту своє здоров'я.

Нейросітка не завжди ставить правильні діагнози

Програми, які використовувалися у згаданих дослідженнях , були створені для діагностики захворювань. ChatGPT та багато інших інструментів на основі штучного інтелекту не орієнтовані на роботу в охороні здоров'я та можуть спиратися на сумнівні джерела інформації.

Більше того, хоч системи й навчаються, це не означає, що діагностика стає точнішою. У 2018 році автори одного дослідження обрали кілька систем для перевірки симптомів та ввели ознаки трьох офтальмологічних станів: глаукоми, пошкодження рогівки та синдрому сухого ока. Те саме повторили через два роки і порівняли результати. Ось що вийшло в результаті:

Ada у 2018 році правильно розпізнала глаукому, але у 2020 році за тими ж симптомами визначила кластерний головний біль.
Babylon при глаукомі рекомендувала терміново лікуватися, але не поставила діагноз, а при сухому оці – стані, який не вимагає негайної допомоги лікаря, радила записатися на прийом того ж дня.
Bouy, розроблена Гарвардською медичною школою, не змогла визначити синдром сухого ока, а замість ушкодження сітківки припустила катаракту та захворювання кісток.

У іншому дослідженні автори зазначили, що з постановки правильного діагнозу дуже важливо, яку вибірку спирається штучний інтелект. Наприклад, якщо більшість інформації про захворювання отримано від чоловіків, зростає ризик помилок при постановці діагнозу жінкам. Те саме стосується етнічної групи та навіть соціально-економічного статусу людей.

Нейросеть може галюцинувати і вигадувати факти

Існує таке явище, як галюцинація штучного інтелекту. Це грубі фактичні помилки нейромережі – її висновки, не засновані на реальних даних. Таке може статися, якщо модель вибирає лише частину наявної інформації та ігнорує іншу, більш важливу.

За різними даними, рівень галюцинацій у моделей ІІ варіюється від 8 до 20% залежно від складності моделі та якості даних, на яких вона тренується.

Федір Катасонов

Пошук у Google – це найгірший варіант самодіагностики. ІІ-чати зазвичай справляються краще, але на сьогодні масові продукти так багато галюцинують і брешуть, що їх я теж не радив би використовувати. Впевнений, чи з'являться хороші ІІ-діагности, але це будуть нейромережі, тонко заточені під цю роботу, а не мовні моделі.

Я перевіряв ChatGPT з базових педіатричних питань — він дає слушні конвенційні поради краще, ніж середній лікар у поліклініці. Але поза найчастішими проблемами починаються вигадки. Тому цей ІІ я б точно для діагностики не пропонував.

А ще штучний інтелект може створювати синтетичні дані — штучно згенеровану інформацію, яка лише імітує справжні факти, але не спирається на те, що було насправді. Таким чином нейромережа може створити неіснуючі історії хвороби, симптоми та лікування, а потім знову їх переробити, що створить ще більше дезінформації.

Ми неправильно вводимо інформацію та погано вибираємо із запропонованих варіантів

У дослідженнях, де нейромережі діагностували хвороби не гірше, ніж лікарі, опис клінічної картини вводили лікарі. Якщо те саме робитиме людина без медичної освіти, намагаючись з'ясувати у чат-бота, чому болить око або паморочиться в голові, результати можуть бути іншими.

Федір Катасонов

Люди взагалі погано розуміють, як влаштовано та як працює тіло. Це проблема шкільної освіти. Але якщо говорити саме про опис симптомів, то цьому легко навчитися за бажання. Нічого складного у цьому немає.

Інша річ, що людина, яка не може описати свої симптоми, напевно не зможе верифікувати дані їй рекомендації. У такому разі безпечніше, можливо, сходити до лікаря.

Є одне цікаве дослідження , поки що не опубліковане в науковому журналі, що рецензується. Під час експерименту вчені набрали 1298 осіб, розділили їх на чотири групи і попросили учасників з трьох використовувати різні моделі штучного інтелекту: GPT-4o, Llama 3 або Command R+. Контрольній групі дістався простий пошук в інтернеті.

Лікарі склали для учасників 10 медичних сценаріїв та докладно розписали там симптоми та скарги. Людям залишалося запровадити це в чат-бот, з'ясувати свій діагноз та подальші дії — полікуватися вдома, сходити до лікаря чи дзвонити в невідкладну допомогу.

Виявилось, що результати діагностики сильно залежать від того, хто вводить інформацію та інтерпретує отримані відомості. Коли до чат-ботів зверталися лікарі, нейромережі ставили правильний діагноз у 95% випадків, а відповідні поради давали у 56% випадків. Але коли штучний інтелект використовували випробувані, точність прогнозів дуже знижувалася. Моделі визначали стан менш ніж у 34% випадків, а вірний курс дій не частіше, ніж у 44%. Коли люди просто шукали відповіді в інтернеті, без штучного інтелекту, точність самодіагностики зростала до 47%.

Вчені вирішили, що помилки у діагностиці виникали з двох причин:

Люди не давали нейромережі повної інформації, хоч вона в них і була.
Учасники не використовували правильних припущень у своїх висновках. Чат-бот зазвичай дає 2-3 варіанти відповіді, і люди погано вибирають, що з них більше підходить до їхнього стану.

Інше дослідження показало, що користувачам чат-ботів нелегко визначити, наскільки їм погано насправді і ще складніше правильно розповісти про це боту. У розмові з живою людиною простіше описати симптоми, їх тяжкість та частоту прояву.

Крім того, на відміну від бота лікар може співчувати, підтримувати діалог і зчитувати невербальні сигнали. Загалом застосовувати всі інструменти людської взаємодії, які допомагають нам розуміти один одного.

Нейросеть дає туманні поради, яким мало хто слідує

Нещодавно відбулося дослідження , в якому вчені перевірили здатність GPT-4о ставити правильні діагнози та давати рекомендації. Автори роботи запроваджували питання, які могли з'явитися у користувачів, а студенти-медики перевіряли відповіді нейромережі. Виявилося, що лише 37% діагнозів були вірними. Більше того, близько 60% відповідей, незалежно від того, правильними вони були чи ні, видалися людям туманними та неясними.

Автори іншого огляду зазначили, що хоч людям і подобається використовувати інструменти для перевірки симптомів, вони рідко дотримуються приписів. Навіть поради лікарів часто залишаються поза увагою, що вже говорити про чат-бот, який явно програє фахівцю в авторитеті.

Федір Катасонов

Безумовно, будь-яка медична інформація незалежно від джерела — це привід для тривог та різноманітних дій, які можуть виявитися шкідливими. Я не вважаю, що лікар повинен узурпувати всі питання здоров'я людини, кожен має право робити зі своїм тілом що хоче, у тому числі безглузді аналізи та УЗД. Але завдання лікаря — навчити людину, чому цього не треба робити і яку це може завдати шкоди.

Я не думаю, що ІІ небезпечніший за середнього лікаря з поліклініки: обидва можуть налякати і порадити радикально не те. Але все ж таки я думаю, що краще дочекатися таких ІІ, які будуть заточені на медицині і припускатимуться менше помилок. А до їхньої появи звертатися до живих людей.

Як використовувати чат-ботів, щоб не нашкодити собі

Чат-боти можуть дати корисну інформацію, але все ж таки не варто сліпо їм довіряти.

Запитуйте, коли записатися до лікаря

Якщо з'явилися симптоми хвороби, спитайте чат-бота, наскільки терміново потрібно йти до лікаря.

Найкраще застосовувати для цього не мовні моделі ІІ, а спеціалізовані медичні послуги. Потрібно пройти невелике опитування про симптоми, і робот видасть вам можливий діагноз, порадить лікаря і скаже, наскільки терміново потрібно до нього записатися.

Федір Катасонов

Я вважаю, що послуги для перевірки діагнозів дуже корисні, особливо коли доступність і якість медичної допомоги низькі. Лікар працює за певним алгоритмом, і якусь частину цього алгоритму цілком може виконати робот, навіть не обов'язково з ІІ.

Зіставити симптоми та червоні прапори, підказати, до якого лікаря йти, — це все технічне завдання, яке давно так чи інакше вирішується. Але такі послуги зазвичай дуже обережні і у разі будь-яких підозр відправляють до лікаря.

Насправді йти до лікаря треба, можливо, не завжди, і поки що кращу допомогу такого роду надають люди, як у сервісі Symptomato.com. Але я думаю, що скоро ІІ справлятиметься майже так само добре, якщо правильно його навчити та проводити регулярну супервізію.

Тільки пам'ятайте, що якщо ви плануєте записатися до державної поліклініки, у будь-якому випадку спочатку потрібно йти до терапевта. Він уже направить вас до вузьких спеціалістів.

Перевіряйте діагноз, якщо сумніваєтеся у ньому

Якщо ви сумніваєтеся у призначенні лікаря, можна перевіряти план лікування за допомогою штучного інтелекту.

Федір Катасонов

Якщо немає довіри до лікаря, перевірити план лікування корисно. Це можна робити і без ІІ, наприклад, зіставляючи діагноз та існуючі рекомендації будь-якої розвиненої країни. Але можна і за допомогою ChatGPT, треба лише перевіряти його за 1-2 джерелами. Власне, можна його просити шукати ці рекомендації при певних діагнозах.

Верифікація призначень — це взагалі велике завдання, якому треба вчитися. Моя книга «Федіатрія II», яка має вийти найближчими місяцями, якраз про це. Але з нашим рівнем медицини це, на жаль, просто питання самозбереження. Тупо довіряти середньому лікареві може бути небезпечно.

Попросіть чат-бота шукати дані в авторитетних джерелах медичної інформації, таких як National Health Service, Centers for Disease Control and Prevention, WHO, Patient.info.

Але пам'ятайте, що навіть це не гарантує точності, оскільки ІІ може галюцинувати. В одній статті лікар Ендрю Тейлор, який проводив симпозіум з ІІ в медицині, розповів, як просив ІІ скласти документ з наукових досліджень. Чат-бот видав йому результат із коректною інформацією, але вигаданими науковими статтями. Тому краще перевіряти як джерела, а й те, чи міститься у яких зазначена інформація.

Не просіть призначити лікування

Ви можете засумніватися у призначенні лікаря, але не варто вибирати лікування та оцінювати свої ризики, спираючись на думку чат-ботів.

Якщо дані від ІІ сильно відрізняються від того, що вам сказав лікар, зверніться до іншого лікаря за альтернативною думкою.

Використовуйте для формування корисних навичок

Чат-бот може підтримати вас на шляху здорового способу життя. Якщо у вас немає обмежень щодо харчування та фізичних навантажень, ІІ може скласти вам корисну дієту та план тренувань, дати поради щодо боротьби зі стресом та покращення якості сну.

No votes yet.

Please wait...