Yapay Zeka ile Triyaj ve Semptom Değerlendirme: Dijital Kapı Bekçileri Ne Kadar Güvenilir?
Bir belirti hissedip "acile mi gitsem, randevu mu alsam, evde mi beklesem?" diye düşündüğünüzde, giderek daha fazla insan bu soruyu bir uygulamaya soruyor. Yapay zekâ tabanlı semptom değerlendirme araçları sağlık sistemine erişimin yeni kapısı haline geliyor. Peki bu dijital kapı bekçileri ne kadar isabetli ve nerede güvenli? Bu yazı, kanıtlara bakıyor.
Triyaj, tıbbın en eski ama en kritik kararlarından biridir: kimin, ne kadar acil bakıma ihtiyacı var? Geleneksel olarak bunu bir hemşire ya da hekim yapar. Son yıllarda ise semptom kontrol uygulamaları (symptom checkers) ve büyük dil modelleri, bu kararı doğrudan hastanın cebine taşıdı. Kullanıcı belirtilerini girer; uygulama olası nedenleri ve bir aciliyet önerisi (acil servis / aile hekimi / evde takip) sunar. Vaat büyük: gereksiz acil başvurularını azaltmak, erişimi kolaylaştırmak, hastayı doğru basamağa yönlendirmek. Ancak vaadin gerçekle örtüşüp örtüşmediği titiz bir kanıt incelemesi gerektirir.
Öne Çıkan Örnek: Ada Health
Bu alanın en çok çalışılan örneklerinden biri Ada Health'tir. 2016'da kullanıma giren Ada'nın tanı algoritması, başlangıçta nadir hastalıkların tanısında klinisyenlere yardımcı olmak üzere geliştirilmişti; zamanla Almanya, Birleşik Krallık ve ABD'de yaygın bir tüketici uygulamasına dönüştü. Önemli bir nokta, Ada'nın kendini açıkça tanı koymayan, yalnızca bilgi ve yönlendirme sunan bir triyaj/bilgi aracı olarak konumlandırmasıdır — bu, hem dürüst hem de düzenleyici açıdan kritik bir sınırdır.
Tanı ile triyaj farklı işlerdir
"Bu hastalık nedir?" (tanı) ile "Bu kişi şimdi ne yapmalı?" (triyaj) ayrı sorulardır. Kanıtlar, semptom kontrol araçlarının genellikle triyajda tanıya göre daha başarılı olduğunu gösterir; çünkü güvenli yöndeki bir aciliyet önerisi, tam doğru tanıdan daha kolaydır.
Kanıtlar Ne Diyor?
Bu araçların performansı, uzun süredir bağımsız çalışmalarla ölçülüyor. BMJ Open'da yayımlanan ve popüler semptom değerlendiricileri bir hekim paneliyle karşılaştıran kapsamlı çalışmalar, tutarlı bir tablo çiziyor: tanısal doğruluk değişkendir ve hekimler doğru tanıyı ilk sırada listelemede semptom kontrol araçlarını belirgin biçimde geçmektedir. Yani "ilk tahmin doğru mu?" ölçütünde insan hekim hâlâ açık ara öndedir.
Triyaj boyutunda tablo daha karışık ama daha umut vericidir. Acil servis verileriyle yapılan karşılaştırmalı çalışmalarda, çeşitli platformların doğru triyaj önerisi oranı yaklaşık %58 dolayında bildirilmiştir; önerilerin yaklaşık %20–30'u "aşırı triyaj" (gereğinden acil yönlendirme), %10–15'i ise "yetersiz triyaj" (gereğinden az aciliyet) ile sonuçlanmaktadır. Buradaki asimetri klinik açıdan anlamlıdır: aşırı triyaj kaynak israfı ve gereksiz kaygı yaratırken, yetersiz triyaj — yani ciddi bir durumu hafife alıp hastayı eve yönlendirmek — doğrudan bir güvenlik riskidir ve bu araçların en kritik zayıf noktasıdır.
Yeni Oyuncu: Büyük Dil Modelleri
2025'te npj Digital Medicine'de yayımlanan bir çalışma, online semptom değerlendirme uygulamalarını, büyük dil modellerini (LLM) ve sıradan kullanıcıları öz-triyaj kararlarında doğrudan karşılaştırdı. LLM'ler bu alana güçlü bir aday olarak girdi; bazı görevlerde geleneksel kural-tabanlı semptom kontrol araçlarına kıyasla daha esnek ve doğal bir etkileşim sundu. Ancak LLM'lerin bu bağlamdaki riskleri de devralındı: aynı modeller, ikna edici bir dille hatalı aciliyet önerisi verebilir ve kullanıcının yanlış ifade ettiği belirtileri sorgulamadan benimseyebilir. Yani teknolojinin değişmesi, temel güvenlik sorularını ortadan kaldırmaz — yalnızca biçim değiştirir.
Kullanıcı Faktörü: Girdi Kadar İyi Çıktı
Bu araçların gerçek dünyadaki doğruluğunu belirleyen kritik ama az konuşulan etken, kullanıcının kendisidir. Bir semptom kontrol aracı, ancak verilen belirti tarifi kadar iyidir. Tıbbi terminolojiye yabancı bir kullanıcı, "göğüs ağrısı"nı kas ağrısı sanıp farklı tarif edebilir ya da kritik bir eşlik eden belirtiyi (ör. nefes darlığı, terleme) atlayabilir. Hekimin sahip olduğu — beden dili, ses tonu, muayene bulgusu, geçmiş bağlam gibi — zengin bağlam, bir uygulamadan büyük ölçüde gizlidir. Bu nedenle bu araçların çıktısı, bir başlangıç noktası olarak değerlidir; bir son karar olarak değil.
Doğru Konumlandırma
Tüm bu kanıtlar, yapay zekâ triyajının değersiz olduğunu değil, yerinin net tanımlanması gerektiğini gösterir. Mantıklı kullanım: hastayı doğru sağlık basamağına yönlendiren bir ön-değerlendirme, hekime ulaşılamayan saatlerde bir ilk rehber, sağlık okuryazarlığını artıran bir bilgi kaynağı. Güvenli tasarımın altın kuralı ise "kuşkuda güvenli tarafa kaymaktır" (safety-netting): belirsizlikte aracın kullanıcıyı daima daha temkinli, daha üst aciliyete yönlendirmesi ve "şu belirtiler varsa hemen acile gidin" gibi kırmızı bayrak uyarılarını net vermesidir.
Sonuç
Yapay zekâ tabanlı semptom değerlendirme ve triyaj araçları, sağlık sistemine erişimin gerçek bir parçası haline geldi ve doğru kullanıldığında değerli bir ön-yönlendirme sağlıyor. Ancak kanıtlar nettir: bu araçlar tanıda hekimin yerini tutmaz, triyajda yaklaşık yarı-üçte iki oranında isabetlidir ve en büyük riskleri ciddi durumları hafife alan yetersiz triyajdır. Doğru çerçeve, onları hekime giden yolu kısaltan bir pusula olarak görmek — asla hekimin yerine geçen bir tanı makinesi olarak değil.
Kaynaklar
- Accuracy of online symptom assessment applications, large language models, and laypeople for self-triage decisions. npj Digital Medicine 2025;8:178. nature.com
- Gilbert S, ve ark. How accurate are digital symptom assessment apps for suggesting conditions and urgency advice? BMJ Open 2020. bmjopen.bmj.com
- Comparison of Diagnostic and Triage Accuracy of Ada Health and WebMD Symptom Checkers, ChatGPT, and Physicians in an Emergency Department. JMIR mHealth and uHealth 2023. mhealth.jmir.org
- Evaluation of Diagnostic and Triage Accuracy and Usability of a Symptom Checker in an Emergency Department: Observational Study. PMC9531004. ncbi.nlm.nih.gov
- Ada Health — Sağlık değerlendirme araçlarının performansının test edilmesi (yöntem açıklaması). about.ada.com