“Konuşma terapisi” genellikle psikoterapistler tarafından hastaların konuşma yoluyla depresyon veya anksiyetenin üstesinden gelmesine yardımcı olmak için kullanılır.
Massachusetts Teknoloji Enstitüsü’ndeki bir araştırma ekibi, hastanın konuşmasını analiz ederek, depresyon belirtilerini tespit ederek “konuşma teşhisi” olarak adlandırılabilecek olanı ortaya çıkarmak için derin öğrenme kullanıyor.
Araştırma, ciddi ve zihinsel sağlık sorunlarının etkili ve ucuz bir şekilde teşhis edilmesini sağlıyor.
Ulusal Ruh Sağlığı Enstitüsüne göre, ABD’deki 15 erişkinden birinin, herhangi bir yılda büyük bir depresyon geçirdiği bildiriliyor. Bu durum bir insanın hayatında ciddi aksamalara yol açabilir. Buna rağmen depresyon hakkındaki çalışmalar ve edinilen bilgi sınırlı kalmıştır.
Depresyonu tanımlamak için kullanılan teknikler tipik olarak
zihin sağlığı uzmanları tarafından doğrudan sorular soran ve sonuçlar çıkaran uygulamalardan oluşur.
Gelecekte, bu işaretli değerlendirmeler, MIT araştırma asistanı ve bilgisayar bilimi bölümün baş araştırmacılarından Tuka Alhanai’ye göre daha az gerekli olabilir. Takımının çalışmalarının, devam eden kişisel ruh sağlığı takip çalışmalarının bir parçası haline gelmesini öngörüyor.
Kilit Nokta: Veri Seti
Derin öğrenmeye başlamanın kilit noktası iyi veri elde etmektir.
Bu; Alhanai’nin ekibinin, modellerini eğitmeye başlarken karşılaştıkları bir zorluktu. Özellikle katılımcıların depresyonda olduğu zaman yaptıkları konuşmaların veri setini arıyordu.
Sonunda, % 20’sinde depresyon belirtileri olan 180 kişilik bir grupla röportaj yapmak için Alman araştırmacılarla bir araya gelen Güney Kaliforniya Üniversitesi’nden birini buldu. Görüşmeler, kişilerin nerede yaşadığı, arkadaşlarının kim olduğu ve kendilerini depresyonda hissedip hissetmedikleri hakkında 20 dakikalık sorulardan oluşuyordu.
Araştırmacıların, depresyonun aslında konuşma şekilleri ve sözcükler ile tespit edilebileceği sonucuna varması Alhanai’yi de aynı kanıya varma konusunda cesaretlendirdi. Alhanai işi bir adım öteye taşıyıp öngörücü soruları kaldırıp bunun yerine normal, günlük konuşma sırasında depresyonu tespit etmek için bir model geliştirmek istedi.
“Verilerde sizi, insanların depresyona girip girmediği hakkında ipuçları verecek önemli işaretler var” dedi. “Genel konuşmayı dinlersiniz; konuşmayı, konuşmanın gidişatını ve içindeki şeylerin söylendiği daha geniş bir bağlamı anlarsınız.”
Alhanai ve ekibi, 40’ın üzerinde NVIDIA TITAN X GPU’yu çalıştıran bir dizi makinenin işlem gücünü, TensorFlow, Keras ve cuDNN derin öğrenme kütüphaneleriyle birleştirdi ve modellerini eğitmek için çalışmaya başladı.
Modele; veri setinden, yapılan görüşmelerin bir kısmını verdiler. Açık soruları ve depresyona atıfta bulunarak, mevcut depresyon ipuçlarının olup olmadığını belirleme işini modele bıraktılar. Ardından, modeli sağlıklı bir kişiden ve depresif bir kişiden kaydedilen konuşma bölümlerine maruz bıraktılar ve daha sonra modele konuşmaların kime ait olduğunu söylediler.
Yeterince tekrardan sonra araştırmacılar modele, konuşmanın başka bir bölümünü vererek olası bir depresyon belirtisi olup olmadığına karar vermelerini isteyeceklerdir. Ekip bu şekilde onlarca model eğitti. Bu, Alhanai’nin GPU’lara erişimin olmadan mümkün olmayacağını söylediği bir şey.
Neler Geliştirilmeli?
Eğitim, normal görüşme yapılarak depresyon durumunun çıkarımı konusunda yüzde 70’ten fazla doğrulukla belirlediği bir modelle sonuçlandı – zihinsel sağlık uzmanlarının tanılarına uygun olarak – her bir deney TITAN X’te gerçekleşti.
Ekip, bulgularını Hindistan’ın Haydarabad kentinde düzenlenen Interspeech 2018 konferansında sunulan bir bildiride rapor etti ve şimdi çalışmayı bir üst seviyeye taşımak için hazırlanıyor.
Alhanai, “Bu çalışma çok cesaret verici” dedi. “Bu sistemleri oraya çıkarma ve değerlendirme amacıyla tahminler yapmalarını sağlayın – henüz klinik olarak kullanmak için değil, daha fazla veri toplamak ve güvenilirliği fazla bir sistem oluşturmak için.”
Doğal olarak, Alhanai daha hızlı ve daha güçlü GPU’lara erişmeyi arzu ediyor, böylece daha büyük veri kümeleriyle daha fazla deneme yapabilir. Ancak uzun vadeli görüşü, iletişimi analiz etmek için derin öğrenmeyi kullanmanın (sadece konuşma değil) diğer zihinsel sağlık koşullarını tanılama ve yönetme konusundaki etkisini araştırmaktır.
“Bir makine, yapılan konuşmayı bir insanın duyabildiği ve hissedebildiği
ya da diğer jestlerden anlayabildiği herhangi bir durumu tespit edebilmelidir” dedi. “Sinyalin ne olduğu önemli değil – konuşma olabilir, yazı olabilir, çene hareketi olabilir, kas gerginliği olabilir.”
Kaynak: NVIDIA Blogs