Konuşmacı Hakkında: 2005 yılından beri Görüntü işleme, Yapay Zeka Uygulamaları konularınında işlendiği bir blog yazıyor. Serbest çalışan olarak çeşitli görüntü işlem projelerinde çalıştı. Bir Computervision kütüphanesi Olan OpenCv konusundaki ilk Türkçe kitabı yazdı. Hali hazırda bir e-ticaret sitesi için görsel bazlı çözümler üzerine çalışıyor.
Derin öğrenmenin 2012 yılından bu yana hızla yaygınlaşması ve görüntü tespitindeki doğruluk oranının artmasında GPU mimarisinin kullanılması büyük bir rol oynamaktadır (GPU mimarileri CPU mimarilerine göre daha fazla çekirdek barındırdığından paralel işlem bakımından üstünlük barındırmaktır).
Derin öğrenme için GPU kullanmak zorunda mıyız? şeklinde bir soru aklınıza gelebilir. Bu soruyu doğru cevaplamak için son dönemde üzerinde çalışılan alternatif çözümlere de bakmamız gerekiyor.
Bu yazıda özellikle konuyla ilgili çalışma yapmak isteyenler için çeşitli makaleler paylaşılmıştır. FPGA platformları (FPGA Nedir?) GPU platformları kadar hızlı olmasa da enerji tüketimi dikkate alındığında tercih sebebi olabiliyorlar. Microsoft Open Cloud Server yapısında enerji tüketiminin GPU’lara göre dha az olması nedeniyle FPGA kullanmakta. Derin öğrenmenin bir eğitim bir de uygulama safhası dikkate alındığında, eğitim safhasında FPGA kullanmak işleri çıkmaza sokabilir. İşte bu nedenle Facebook hergün sisteme yüklenen 600 milyon fotografla anlamlı veri elde etmek için GPU yapısı kullanmaktadır.
Verisetinizi eğittikten sonra elde ettiğiniz modelinizi kullanmak için FPGA kullanmayı düşünebilirsiniz. Yazının devamında Altera’nın geliştirdiği FPGA kartı üzerinde yaptığı demo videolarını görebilirsiniz. Demolardan anladığım gerçek zamanlı tanımada FPGA ufakta olsa geçikme yaşıyor.
Güç tüketimi bakımından FPGA uygulamada tercih sebebi olacaksa bir de uygulama yazımı konusunu değerlendirmek gerekiyor. FPGA platformlarına kod yazan uzman sayısının az olduğu, nispetende zorluklar barındırdığı gözardı edilmemelidir.
Peki, güç tüketimi konusu değerlendirildiğinde GPU tabanlı alternatif bir çözüm yok mu? NVIDIA Jetson TX1 düşük güç tüketimi yanında sağlamış olduğu altyapı desteği sayesinde geliştiriciler için alışmış oldukları ortamı bırakmadan GPU mimarisinin sağlamış olduğu tüm olanakları gömülü donanım hızlandırmalı olarak kullanma imkanı sunuyor.
GPU dışındaki diğer yapılar:
Google, makine öğrenmesi ve TensorFlow için Tensor Processing Unit (TPU) yapısına sahip. Söz konusu işlemci Google’ın birçok ürününde hizmet vermeye başladı. Bu mimari özellikle düşük enerji tüketimi bakımından GPU’lara göre daha uygun gözüküyor.
IBM TrueNorth işlemcisi DARPA SyNAPSE Programı desteği ile geliştirilen ve 70 miliwatt enerji harcayarak saniyede 46 milyar sinaptik işlem yapabilen avuç içi süper bilgisayardır. Kıyaslama açısından bakarsak insan beyni 100 trilyon işlem için 20W harcarken varsayıma dayalı bir bilgisayarın bu kadar işlemi yapabilmesi için 12GW’a ihtiyaç duyulmaktadır. Daha fazla bilgi için http://www.research.ibm.com/articles/brain-chip.shtml adresine bakabilirsiniz.
Intel Altera FPGA‘yi bünyesine kattıktan sonra Altera derin öğrenme kullanımına yönelik çalışmalarına hız verdi. Aşağıdaki videolardan ve kaynaklardan detaylara ulaşabilirsiniz.
Convolution Neural Network CNN Implementation on Altera FPGA using OpenCL
FPGAs vs. GPGPUs
Machine Learning on FPGAs: Neural Networks
Object Detection and Recognition with Neural Networks
ALTERA ile obje tespiti ve tanıma yapılabiliyorsada gerçek zamanlı işlem geçikmesi sorun teşkil edebilir.
FPGA ile derin öğrenme kullanımına yönelik makaleler:
12 Aralık 2015 tarihinde Derin Öğrenme Etkinliği kapsamında icra edilen “Caffe Başlangıç Rehberi” eğitimine ait sunum dosyasına aşağıdan erişebilirsiniz.
Derin öğrenme çok hızlı bir şekilde yapay zeka alanında büyüme kaydetmektedir. İnsana yakın doğrulukla resim sınıflandırma, ses tanıma, doğal dil işleme, duygu analizi, tavsiye motoru vb. alanlarda gittikçe kullanımı artmaktadır. Uygulama alanlarına yüz tanıma, sahne tanıma, ileri medikal ve farmasötik araştırma, otonom ve kendi kendine giden araçlar dahildir.
Ücretsiz Derin Öğrenme Dersi
NVIDIA, derin öğrenme konusunda online deslere başlıyor. Bu giriş dersi interaktif ders anlatımı, uygulamalı alıştırmalar ve çalışma saatlerinde öğretim üyesi desteğini içerecek şekilde beş öğretim üyesi tarafından verilecektir.
Bu dersler ile tasarım ve eğitim için gerekli olan becerinin yanında sinir ağı destekli yapay zekayı geniş kapsamlı kullanılan açık kaynak kodlu yapılar ve NVIDIA yazılımı ile kendi uygulamalarınıza entegre etme imkanı bulacaksınız.
Çalışma Saatlari oturumundan önce sorularınızı dl-course@nvidia.com adresine gönderebilirsiniz. Böylece öğretim üyeleri oturumlardan önce sorularınıza yönelik faydalı cevaplar hazırlayabilir. Türkçe sorularınız için info@derinogrenme.com adresine e-posta gönderebilir veya iletişim sayfamızı kullanabilirsiniz.
Her derse yönelik hazırlanan uygulamalı alıştırmalara ders süresince nvidia.qwiklab.com adresinden ücretsiz erişilebilirsiniz.
Caffe derin öğrenme yapısı hızlı ve modüler olacak şekilde tasarlanmıştır. Berkeley Vision and Learning Center – BVLC (Berkeley Görüntü ve Öğrenme Merkezi) ve kullanıcı topluluğu tarafından geliştirilmiştir. Yangqing Jia tarafından UC Berkeley’de doktora döneminde hazırlanmıştır. Caffe BSD 2-Clause license altında kullanıma sunulmuştur.
İfade Yapısı yeni ve farklı fikirlerin yada uygulamaların ortaya atılmasını cesaretlendirmektedir. Model ve optimizasyonlar kodlama yapılmaksızın ayar dosyası üzerinden yapılabilmektedir. GPU makine üzerinde eğitim işlemini yapmak için CPU ve GPU değişimi bir etiket ayarı ile gerçekleştirilebilmekte böylece küme bilgisayarlara veya mobil cihazlara yayılım sağlanabilmektedir.
Genişletilebilir kod yapısı aktif geliştirmeyi desteklemektedir. Caffe’nin ilk yılında, 1.000 geliştirici tarafından birçok önemli değişiklik katkısı sağlanmıştır. Hem kod hem de model olarak modern bir yapının tesis edilmesine katkı sağlayanlara teşekkür ederiz.
Hız Caffe’nin araştırma deneyimleri ve endüstri uygulamaları için mükemmel hale getirmiştir. Caffe bir tek NVIDIA K40 GPU* işlemciyle 60 Milyonun üzerinde resmi bir günde işleyebilir. Bu da anlam çıkarma için 1 ms/resim, öğrenme için 4 ms/resim demektir. Şuna inanıyoruz ki Caffe erişilebilir en hızlı convnet uygulamasıdır.
Topluluk: Caffe hali hazırda akademik araştırma projelerine, girişim prototiplerine ve hatta geniş ölçekli görüntü alanındaki endüstriyel uygulamalar ile konuşma ve multimedyaya güç katmaktadır. Topluluğumuza katılmak için caffe-kullanıcı grubu ve Github sayfalarını ziyaret edebilirsiniz.
Sınıflandırma için hazır SGD
Resimsiz HDF5 verisi üzerinde lojistik regresyon eğitimi yapmak için genel SGM en iyileyici olarak Caffe kullanma.
Model parametrelerini düzenleme
How to do net surgery and manually change model parameters, making a fully-convolutional classifier for dense feature extraction.