Automatic Liver Segmentation with Adversarial Loss and Convolutional Neural Network

11/28/2018 ∙ by Bora Baydar, et al. ∙ Middle East Technical University 0

Automatic segmentation of medical images is among most demanded works in the medical information field since it saves time of the experts in the field and avoids human error factors. In this work, a method based on Conditional Adversarial Networks and Fully Convolutional Networks is proposed for the automatic segmentation of the liver MRIs. The proposed method, without any post-processing, is achieved the second place in the SIU Liver Segmentation Challenge 2018, data of which is provided by Dokuz Eylül University. In this paper, some improvements for the post-processing step are also proposed and it is shown that with these additions, the method outperforms other baseline methods.

READ FULL TEXT VIEW PDF
POST COMMENT

Comments

There are no comments yet.

Authors

page 3

This week in AI

Get the week's most popular data science and artificial intelligence research sent straight to your inbox every Saturday.

1 Giriş

Son yıllarda, tıbbi görüntü analizi süresince uzmanlarca harcanan zamanı ve insan hatalarını azaltmak için otomatik bilgisayar tabanlı yaklaşımlar sıklıkla tercih edilmektedir. Otomatik nesne bölütleme özellikle birçok tıbbi görüntüleme arasında en önemli ve ihtiyaç duyulan uygulama alanı olarak belirlenebilir. Kısaca bölütleme, görüntünün/sahnenin anlamlı bütünlük sağlayacak şekilde parçalara ayrılması işlemidir ve hastalıkların saptanmasında, tedavinin planlamasında ve tedavi sonrası gelişimi izlemede yaygın olarak kullanılmaktadır.

MR görüntülerinin bölütlemesi için literatürde birçok farklı yöntem sunulmuş-tur [3],[4],[5],[6],[7] . Özellikle, veri miktarı ve paralel işleme gücündeki artış, derin öğrenme tabanlı yöntemlerin daha etkin bir şekilde kullanılabilmesini hızlandır-mıştır. Evrişimli sinir ağ yapısı, sahne sınıflandırma için etkin olarak kullanılmak-ta [8],[9],[10],[11] ve yalnızca son ağ katmanında yapılan değişikliklerle bölütleme problemine uyarlanabilmektedir [12]. Literatürde, bu konuda çok başarılı yakla-şımlar önerilmiştir. Dolayısıyla en son sunulan tıbbi görüntü bölütleme yöntemlerinin büyük bir kısmı Tam Evrişimli Ağ(TEA) tabanlıdır.

Bu çalışmada, MR görüntülerinin yüksek başarım oranıyla otomatik olarak bölütlenmesi için yenilikçi bir yöntem önerilmektedir. Bu kapsamda, çalışma uzayı olarak MR karaciğer görüntüleri yapılan testlerde kullanılmıştır. Önerilen yöntemde, tam evrişimli ağ yapısı tercih edilmiştir. Özellikle, literatürdeki genel filtre yapısından farklı olarak önemli yapısal değişiklikler sunulmaktadır. Bu sayede, ağ parametrelerinin aşırı öğrenme oranları engellenmiştir. Ayrıca, çekişmeli sinir ağ öğrenme adımı [13], sınıflandırma adımı ile birlikte kullanılmış, böylelikle evrişimsel ağların MR nesne sınırlarında yumuşak olan bölütleme so-nuçları daha keskin olması sağlanmıştır. Önerilen yöntem, MR kanallarını tek ya da küçük kanal grupları olarak işleyebildiğinden, bölütme sonuçlarında oluşabile-cek ayrışımları gidermek için son filtreleme adımı uygulanmıştır. Bu sayede, elde edilen MR bölüt görüntüsü tek bir bütün nesne parçası olarak hesaplamaktadır.

Bildirinin devamında, ilk olarak literatürde MR bölütme üzerine yapılan araştırmalar özetlenmektedir. Daha sonra, bildiride önerilen yöntem detaylı olarak anlatılmaktadır. Son olarak, deneyler sırasında kullanılan veriseti, yapılan testler ve elde edilen sonuçlar karşılaştırmalı olarak sunulmaktadır.

2 İlgili Çalışmalar

Ronneberger et al., [12] de sunulan tam evrişimli ağı (FCN-8s) geliştirerek tıbbi görüntü bölütlemesi için U-Net’i sunmuştur [21]. U-Net, atlama bağlantıları ve adım adım üst örnekleme yapması sayesinde performansı artırmış ve sunulduğu dönemden itibaren, tıbbi görüntü bölütlemede araştırmacıların tercihi haline gelmiştir. Buna rağmen, doğru değişiklikler ve ağ yapısının probleme uyarlanması ile hala geliştirmeye açıktır.

Beyin MR bölütlemesi gibi çok sınıflı problemler için literatürde birçok yöntem bulunmaktadır. Bu yöntemler bazen farklı ağlar kullanarak performansı artırmayı hedeflerken [7, 5], bazıları ise ESA’nın iç yapısını değiştirerek bunu başarmaya çalışmıştır [14, 15, 16]. Örneğin, [7] kademeli bir ağ yapısı önerilmiştir. Bu yapıda herbir sınıfın sınıflandırması sıralı bir şekilde yapılmaktadır. Buna karşın [5] farklı yapıda birçok ağı eğitip bunların sonuçlarını birleştirerek son sınıf etiketine ulaşmıştır.

ESA’ların performansını artırmak için önceden sunulan bazı yapısal değişiklik-ler MR bölütlemesine de uygulanmıştır. Bunlardan öne çıkanlar başlangıç modül-leri [10], genişletilmiş evrişimler [17] ve artık bağlantı blokları [9] olarak özetlene-bilir. Bunlara ek olarak, birçok problemde olduğu gibi MR bölütleme probleminde de aktivasyon fonksiyonu, kayıp fonksiyonu vb. seçimlerin performansı önemli ölçüde etkileyebileceği bilinmektedir.

3 Tıbbi Görüntü Bölütleme için Genelleştirilmiş Bir Derin Öğrenme Yaklaşımı

Bu çalışmadaki hedefimiz, bütün MR görüntü bölütleme problemlerinde iyi sonuç verebilecek, genelleştirilmiş bir yaklaşım sunmaktır. Ana bölütleme ağı olarak, FCN-8’e göre avantajları olduğu için U-Net kullanılmıştır. Bu avantajlardan en önemlisi U-Net’in atlama bağlantılarını kullanarak hatanın daha kolay yayılım yapmasını sağlamasıdır. Bu sayede bilgi kaybetme problemi azaltılmış olur.

Ayrıca, bölütleme ağının eğitimini iyileştirmek için, bu ağ yapısına ek olarak bir çekişmeli ağ kayıp değeri eklenmiştir. Genel ağ yapısı Şekil 1’de verilmiştir.

Figure 1: Önerilen yöntemin genel akışı

3.1 Veri Normalleştirme

Tıbbi veriler toplanırken, birçok farklı kuruluş, hastane, enstitü vs. bu işleme katkı sağlayabilir. Benzer şekilde, bu kuruluşlar farklı MR makineleri (çözünürlük ve kalite farklılıkları) ve farklı protokoller ile bu verileri toplayabilir. Önerilecek yöntem, aynı tipte fakat farklı karakteristiklerdeki verileri aynı başarı oranıyla işleyebilmelidir. Bu nedenle, görüntülerin bir ön işleme adımıyla düzeltilmesi elde edilecek başarıya katkı sağlamaktadır.

Önerilen ön işleme adımında, her bir MR görüntü, piksel değerleri dağılımına göre normalize edilmiştir. Burada, ve görüntünün uzamsal boyutlarını gösterirken, MR görüntünün kanal sayısına karşılık gelmektedir. Bu amaçla, görüntüdeki en yüksek ve en küçük pixel değeri ile görüntü tekrar ölçeklenmiştir:

(1)

Burada ve değerleri görüntüdeki bütün pikseller arasında en büyük ve en küçük değerlere karşılık gelmektedir. Bu adım sayesinde, farklı piksel aralıklarındaki görüntüler, aynı değer aralığına ölçütlendiği için bölütlemedeki doğru sınıflandırma oranı artmaktadır.

3.2 Genel Evrişimsel Ağ Yapısı

Bölütleme problemini, sahne sınıflandırma probleminden ayıran en temel fark, çıktı sonucunun tek bir değer yerine herbir piksel için farklı sonuçlara karşılık gelmesidir. Bu nedenle de, çıktı sonucu girdi görüntüyle aynı uzaysal boyutlara sahip olmalıdır ve bölütleme problemi için her pikselin sınıflandırması yapılma-lıdır. Sınıflandırma problemlerinde, derin katmanlara indikçe uzaysal boyutlar küçülürken, saklı (latent) öznitelik bilgi miktarı artmaktadır. Bölütleme için önerilmiş olan FCN-8 ve U-Net gibi ağlarda [12, 21], derin katmanlarda elde edilen ve uzaysal boyutları küçük olan öznitelikler, farklı yollarla üst örnekleme yapılarak girdi boyutlarına yükseltilir. FCN-8 bu işlemi tek adımda yaparken, U-Net bu işlemi herbir katmanda tekrarlı şekilde yapmaktadır. Eğer, görüntülerden öznitelik çıkarma adımına kodlama ve bölütlemenin oluşturulması için örnekleme yapılan adıma da çözümleme denirse, kodlama adımının farklı katmanlarında elde edilen değerler, çözümleme adımında herbir katmanda ayrı ayrı birleştirilmektedir (toplama veya bitiştirme yöntemiyle). Bu sayede, girdi görüntüden çıktı sonucuna kadar olan bilginin miktarını maksimuma çıkarmak amaçlanmaktadır ve eğitim sırasında sonuç değerinde oluşabilecek hatanın daha kolay geri yayılım yapabileceği bir kısayol eklenmiş olur. Ayrıca, FCN-8 modeline göre hesaplama yükü katmanlar halinde birleştirme yapıldığı için nispeten azalmıştır.

Önerilen yöntemin eğitimi sırasında softmax çapraz entropi [22] kayıp değeri kullanılmaktadır:

(2)

Burada gerçek bölüt görüntüsünü gösterirken, önerilen yöntem tarafından tahmin edilen bölütleme sonucuna karşılık gelmektedir. ise görüntüdeki piksel sayısını temsil eder.

3.3 Yapısal Önermeler

Literatürde, özellikle geri yayılım bilgisinin kaybolmasını engellemek ve ReLU aktivasyon fonksiyonu

[23] ile kullanıldığında seçiciliği arttırmak için Grup (batch) Normalleştirme [24] yaygın olarak kullanılmaktadır. Yaygın olarak her katmanda önce Evrişimsel Filtre, sonrasında Grup Normalleştirme, ve en son ReLU uygulaması tercih edilmektedir.

Fakat Grup normalleştirme adımının, evrişimsel filtre yapıdan önce uygulanmasının daha başarılı sonuçlar verdiği deneysel sonuçlarda gözlenmiştir. Ayrıca, ReLU aktivasyon fonksiyonu yerine negatif değerlere kısmi izin veren Parametrik ReLU [25] aktivasyon fonksiyonu tercih edilmiştir. Sonuçların iyileşmesindeki temel etken, filtreleme sonucunda elde edilen negatif değerlerin bilgi akışı sırasın-da tamamen kaybedilmemesi ve olabildiğince en yüksek seviyede bütün değer aralıklarının istatistiki olarak değerlendirmeye alınmış olmasıdır.

3.4 Çekişmeli Sinir Ağları

Evrişimli filtre yapısındaki en önemli eksik, nesnenin kenar bölgelerinde yumuşak ve belirgin bir şekilde bozuk şekillerin oluşmasıdır. Bu durumu iyileştirmek için literatürde en fazla tercih edilen yöntemlerin başında Koşullu Rastgele Alanlar gelmektedir. Bu fonksiyon pikselin rengine, komşu piksellerin sınıflarına, pikselin pozisyonuna bağlı olarak ilişkiler kurarak bölütme sonuçlarını iyileştirmeyi amaçlamaktadır. Fakat, öğrenme sırasında, evrişimler ağlardaki parametre değer-lerine etki edemediği için, genel yapıdan bağımsız bir ikinci adım olarak tercih edilmektedir. Bu nedenle bizim yaklaşımımızda Koşullu Rastgele Alanlar tabanlı bir yaklaşım yerine, derin ağ modeliyle etkileşime geçebilecek Koşullu Çekişmeli Ağ yaklaşımı entegre edilmiştir.

Kısaca, klasik Üretken Çekişmeli Ağlarda [13], ağ rastgele Gaussian vektörleri ile beslenir ve ayrıştırıcı-iyileştirici öğrenme modeli sonucunda eğitim veri setinde bulunan görsellere benzeyen yeni sonuçlar elde edilir. Koşullu Çekişmeli Ağlarda ise ağa aynı zamanda belli koşullar girdi olarak verilebilir. Örneğin, [26] çalışmala-rında, elde edilmek istenen yüz ifadesi girdi olarak ağa sağlanır. Anlamsal bölütle-me probleminde de yaklaşım buna oldukça benzerdir. MR görüntüsü ile elle etiketlenen gerçek bölüt alanı bitiştirilmiştir ( , bitiştirme işlemini belirtmektedir). Benzer şekilde MR görüntüsü ile üretici ağ tarafın-dan elde edilen sonuç görüntüsü bitiştirilmiştir . Koşullamada, üretici ağ, ile yi ayırt etmeye çalışan bir ayrıştırıcı ağ ile eğitilmektedir. Böylece, eğitim sırasında nesnelerin kenar sınırlarında oluşacak hatanın modele yayılımı ek bir kayıp değeri ile sağlanır:

(3)
(4)

Burada, ayrıştırıcı kayıp değeri, gerçek ile elde edilen bölütleme değerini birbirinden olabildiğince ayırt etmeye çalışırken, evrişimsel filtreleri bölütleri olabildiğince gerçek değerlere benzetmeye yani sınır kenar noktalarında keskinleş-tirmeye çalışmaktadır. Not edilmelidir ki, karaciğer bölütlemede kullanılan KÇA, son işleme adımından ziyade, kayıp fonksiyonunun geliştirilmesi olarak düşünüle-bilir.

3.5 Öğrenme Modeli

Üst kısımda özetlendiği üzere, parametre öğrenmede iki kayıp değerlerinden faydalanılmaktadır:

(5)

Dikkat edileceği üzere Koşullu Çekişmeli kayıp değeri oldukça düşük tutulmuştur. Bunun nedeni, [27]’de özetlendiği gibi çekişmeli ağlar parametre uzayını ayırırken devamlı olmadığı ve yerel minimumlara takılabileceğinden dolayıdır. Ayrıca, parametrelerin öğrenilmesi için Adam çözümleyicisi [28]

kullanılmıştır. Öğrenme katsayısı ve toplam iterasyon sayısı 0.001 ve 100K olarak belirlenmiştir. Kodlanması sırasında Tensorflow kod kütüphanesinden yararlanılmıştır.

3.6 3-Boyutlu Ayrık Giderme

Önerilen sistem, 3-boyutlu MR görüntüsü bölütleme esnasında, bütün girdi görün-tülerini kullanmak yerine, sıralı gruplar halinde bölüt tahminleri yapmaktadır. Matematiksel olarak, önerilen evrişimsel filtre modelini belirtirse, elde edilen herbir bölüt sonucu komşuluğundaki görüntüler kullanılarak ile gösterilebilir. Bu nedenle, tahminler sıra-sında bazı 3-boyutlu nesneden kopuk ayrışımlar oluşacaktır.

Son adım olarak, elde edilen 3-boyutlu MR görüntüleri birbirine bağlı voksellerden oluşacağı bilgisi de göz önünde bulundurularak, küçük yanlış ayrışımları gidermek için en büyük 3 boyutlu bağlı hacim filtrelemesinin performansı artırdığı gözlenmiştir.

4 Deneysel Sonuçlar

İlk olarak kullanılan veriseti ve performans hesaplama metrikleri özetlenecektir. Daha sonra, yapılan deneyler ve elde edilen sonuçlar karşılaştırmalı olarak değer-lendirilecektir.

4.1 Veriseti ve Metrikler

SIU Karaciğer Bölütleme Yarışması 2018111https://eee.deu.edu.tr/moodle/mod/page/view.php?id=7873 ’de de kullanılan BT veri seti 20 hastadan oluşmaktadır[1, 2]. Bunların 6 tanesi eğitim için referans etiketleri ile birlikte sağlanmıştır. Kalan 14 hastanın ise yalnızca tarama görüntüleri verilmiştir. Bölüm 4.2’de yarışmada elde edilen sonuçlar verilmiştir. Verisetinde herbir hasta farklı karaciğer MR kesiti görüntüsünden oluşabilmektedir.

Table 1: Son işleme adımı eklenmeden, farklı komşu katman sayıları kullanılarak elde edilen sonuçlar.

Performans değerlendirmesinde 5 farklı metriğin ortalama değeri dikkate alınmıştır. Bunlar, hacimsel örtüşme, bağıl mutlak hacim farkı, ortalama simetrik yüzey mesafesi, etkin simetrik yüzey mesafesi ve en büyük simetrik yüzey mesafesidir.

4.2 Sonuçlar

Önerilen yöntemin sonuçları bu bölümde detaylı olarak sunulmuştur. İlk olarak Tablo 1’de son işleme adımı (3B ayrık giderme) olmadan yöntemin sonuçları göstermektedir. Tablodaki kullanılan komşu katman sayısı değerine karşılık gelmektedir. Sonuçlardan, bölütleme işleminde kullanılan komşu katman sayısının artması sonuçlara olumlu etki yapabildiğini göstermektedir. Fakat, bu artış, hesaplama da benzer bir artışa neden olmaktadır.

Table 2: 2 boyutlu ayrık giderme sonrası elde edilen sonuçlar.

Tablo 2’de son işleme olarak 2B ayrık giderme uygulandığında elde edilen sonuçlar görülmektedir. Tablo 1’de verilen son işlemesiz halleri ile karşılaştırıldı-ğında sonuç puanlarının yaklaşık 20 puan arttığı görülmektedir. Bu da, sunulan yöntemin aslında basit bir işlem adımıyla çok daha başarılı sonuçlar verebileceğini göstermektedir. Ayrıca, komuşulukların kullanılmasının performansa olan olumlu etkisi benzer şekilde bu tabloda da gözlenmektedir.

Son olarak, 2B yerine 3B ayrık giderme son adımı uygulandığında sonuçlara olan etkisi gösterilmiştir. Tablo 3’de önerilen yöntemin (METU MM LAB v5) SIU Karaciğer Bölütleme Algoritmaları Yarışması’nda sunulan diğer yöntemlerle karşılaştırmalı sonuçları verilmektedir. Burada, önerilen yöntem sadece verilen kısıtlı veri seti ile eğitilmiştir. İTÜ Vision Lab-v10 algoritmasında ise farklı veri setleri ile eğitim veri seti daha geniş tutulmuştur. Bu da, önerilen yöntemin limitli eğitim seti ile dahi en iyi başarımı verebileceği ve MR görüntü bölütleme problemi için en iyi yöntem olabileceğinin göstergesidir.

Table 3: Yarışmada sunulan en başarılı yöntemlerin sonuçları.

*2 boyutlu ayrık giderme 3 boyutlu olarak uygulandığında elde edilen sonuç

5 Yorumlar

Tıbbi görüntüler 3 boyutlu olarak toplandığından ve değerlendirme sırasında bu bilgiden faydalanılması gerektiğinden, 3 boyutlu otomatik yöntemlerin başarımı artırabildiği gösterilmiştir. Ayrıca, önerilen yöntemde, Koşullu Çekişmeli Ağlar eğitime dahil edilmiştir. Bu sayede doku sınırlarında, ağ bir koşullama kurarak, yöntemin eğitimi geliştirilmiş ve başarımı artırılmıştır. Son olarak, elde edilen bölütleme görüntülerinde ayrıkların temizlenmesinin başarımı arttırdığı özetlenmekdir. Önerilen yöntemin testleri sırasında sadece karaciğer bölütleme problemi kullanılsa da, bu yöntem herhangi bir MR görüntü bölütleme problemine rahatlıkla uygulanabilir.

6 Teşekkürler

Önerilen modelin eğitimi ve testleri sırasında kullanılan hibe edilmiş GPU kartları için yazarlar NVIDIA şirketine memnuniyetlerini sunar. Ayrıca, yarışma sırasında ve sonrasında değerli fikir alışverişlerinden dolayı Sn. Alper Selver’e ve Sn. Emre Kavur’a teşekkür eder.

References