腎臓病の管理:腎臓糸球体の識別と分類

Mar 14, 2022

詳細情報:ali.ma@wecistanche.com


パートⅡ:腎生検の組織像に基づく糸球体分類のためのニューラルネットワーク

Giacomo Donato Cascaranol、Francesco Saverio Debitontol&etal。


概要

背景:医用画像に基づくコンピューター支援診断(CAD)システムは、意思決定プロセスにおいて医師をサポートする可能性があります。 過去数十年の間に、研究者は有望な結果を達成するいくつかの医療分野でCADシステムを提案してきました。

CADシステムは、標準化された客観的なワークフローによって生検スライドを分析する際に病理医をサポートするデジタルパソロジーで重要な役割を果たします。 提案された作業では、画像処理技術と機械学習に基づいた新しいCADシステムモジュールを設計およびテストしました。その目的は、腎小体(糸球体)に影響を与える状態を硬化性と非硬化性に分類することでした。 このような識別は、病理医が実施する生検スライドの評価に役立ちます。

結果:から取られた26のデジタルスライドを収集しました腎臓過ヨウ素酸シッフ染色を行った19人のドナーのうち、専門の病理学者がスライドの準備、デジタル取得、糸球体の注釈を実施しました。 分類器を設定する前に、注釈付き領域からのいくつかの特徴抽出手法を評価しました。 次に、特徴削減手順とそれに続く浅い人工ニューラルネットワークにより、糸球体クラスを区別することができました。 独立したデータセット(つまり、トレーニング手順で使用されていない画像の処理)を考慮してワークフローを評価しました。 トレーニングアルゴリズムと評価を10回独立して実行することで、MCCと精度0 .95(±0。0 1)と0.99(標準偏差)を達成できました。<0.00), respectively.="" we="" also="" obtained="" good="" precision="" (0.9844±0.0111)="" and="" recall="">

結論:テストセットの結果は、提案されたワークフローが調査対象のドメインに対して一貫性があり信頼できることを確認し、2つのクラスの糸球体を区別する臨床診療をサポートできます。 誤分類に関する分析は、関連する画像が通常、染色アーチファクトまたは現在の部分的なセクションの影響を受けることを示しています


kidney disease: glomerulus classification

腎臓病のためのCistanchetubulosaの投与量をクリックしてください

討論

独立したテストセットで提案されたアプローチを評価すると、分類ワークフローは、平均MCCと精度がそれぞれ{{0}}。95と0.99であり、10回の独立した反復で低い変動性を達成しました(MCC std {{5} }.01およびAccuracystd<0.00). good="" precision="" and="" recall="" were="" also="" obtained(precision:="" 0.9844±0.011l,="" recall:0.9310±0.0153).="" the="" proposed="" approach="" thus="" leads="" to="" an="" improvement="" of="" the="" classification="" performance="" if="" compared="" to="" the="" reported="" literature="">

報告されたワークフローを実装および評価する際に、パフォーマンス比較係数としてMCCを使用し、最適な分類しきい値を選択するためのROCcurveを使用することで解決された、一般的なデータの不均衡の問題に直面してテストしました。 報告された結果は、提案されたワークフロー設定が調査対象のドメインに対して信頼できることを示唆しており、糸球体の2つのクラスを区別する臨床診療をサポートしています。

how to treat kidney disease

誤分類された糸球体を分析すると、誤分類されたサンプルに対応する入力画像が、染色アーチファクトまたは部分的な部分(主にエッジ)を示していることもわかりました。 一般的な例を図1に示します。ただし、臨床診療では、病理医は、このような問題の影響を受ける画像を事前に検出するための戦略を設計することにより、提案されたワークフローで除外できる画像を破棄します。


image

図1最良のモデルによって誤分類されたFalseNegative


結論

提示された作業では、強膜糸球体と非強膜糸球体を分類するためのワークフロー全体を提案しました。 いくつかの特徴抽出アルゴリズムが調査および評価され、2つの特徴の類型が選択されました。形態的特徴とテクスチャ特徴です。 150個の特徴を収集しました。mrcLBPおよびHaralickアルゴリズムを使用して計算された2つの形態学的特徴と148のテクスチャ特徴です。 次に、PCAを使用して機能の数を95に減らしました。 相互検証された人工ニューラルネットワークがトレーニングされ、不均衡なデータセットとネットワーク調整の問題に直面しました。 得られた結果は、そのような種類の分類タスクを実行する際の最先端技術を向上させた。

将来的には、特徴抽出プロセスで経験的な仮定の数を最小限に抑え、フォールド間に加重分類を組み込む方法を調査します。 さらに、機能分析を実行して、最適なものを特定します。

best herb for kidney

さらに、データセットの不均衡の問題に直面し、オーバーサンプリング手法に基づく新しい手法が調査される可能性があります[20]。 ディープラーニングアプローチ[21-24]を評価し、このホワイトペーパーで提案されている方法論と直接比較することも興味深いでしょう。 WSIに適用されるさまざまな深層学習セマンティックセグメンテーション手法に関する予備調査はすでに実施されています[25]。 最後に、提示されたワークフローは、次の完全なCADツールに統合されます。肝臓生検分析。


メソッド

この研究では、の分類を可能にするCADフレームワークを提示します糸球体機能ベースのアプローチを使用した条件。 画像処理と機械学習技術に基づく提案されたソリューションは、それぞれに自動的にラベルを付けるように設計されています糸球体強膜または非強膜として。 糸球体分類の完全なワークフローの詳細な表現を図2に示します。処理パイプラインは、(i)特徴抽出、(i)特徴削減、(i)分類の3つの主要なステップに編成できます。


image

図2全特徴抽出と分類ワークフロー

データの説明

スライド全体の画像は、2011年7月から2015年2月の間に、バーリ大学病院(イタリア)の緊急臓器移植部門の医師によって収集されました。 全ての肝臓PAS染色による生検は、AperioScanScopeCSを使用して20×で0.50μm/ピクセルの解像度でスキャンされました。 この調査で検討されたWSIは、合計26から収集されました。肝臓19人のドナーのデジタル生検。SVSファイル形式(非標準のメタデータと圧縮を備えたピラミッド型のタイルTIFFで構成されるAperioファイル形式)でフル解像度で保存されます。

natural herb for kidney

各WSIには、異なる数の生検セクション(1から7)が含まれています。 使用されるデータセット全体では、WSIごとに平均4つの生検セクションがカウントされ、合計で105セクションがカウントされます。 使用されたデータセットの収集された画像は、それらすべてがPAS染色で処理されたとしても、色と彩度の点で大きな違いが特徴です。 飽和差の例を図3に示します。


image

図3PAS染色腎生検で飽和レベルが異なる糸球体の例

データセットの作成

すべての糸球体は、2人の医学卒業生によって手動で識別およびラベル付けされました。 次に、1人の専門家の腎臓病理学者が最終的な注釈を検証しました。 手順は、実際の糸球体領域の輪郭を描き、それぞれにラベルを付けることで構成されていました糸球体AperioImageScopeツールを使用して強膜または非強膜として。

手動注釈で導入された変動性のため、ラベル付けされた各領域は、各次元に対して1.1の過大評価係数を持つ長方形の境界ボックスで囲まれていました。 次に、検出およびラベル付けされたすべての糸球体領域が抽出され、データセットの作成に使用されました。

得られた初期データセットは、428個の硬化性糸球体と2344個の非硬化性糸球体で構成され、2つのクラスの比率は1/5.5でした。 詳細には、合計2772個の糸球体にラベルが付けられ、平均して、各生検および各セクションには、それぞれ106個および26個の糸球体が含まれていました。

その後、データセットはトレインセットとテストセットに分割されました。 特に、元のデータセットの20%がテストセットとして使用されており、テストセットターゲットの情報は最終的なパフォーマンスのみを評価するために使用されています。 選択はランダムに実行されましたが、糸球体テストセットに表示された場合、同じ生検に属する他のすべての糸球体がテストセットに表示される必要があります。つまり、トレイン/テスト分割は生検レベルで実行されています。 最新のデータセット構成を表1に示します。


特徴抽出

特徴抽出は、2つの異なるタイプの糸球体を区別するために使用される一連の特性の定義を可能にするワークフローの最初のステップです。 問題に対処できる医師が使用する人間の推論に基づくと、問題に直面するのに最適な機能は、形態学的機能とテクスチャベースの機能という2つの主要な画像処理技術に関連する機能です。

研究に関与した病理学者によって示唆されたように、強膜糸球体と非強膜糸球体の主な違いは、ボーマン嚢の形状、寸法、および血管によるテクスチャーに関するものです。 非硬化性糸球体は通常、楕円形であり、ボーマンの空間によってメサンギウムで毛細血管房から分離されているボーマン嚢の存在を特徴とします。 細胞核の集合(図4の青い点)、毛細血管内腔(図4の白い領域)、およびメサンギウムマトリックス(図4の類似した色調と異なる飽和レベルの領域)は、特定のことを示しています一般に「ポメグラネートテクスチャー」と呼ばれるテクスチャー。代わりに、硬化性糸球体は、毛細血管内腔を破壊する細胞外マトリックスの増加、およびコラーゲン性物質によるボーマンの空間の減少または欠如を特徴とする。

図4と図5は、非強膜と強膜の例を示しています。糸球体、 それぞれ。 パラメータ値やアルゴリズム構成を含む画像処理アルゴリズムの微調整は、トレインセットでのみ行われていることに注意してください。


形態的特徴

形態的特徴に関しては、ボーマン嚢とボーマンの空間に関連する2つの特徴を検討しました。 最初の特徴は、ボーマン嚢に関連する領域、血管領域、およびPAS染色による白色度の着色を特徴とする毛細血管間空間の合計として計算されます。 領域を表すマスクの検出は、RGB、CMYK、およびLabの3つの異なる色空間のチャネルを考慮した3つの並列画像処理手順に基づいています。 詳細に:

・RGB色空間の緑のチャネル。これは、糸球体構造;・CMYKカラーモデルからのマゼンタの補色は、この色成分の検出可能な経験的重要性のために選択されました(図3,4および5)。

・人間の色覚との関連によるラボ色空間のaおよびbコンポーネント。

非硬化性および硬化性糸球体へのプロセスの適用例は、それぞれ図6および7に報告されています。

RGB色空間からの緑チャンネルとCMYKカラーモデルからのマゼンタチャンネルのマスクの抽出は、同じ画像処理ステップに従います。

1. 2値化:ピクセルを白に関連させておく

地域のしきい値は経験的に190に設定されています[16]。

2.モルフォロジー演算子:取得した画像をクリーンアップする

前のステップから、構造要素として半径1から3の範囲のディスクで、侵食、拡張、およびメディアンフィルタリングが使用されました。

3.アクティブコンター:取得したマスクの形状をきれいにするために、アクティブコンターアルゴリズム[26]が200回の反復で使用されています(選択された反復回数は、糸球体形)。

3番目のマスクは、ラボ色空間のaおよびbコンポーネントから計算されました。 ab行列は、k-meansクラスタリングアルゴリズムへの入力として使用されています[27]。 特に、クラスターの数は経験的に5に設定され、クラスター化プロセスの繰り返しの数は、局所的な最小値を回避するために異なる初期クラスター重心位置を設定するために3に設定されました。 続いて、最大の平均グレースケール強度値を持つクラスターに属するピクセルのみを保持することにより、マスクが計算されました。 次に、グリーンマゼンタのセグメンテーションプロセスのステップ2と3が適用されました。

最後に、3つのマスクを使用して、多数決基準を使用して最終的なマスクを計算しました。少なくとも2つのマスクに属するピクセルのみが保持されました。 得られたテクスチャ分析アルゴリズムが使用されました:ローカルバイナリパターン(LBP)とハラリック機能。

[13]ですでに提案されているように、マルチラジアルカラーLBP(mrcLBP)は、識別の問題に直面するための古典的なLBPの適切なバリエーションです。 詳細には、半径値が異なり(1、3、9、および27)、回転に対して不変性がある3つのRGBカラーチャネルへのLBPアルゴリズムの適用を検討します。 このような構成は、生のRGBに適用されました糸球体画像。 得られた特徴は、半径ごとに10であり、したがって、合計120の特徴(半径ごとに10の特徴、4つの半径、3つのチャネル)が得られました。

テクスチャベースの機能の2番目のセットは、ハラリックの機能に基づいていました。 各方向に1つずつ、4つのグレイレベルの共起行列が計算されました。 次に、14個のハラリックインデックスが計算され、56個の特徴が得られました。 この数を減らすために、4つの方向の間の平均と範囲が計算されました。 したがって、機能の最終的な数は28でした(14の平均と14の範囲、各ハラリック機能に1つ)。 テクスチャ特徴抽出の結果、合計148個の特徴が計算されました。


機能の前処理

上記のように、特徴抽出プロセスは、糸球体の形態学的およびテクスチャベースの特性の両方を考慮した150の特徴を生成しました。 主成分分析(PCA)は、分類ステップの入力として使用されるさまざまな特徴間の相関を減らすための特徴削減アルゴリズムとして適用されました。 PCAの前は、各機能はZスコアで正規化されていました。

前述のように、画像処理と分類アルゴリズムの微調整は、列車セットでのみ実行されています。 代わりに、機能削減アルゴリズムはラベル情報を必要とせず、使用しませんでした。 このため、PCAの適用は、データセット全体またはトレーニングデータセットのみで実行できますが、さまざまな長所と短所があります。 両方のソリューションがデータセットに適用され、分類問題の複雑さのために、分散の99.9パーセントがしきい値として選択されました。 最後に、PCAがデータセット全体とトレインセットのみにそれぞれ適用された場合、95と93の特徴が得られました。 2つのアプローチで同数の特徴が得られたため、データセット内のすべての情報を考慮に入れることを選択しました。したがって、分類フェーズで考慮された特徴の数は95でした。


糸球体分類

糸球体の分類手順は、ANNに基づいており、特に浅いANNアーキテクチャに基づいています。 ANNアーキテクチャの設計とそのパラメータの調整は、トレインセットのみを考慮して行われましたが、報告されたすべての結果とパフォーマンスの説明は、テストセットを参照しています(結果と説明を参照)。 K-fold(kは10に設定)は、一般化し、過剰適合を回避し、特定の入力データセットから独立した分類器を取得するための交差検定手法として使用されました。 特定のネットワーク初期化からの独立性を取得し、全体的なフォールドクラスラベルを計算するために、各フォールドのいくつかのネットワーク初期化とフォールド間のハード投票が使用されました。

固定トレーニングパラメータは次のとおりです。1つの隠れ層、トランジット、およびsoftmaxは、それぞれ隠れ層と出力層の活性化関数として、クロスエントロピーは損失関数として。 バックプロパゲーションアルゴリズムとしてのスケーリングされた共役勾配。 一般化を促進し、過剰適合を回避するために、検証セットに基づくトレーニング早期打ち切り基準が実装されました。 検証セットのパフォーマンスが6エポックのスライディングウィンドウ内で低下しなかった場合、停止基準が発生します。

隠れ層のニューロン数は以下のように選択されています。 95のネットワークのパフォーマンスを比較しました。 詳細には、1から95の範囲の隠れ層サイズを持ついくつかのネットワークがトレーニングされました(95は入力フィーチャの数であることを覚えておく価値があります)。 評価された95のトポロジの中から、フォールドの平均MCCとして計算された最良のMCC値に基づいて、隠れ層のサイズが27に等しいトポロジが選択されました。 MCCと精度指標の傾向をグラフで表したものを図10に示します。 最終的な人工ニューラルネットワークの構成を表6にまとめています。


不均衡なデータセットの問題

上で報告したように、トレーニングセットは、強膜糸球体と非強膜糸球体の間の大きな不均衡な分布の影響を受けました(各強膜に対して5.5の非強膜糸球体)糸球体)。 トレーニングフェーズでの過剰適合を回避するために、選択された機能はメインの画像変換に対して不変であるため、データ拡張は適切なソリューションとは見なされませんでした。 そこで、以下のアプローチを検討しました。

まず、フォールド間の一般的なパフォーマンス比較として、MCCの使用を検討しました。 式で報告されているように。 4、MCCは、誤検知と誤検知を考慮し、予測クラスとターゲットクラス間の相関係数を計算します。 この係数は、区間[-1; 1]内の範囲になります。ここで、1は完全な予測、-1は完全な不一致、0はランダム予測子と同等です。 [28]で述べられているように、通常のパフォーマンススコアの中で、混同行列のサイズの比率を考慮に入れるのはMCCだけであり、不均衡なデータセットの精度やF1スコアよりもパフォーマンスの指標として優れていることが明らかになりました。

正しい分類しきい値の選択に関しては、受信者動作特性(ROC)曲線が使用されています。 2つのアプローチが分析されました。 最初のもの(アプローチA)は、ROC曲線と、負のサンプルと正のサンプルの総数の比率に等しい傾きを持ち、左上隅からスライドする線との間の最初の交点として最適値を想定しています。 ROCプロット((FPR、TPR)=(0、1))。 一方、2番目のアプローチ(アプローチB)[29]は、ROCplotのポイント(0、1)からの最小距離(Eq.5を参照)のポイントを評価します。

異なるパフォーマンス指標(Eq.1、2、3、および4)に関する2つの方法(アプローチAおよびアプローチB)の比較を表7に報告します。ネガティブの予測よりも病気の方が重要であり、より高い想起が好ましいため、アプローチBが選択されました。


参考文献

  1. Neuen BL、Chadban SJ、Demaio AR、Johnson DW、PerkovicV。慢性腎臓病およびグローバルNCDアジェンダ。BMJグローバルヘルス。2017。

  2. Wang H、Naghavi M、Allen C、Barber RM、Carter A、CaseyDCなど。 世界的、地域的、および全国的な平均余命、すべての原因による死亡率、および249の死亡原因の原因別死亡率、1980-2015:グローバル疾病負荷研究2015の体系的分析。ランセット。 2016; 6:66。

  3. Wolfe RA、AshbyVB、Milford EL、Ojo AO、Ettenger RE、AgodoaLYCなど。 透析中のすべての患者、移植を待っている透析中の患者、および最初の死体移植のレシピエントにおける死亡率の比較。 N Engl J Med.2002; 6:66。

  4. Port FK、Wolfe RA、Mauger EA、Berling DP、JiangK.透析患者と死体腎移植レシピエントの生存確率の比較。 J AmMedAssoc。 1993; 6:66。

  5. Liyanage、NinomiyaTJha V、Neal B、Patrice HM、Okpechil、他 Word-5。[治療への幅広いアクセス末期腎疾患:系統的レビュー。 ランセット.2015;666。

  6. CeckaJM.UNOS科学的腎移植登録-10年肝臓移植。 ClinTranspl。 19976:66。

  7. 臓器共有のためのユナイテッドネットワーク。 2004年年次報告書

  8. Perico N、Ruggenenti P、Scalamogna M、RemuzziG.ドナーの不足への取り組み腎臓:私たちが持っている最高のものを使用する方法。AmJNephrol。 2003; 6:66。

  9. Moore PS、Farney AC、Sundberg AK、Rohr MS、Hartmann EL、IskandarSSなど。二重腎移植:ケースコントロール比較と単腎移植標準および拡張基準のドナーから。移植. 2007;6:66.

  10. RemuzziG、GrinyoJ、Ruggenenti P Bertini M、Cole EH、MilfordELなど。 との初期の経験二重腎移植拡張ドナー基準を使用する成人の場合。Double腎臓移植グループ(DKG.JAm SocNephrol。1999;6:66。



あなたはおそらくそれも好きでしょう