Sequence recovery rate(配列回復率)とは

タンパク質バックボーンから配列を生成する際のSequence recovery rate(配列回復率)は、生成された配列が元のターゲット配列とどれだけ一致しているかを示す指標です。これは、予測された配列と実際の配列の間で、どれだけ正確にアミノ酸が予測されたかを測定するために使用されます。

Sequence recovery rateは、次のように計算されます。

  1. 生成された配列と実際のターゲット配列を比較します。
  2. それぞれの位置で、予測されたアミノ酸が正確である場合にカウントします。
  3. 正確に予測されたアミノ酸の数を、配列の全長で割ります。

この計算により、0から1の範囲の値が得られ、1に近いほど生成された配列が実際のターゲット配列に正確に一致していることを示します。逆に、0に近い値は、生成された配列が実際のターゲット配列とほとんど一致していないことを示します。

Sequence recovery rateは、機械学習モデルの性能を評価するための重要な指標であり、特にタンパク質の構造予測や配列生成タスクにおいて役立ちます。配列回復率が高いほど、生成された配列が実際のターゲット配列に近いことが示され、モデルがタンパク質バックボーンから正確な配列を生成できることが示唆されます。

コメント