# 批次&分析顺序矫正 (Batch & Run-Order Correction)

链接: https://npyc-toolbox.readthedocs.io/en/latest/batchAndROCorrection.html#module-nPYc.batchAndROCorrection

[`batchAndROCorrection`](https://npyc-toolbox.readthedocs.io/en/latest/batchAndROCorrection.html#module-nPYc.batchAndROCorrection)模型,通过描述参考样本(referenece sample)以及对中间样品(intermediate samples)的内插矫正参数(correction effector),为数据集每一部分信号的分析顺序及批次效应的检测和矫正。

![Samples with run-order and batch correction applied](https://npyc-toolbox.readthedocs.io/en/latest/_images/plotBatchAndROCorrection.svg)

图2. 样本前和后运行顺序和批修正,加上适用于数据集

nPYc.batchAndROCorrection.correctMSdataset(*data*, window=11, method='LOWESS', align='median', parallelise=True, excludeFailures=True)

对`MSDataset`实例数据执行运行顺序校正和批对齐,返回一个新的实例,其强度值已被纠正。

样例被分离成批次,对应于data.sampleMetadata中的“纠正批处理(Correction Batch) ”列

参数(Parameters)

- data (*MSDataset*)-项目MSDataset含有需要矫正的测量值

- window(*int*)-在计算趋势时,使用一个考虑这许多参考样本(referenece sample),集中在当前位置

- method(*str*)-矫正方法,其中一个是‘LOWESS'(默认), ‘SavitzkyGolay' 或者'None'不作任何矫正

- align(*str*)-校正的批处理和特征强度的平均计算,其中一个为“中位数”(默认值)或“平均值”

- parallelise (*bool*)-如果`True`,使用多核

- excludeFailures (*bool*)-如果`True`,删除无法从数据集中计算出正确匹配度的特性

返回 (Returns)

重复的数据,与运行顺序校正应用。`MSDataset`