Adding cluster error NN evaluation, CSV readout and scaling of error

ChSonnabend · ChSonnabend · commit 3d5b10b7a1d3 · 2026-02-11T08:54:59.000+01:00
diff --git a/Common/ML/include/ML/OrtInterface.h b/Common/ML/include/ML/OrtInterface.h
@@ -91,16 +91,16 @@ class OrtModel
 
   // Inferencing
   template <class I, class O> // class I is the input data type, e.g. float, class O is the output data type, e.g. OrtDataType::Float16_t from O2/Common/ML/include/ML/GPUORTFloat16.h
-  std::vector<O> inference(std::vector<I>&);
+  std::vector<O> inference(std::vector<I>&) const;
 
   template <class I, class O>
-  std::vector<O> inference(std::vector<std::vector<I>>&);
+  std::vector<O> inference(std::vector<std::vector<I>>&) const;
 
   template <class I, class O>
-  void inference(I*, int64_t, O*);
+  void inference(I*, int64_t, O*) const;
 
   template <class I, class O>
-  void inference(I**, int64_t, O*);
+  void inference(I**, int64_t, O*) const;
 
   void release(bool = false);
 
@@ -112,7 +112,8 @@ class OrtModel
   // Input & Output specifications of the loaded network
   std::vector<const char*> mInputNamesChar, mOutputNamesChar;
   std::vector<std::string> mInputNames, mOutputNames;
-  std::vector<std::vector<int64_t>> mInputShapes, mOutputShapes, mInputShapesCopy, mOutputShapesCopy; // Input shapes
+  std::vector<std::vector<int64_t>> mInputShapes, mOutputShapes;
+  mutable std::vector<std::vector<int64_t>> mInputShapesCopy, mOutputShapesCopy; // Input shapes
   std::vector<int64_t> mInputSizePerNode, mOutputSizePerNode;                                         // Output shapes
   int32_t mInputsTotal = 0, mOutputsTotal = 0;                                                        // Total number of inputs and outputs
 
diff --git a/Common/ML/src/OrtInterface.cxx b/Common/ML/src/OrtInterface.cxx
@@ -289,7 +289,7 @@ void OrtModel::setEnv(Ort::Env* env)
 
 // Inference
 template <class I, class O>
-std::vector<O> OrtModel::inference(std::vector<I>& input)
+std::vector<O> OrtModel::inference(std::vector<I>& input) const
 {
   std::vector<int64_t> inputShape = mInputShapes[0];
   inputShape[0] = input.size();
@@ -310,12 +310,12 @@ std::vector<O> OrtModel::inference(std::vector<I>& input)
   return outputValuesVec;
 }
 
-template std::vector<float> o2::ml::OrtModel::inference<float, float>(std::vector<float>&);
-template std::vector<float> o2::ml::OrtModel::inference<OrtDataType::Float16_t, float>(std::vector<OrtDataType::Float16_t>&);
-template std::vector<OrtDataType::Float16_t> o2::ml::OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(std::vector<OrtDataType::Float16_t>&);
+template std::vector<float> o2::ml::OrtModel::inference<float, float>(std::vector<float>&) const;
+template std::vector<float> o2::ml::OrtModel::inference<OrtDataType::Float16_t, float>(std::vector<OrtDataType::Float16_t>&) const;
+template std::vector<OrtDataType::Float16_t> o2::ml::OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(std::vector<OrtDataType::Float16_t>&) const;
 
 template <class I, class O>
-void OrtModel::inference(I* input, int64_t input_size, O* output)
+void OrtModel::inference(I* input, int64_t input_size, O* output) const
 {
   // std::vector<std::string> providers = Ort::GetAvailableProviders();
   // for (const auto& provider : providers) {
@@ -350,13 +350,13 @@ void OrtModel::inference(I* input, int64_t input_size, O* output)
   //   mOutputNamesChar.size());
 }
 
-template void OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(OrtDataType::Float16_t*, int64_t, OrtDataType::Float16_t*);
-template void OrtModel::inference<OrtDataType::Float16_t, float>(OrtDataType::Float16_t*, int64_t, float*);
-template void OrtModel::inference<float, OrtDataType::Float16_t>(float*, int64_t, OrtDataType::Float16_t*);
-template void OrtModel::inference<float, float>(float*, int64_t, float*);
+template void OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(OrtDataType::Float16_t*, int64_t, OrtDataType::Float16_t*) const;
+template void OrtModel::inference<OrtDataType::Float16_t, float>(OrtDataType::Float16_t*, int64_t, float*) const;
+template void OrtModel::inference<float, OrtDataType::Float16_t>(float*, int64_t, OrtDataType::Float16_t*) const;
+template void OrtModel::inference<float, float>(float*, int64_t, float*) const;
 
 template <class I, class O>
-void OrtModel::inference(I** input, int64_t input_size, O* output)
+void OrtModel::inference(I** input, int64_t input_size, O* output) const
 {
   std::vector<Ort::Value> inputTensors(mInputShapesCopy.size());
 
@@ -410,13 +410,13 @@ void OrtModel::inference(I** input, int64_t input_size, O* output)
     mOutputNamesChar.size());
 }
 
-template void OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(OrtDataType::Float16_t**, int64_t, OrtDataType::Float16_t*);
-template void OrtModel::inference<OrtDataType::Float16_t, float>(OrtDataType::Float16_t**, int64_t, float*);
-template void OrtModel::inference<float, OrtDataType::Float16_t>(float**, int64_t, OrtDataType::Float16_t*);
-template void OrtModel::inference<float, float>(float**, int64_t, float*);
+template void OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(OrtDataType::Float16_t**, int64_t, OrtDataType::Float16_t*) const;
+template void OrtModel::inference<OrtDataType::Float16_t, float>(OrtDataType::Float16_t**, int64_t, float*) const;
+template void OrtModel::inference<float, OrtDataType::Float16_t>(float**, int64_t, OrtDataType::Float16_t*) const;
+template void OrtModel::inference<float, float>(float**, int64_t, float*) const;
 
 template <class I, class O>
-std::vector<O> OrtModel::inference(std::vector<std::vector<I>>& inputs)
+std::vector<O> OrtModel::inference(std::vector<std::vector<I>>& inputs) const
 {
   std::vector<Ort::Value> input_tensors;
 
@@ -461,8 +461,8 @@ std::vector<O> OrtModel::inference(std::vector<std::vector<I>>& inputs)
   return output_vec;
 }
 
-template std::vector<float> OrtModel::inference<float, float>(std::vector<std::vector<float>>&);
-template std::vector<OrtDataType::Float16_t> OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(std::vector<std::vector<OrtDataType::Float16_t>>&);
+template std::vector<float> OrtModel::inference<float, float>(std::vector<std::vector<float>>&) const;
+template std::vector<OrtDataType::Float16_t> OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(std::vector<std::vector<OrtDataType::Float16_t>>&) const;
 
 // Release session
 void OrtModel::release(bool profilingEnabled)
diff --git a/GPU/GPUTracking/Base/GPUParam.cxx b/GPU/GPUTracking/Base/GPUParam.cxx
@@ -125,6 +125,7 @@ void GPUParam::UpdateSettings(const GPUSettingsGRP* g, const GPUSettingsProcessi
   qptB5Scaler = CAMath::Abs(bzkG) > 0.1f ? CAMath::Abs(bzkG) / 5.006680f : 1.f; // Repeat here, since passing in g is optional
   if (p) {
     UpdateRun3ClusterErrors(p->param.tpcErrorParamY, p->param.tpcErrorParamZ);
+    initClusterErrorModel(p->nn);
   }
   if (w) {
     par.dodEdx = dodEdxEnabled = w->steps.isSet(gpudatatypes::RecoStep::TPCdEdx);
diff --git a/GPU/GPUTracking/Base/GPUParam.h b/GPU/GPUTracking/Base/GPUParam.h
@@ -21,6 +21,8 @@
 #include "GPUSettings.h"
 #include "GPUTPCGMPolynomialField.h"
 
+#include "ML/OrtInterface.h"
+
 #if !defined(GPUCA_GPUCODE)
 namespace o2::base
 {
@@ -67,6 +69,11 @@ struct GPUParam_t {
 
   GPUParamSector SectorParam[GPUCA_NSECTORS];
 
+  std::unique_ptr<o2::ml::OrtModel> mModelClusterErrors; // For cluster error estimation
+  bool useClusterErrorNetwork = false; // Whether to use the cluster error network at all, can be set to false to save time if not needed
+  bool dumpClusterErrorCSV = false;
+  float scaleError = 1.f;
+
  protected:
 #ifdef GPUCA_TPC_GEOMETRY_O2
   float ParamErrors[2][4][4]; // cluster error parameterization used during seeding and fit
@@ -87,6 +94,46 @@ struct GPUParam : public internal::GPUParam_t<GPUSettingsRec, GPUSettingsParam>
   void UpdateRun3ClusterErrors(const float* yErrorParam, const float* zErrorParam);
 #endif
 
+  void initClusterErrorModel(const GPUSettingsProcessingNNclusterizer& p) {
+    useClusterErrorNetwork = p.nnUseClusterErrorNetwork;
+    dumpClusterErrorCSV = p.dumpClusterErrorCSV;
+    scaleError = p.nnScaleClusterError;
+    if (useClusterErrorNetwork && !p.nnClusterErrorModelPath.empty()) {
+      mModelClusterErrors = std::make_unique<o2::ml::OrtModel>();
+      LOG(info) << "Loading cluster error network from " << p.nnClusterErrorModelPath;
+      // LOG(info) << "use=" << p.nnUseClusterErrorNetwork
+      //     << " model=" << p.nnClusterErrorModelPath
+      //     << " dev=" << p.nnInferenceDevice
+      //     << " allocDevMem=" << p.nnInferenceAllocateDevMem
+      //     << " intra=" << p.nnInferenceIntraOpNumThreads
+      //     << " inter=" << p.nnInferenceInterOpNumThreads
+      //     << " opt=" << p.nnInferenceEnableOrtOptimization
+      //     << " det=" << p.nnInferenceUseDeterministicCompute
+      //     << " prof=" << p.nnInferenceOrtProfiling
+      //     << " verb=" << p.nnInferenceVerbosity;
+      std::unordered_map<std::string, std::string> mOrtOptions = {
+        {"model-path", p.nnClusterErrorModelPath},
+        {"device-type", p.nnInferenceDevice},
+        {"allocate-device-memory", std::to_string(p.nnInferenceAllocateDevMem)},
+        {"intra-op-num-threads", "1"},
+        {"inter-op-num-threads", "1"},
+        {"enable-optimizations", std::to_string(p.nnInferenceEnableOrtOptimization)},
+        {"deterministic-compute", std::to_string(p.nnInferenceUseDeterministicCompute)}, // TODO: This unfortunately doesn't guarantee determinism (25.07.2025)
+        {"enable-profiling", std::to_string(p.nnInferenceOrtProfiling)},
+        {"profiling-output-path", p.nnInferenceOrtProfilingPath},
+        {"logging-level", std::to_string(p.nnInferenceVerbosity)},
+        {"onnx-environment-name", "cluster_error"}
+      };
+      // LOG(info) << "NN cluster error options done!";
+      mModelClusterErrors->initOptions(mOrtOptions);
+      // LOG(info) << "NN cluster error options loaded!";
+      mModelClusterErrors->initEnvironment();
+      // LOG(info) << "NN cluster error environment initialized!";
+      mModelClusterErrors->initSession();
+      // LOG(info) << "NN cluster error session initialized!";
+    }
+  }
+
   GPUd() float Alpha(int32_t iSector) const
   {
     if (iSector >= GPUCA_NSECTORS / 2) {
diff --git a/GPU/GPUTracking/Base/GPUReconstruction.cxx b/GPU/GPUTracking/Base/GPUReconstruction.cxx
@@ -1278,6 +1278,7 @@ void GPUReconstruction::SetSettings(const GPUSettingsGRP* grp, const GPUSettings
     mRecoSteps.outputs = workflow->outputs;
   }
   param().SetDefaults(mGRPSettings.get(), rec, proc, workflow);
+  // param().initClusterErrorModel(proc->nn);
 }
 
 void GPUReconstruction::SetOutputControl(void* ptr, size_t size)
diff --git a/GPU/GPUTracking/Definitions/GPUSettingsList.h b/GPU/GPUTracking/Definitions/GPUSettingsList.h
@@ -283,6 +283,10 @@ AddOption(nnSigmoidTrafoClassThreshold, int, 1, "", 0, "If true (default), then
 AddOption(nnEvalMode, std::string, "c1:r1", "", 0, "Concatention of modes, e.g. c1:r1 (classification class 1, regression class 1)")
 AddOption(nnClusterizerUseClassification, int, 1, "", 0, "If 1, the classification output of the network is used to select clusters, else only the regression output is used and no clusters are rejected by classification")
 AddOption(nnClusterizerForceGpuInputFill, int, 0, "", 0, "Forces to use the fillInputNNGPU function")
+AddOption(nnUseClusterErrorNetwork, int, 1, "", 0, "If 1, the cluster error network is used to parametrize the cluster errors, else a fixed parametrization is used")
+AddOption(nnClusterErrorModelPath, std::string, "", "", 0, "Network for cluster error parameterization")
+AddOption(dumpClusterErrorCSV, int, 0, "", 0, "Dumps the cluster errors to CSV if enabled")
+AddOption(nnScaleClusterError, float, 1.0, "", 0, "Scale factor for the cluster errors predicted by the network, can be used to effectively increase or decrease the cluster errors without retraining the network")
 // CCDB
 AddOption(nnLoadFromCCDB, int, 0, "", 0, "If 1 networks are fetched from ccdb, else locally")
 AddOption(nnCCDBDumpToFile, int, 0, "", 0, "If 1, additionally dump fetched CCDB networks to nnLocalFolder")
diff --git a/GPU/GPUTracking/Global/GPUChainTracking.cxx b/GPU/GPUTracking/Global/GPUChainTracking.cxx
@@ -78,8 +78,8 @@ void GPUChainTracking::RegisterPermanentMemoryAndProcessors()
 {
   fpdumperr = fopen("dump_cluster_error.csv", "a");
   fpdumptrk = fopen("dump_trk_index.csv", "a");
-  fprintf(fpdumperr, "internal_trkid,cluster.num,err2Y,err2Z,clusterState,clusterY,clusterZ,mP[0],mP[1],mP[2],mP[3],mP[4],mC[0],mC[2],mC[5],mC[9],mC[14]\n");
-  fprintf(fpdumptrk, "internal_trkid,trkid\n");
+  // fprintf(fpdumperr, "internal_trkid,cluster.num,err2Y,err2Z,clusterState,cluster.getSigmaPad(),cluster.getSigmaTime(),invAvgCharge,invCharge,xx,yy,zz,mP[0],mP[1],mP[2],mP[3],mP[4],mC[0],mC[2],mC[5],mC[9],mC[14]\n");
+  // fprintf(fpdumptrk, "internal_trkid,trkid\n");
   if (mRec->IsGPU()) {
     mFlatObjectsShadow.InitGPUProcessor(mRec, GPUProcessor::PROCESSOR_TYPE_SLAVE);
     mFlatObjectsDevice.InitGPUProcessor(mRec, GPUProcessor::PROCESSOR_TYPE_DEVICE, &mFlatObjectsShadow);
diff --git a/GPU/GPUTracking/Merger/GPUTPCGMO2Output.cxx b/GPU/GPUTracking/Merger/GPUTPCGMO2Output.cxx
@@ -272,7 +272,9 @@ GPUdii() void GPUTPCGMO2Output::Thread<GPUTPCGMO2Output::output>(int32_t nBlocks
       oTrack.setHasASideClusters();
     }
 #ifndef GPUCA_GPUCODE
-    fprintf(fpdumptrk, "%d,%d\n", i, iTmp);
+    if (merger.Param().dumpClusterErrorCSV) {
+      fprintf(fpdumptrk, "%d,%d\n", i, iTmp);
+    }
 #endif
     outputTracks[iTmp] = oTrack;
   }
diff --git a/GPU/GPUTracking/Merger/GPUTPCGMTrackParam.cxx b/GPU/GPUTracking/Merger/GPUTPCGMTrackParam.cxx
@@ -279,10 +279,47 @@ GPUd() bool GPUTPCGMTrackParam::Fit(GPUTPCGMMerger* GPUrestrict() merger, int32_
         const float invCharge = merger->GetConstantMem()->ioPtrs.clustersNative ? (1.f / merger->GetConstantMem()->ioPtrs.clustersNative->clustersLinear[cluster.num].qMax) : 0.f;
         float invAvgCharge = (sumInvSqrtCharge += invSqrtCharge) / ++nAvgCharge;
         invAvgCharge *= invAvgCharge;
-        prop.GetErr2(err2Y, err2Z, param, zz, cluster.row, clusterState, cluster.sector, time, invAvgCharge, invCharge);
+        if (param.useClusterErrorNetwork) {
+          // Python expands clusterState into 4 bits (cs0..cs3) and drops clusterState.
+          // Final X dimension: 17 features.
+          float inputFeatures[17];
+          float outputFeatures[2];
+
+          inputFeatures[0]  = xx;
+          inputFeatures[1]  = yy;
+          inputFeatures[2]  = zz;
+
+          inputFeatures[3]  = static_cast<float>(merger->GetConstantMem()->ioPtrs.clustersNative->clustersLinear[cluster.num].getSigmaPad());
+          inputFeatures[4]  = static_cast<float>(merger->GetConstantMem()->ioPtrs.clustersNative->clustersLinear[cluster.num].getSigmaTime());
+
+          inputFeatures[5]  = mP[0];
+          inputFeatures[6]  = mP[1];
+          inputFeatures[7]  = mP[2];
+          inputFeatures[8] = mP[3];
+          inputFeatures[9] = mP[4];
+
+          inputFeatures[10] = mC[0];
+          inputFeatures[11] = mC[2];
+          inputFeatures[12] = mC[5];
+          inputFeatures[13] = mC[9];
+          inputFeatures[14] = mC[14];
+
+          inputFeatures[15] = static_cast<float>((clusterState >> 0) & 1);  // cs0
+          inputFeatures[16] = static_cast<float>((clusterState >> 1) & 1);  // cs1
+          inputFeatures[17] = static_cast<float>((clusterState >> 2) & 1);  // cs2
+          inputFeatures[18] = static_cast<float>((clusterState >> 3) & 1);  // cs3
+
+          param.mModelClusterErrors->inference(inputFeatures, (int64_t)1, outputFeatures);
+          err2Y = param.scaleError*outputFeatures[0];
+          err2Z = param.scaleError*outputFeatures[1];
+        } else {
+          prop.GetErr2(err2Y, err2Z, param, zz, cluster.row, clusterState, cluster.sector, time, invAvgCharge, invCharge);
+        }
 
 #ifndef GPUCA_GPUCODE
-        fprintf(fpdumperr, "%d,%d,%f,%f,%d,%f,%f,%f,%f,%f,%f,%f,%f,%f,%f,%f,%f\n", iTrk, cluster.num, err2Y, err2Z, clusterState, yy, zz, mP[0], mP[1], mP[2], mP[3], mP[4], mC[0], mC[2], mC[5], mC[9], mC[14]);
+        if (param.dumpClusterErrorCSV) {
+          fprintf(fpdumperr, "%d,%d,%f,%f,%d,%f,%f,%f,%f,%f,%f,%f,%f,%f,%f,%f,%f,%f,%f,%f,%f,%f\n", iTrk, cluster.num, err2Y, err2Z, clusterState, merger->GetConstantMem()->ioPtrs.clustersNative->clustersLinear[cluster.num].getSigmaPad(), merger->GetConstantMem()->ioPtrs.clustersNative->clustersLinear[cluster.num].getSigmaTime(), invAvgCharge, invCharge, xx, yy, zz, mP[0], mP[1], mP[2], mP[3], mP[4], mC[0], mC[2], mC[5], mC[9], mC[14]);
+        }
 #endif
 
         if (rejectChi2 >= GPUTPCGMPropagator::rejectInterFill) {
diff --git a/nn_cluster_error.diff b/nn_cluster_error.diff
@@ -0,0 +1,41 @@
+diff --git a/GPU/GPUTracking/Base/GPUParam.cxx b/GPU/GPUTracking/Base/GPUParam.cxx
+index aa4c3c7671..3963eeced7 100644
+--- a/GPU/GPUTracking/Base/GPUParam.cxx
++++ b/GPU/GPUTracking/Base/GPUParam.cxx
+@@ -157,6 +157,7 @@ void GPUParam::SetDefaults(const GPUSettingsGRP* g, const GPUSettingsRec* r, con
+     rec = *r;
+   }
+   UpdateSettings(g, p, w);
++  initClusterErrorModel(p->nn);
+ }
+
+ void GPUParam::UpdateRun3ClusterErrors(const float* yErrorParam, const float* zErrorParam)
+diff --git a/GPU/GPUTracking/Base/GPUParam.h b/GPU/GPUTracking/Base/GPUParam.h
+index 1b46dc4c9c..9c31093b60 100644
+--- a/GPU/GPUTracking/Base/GPUParam.h
++++ b/GPU/GPUTracking/Base/GPUParam.h
+@@ -93,9 +93,9 @@ struct GPUParam : public internal::GPUParam_t<GPUSettingsRec, GPUSettingsParam>
+   void UpdateRun3ClusterErrors(const float* yErrorParam, const float* zErrorParam);
+ #endif
+
+-  void initClusterErrorModel(const GPUSettingsProcessing* p) {
+-    useClusterErrorNetwork = p->nn.nnUseClusterErrorNetwork;
+-    mOrtOptions["model_path"] = p->nn.nnClusterErrorModelPath;
++  void initClusterErrorModel(const GPUSettingsProcessingNNclusterizer& p) {
++    useClusterErrorNetwork = p.nnUseClusterErrorNetwork;
++    mOrtOptions["model_path"] = p.nnClusterErrorModelPath;
+     mModelClusterErrors.initOptions(mOrtOptions);
+     mModelClusterErrors.setIntraOpNumThreads(1);
+     mModelClusterErrors.initEnvironment();
+diff --git a/GPU/GPUTracking/Base/GPUReconstruction.cxx b/GPU/GPUTracking/Base/GPUReconstruction.cxx
+index fbbe815f63..c32f574ef1 100644
+--- a/GPU/GPUTracking/Base/GPUReconstruction.cxx
++++ b/GPU/GPUTracking/Base/GPUReconstruction.cxx
+@@ -1278,6 +1278,7 @@ void GPUReconstruction::SetSettings(const GPUSettingsGRP* grp, const GPUSettings
+     mRecoSteps.outputs = workflow->outputs;
+   }
+   param().SetDefaults(mGRPSettings.get(), rec, proc, workflow);
++  // param().initClusterErrorModel(proc->nn);
+ }
+
+ void GPUReconstruction::SetOutputControl(void* ptr, size_t size)

Original file line number	Diff line number	Diff line change
`@@ -125,6 +125,7 @@ void GPUParam::UpdateSettings(const GPUSettingsGRP* g, const GPUSettingsProcessi`
`125`	`125`	`qptB5Scaler = CAMath::Abs(bzkG) > 0.1f ? CAMath::Abs(bzkG) / 5.006680f : 1.f; // Repeat here, since passing in g is optional`
`126`	`126`	`if (p) {`
`127`	`127`	`UpdateRun3ClusterErrors(p->param.tpcErrorParamY, p->param.tpcErrorParamZ);`
	`128`	`+ initClusterErrorModel(p->nn);`
`128`	`129`	`}`
`129`	`130`	`if (w) {`
`130`	`131`	`par.dodEdx = dodEdxEnabled = w->steps.isSet(gpudatatypes::RecoStep::TPCdEdx);`
Original file line number	Diff line number	Diff line change
`@@ -1278,6 +1278,7 @@ void GPUReconstruction::SetSettings(const GPUSettingsGRP* grp, const GPUSettings`
`1278`	`1278`	`mRecoSteps.outputs = workflow->outputs;`
`1279`	`1279`	`}`
`1280`	`1280`	`param().SetDefaults(mGRPSettings.get(), rec, proc, workflow);`
	`1281`	`+ // param().initClusterErrorModel(proc->nn);`
`1281`	`1282`	`}`
`1282`	`1283`
`1283`	`1284`	`void GPUReconstruction::SetOutputControl(void* ptr, size_t size)`
Original file line number	Diff line number	Diff line change
`@@ -272,7 +272,9 @@ GPUdii() void GPUTPCGMO2Output::Thread<GPUTPCGMO2Output::output>(int32_t nBlocks`
`272`	`272`	`oTrack.setHasASideClusters();`
`273`	`273`	`}`
`274`	`274`	`#ifndef GPUCA_GPUCODE`
`275`		`- fprintf(fpdumptrk, "%d,%d\n", i, iTmp);`
	`275`	`+ if (merger.Param().dumpClusterErrorCSV) {`
	`276`	`+ fprintf(fpdumptrk, "%d,%d\n", i, iTmp);`
	`277`	`+ }`
`276`	`278`	`#endif`
`277`	`279`	`outputTracks[iTmp] = oTrack;`
`278`	`280`	`}`