Updating OrtInterface with const inference implementing cluster error parametrization by NN

ChSonnabend · ChSonnabend · commit 4944e5ff766e · 2026-02-06T13:40:50.000+01:00
diff --git a/Common/ML/include/ML/OrtInterface.h b/Common/ML/include/ML/OrtInterface.h
@@ -91,16 +91,16 @@ class OrtModel
 
   // Inferencing
   template <class I, class O> // class I is the input data type, e.g. float, class O is the output data type, e.g. OrtDataType::Float16_t from O2/Common/ML/include/ML/GPUORTFloat16.h
-  std::vector<O> inference(std::vector<I>&);
+  std::vector<O> inference(std::vector<I>&) const;
 
   template <class I, class O>
-  std::vector<O> inference(std::vector<std::vector<I>>&);
+  std::vector<O> inference(std::vector<std::vector<I>>&) const;
 
   template <class I, class O>
-  void inference(I*, int64_t, O*);
+  void inference(I*, int64_t, O*) const;
 
   template <class I, class O>
-  void inference(I**, int64_t, O*);
+  void inference(I**, int64_t, O*) const;
 
   void release(bool = false);
 
@@ -112,7 +112,8 @@ class OrtModel
   // Input & Output specifications of the loaded network
   std::vector<const char*> mInputNamesChar, mOutputNamesChar;
   std::vector<std::string> mInputNames, mOutputNames;
-  std::vector<std::vector<int64_t>> mInputShapes, mOutputShapes, mInputShapesCopy, mOutputShapesCopy; // Input shapes
+  std::vector<std::vector<int64_t>> mInputShapes, mOutputShapes;
+  mutable std::vector<std::vector<int64_t>> mInputShapesCopy, mOutputShapesCopy; // Input shapes
   std::vector<int64_t> mInputSizePerNode, mOutputSizePerNode;                                         // Output shapes
   int32_t mInputsTotal = 0, mOutputsTotal = 0;                                                        // Total number of inputs and outputs
 
diff --git a/Common/ML/src/OrtInterface.cxx b/Common/ML/src/OrtInterface.cxx
@@ -289,7 +289,7 @@ void OrtModel::setEnv(Ort::Env* env)
 
 // Inference
 template <class I, class O>
-std::vector<O> OrtModel::inference(std::vector<I>& input)
+std::vector<O> OrtModel::inference(std::vector<I>& input) const
 {
   std::vector<int64_t> inputShape = mInputShapes[0];
   inputShape[0] = input.size();
@@ -310,12 +310,12 @@ std::vector<O> OrtModel::inference(std::vector<I>& input)
   return outputValuesVec;
 }
 
-template std::vector<float> o2::ml::OrtModel::inference<float, float>(std::vector<float>&);
-template std::vector<float> o2::ml::OrtModel::inference<OrtDataType::Float16_t, float>(std::vector<OrtDataType::Float16_t>&);
-template std::vector<OrtDataType::Float16_t> o2::ml::OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(std::vector<OrtDataType::Float16_t>&);
+template std::vector<float> o2::ml::OrtModel::inference<float, float>(std::vector<float>&) const;
+template std::vector<float> o2::ml::OrtModel::inference<OrtDataType::Float16_t, float>(std::vector<OrtDataType::Float16_t>&) const;
+template std::vector<OrtDataType::Float16_t> o2::ml::OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(std::vector<OrtDataType::Float16_t>&) const;
 
 template <class I, class O>
-void OrtModel::inference(I* input, int64_t input_size, O* output)
+void OrtModel::inference(I* input, int64_t input_size, O* output) const
 {
   // std::vector<std::string> providers = Ort::GetAvailableProviders();
   // for (const auto& provider : providers) {
@@ -350,13 +350,13 @@ void OrtModel::inference(I* input, int64_t input_size, O* output)
   //   mOutputNamesChar.size());
 }
 
-template void OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(OrtDataType::Float16_t*, int64_t, OrtDataType::Float16_t*);
-template void OrtModel::inference<OrtDataType::Float16_t, float>(OrtDataType::Float16_t*, int64_t, float*);
-template void OrtModel::inference<float, OrtDataType::Float16_t>(float*, int64_t, OrtDataType::Float16_t*);
-template void OrtModel::inference<float, float>(float*, int64_t, float*);
+template void OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(OrtDataType::Float16_t*, int64_t, OrtDataType::Float16_t*) const;
+template void OrtModel::inference<OrtDataType::Float16_t, float>(OrtDataType::Float16_t*, int64_t, float*) const;
+template void OrtModel::inference<float, OrtDataType::Float16_t>(float*, int64_t, OrtDataType::Float16_t*) const;
+template void OrtModel::inference<float, float>(float*, int64_t, float*) const;
 
 template <class I, class O>
-void OrtModel::inference(I** input, int64_t input_size, O* output)
+void OrtModel::inference(I** input, int64_t input_size, O* output) const
 {
   std::vector<Ort::Value> inputTensors(mInputShapesCopy.size());
 
@@ -410,13 +410,13 @@ void OrtModel::inference(I** input, int64_t input_size, O* output)
     mOutputNamesChar.size());
 }
 
-template void OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(OrtDataType::Float16_t**, int64_t, OrtDataType::Float16_t*);
-template void OrtModel::inference<OrtDataType::Float16_t, float>(OrtDataType::Float16_t**, int64_t, float*);
-template void OrtModel::inference<float, OrtDataType::Float16_t>(float**, int64_t, OrtDataType::Float16_t*);
-template void OrtModel::inference<float, float>(float**, int64_t, float*);
+template void OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(OrtDataType::Float16_t**, int64_t, OrtDataType::Float16_t*) const;
+template void OrtModel::inference<OrtDataType::Float16_t, float>(OrtDataType::Float16_t**, int64_t, float*) const;
+template void OrtModel::inference<float, OrtDataType::Float16_t>(float**, int64_t, OrtDataType::Float16_t*) const;
+template void OrtModel::inference<float, float>(float**, int64_t, float*) const;
 
 template <class I, class O>
-std::vector<O> OrtModel::inference(std::vector<std::vector<I>>& inputs)
+std::vector<O> OrtModel::inference(std::vector<std::vector<I>>& inputs) const
 {
   std::vector<Ort::Value> input_tensors;
 
@@ -461,8 +461,8 @@ std::vector<O> OrtModel::inference(std::vector<std::vector<I>>& inputs)
   return output_vec;
 }
 
-template std::vector<float> OrtModel::inference<float, float>(std::vector<std::vector<float>>&);
-template std::vector<OrtDataType::Float16_t> OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(std::vector<std::vector<OrtDataType::Float16_t>>&);
+template std::vector<float> OrtModel::inference<float, float>(std::vector<std::vector<float>>&) const;
+template std::vector<OrtDataType::Float16_t> OrtModel::inference<OrtDataType::Float16_t, OrtDataType::Float16_t>(std::vector<std::vector<OrtDataType::Float16_t>>&) const;
 
 // Release session
 void OrtModel::release(bool profilingEnabled)
diff --git a/GPU/GPUTracking/Base/GPUParam.h b/GPU/GPUTracking/Base/GPUParam.h
@@ -21,6 +21,8 @@
 #include "GPUSettings.h"
 #include "GPUTPCGMPolynomialField.h"
 
+#include "ML/OrtInterface.h"
+
 #if !defined(GPUCA_GPUCODE)
 namespace o2::base
 {
@@ -67,6 +69,10 @@ struct GPUParam_t {
 
   GPUParamSector SectorParam[GPUCA_NSECTORS];
 
+  std::unordered_map<std::string, std::string> mOrtOptions;
+  o2::ml::OrtModel mModelClusterErrors; // For cluster error estimation
+  bool useClusterErrorNetwork = false; // Whether to use the cluster error network at all, can be set to false to save time if not needed
+
  protected:
 #ifdef GPUCA_TPC_GEOMETRY_O2
   float ParamErrors[2][4][4]; // cluster error parameterization used during seeding and fit
@@ -87,6 +93,15 @@ struct GPUParam : public internal::GPUParam_t<GPUSettingsRec, GPUSettingsParam>
   void UpdateRun3ClusterErrors(const float* yErrorParam, const float* zErrorParam);
 #endif
 
+  void initClusterErrorModel(const GPUSettingsProcessing* p) {
+    useClusterErrorNetwork = p->nn.nnUseClusterErrorNetwork;
+    mOrtOptions["model_path"] = p->nn.nnClusterErrorModelPath;
+    mModelClusterErrors.initOptions(mOrtOptions);
+    mModelClusterErrors.setIntraOpNumThreads(1);
+    mModelClusterErrors.initEnvironment();
+    mModelClusterErrors.initSession();
+  }
+
   GPUd() float Alpha(int32_t iSector) const
   {
     if (iSector >= GPUCA_NSECTORS / 2) {
diff --git a/GPU/GPUTracking/Definitions/GPUSettingsList.h b/GPU/GPUTracking/Definitions/GPUSettingsList.h
@@ -283,6 +283,8 @@ AddOption(nnSigmoidTrafoClassThreshold, int, 1, "", 0, "If true (default), then
 AddOption(nnEvalMode, std::string, "c1:r1", "", 0, "Concatention of modes, e.g. c1:r1 (classification class 1, regression class 1)")
 AddOption(nnClusterizerUseClassification, int, 1, "", 0, "If 1, the classification output of the network is used to select clusters, else only the regression output is used and no clusters are rejected by classification")
 AddOption(nnClusterizerForceGpuInputFill, int, 0, "", 0, "Forces to use the fillInputNNGPU function")
+AddOption(nnUseClusterErrorNetwork, int, 1, "", 0, "If 1, the cluster error network is used to parametrize the cluster errors, else a fixed parametrization is used")
+AddOption(nnClusterErrorModelPath, std::string, "network_cluster_error.onnx", "", 0, "Network for cluster error parameterization")
 // CCDB
 AddOption(nnLoadFromCCDB, int, 0, "", 0, "If 1 networks are fetched from ccdb, else locally")
 AddOption(nnCCDBDumpToFile, int, 0, "", 0, "If 1, additionally dump fetched CCDB networks to nnLocalFolder")
diff --git a/GPU/GPUTracking/Global/GPUChainTracking.cxx b/GPU/GPUTracking/Global/GPUChainTracking.cxx
@@ -78,7 +78,7 @@ void GPUChainTracking::RegisterPermanentMemoryAndProcessors()
 {
   fpdumperr = fopen("dump_cluster_error.csv", "a");
   fpdumptrk = fopen("dump_trk_index.csv", "a");
-  fprintf(fpdumperr, "internal_trkid,cluster.num,err2Y,err2Z,clusterState,clusterY,clusterZ,mP[0],mP[1],mP[2],mP[3],mP[4],mC[0],mC[2],mC[5],mC[9],mC[14]\n");
+  fprintf(fpdumperr, "internal_trkid,cluster.num,err2Y,err2Z,clusterState,xx,yy,zz,mP[0],mP[1],mP[2],mP[3],mP[4],mC[0],mC[2],mC[5],mC[9],mC[14]\n");
   fprintf(fpdumptrk, "internal_trkid,trkid\n");
   if (mRec->IsGPU()) {
     mFlatObjectsShadow.InitGPUProcessor(mRec, GPUProcessor::PROCESSOR_TYPE_SLAVE);
diff --git a/GPU/GPUTracking/Merger/GPUTPCGMTrackParam.cxx b/GPU/GPUTracking/Merger/GPUTPCGMTrackParam.cxx
@@ -279,10 +279,30 @@ GPUd() bool GPUTPCGMTrackParam::Fit(GPUTPCGMMerger* GPUrestrict() merger, int32_
         const float invCharge = merger->GetConstantMem()->ioPtrs.clustersNative ? (1.f / merger->GetConstantMem()->ioPtrs.clustersNative->clustersLinear[cluster.num].qMax) : 0.f;
         float invAvgCharge = (sumInvSqrtCharge += invSqrtCharge) / ++nAvgCharge;
         invAvgCharge *= invAvgCharge;
-        prop.GetErr2(err2Y, err2Z, param, zz, cluster.row, clusterState, cluster.sector, time, invAvgCharge, invCharge);
+        if(param.useClusterErrorNetwork){
+          float inputFeatures[12];
+          float outputFeatures[2];
+          inputFeatures[0] = static_cast<float>(clusterState);
+          inputFeatures[1] = xx;
+          inputFeatures[2] = yy;
+          inputFeatures[3] = zz;
+          inputFeatures[4] = mP[2];
+          inputFeatures[5] = mP[3];
+          inputFeatures[6] = mP[4];
+          inputFeatures[7] = mC[0];
+          inputFeatures[8] = mC[2];
+          inputFeatures[9] = mC[5];
+          inputFeatures[10] = mC[9];
+          inputFeatures[11] = mC[14];
+          param.mModelClusterErrors.inference(inputFeatures, (int64_t)1, outputFeatures);
+          err2Y = outputFeatures[0];
+          err2Z = outputFeatures[1];
+        } else {
+          prop.GetErr2(err2Y, err2Z, param, zz, cluster.row, clusterState, cluster.sector, time, invAvgCharge, invCharge);
+        }
 
 #ifndef GPUCA_GPUCODE
-        fprintf(fpdumperr, "%d,%d,%f,%f,%d,%f,%f,%f,%f,%f,%f,%f,%f,%f,%f,%f,%f\n", iTrk, cluster.num, err2Y, err2Z, clusterState, yy, zz, mP[0], mP[1], mP[2], mP[3], mP[4], mC[0], mC[2], mC[5], mC[9], mC[14]);
+        fprintf(fpdumperr, "%d,%d,%f,%f,%d,%f,%f,%f,%f,%f,%f,%f,%f,%f,%f,%f,%f,%f\n", iTrk, cluster.num, err2Y, err2Z, clusterState, xx, yy, zz, mP[0], mP[1], mP[2], mP[3], mP[4], mC[0], mC[2], mC[5], mC[9], mC[14]);
 #endif
 
         if (rejectChi2 >= GPUTPCGMPropagator::rejectInterFill) {

Original file line number	Diff line number	Diff line change
`@@ -78,7 +78,7 @@ void GPUChainTracking::RegisterPermanentMemoryAndProcessors()`
`78`	`78`	`{`
`79`	`79`	`fpdumperr = fopen("dump_cluster_error.csv", "a");`
`80`	`80`	`fpdumptrk = fopen("dump_trk_index.csv", "a");`
`81`		`- fprintf(fpdumperr, "internal_trkid,cluster.num,err2Y,err2Z,clusterState,clusterY,clusterZ,mP[0],mP[1],mP[2],mP[3],mP[4],mC[0],mC[2],mC[5],mC[9],mC[14]\n");`
	`81`	`+ fprintf(fpdumperr, "internal_trkid,cluster.num,err2Y,err2Z,clusterState,xx,yy,zz,mP[0],mP[1],mP[2],mP[3],mP[4],mC[0],mC[2],mC[5],mC[9],mC[14]\n");`
`82`	`82`	`fprintf(fpdumptrk, "internal_trkid,trkid\n");`
`83`	`83`	`if (mRec->IsGPU()) {`
`84`	`84`	`mFlatObjectsShadow.InitGPUProcessor(mRec, GPUProcessor::PROCESSOR_TYPE_SLAVE);`