add option for select gpu for classifier train

yztxwd · yztxwd · commit 84ad3a3c93e5 · 2026-04-02T13:55:17.000-04:00
diff --git a/test/test_cav_trainer.py b/test/test_cav_trainer.py
@@ -279,7 +279,7 @@ def test_all(self):
         cav_trainer.set_control(builder.control_concepts[0], num_samples=100)
 
         cav_trainer.train_concepts(
-            builder.concepts, 100, output_dir="data/cavs/", num_processes=2, backend='torch'
+                builder.concepts, 100, output_dir="data/cavs/", num_processes=2, backend='torch', device='cuda:1' if torch.cuda.device_count() > 1 else 'cuda:0', 
         )
         cav_trainer.train_concepts(
             builder.concepts, 100, output_dir="data/cavs/", num_processes=2
diff --git a/tpcav/cavs.py b/tpcav/cavs.py
@@ -130,7 +130,7 @@ def fit(self, train_val_avs: np.ndarray, train_val_ls: np.ndarray):
         
         best_state_dict = None; best_loss = None
         for w in self.weight_decay_search:
-            model = _TorchLinear(self.input_dim, self.num_class).to(self.device)
+            model = _TorchLinear(self.input_dim, self.num_class, device=self.device).to(self.device)
             state_dict, loss = model.fit(train_avs, train_ls, val_avs, val_ls, lr=self.lr, weight_decay=w)
             if (best_loss is None) or (loss < best_loss):
                 best_loss = loss
@@ -237,6 +237,7 @@ def _train(
     output_dir: str,
     penalty: str = "l2",
     backend: str = "sklearn",
+    device=None,
 ) -> Tuple[float, torch.Tensor]:
     """
     Train a binary CAV classifier for a concept vs cached control embeddings.
@@ -255,8 +256,9 @@ def _train(
         # replace label 0 as -1 to accomodate hinge loss
         train_l[train_l==0] = -1
         test_l[test_l==0] = -1
-
-        clf = _TorchLinearWrapper(input_dim= train_avs.shape[1])
+        
+        device = device or ('cuda:0' if torch.cuda.is_available else 'cpu')
+        clf = _TorchLinearWrapper(input_dim= train_avs.shape[1], device=device)
     clf.fit(train_avs, train_l)
     
     #breakpoint()
@@ -348,6 +350,7 @@ def train_concepts(
         num_processes: int = 1,
         max_pending: int = 8,
         backend='sklearn',
+        device=None
     ):
         "Train concepts with a fixed control set by self.set_control()"
         if self.control_embeddings is None:
@@ -367,7 +370,8 @@ def train_concepts(
                     self.control_embeddings.cpu(),
                     Path(output_dir) / c.name,
                     self.penalty,
-                    backend=backend
+                    backend=backend,
+                    device=device
                 )
                 self.cav_fscores[c.name] = fscore
                 self.cav_weights[c.name] = weight
@@ -399,7 +403,8 @@ def train_concepts(
                         self.control_embeddings,
                         Path(output_dir) / c.name,
                         self.penalty,
-                        backend=backend
+                        backend=backend,
+                        device=device
                     )
                     logger.info("Submitted CAV training for concept %s", c.name)
                     futures.append((c.name, future))
@@ -416,7 +421,8 @@ def train_concepts_pairs(self,
                              output_dir: str,
                              num_processes: int = 1,
                              max_pending: int = 8,
-                             backend='sklearn'):
+                             backend='sklearn',
+                             device=None):
         """Train concept pairs (test concept, control concept)
 
         Note: It would compute embeddings on every control concept, use self.train_concepts if control concept is fixed
@@ -435,7 +441,8 @@ def train_concepts_pairs(self,
                     control_embeddings.cpu(),
                     Path(output_dir) / c_test.name,
                     self.penalty,
-                    backend=backend
+                    backend=backend,
+                    device=device
                 )
                 self.cav_fscores[c_test.name] = fscore
                 self.cav_weights[c_test.name] = weight
@@ -469,7 +476,8 @@ def train_concepts_pairs(self,
                         control_embeddings.cpu(),
                         Path(output_dir) / c_test.name,
                         self.penalty,
-                        backend=backend
+                        backend=backend,
+                        device=device
                     )
                     logger.info("Submitted CAV training for concept %s", c_test.name)
                     futures.append((c_test.name, future))
@@ -802,6 +810,7 @@ def run_tpcav(
     html_report_fscore_thresh=0.9,
     seed=1001,
     backend='sklearn',
+    device=None,
 ):
     """
     One-stop function to compute CAVs on motif concepts and bed concepts, compute AUC of motif concept f-scores after correction
@@ -889,13 +898,13 @@ def run_tpcav(
             cav_trainer.train_concepts_pairs(motif_concepts_pairs[nm], 
                                              num_samples_for_cav, 
                                              output_dir=str(output_path / f"cavs_{nm}_motifs/"),
-                                             num_processes=p, max_pending=max_pending_jobs, backend=backend)
+                                             num_processes=p, max_pending=max_pending_jobs, backend=backend, device=device)
         else:
             cav_trainer.set_control(motif_concept_builders[nm].control_concepts[0], num_samples=num_samples_for_cav)
             cav_trainer.train_concepts([c for c, _ in motif_concepts_pairs[nm]],
                                         num_samples_for_cav,
                                         output_dir=str(output_path / f"cavs_{nm}_motifs/"),
-                                        num_processes=p, max_pending=max_pending_jobs, backend=backend)
+                                        num_processes=p, max_pending=max_pending_jobs, backend=backend, device=device)
         if save_cav_trainer:
             torch.save(cav_trainer, str(output_path / f"cavs_{nm}_motifs/cav_trainer.pt"))
         motif_cav_trainers[nm] = cav_trainer
@@ -909,7 +918,8 @@ def run_tpcav(
             num_samples_for_cav,
             output_dir=str(output_path / f"cavs_bed_concepts/"),
             num_processes=p,
-            backend=backend
+            backend=backend,
+            device=device
         )
         if save_cav_trainer:
             torch.save(bed_cav_trainer, str(output_path / f"cavs_bed_concepts/cav_trainer.pt"))

Original file line number	Diff line number	Diff line change
`@@ -279,7 +279,7 @@ def test_all(self):`
`279`	`279`	`cav_trainer.set_control(builder.control_concepts[0], num_samples=100)`
`280`	`280`
`281`	`281`	`cav_trainer.train_concepts(`
`282`		`- builder.concepts, 100, output_dir="data/cavs/", num_processes=2, backend='torch'`
	`282`	`+ builder.concepts, 100, output_dir="data/cavs/", num_processes=2, backend='torch', device='cuda:1' if torch.cuda.device_count() > 1 else 'cuda:0',`
`283`	`283`	`)`
`284`	`284`	`cav_trainer.train_concepts(`
`285`	`285`	`builder.concepts, 100, output_dir="data/cavs/", num_processes=2`