feature: custom loss function and DOS predict model (#6)

saraheisenach · web-flow · commit 04679145c8de · 2022-11-14T15:03:32.000-05:00
* Adding in custom DOS loss function

* Adding DOS predict model
diff --git a/configs/config.yml b/configs/config.yml
@@ -5,30 +5,25 @@ task:
   # run_mode: train
   name: "my_train_job"
 
-  reprocess: "False"
+  reprocess: False
 
 
-  parallel: "True"
+  parallel: True
   seed: 0
   #seed=0 means random initalization
 
 
-  write_output: "True"
-  parallel: "True"
+  write_output: True
+  parallel: True
   #Training print out frequency (print per n number of epochs)
   verbosity: 5
 
-  #Ratios for train/val/test split out of a total of 1
-  train_ratio: 0.8
-  val_ratio: 0.05
-  test_ratio: 0.15
-
 
 
 model:
   name: CGCNN
-  load_model: "False"
-  save_model: "True"
+  load_model: False
+  save_model: True
   model_path: "my_model.pth"
   edge_steps: 50
   self_loop: True
@@ -40,16 +35,19 @@ model:
   post_fc_count: 3
   pool: "global_mean_pool"
   pool_order: "early"
-  batch_norm: "True"
-  batch_track_stats: "True"
+  batch_norm: True
+  batch_track_stats: True
   act: "relu"
   dropout_rate: 0.0
 
 optim:
   max_epochs: 250
   lr: 0.002
-  #Loss functions (from pytorch) examples: l1_loss, mse_loss, binary_cross_entropy
-  loss_fn: "l1_loss"
+  #Either custom or from torch.nn.functional library. If from torch, loss_type is TorchLossWrapper
+  loss:
+    loss_type: "TorchLossWrapper"
+    loss_args: {"loss_fn": "l1_loss"}
+
   batch_size: 100
   optimizer:
     optimizer_type: "AdamW"
@@ -72,8 +70,9 @@ dataset:
   data_format: "json"
   #Method of obtaining atom idctionary: available:(onehot)
   node_representation: "onehot"
+  additional_attributes: []
   #Print out processing info
-  verbose: "True"
+  verbose: True
 
   #Loading dataset params
   #Index of target column in targets.csv
@@ -83,4 +82,8 @@ dataset:
   cutoff_radius : 8.0
   n_neighbors : 12
   edge_steps : 50
-  
+
+  #Ratios for train/val/test split out of a total of 1
+  train_ratio: 0.8
+  val_ratio: 0.05
+  test_ratio: 0.15
diff --git a/configs/examples/DOS_STO.yml b/configs/examples/DOS_STO.yml
@@ -0,0 +1,55 @@
+trainer: property
+
+task:
+  name: "my_train_job"
+  reprocess: False
+  parallel: True
+  seed: 0
+  write_output: True
+  verbosity: 5
+
+model:
+  name: DOSPredict
+  load_model: False
+  save_model: True
+  model_path: "my_model.pth"
+  edge_steps: 50
+  self_loop: True
+  dim1: 370
+  dim2: 370
+  pre_fc_count: 1
+  gc_count: 9
+  batch_norm: True
+  batch_track_stats: False
+  dropout_rate: 0.05
+
+optim:
+  max_epochs: 2000
+  lr: 0.00047
+  loss:
+    loss_type: "DOSLoss"
+    loss_args: {"loss_fn": "l1_loss", "scaling_weight": 0.05, "cumsum_weight": 0.005, "features_weight": 0.15}
+  batch_size: 180
+  optimizer:
+    optimizer_type: "AdamW"
+    optimizer_args: {"weight_decay":0.1}
+  scheduler:
+    scheduler_type: "ReduceLROnPlateau"
+    scheduler_args: {"mode":"min", "factor":0.8, "patience":40, "min_lr":0.00001, "threshold":0.0002}
+
+dataset:
+  processed: False
+  src: "/global/cfs/projectdirs/m3641/Shared/Materials_datasets/STO_DOS_data/raw/"
+  target_path: "/global/cfs/projectdirs/m3641/Shared/Materials_datasets/STO_DOS_data/targets.csv"
+  pt_path: "/global/cfs/projectdirs/m3641/Sarah/datasets/processed/STO_DOS_data/"
+  data_format: "vasp"
+  node_representation: "onehot"
+  additional_attributes: ["features", "scaled", "scaling_factor"]
+  verbose: True
+  target_index: 0
+  cutoff_radius : 8.0
+  n_neighbors : 12
+  edge_steps : 50
+  train_ratio: 0.8
+  val_ratio: 0.05
+  test_ratio: 0.15
diff --git a/matdeeplearn/__init__.py b/matdeeplearn/__init__.py
@@ -1,4 +0,0 @@
-from matdeeplearn.common.data import *
-
-from .models import *
-from .preprocessor import *
diff --git a/matdeeplearn/models/__init__.py b/matdeeplearn/models/__init__.py
@@ -1 +1,5 @@
+__all__ = ["BaseModel", "CGCNN", "DOSPredict"]
+
 from .base_model import BaseModel
+from .cgcnn import CGCNN
+from .dos_predict import DOSPredict
diff --git a/matdeeplearn/models/base_model.py b/matdeeplearn/models/base_model.py
@@ -1,4 +1,5 @@
 import warnings
+from abc import abstractmethod
 
 import torch
 import torch.nn as nn
@@ -52,6 +53,10 @@ def __str__(self):
 
         return str_representation
 
+    @abstractmethod
+    def forward(self):
+        """The forward method for the model."""
+
     def generate_graph(self, data, r, n_neighbors, otf: bool = False):
         """
         generates the graph on-the-fly.
diff --git a/matdeeplearn/models/cgcnn.py b/matdeeplearn/models/cgcnn.py
@@ -59,8 +59,8 @@ def __init__(
         else:
             self.gc_dim, self.post_fc_dim = dim1, dim1
 
-            # Determine output dimension length
-            self.output_dim = 1 if data[0].y.ndim == 0 else len(data[0].y[0])
+        # Determine output dimension length
+        self.output_dim = 1 if data[0].y.ndim == 0 else len(data[0].y[0])
 
         # setup layers
         self.pre_lin_list = self._setup_pre_gnn_layers()
@@ -99,7 +99,7 @@ def _setup_gnn_layers(self):
             )
             conv_list.append(conv)
             # Track running stats set to false can prevent some instabilities; this causes other issues with different val/test performance from loader size?
-            if self.batch_norm == "True":
+            if self.batch_norm:
                 bn = BatchNorm1d(
                     self.gc_dim, track_running_stats=self.batch_track_stats
                 )
@@ -147,7 +147,7 @@ def forward(self, data):
         # GNN layers
         for i in range(0, len(self.conv_list)):
             if len(self.pre_lin_list) == 0 and i == 0:
-                if self.batch_norm == "True":
+                if self.batch_norm:
                     out = self.conv_list[i](
                         data.x, data.edge_index, data.edge_attr.float()
                     )
@@ -157,7 +157,7 @@ def forward(self, data):
                         data.x, data.edge_index, data.edge_attr.float()
                     )
             else:
-                if self.batch_norm == "True":
+                if self.batch_norm:
                     out = self.conv_list[i](
                         out, data.edge_index, data.edge_attr.float()
                     )
diff --git a/matdeeplearn/models/dos_predict.py b/matdeeplearn/models/dos_predict.py
@@ -0,0 +1,171 @@
+from __future__ import annotations
+
+import torch
+import torch.nn.functional as F
+from torch import Tensor
+from torch.nn import BatchNorm1d, Linear, Sequential
+from torch_geometric.nn.conv import MessagePassing
+from torch_geometric.typing import Adj, OptTensor, PairTensor, Size
+
+from matdeeplearn.common.registry import registry
+from matdeeplearn.models.base_model import BaseModel
+
+
+@registry.register_model("DOSPredict")
+class DOSPredict(BaseModel):
+    def __init__(
+        self,
+        edge_steps,
+        self_loop,
+        data,
+        dim1=64,
+        dim2=64,
+        pre_fc_count=1,
+        gc_count=3,
+        batch_norm=True,
+        batch_track_stats=True,
+        dropout_rate=0.0,
+        **kwargs,
+    ):
+        super(DOSPredict, self).__init__(edge_steps, self_loop)
+        self.dim1 = dim1
+        self.dim2 = dim2
+        self.pre_fc_count = pre_fc_count
+        self.gc_count = gc_count
+        self.num_features = data.num_features
+        self.num_edge_features = data.num_edge_features
+        self.batch_norm = batch_norm
+        self.batch_track_stats = batch_track_stats
+        self.dropout_rate = dropout_rate
+
+        # Determine gc dimension and post_fc dimension
+        assert gc_count > 0, "Need at least 1 GC layer"
+        if pre_fc_count == 0:
+            self.gc_dim, self.post_fc_dim = data.num_features, data.num_features
+        else:
+            self.gc_dim, self.post_fc_dim = dim1, dim1
+
+        # Determine output dimension length
+        self.output_dim = 1 if data[0].scaled.ndim == 0 else len(data[0].scaled[0])
+
+        # setup layers
+        self.pre_lin_list = self._setup_pre_gnn_layers()
+        self.conv_list, self.bn_list = self._setup_gnn_layers()
+
+        self.dos_mlp = Sequential(
+            Linear(self.post_fc_dim, self.dim2),
+            torch.nn.PReLU(),
+            Linear(self.dim2, self.output_dim),
+            torch.nn.PReLU(),
+        )
+
+        self.scaling_mlp = Sequential(
+            Linear(self.post_fc_dim, self.dim2),
+            torch.nn.PReLU(),
+            Linear(self.dim2, 1),
+        )
+
+    def _setup_pre_gnn_layers(self):
+        """Sets up pre-GNN dense layers (NOTE: in v0.1 this is always set to 1 layer)."""
+        pre_lin_list = torch.nn.ModuleList()
+        if self.pre_fc_count > 0:
+            pre_lin_list = torch.nn.ModuleList()
+            for i in range(self.pre_fc_count):
+                if i == 0:
+                    lin = torch.nn.Linear(self.num_features, self.dim1)
+                else:
+                    lin = torch.nn.Linear(self.dim1, self.dim1)
+
+                pre_lin_list.append(Sequential(lin, torch.nn.PReLU()))
+
+        return pre_lin_list
+
+    def _setup_gnn_layers(self):
+        """Sets up GNN layers."""
+        conv_list = torch.nn.ModuleList()
+        bn_list = torch.nn.ModuleList()
+        for i in range(self.gc_count):
+            conv = GCBlock(self.gc_dim, self.num_edge_features, aggr="mean")
+            conv_list.append(conv)
+            # Track running stats set to false can prevent some instabilities; this causes other issues with different val/test performance from loader size?
+            if self.batch_norm:
+                bn = BatchNorm1d(
+                    self.gc_dim, track_running_stats=self.batch_track_stats, affine=True
+                )
+                bn_list.append(bn)
+
+        return conv_list, bn_list
+
+    def forward(self, data):
+
+        # Pre-GNN dense layers
+        for i in range(0, len(self.pre_lin_list)):
+            if i == 0:
+                out = self.pre_lin_list[i](data.x.float())
+            else:
+                out = self.pre_lin_list[i](out)
+
+        # GNN layers
+        for i in range(0, len(self.conv_list)):
+            if len(self.pre_lin_list) == 0 and i == 0:
+                out = self.conv_list[i](data.x, data.edge_index, data.edge_attr.float())
+            else:
+                out = self.conv_list[i](out, data.edge_index, data.edge_attr.float())
+            if self.batch_norm:
+                out = self.bn_list[i](out)
+
+        out = F.dropout(out, p=self.dropout_rate, training=self.training)
+        # Post-GNN dense layers
+        dos_out = self.dos_mlp(out)
+        scaling = self.scaling_mlp(out)
+
+        if dos_out.shape[1] == 1:
+            return dos_out.view(-1), scaling.view(-1)
+        else:
+            return dos_out, scaling.view(-1)
+
+
+class GCBlock(MessagePassing):
+    def __init__(
+        self,
+        channels: int | tuple[int, int],
+        dim: int = 0,
+        aggr: str = "mean",
+        **kwargs,
+    ):
+        super(GCBlock, self).__init__(aggr=aggr, **kwargs)
+        self.channels = channels
+        self.dim = dim
+
+        if isinstance(channels, int):
+            channels = (channels, channels)
+
+        self.mlp = Sequential(
+            Linear(sum(channels) + dim, channels[1]),
+            torch.nn.PReLU(),
+        )
+        self.mlp2 = Sequential(
+            Linear(dim, dim),
+            torch.nn.PReLU(),
+        )
+
+    def forward(
+        self,
+        x: Tensor | PairTensor,
+        edge_index: Adj,
+        edge_attr: OptTensor = None,
+        size: Size = None,
+    ) -> Tensor:
+
+        if isinstance(x, Tensor):
+            x: PairTensor = (x, x)
+
+        # propagate_type: (x: PairTensor, edge_attr: OptTensor)
+        out = self.propagate(edge_index, x=x, edge_attr=edge_attr, size=size)
+        out += x[1]
+        return out
+
+    def message(self, x_i, x_j, edge_attr: OptTensor) -> Tensor:
+        z = torch.cat([x_i, x_j, self.mlp2(edge_attr)], dim=-1)
+        z = self.mlp(z)
+        return z
diff --git a/matdeeplearn/modules/__init__.py b/matdeeplearn/modules/__init__.py
@@ -0,0 +1,5 @@
+__all__ = ["Evaluator", "DOSLoss", "TorchLossWrapper", "LRScheduler"]
+
+from .evaluator import Evaluator
+from .loss import DOSLoss, TorchLossWrapper
+from .scheduler import LRScheduler
diff --git a/matdeeplearn/modules/evaluator.py b/matdeeplearn/modules/evaluator.py
@@ -11,7 +11,7 @@ def __init__(self, task=None):
     def eval(self, prediction, target, loss_method, prev_metrics={}):
         metrics = prev_metrics
         res = loss_method(prediction, target)
-        metrics = self.update(loss_method.__name__, res.item(), metrics)
+        metrics = self.update(type(loss_method).__name__, res.item(), metrics)
 
         return metrics
 
diff --git a/matdeeplearn/modules/loss.py b/matdeeplearn/modules/loss.py
diff --git a/matdeeplearn/trainers/__init__.py b/matdeeplearn/trainers/__init__.py
diff --git a/matdeeplearn/trainers/base_trainer.py b/matdeeplearn/trainers/base_trainer.py
diff --git a/matdeeplearn/trainers/property_trainer.py b/matdeeplearn/trainers/property_trainer.py