ericbudi
diff --git a/‎DGLPyTorch/DrugDiscovery/SE3Transformer/se3_transformer/runtime/callbacks.py‎
Lines changed: 11 additions & 0 deletions b/‎DGLPyTorch/DrugDiscovery/SE3Transformer/se3_transformer/runtime/callbacks.py‎
Lines changed: 11 additions & 0 deletions
diff --git a/‎DGLPyTorch/DrugDiscovery/SE3Transformer/se3_transformer/runtime/loggers.py‎
Lines changed: 18 additions & 0 deletions b/‎DGLPyTorch/DrugDiscovery/SE3Transformer/se3_transformer/runtime/loggers.py‎
Lines changed: 18 additions & 0 deletions
diff --git a/‎MxNet/Classification/RN50v1.5/log_utils.py‎
Lines changed: 8 additions & 0 deletions b/‎MxNet/Classification/RN50v1.5/log_utils.py‎
Lines changed: 8 additions & 0 deletions
diff --git a/‎PyTorch/Classification/ConvNets/image_classification/logger.py‎
Lines changed: 3 additions & 3 deletions b/‎PyTorch/Classification/ConvNets/image_classification/logger.py‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎PyTorch/Classification/GPUNet/train.py‎
Lines changed: 5 additions & 0 deletions b/‎PyTorch/Classification/GPUNet/train.py‎
Lines changed: 5 additions & 0 deletions
diff --git a/‎PyTorch/Detection/Efficientdet/train.py‎
Lines changed: 7 additions & 0 deletions b/‎PyTorch/Detection/Efficientdet/train.py‎
Lines changed: 7 additions & 0 deletions
diff --git a/‎PyTorch/Detection/Efficientdet/validate.py‎
Lines changed: 5 additions & 0 deletions b/‎PyTorch/Detection/Efficientdet/validate.py‎
Lines changed: 5 additions & 0 deletions
diff --git a/‎PyTorch/Detection/SSD/ssd/logger.py‎
Lines changed: 6 additions & 0 deletions b/‎PyTorch/Detection/SSD/ssd/logger.py‎
Lines changed: 6 additions & 0 deletions
diff --git a/‎PyTorch/Forecasting/TFT/log_helper.py‎
Lines changed: 20 additions & 17 deletions b/‎PyTorch/Forecasting/TFT/log_helper.py‎
Lines changed: 20 additions & 17 deletions
diff --git a/‎PyTorch/LanguageModeling/BART/finetune.py‎
Lines changed: 3 additions & 0 deletions b/‎PyTorch/LanguageModeling/BART/finetune.py‎
Lines changed: 3 additions & 0 deletions
@@ -64,6 +64,8 @@ def __init__(self, logger: Optional[Logger] = None):
         self.logger = logger
         self.scheduler = None
 
+        self.logger.log_metadata('learning rate', {'unit': None})
+
     @abstractmethod
     def get_scheduler(self, optimizer, args):
         pass
@@ -93,6 +95,9 @@ def __init__(self, logger, targets_std, prefix=''):
         self.prefix = prefix
         self.best_mae = float('inf')
 
+        self.logger.log_metadata(f'{self.prefix} MAE', {'unit': None})
+        self.logger.log_metadata(f'{self.prefix} best MAE', {'unit': None})
+
     def on_validation_step(self, input, target, pred):
         self.mae(pred.detach(), target.detach())
 
@@ -126,6 +131,12 @@ def __init__(self, logger, batch_size: int, warmup_epochs: int = 1, mode: str =
         self.mode = mode
         self.logger = logger
 
+        logger.log_metadata(f"throughput_{self.mode}", {'unit': 'molecules/s'})
+        logger.log_metadata(f"total_time_{self.mode}", {'unit': 's'})
+        logger.log_metadata(f"latency_{self.mode}_mean", {'unit': 's'})
+        for level in [90, 95, 99]:
+            logger.log_metadata(f"latency_{self.mode}_{level}", {'unit': 's'})
+
     def on_batch_start(self):
         if self.epoch >= self.warmup_epochs:
             self.timestamps.append(time.time() * 1000.0)
 
@@ -40,6 +40,11 @@ class Logger(ABC):
     def log_hyperparams(self, params):
         pass
 
+    @rank_zero_only
+    @abstractmethod
+    def log_metadata(self, metric, metadata):
+        pass
+
     @rank_zero_only
     @abstractmethod
     def log_metrics(self, metrics, step=None):
@@ -81,6 +86,11 @@ def log_hyperparams(self, params):
         for logger in self.loggers:
             logger.log_hyperparams(params)
 
+    @rank_zero_only
+    def log_metadata(self, metric, metadata):
+        for logger in self.loggers:
+            logger.log_metadata(metric, metadata)
+
 
 class DLLogger(Logger):
     def __init__(self, save_dir: pathlib.Path, filename: str):
@@ -95,6 +105,10 @@ def log_hyperparams(self, params):
         params = self._sanitize_params(params)
         dllogger.log(step="PARAMETER", data=params)
 
+    @rank_zero_only
+    def log_metadata(self, metric, metadata):
+        dllogger.metadata(metric, metadata)
+
     @rank_zero_only
     def log_metrics(self, metrics, step=None):
         if step is None:
@@ -126,6 +140,10 @@ def log_hyperparams(self, params: Dict[str, Any]) -> None:
         params = self._sanitize_params(params)
         self.experiment.config.update(params, allow_val_change=True)
 
+    @rank_zero_only
+    def log_metadata(self, metric, metadata):
+        pass
+
     @rank_zero_only
     def log_metrics(self, metrics: Dict[str, float], step: Optional[int] = None) -> None:
         if step is not None:
 
@@ -31,3 +31,11 @@ def setup_logging(args):
         ])
     else:
         dllogger.init([])
+
+    dllogger.metadata("val.accuracy", {"unit": None})
+    dllogger.metadata("val.top_k_accuracy_5", {"unit": None})
+    dllogger.metadata("train.ips", {"unit": "images/s"})
+    dllogger.metadata("val.ips", {"unit": "images/s"})
+    dllogger.metadata("val.latency_50", {"unit": "s"})
+    dllogger.metadata("val.latency_90", {"unit": "s"})
+    dllogger.metadata("val.latency_avg", {"unit": "s"})
@@ -338,10 +338,10 @@ def epoch_generator_wrapper(self, gen):
 
 class Metrics:
     ACC_METADATA = {"unit": "%", "format": ":.2f"}
-    IPS_METADATA = {"unit": "img/s", "format": ":.2f"}
+    IPS_METADATA = {"unit": "images/s", "format": ":.2f"}
     TIME_METADATA = {"unit": "s", "format": ":.5f"}
-    LOSS_METADATA = {"format": ":.5f"}
-    LR_METADATA = {"format": ":.5f"}
+    LOSS_METADATA = {"unit": None, "format": ":.5f"}
+    LR_METADATA = {"unit": None, "format": ":.5f"}
 
     def __init__(self, logger):
         self.logger = logger
 
@@ -1100,6 +1100,11 @@ def main():
         )
     else:
         dllogger.init(backends=[])
+
+    dllogger.metadata("top1", {"unit": None})
+    dllogger.metadata("top5", {"unit": None})
+    dllogger.metadata("average_ips", {"unit": "images/s"})
+
     data_config = resolve_data_config(
         vars(args), model=model, verbose=args.local_rank == 0
     )
 
@@ -275,6 +275,13 @@ def main():
     assert args.rank >= 0
 
     setup_dllogger(args.rank, filename=args.dllogger_file)
+    dllogger.metadata('eval_batch_time', {'unit': 's'})
+    dllogger.metadata('train_batch_time', {'unit': 's'})
+    dllogger.metadata('eval_throughput', {'unit': 'images/s'})
+    dllogger.metadata('train_throughout', {'unit': 'images/s'})
+    dllogger.metadata('eval_loss', {'unit': None})
+    dllogger.metadata('train_loss', {'unit': None})
+    dllogger.metadata('map', {'unit': None})
 
     if args.distributed:
         logging.info('Training in distributed mode with multiple processes, 1 GPU per process. Process %d, total %d.'
 
@@ -114,6 +114,11 @@ def add_bool_arg(parser, name, default=False, help=''):  # FIXME move to utils
 
 def validate(args):
     setup_dllogger(0, filename=args.dllogger_file)
+    dllogger.metadata('total_inference_time', {'unit': 's'})
+    dllogger.metadata('inference_throughput', {'unit': 'images/s'})
+    dllogger.metadata('inference_time', {'unit': 's'})
+    dllogger.metadata('map', {'unit': None})
+    dllogger.metadata('total_eval_time', {'unit': 's'})
 
     if args.checkpoint != '':
         args.pretrained = True
 
@@ -66,6 +66,7 @@ def __init__(self, name, json_output=None, log_interval=20):
             backends.append(DLLogger.JSONStreamBackend(DLLogger.Verbosity.VERBOSE, json_output))
 
         DLLogger.init(backends)
+        DLLogger.metadata("mAP", {"unit": None})
 
         self.epoch = 0
         self.train_iter = 0
@@ -137,6 +138,11 @@ def __init__(self, *args, **kwargs):
         super().__init__(*args, **kwargs)
         self.images_per_ses = BenchmarkMeter(self.name)
 
+        DLLogger.metadata("avg_img/sec", {"unit": "images/s"})
+        DLLogger.metadata("med_img/sec", {"unit": "images/s"})
+        DLLogger.metadata("min_img/sec", {"unit": "images/s"})
+        DLLogger.metadata("max_img/sec", {"unit": "images/s"})
+
     def update(self, bs, time):
         self.images_per_ses.update(bs, time)
 
 
@@ -101,23 +101,26 @@ def step_format(step):
     container_setup_info = {**get_framework_env_vars(), **get_system_info()}
     dllogger.log(step='ENVIRONMENT', data=container_setup_info, verbosity=0)
 
-    dllogger.metadata('loss', {'GOAL': 'MINIMIZE', 'STAGE': 'TRAIN', 'format': ':5f'})
-    dllogger.metadata('P10', {'GOAL': 'MINIMIZE', 'STAGE': 'TRAIN', 'format': ':5f'})
-    dllogger.metadata('P50', {'GOAL': 'MINIMIZE', 'STAGE': 'TRAIN', 'format': ':5f'})
-    dllogger.metadata('P90', {'GOAL': 'MINIMIZE', 'STAGE': 'TRAIN', 'format': ':5f'})
-    dllogger.metadata('items/s', {'GOAL': 'MAXIMIZE', 'STAGE': 'TRAIN', 'format': ':1f'})
-    dllogger.metadata('val_loss', {'GOAL': 'MINIMIZE', 'STAGE': 'VAL', 'format':':5f'})
-    dllogger.metadata('val_P10', {'GOAL': 'MINIMIZE', 'STAGE': 'VAL', 'format': ':5f'})
-    dllogger.metadata('val_P50', {'GOAL': 'MINIMIZE', 'STAGE': 'VAL', 'format': ':5f'})
-    dllogger.metadata('val_P90', {'GOAL': 'MINIMIZE', 'STAGE': 'VAL', 'format': ':5f'})
-    dllogger.metadata('val_items/s', {'GOAL': 'MAXIMIZE', 'STAGE': 'VAL', 'format': ':1f'})
-    dllogger.metadata('test_P10', {'GOAL': 'MINIMIZE', 'STAGE': 'TEST', 'format': ':5f'})
-    dllogger.metadata('test_P50', {'GOAL': 'MINIMIZE', 'STAGE': 'TEST', 'format': ':5f'})
-    dllogger.metadata('test_P90', {'GOAL': 'MINIMIZE', 'STAGE': 'TEST', 'format': ':5f'})
-    dllogger.metadata('throughput', {'GOAL': 'MAXIMIZE', 'STAGE': 'TEST', 'format': ':1f'})
-    dllogger.metadata('latency_p90', {'GOAL': 'MIMIMIZE', 'STAGE': 'TEST', 'format': ':5f'})
-    dllogger.metadata('latency_p95', {'GOAL': 'MIMIMIZE', 'STAGE': 'TEST', 'format': ':5f'})
-    dllogger.metadata('latency_p99', {'GOAL': 'MIMIMIZE', 'STAGE': 'TEST', 'format': ':5f'})
+    dllogger.metadata('loss', {'GOAL': 'MINIMIZE', 'STAGE': 'TRAIN', 'format': ':5f', 'unit': None})
+    dllogger.metadata('P10', {'GOAL': 'MINIMIZE', 'STAGE': 'TRAIN', 'format': ':5f', 'unit': None})
+    dllogger.metadata('P50', {'GOAL': 'MINIMIZE', 'STAGE': 'TRAIN', 'format': ':5f', 'unit': None})
+    dllogger.metadata('P90', {'GOAL': 'MINIMIZE', 'STAGE': 'TRAIN', 'format': ':5f', 'unit': None})
+    dllogger.metadata('items/s', {'GOAL': 'MAXIMIZE', 'STAGE': 'TRAIN', 'format': ':1f', 'unit': 'items/s'})
+    dllogger.metadata('val_loss', {'GOAL': 'MINIMIZE', 'STAGE': 'VAL', 'format':':5f', 'unit': None})
+    dllogger.metadata('val_P10', {'GOAL': 'MINIMIZE', 'STAGE': 'VAL', 'format': ':5f', 'unit': None})
+    dllogger.metadata('val_P50', {'GOAL': 'MINIMIZE', 'STAGE': 'VAL', 'format': ':5f', 'unit': None})
+    dllogger.metadata('val_P90', {'GOAL': 'MINIMIZE', 'STAGE': 'VAL', 'format': ':5f', 'unit': None})
+    dllogger.metadata('val_items/s', {'GOAL': 'MAXIMIZE', 'STAGE': 'VAL', 'format': ':1f', 'unit': 'items/s'})
+    dllogger.metadata('test_P10', {'GOAL': 'MINIMIZE', 'STAGE': 'TEST', 'format': ':5f', 'unit': None})
+    dllogger.metadata('test_P50', {'GOAL': 'MINIMIZE', 'STAGE': 'TEST', 'format': ':5f', 'unit': None})
+    dllogger.metadata('test_P90', {'GOAL': 'MINIMIZE', 'STAGE': 'TEST', 'format': ':5f', 'unit': None})
+    dllogger.metadata('sum', {'GOAL': 'MINIMIZE', 'STAGE': 'TEST', 'format': ':5f', 'unit': None})
+    dllogger.metadata('throughput', {'GOAL': 'MAXIMIZE', 'STAGE': 'TEST', 'format': ':1f', 'unit': 'items/s'})
+    dllogger.metadata('latency_avg', {'GOAL': 'MIMIMIZE', 'STAGE': 'TEST', 'format': ':5f', 'unit': 's'})
+    dllogger.metadata('latency_p90', {'GOAL': 'MIMIMIZE', 'STAGE': 'TEST', 'format': ':5f', 'unit': 's'})
+    dllogger.metadata('latency_p95', {'GOAL': 'MIMIMIZE', 'STAGE': 'TEST', 'format': ':5f', 'unit': 's'})
+    dllogger.metadata('latency_p99', {'GOAL': 'MIMIMIZE', 'STAGE': 'TEST', 'format': ':5f', 'unit': 's'})
+    dllogger.metadata('average_ips', {'GOAL': 'MAXIMIZE', 'STAGE': 'TEST', 'format': ':1f', 'unit': 'items/s'})
 
 
 def get_framework_env_vars():
 
@@ -560,6 +560,9 @@ def main(args, model=None) -> SummarizationModule:
     else:
         dllogger.init(backends=[])
 
+    dllogger.metadata("avg_train_time", {"unit": "s"})
+    dllogger.metadata("avg_train_throughput", {"unit": "tokens/s"})
+
     main(args)
 
     dllogger.flush()
Original file line number	Diff line number	Diff line change
`@@ -1100,6 +1100,11 @@ def main():`
`1100`	`1100`	`)`
`1101`	`1101`	`else:`
`1102`	`1102`	`dllogger.init(backends=[])`
	`1103`	`+`
	`1104`	`+ dllogger.metadata("top1", {"unit": None})`
	`1105`	`+ dllogger.metadata("top5", {"unit": None})`
	`1106`	`+ dllogger.metadata("average_ips", {"unit": "images/s"})`
	`1107`	`+`
`1103`	`1108`	`data_config = resolve_data_config(`
`1104`	`1109`	`vars(args), model=model, verbose=args.local_rank == 0`
`1105`	`1110`	`)`