@@ -1,5 +1,27 @@
 
                             from .format_converter import ConcatenatedTensorFormatConverter
                
 
                             from .output_adapters import DetectionOutputAdapter
                
 
                             from .formats import ConcatenatedTensorFormat, BoundingBoxesTensorSliceItem, TensorSliceItem
                
 
                            +from .bbox_formats import (
                
 
                            +    CXCYWHCoordinateFormat,
                
 
                            +    NormalizedCXCYWHCoordinateFormat,
                
 
                            +    NormalizedXYWHCoordinateFormat,
                
 
                            +    NormalizedXYXYCoordinateFormat,
                
 
                            +    XYWHCoordinateFormat,
                
 
                            +    XYXYCoordinateFormat,
                
 
                            +    YXYXCoordinateFormat,
                
 
                            +)
                
 
                            -__all__ = ["ConcatenatedTensorFormatConverter", "DetectionOutputAdapter", "TensorSliceItem", "ConcatenatedTensorFormat", "BoundingBoxesTensorSliceItem"]
                
 
                            +__all__ = [
                
 
                            +    "BoundingBoxesTensorSliceItem",
                
 
                            +    "CXCYWHCoordinateFormat",
                
 
                            +    "ConcatenatedTensorFormat",
                
 
                            +    "ConcatenatedTensorFormatConverter",
                
 
                            +    "DetectionOutputAdapter",
                
 
                            +    "NormalizedCXCYWHCoordinateFormat",
                
 
                            +    "NormalizedXYWHCoordinateFormat",
                
 
                            +    "NormalizedXYXYCoordinateFormat",
                
 
                            +    "TensorSliceItem",
                
 
                            +    "XYWHCoordinateFormat",
                
 
                            +    "XYXYCoordinateFormat",
                
 
                            +    "YXYXCoordinateFormat",
                
 
                            +]
                
@@ -114,7 +114,7 @@ class DetectionOutputAdapter(nn.Module):
 
                                 >>> )
                
 
                                 >>>
                
 
                                 >>> # Now we can construct output adapter and attach it to the model
                
 
                            -    >>> output_adapter = DetectionOutputAdapter(yolox,
                
 
                            +    >>> output_adapter = DetectionOutputAdapter(
                
 
                                 >>>     input_format=yolox.head.format,
                
 
                                 >>>     output_format=output_format,
                
 
                                 >>>     image_shape=(640, 640)
                
@@ -133,14 +133,16 @@ class DetectionOutputAdapter(nn.Module):
 
                                                         If you're not using normalized coordinates you can set this to None
                
 
                                     """
                
 
                                     super().__init__()
                
 
                            -        self.rearrange_outputs, rearranged_format = self.get_rearrange_outputs_module(input_format, output_format)
                
 
                                     self.format_conversion: nn.Module = self.get_format_conversion_module(
                
 
                            -            location=rearranged_format.locations[rearranged_format.bboxes_format.name],
                
 
                            -            input_bbox_format=rearranged_format.bboxes_format.format,
                
 
                            +            location=input_format.locations[input_format.bboxes_format.name],
                
 
                            +            input_bbox_format=input_format.bboxes_format.format,
                
 
                                         output_bbox_format=output_format.bboxes_format.format,
                
 
                                         image_shape=image_shape,
                
 
                                     )
                
 
                            +
                
 
                            +        self.rearrange_outputs, rearranged_format = self.get_rearrange_outputs_module(input_format, output_format)
                
 
                            +
                
 
                                     self.input_format = input_format
                
 
                                     self.output_format = output_format
                
 
                                     self.input_length = input_format.num_channels
                
@@ -157,8 +159,8 @@ class DetectionOutputAdapter(nn.Module):
 
                                             f"equal to {self.input_length} as defined by input format."
                
 
                                         )
                
 
                            +        predictions = self.format_conversion(predictions.clone())
                
 
                                     predictions = self.rearrange_outputs(predictions)
                
 
                            -        predictions = self.format_conversion(predictions)
                
 
                                     return predictions
                
 
                                 @classmethod
                
@@ -7,14 +7,20 @@ import onnx
 
                             import onnxruntime as ort
                
 
                             import torch.jit
                
 
                            -from super_gradients.training.datasets.data_formats.bbox_formats import NormalizedXYWHCoordinateFormat, CXCYWHCoordinateFormat, YXYXCoordinateFormat
                
 
                            -from super_gradients.training.datasets.data_formats.output_adapters.detection_adapter import DetectionOutputAdapter
                
 
                             from super_gradients.training.datasets.data_formats import (
                
 
                                 ConcatenatedTensorFormat,
                
 
                                 BoundingBoxesTensorSliceItem,
                
 
                                 TensorSliceItem,
                
 
                            +    XYXYCoordinateFormat,
                
 
                            +    NormalizedXYWHCoordinateFormat,
                
 
                            +    CXCYWHCoordinateFormat,
                
 
                            +    YXYXCoordinateFormat,
                
 
                            +    NormalizedCXCYWHCoordinateFormat,
                
 
                            +    DetectionOutputAdapter,
                
 
                             )
                
 
                            +from super_gradients.training.datasets.data_formats.bbox_formats.normalized_cxcywh import xyxy_to_normalized_cxcywh
                
 
                            +
                
 
                             NORMALIZED_XYWH_SCORES_LABELS = ConcatenatedTensorFormat(
                
 
                                 layout=(
                
 
                                     BoundingBoxesTensorSliceItem(name="bboxes", format=NormalizedXYWHCoordinateFormat()),
                
@@ -135,6 +141,43 @@ class TestDetectionOutputAdapter(unittest.TestCase):
 
                                         np.testing.assert_allclose(actual_output, expected_output)
                
 
                            +    def test_output_adapter_manual_case(self):
                
 
                            +
                
 
                            +        image_shape = 640, 640
                
 
                            +
                
 
                            +        expected_bboxes_xyxy = np.array(
                
 
                            +            [
                
 
                            +                [256, 320, 340, 400],
                
 
                            +                [32, 64, 100, 150],
                
 
                            +                [0, 0, 100, 100],
                
 
                            +            ]
                
 
                            +        )
                
 
                            +
                
 
                            +        input_bboxes_cxcywh = xyxy_to_normalized_cxcywh(expected_bboxes_xyxy, image_shape)
                
 
                            +        input_labels = np.arange(len(expected_bboxes_xyxy))
                
 
                            +        input = torch.from_numpy(np.concatenate([input_bboxes_cxcywh, input_labels[:, None]], axis=-1))
                
 
                            +        print(input.numpy())
                
 
                            +
                
 
                            +        input_format = ConcatenatedTensorFormat(
                
 
                            +            layout=(
                
 
                            +                BoundingBoxesTensorSliceItem(name="bboxes", format=NormalizedCXCYWHCoordinateFormat()),
                
 
                            +                TensorSliceItem(name="class", length=1),
                
 
                            +            )
                
 
                            +        )
                
 
                            +
                
 
                            +        output_format = ConcatenatedTensorFormat(
                
 
                            +            layout=(
                
 
                            +                TensorSliceItem(name="class", length=1),
                
 
                            +                BoundingBoxesTensorSliceItem(name="bboxes", format=XYXYCoordinateFormat()),
                
 
                            +            )
                
 
                            +        )
                
 
                            +
                
 
                            +        output_adapter = DetectionOutputAdapter(input_format, output_format, image_shape)
                
 
                            +        output = output_adapter(input)
                
 
                            +        output_bboxes = output[:, 1:].numpy()
                
 
                            +        print(output.numpy())
                
 
                            +        np.testing.assert_allclose(output_bboxes, expected_bboxes_xyxy)
                
 
                            +
                
 
                             if __name__ == "__main__":
                
 
                                 unittest.main()