8个计算机视觉深度学习中常见的Bug
这里出了什么问题?首先,用三次插值调整掩模的大小是一个坏主意。同样的问题 float32到 uint8:三次插值可以输出值大于输入,这会导致溢出。 我在做可视化的时候发现了这个问题。在你的训练循环中到处放置断言也是一个好主意。 7. 拼写错误 假设需要对全卷积网络(如语义分割问题)和一个巨大的图像进行推理。该图像是如此巨大,没有机会把它放在你的GPU中,它可以是一个医疗或卫星图像。 在这种情况下,可以将图像分割成网格,独立地对每一块进行推理,最后合并。此外,一些预测交叉可能有助于平滑边界附近的artifacts。 from tqdm import tqdm class GridPredictor: """ This class can be used to predict a segmentation mask for the big image when you have GPU memory limitation """ def __init__(self, predictor: AbstractPredictor, size: int, stride: Optional[int] = None): self.predictor = predictor self.size = size self.stride = stride if stride is not None else size // 2 def __call__(self, x: np.ndarray): h, w, _ = x.shape mask = np.zeros((h, w, 1), dtype='float32') weights = mask.copy() for i in tqdm(range(0, h - 1, self.stride)): for j in range(0, w - 1, self.stride): (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |