图像增强是一种非常强大的技术,针对现有图像人为创建各种变化以扩展图像数据集,例如缩放现有图像、将现有图像旋转几度、剪切或裁剪图像等等。在本文中,我们将使用 imgaug 库探索 Python 中的图像增强技术。
站在用户的角度思考问题,与客户深入沟通,找到毕节网站设计与毕节网站推广的解决方案,凭借多年的经验,让设计与互联网技术结合,创造个性化、用户体验好的作品,建站类型包括:成都做网站、成都网站设计、企业官网、英文网站、手机端网站、网站推广、主机域名、网页空间、企业邮箱。业务覆盖毕节地区。
深度学习卷积神经网络(CNN)需要大量图像才能有效训练模型。通过更好的增强有助于提高模型的性能,从而减少过度拟合。可用于分类和对象检测数据集的最流行的数据集具有数千到数百万个图像。
归纳是指在模型训练期间根据以前从未见过的数据进行评估模型的性能测试或验证。由于 CNN 具有不变性,即使在不同大小,方向或不同照明下可见时,它也可以对对象进行分类。因此,我们可以获取图像的小型数据集,并通过放大或缩小,垂直或水平翻转它们或更改亮度来改变对象的大小。这样,我们可以创建丰富、多样化的图像数据集。
图像增强可以从一小组图像中创建丰富多样的图像集,以进行图像分类,目标检测或图像分割。在仔细了解问题域之后,需要采用增加训练数据集大小的增强策略。
在我们训练模型之前,可以将图像增强用作预处理。
增强被用作预处理步骤,以增加数据集的大小。通常,当我们有一个小的训练数据集要扩展时,便可以完成此操作。
在较小的数据集上生成扩充很有帮助,但在应用于较大的数据集时,我们需要考虑磁盘空间。
顾名思义,增强是实时应用的。这通常适用于较大的数据集,因为我们不需要将增强的映像保存在磁盘上。
在这种情况下,我们在小批量中应用转换,然后将其输入模型。
在线增强模型将在每个时期看到不同的图像。在“离线增强”中,增强图像是训练集的一部分,它会根据时期数多次查看增强图像。
该模型可通过在线增强更好地推广,因为它在通过在线数据增强进行训练期间会看到更多样本。
我们将使用 imgaug 类来演示图像增强。
现在,我们将使用 imgaug 库探索这些数据增强技术
imgaug 是一个用于图像增强以及关键点 / 地标,边界框,热图和分段图的库。
- pip install imgaug
在某些情况下,我们会遇到 Shapely 错误,在这种情况下,我们可以尝试使用以下命令
- pip install imgaug — upgrade — no-deps
我们将拍摄一张图像,并使用基本的数据增强技术对其进行转换实践。
导入所需的库:
- import imageio
- import imgaug as ia
- import imgaug.augmenters as iaa
- import numpy as np
- import pandas as pd
- import matplotlib.pyplot as plt
- import matplotlib.patches as patches
- import matplotlib
- %matplotlib inline
我们使用 imageio 显示原始图像
- image = imageio.imread(“.\car2.jpeg”)
- ia.imshow(image)
我们可以通过指定旋转角度来旋转图像。我们将图像旋转 -50 度到 30 度
- rotate=iaa.Affine(rotate=(-50, 30))
- rotated_image=rotate.augment_image(image)
- ia.imshow(rotated_image)
我们将从高斯分布采样的不同噪声值添加到图像。
- gaussian_noise=iaa.AdditiveGaussianNoise(10,20)
- noise_image=gaussian_noise.augment_image(image)
- ia.imshow(noise_image)
修剪会删除图像侧面的像素列 / 行。在下面的示例中,我们将图像的一侧裁剪了 30%
- crop = iaa.Crop(percent=(0, 0.3)) # crop image
- corp_image=crop.augment_image(image)
- ia.imshow(corp_image)
设置 0 到 40 度
- shear = iaa.Affine(shear=(0,40))
- shear_image=shear.augment_image(image)
- ia.imshow(shear_image)
我们可以垂直或水平翻转图像。Fliplr 水平翻转图像
- #flipping image horizontally
- flip_hr=iaa.Fliplr(p=1.0)
- flip_hr_image= flip_hr.augment_image(image)
- ia.imshow(flip_hr_image)
- flip_vr=iaa.Flipud(p=1.0)
- flip_vr_image= flip_vr.augment_image(image)
- ia.imshow(flip_vr_image)
我们使用 GammaContrast 通过缩放像素值来调整图像亮度。在 gamma =(0.5,2.0)范围内的值似乎是明智的。我们也可以使用 SigmoidContrast 或 LinearContrast 来更改图像的亮度
- image = imageio.imread(“.\img Aug\car2.jpeg”)
- contrast=iaa.GammaContrast(gamma=2.0)
- contrast_image =contrast.augment_image(image)
- ia.imshow(contrast_image)
我们可以使用缩放来放大或缩小图像。我们已将图像缩放到图像高度 / 宽度的 150%至 80%。我们可以独立缩放每个轴
我们绘制边界框以进行对象检测。当我们放大图像时,我们希望包围盒也相应地更新。
imgaug 支持边界框。当我们旋转,剪切或裁剪图像时,对象周围的边界框也会相应更新。
从 imgaug 导入边界框
- from imgaug.augmentables.bbs import BoundingBox, BoundingBoxesOnImage
初始化原始图像周围的边界框
- bbs = BoundingBoxesOnImage([
- BoundingBox(x1=10, x2=520, y1=10, y2=300)
- ], shape=image.shape)
在原始图像上方显示边框
- ia.imshow(bbs.draw_on_image(image, size=2))
在下面的代码中,我们使用 translate_percentage 移动图像,扩大边界框并将其应用于图像上
- move=iaa.Affine(translate_percent={"x": 0.1}, scale=0.8)
- image_aug, bbs_aug = move(image=image, bounding_boxes=bbs)
- ia.imshow(bbs_aug.draw_on_image(image_aug, size=2))
边框有时可能会超出图像,因此我们需要其他代码来处理这种情况
我们旋转图像,并尝试在对象周围绘制边框
- rotate_bb=iaa.Affine(rotate=(-50, 30))
- image_aug, bbs_aug = rotate_bb(image=image, bounding_boxes=bbs)
- ia.imshow(bbs_aug.draw_on_image(image_aug, size=2))
边界框的部分在图像外部。在下面的代码中,我们将将边框完全或部分移出图像
裁剪部分位于外部的边界框,使其完全位于图像内部
我们创建一个 padding 函数,以 1 像素的白色边框和 1 像素的黑色边框填充图像:
- def pad(image, by):
- image_border1 = ia.pad(image, top=1, right=1, bottom=1, left=1,
- mode="constant", cval=255)
- image_border2 = ia.pad(image_border1, top=by-1, right=by-1,
- bottom=by-1, left=by-1,
- mode="constant", cval=0)
- return image_border2
然后,我们在图像上绘制边界框。我们首先将图像平面扩展 BORDER 像素,然后标记图像平面内的边界框
- def draw_bbs(image, bbs, border):
- GREEN = [0, 255, 0]
- ORANGE = [255, 140, 0]
- RED = [255, 0, 0]
- image_border = pad(image, border)
- for bb in bbs.bounding_boxes:
- if bb.is_fully_within_image(image.shape):
- color = GREEN
- elif bb.is_partly_within_image(image.shape):
- color = ORANGE
- else:
- color = RED
- image_border = bb.shift(left=border, top=border)
- .draw_on_image(image_border, size=2, color=color)
- return image_border
现在,我们对图像应用相同的旋转并绘制边界框
- rotate=iaa.Affine(rotate=(-50, 30))
- image_aug, bbs_aug = rotate(image=image, bounding_boxes=bbs)
- image_after = draw_bbs(image_aug, bbs_aug.remove_out_of_image().clip_out_of_image(), 100)
- ia.imshow(image_after)
本文名称:Python中的图像增强技术
浏览路径:http://www.csdahua.cn/qtweb/news20/300120.html
网站建设、网络推广公司-快上网,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 快上网