![深度学习从0到1](https://wfqqreader-1252317822.image.myqcloud.com/cover/588/39479588/b_39479588.jpg)
1.4 深度学习的应用
深度学习最早兴起于图像识别,在最近几年可以说是已经深入各行各业。深度学习在计算机视觉、语音识别、自然语言处理、机器人控制、生物信息、医疗、法律、金融、推荐系统、搜索引擎、电脑游戏和娱乐等领域均有应用。
图像识别——图像识别可以说是深度学习最早实现突破性成就的领域。如今计算机对图片的识别能力已经跟人类不相上下。我们把一张图片输入神经网络,经过网络的运算,最后可以得到图片的分类。如图1.15所示,我们可以看到,对于每一张图片,神经网络都给出了5个最有可能的分类,排在最上面的可能性最大。图1.15中的置信度表示的就是该图片的概率值。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_29_2.jpg?sign=1739654485-YNrxex3KZ9aMJyqATP1gb4Br8VFP585D-0-71737ffd90037c1f8c112034cea33b7e)
图1.15 图像识别
目标检测——利用深度学习我们还可以识别图片中的特定物体,然后对该物体进行标注,如图1.16所示。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_30_1.jpg?sign=1739654485-PZGFKhvVAGYxq2AkIASsHxn0d44HH0rk-0-315d80dc4ab89dcba356d048e9255650)
图1.16 目标检测[1]
人脸识别——深度学习还可以识别图像中的人脸,判断是男人还是女人,判断人的年龄,判断图像中的人是谁等,如图1.17所示。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_30_2.jpg?sign=1739654485-EhiY1PWhfL7HbQh5WjrgwRu1yL6WrQbQ-0-42613529280f6ddb1bcf76b8d8a49bff)
图1.17 人脸识别
目标分割——目标分割可以识别出图中的物体,并且可以划分出物体的边界,如图1.18所示。
描述图片——把一张图片输入神经网络中,就可以输出对这张图片的文字描述,如图1.19所示。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_31_1.jpg?sign=1739654485-hc7XG9Qra7OKVIVII9v1BVrB1pnyZoEh-0-66c4a601b1ddde5f61124f55765ae984)
图1.18 目标分割[2]
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_31_2.jpg?sign=1739654485-b2viD9ybGnJc7fN2mthFwhuiinV9P37w-0-3a60461fe5f60bdee13fe7dcd2945ffe)
图1.19 图片描述
图片风格转换——利用深度学习实现一张图片加上另一张图片的风格,然后生成一张新的图片,如图1.20所示。
语音识别——深度学习还可以用来识别人说的话,把语音数据转换为文本数据,如图1.21所示。
文本分类——使用深度学习对多个文本进行分类,比如判断一个评论是好评还是差评,或者判断一篇新闻是属于娱乐新闻、体育新闻还是科技新闻,如图1.22所示。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_32_1.jpg?sign=1739654485-bh0RjS9prTkXrQSiorPMZY6HmqQ1sfTy-0-5114a0936655831d9576f21c0c45b021)
图1.20 图片风格转换[3]
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_32_2.jpg?sign=1739654485-5n3kjY7BWusOeyaiKjwwJfub82W24jpz-0-a25c78ab587fef901423866b6c540a38)
图1.21 语音识别
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_32_3.jpg?sign=1739654485-dF6oLh50uQFM9faLr4eS2TXW0r500gFv-0-7b2999261bbb181da0b23e1178846c20)
图1.22 文本分类
机器翻译——使用深度学习进行机器翻译,如图1.23所示。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_33_1.jpg?sign=1739654485-lQ5F6eiNlaaCsNOCjWF4CFHqATR0cbbC-0-ba6d99a7524f1844a4b65705ce49b56a)
图1.23 机器翻译
诗词生成——把一个诗词的题目传入神经网络,就可以生成一篇诗词,如图1.24所示,其就是AI写的一首诗。虽然这首诗有些看不太懂,但是已经“有内味了”。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_33_2.jpg?sign=1739654485-m6z5HaBUIbBPCheIWBBZ8uLCWm4l4uP5-0-9cffcfae2ea171633b02e31c2d28a591)
图1.24 诗词生成
图像生成——深度学习还可以用来生成图片。比如我们可以打开网站https://make.girls.moe/#/,设置好动漫人物的头发颜色、头发长度、眼睛颜色、是否戴帽子等信息就可以生成符合条件的动漫人物,并且可以生成无数张不重复的照片,如图1.25所示。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_33_3.jpg?sign=1739654485-q3XcSdIk6BSeqAarGoOZUxjZOv0RkeQF-0-a0ab1cc3a531b126793aafdd5b2197e9)
图1.25 图像生成
这里只是列举了非常少量的例子,深度学习的已经逐渐深入各行各业,深入我们的生活中。