Andrew Ng机器学习课程笔记--week11(图像识别&总结划重点)
一、内容概要 Photo OCR Problem Decription and pipeline(问题描述和流程图) Sliding Windows(滑动窗口) Getting Lots of Data and Artificial Data Ceiling Analysis(上限分析):What part of the pipline to Work on Next 二、重点&难点 1. Problem Decription and pipeline 为了实现图像文字识别通常按如下流程图进行操作: 文字侦测(Text detection)——将图片上的文字与其他环境对象分离开来 字符切分(Character segmentation)——将文字分割成一个个单一的字符 字符分类(Character recognition)——文字识别 2. Sliding Windows(滑动窗口) 滑动窗口是一项用来从图像中抽取对象的技术。 假使我们需要在一张图片中识别行人,首先要做的是用许多固定尺寸的图片来训练一个能够准确识别行人的模型。然后我们用之前训练识别行人的模型时所采用的图片尺寸在...
