自然场景文本检测算法研究

978-7-115-58387-1
作者: 赵雪专李玲玲刘粉林罗向阳
译者:
编辑: 贾鸿飞
分类: 算法

图书目录:

目 录

第 1章 绪论 1

1.1研究背景 1

1.2 问题与挑战 3

1.3主要研究内容 5

1.4 本文的组织结构 5

第 2章 场景文本检测算法综述 7

2.1简介 7

2.2场景文本检测和识别过程概述 8

2.3场景文本检测和识别算法分类 10

2.3.1基于传统机器学习的场景文本检测和识别算法 10

2.3.2基于深度学习的场景文本检测和识别算法 28

2.4文本检测和识别的评价指标 41

2.5文本检测和识别的数据集 42

2.5.1 ICDAR数据集 42

2.5.2 SVT数据集 44

2.5.3 IIIT数据集 45

2.5.4 KAIST数据集 46

2.5.5 CTW数据集 46

2.5.6 RCTW-17数据集 47

2.5.7 ICPR MWI 2018数据集 48

2.5.8 Total-Text数据集 48

2.5.9 Google FSNS数据集 49

2.5.10 COCO-TEXT数据集 49

2.5.11 Synthetic数据集 50

2.6 总结 50

第3章 基于融合网络的TSFnet模型 52

3.1 问题形成 52

3.2 相关研究 52

3.2.1基于回归的模型 53

3.2.2 基于分割的模型 53

3.3 TSFnet 54

3.4实验 60

3.4.1评价指标 60

3.4.2 参数设置 60

3.4.3 结果与分析 61

3.5 本章小结 64

第4章 结合区域建议网络与注意力网络的Mnet算法 66

4.1 问题形成 66

4.2 相关研究 66

4.2.1基于回归的模型 66

4.2.2 基于分割的模型 67

4.2.3 两阶段检测模型 67

4.3 Mnet 68

4.3.1 Scale-RPN 69

4.3.2回归网络 70

4.3.3 分割网络 70

4.3.4 注意力网络 71

4.4 实验 72

4.4.1评价指标 72

4.4.2参数设置 72

4.4.3实验对比与分析 73

4.5 本章小结 75

第5章 场景文本检测与识别应用 77

5.1卡证文字检测与识别 77

5.1.1证件文字检测与识别 77

5.1.2 银行卡文字检测与识别 79

5.1.3 名片文字检测与识别 79

5.1.4 营业执照文字检测与识别 80

5.2票据文字检测与识别 80

5.3汽车场景文字检测与识别 81

5.3.1 车牌检测与识别 81

5.3.2 汽车VIN码检测与识别 83

5.4 文档文字检测与识别 83

5.5 自然场景文字检测识别 84

第6章 总结与展望 86

6.1 总结 86

6.2展望 86

参考文献 88

详情

以深度学习为基础的文本检测算法有基于回归的模型和基于分割的模型,目前这两种模型的应用效果各有优劣。为解决回归模型对训练数据的依赖,以及分割模型受目标尺寸影响的问题,本书提出了两种新的算法:TSFnet和Mnet。 全书分为5章,概述了自然场景下文本检测的研究现状,陈述了相关算法的问题、数据集与存在的挑战,并通过实验,对基于融合网络的TSFnet模型及结合区域网络与注意力网络的Mnet模型进行了详细的介绍,最后对相关的应用进行了简介。 本书结构清晰,文字流畅,图文并茂,适合从事场景文本检测与识别研究的相关读者阅读,也适合作为高校相关专业学生的参考书。

图书摘要

相关图书

大语言模型:基础与前沿
大语言模型:基础与前沿
高级算法和数据结构
高级算法和数据结构
互联网大厂推荐算法实战
互联网大厂推荐算法实战
动手学自然语言处理
动手学自然语言处理
算法详解(卷4)——NP-Hard问题算法
算法详解(卷4)——NP-Hard问题算法
算法详解(卷3)——贪心算法和动态规划
算法详解(卷3)——贪心算法和动态规划

相关文章

相关课程