文本数据增强技术 技术杂谈

文本数据增强技术

文本增强技术学习:链接 数据类别不均衡,导致模型对于小样本类别往往处于欠拟合状态 针对小样本进行数据扩充 处理方式方面分为两个方面: 不变语义,更改表达方式 对原文进行策略调整,如同义词替换 回译技术...
阅读全文
高质量数据科学竞赛平台汇总 技术杂谈

高质量数据科学竞赛平台汇总

前言 学习过机器学习算法的小伙伴大多数都听说过“打比赛”,一些同学自己参与过一些比赛项目,从中获益匪浅。今天来详细罗列一下国内外的比赛平台,方便即时找到自己感兴趣的项目。 1. kaggle 一个比较...
阅读全文
CRNN翻译 深度学习

CRNN翻译

摘要 ​ 基于图像的序列识别一直是计算机视觉中长期存在的研究课题。在本文中,我们研究了场景文本识别的问题,这是基于图像的序列识别中最重要和最具挑战性的任务之一。提出了一种整合 特征提取,序列建模和转录...
阅读全文
xgboost做二分类,多分类以及回归任务 机器学习

xgboost做二分类,多分类以及回归任务

1.简介 该部分是代码整理的第二部分,为了方便一些初学者调试代码,作者已将该部分代码打包成一个工程文件,包含简单的数据处理、xgboost配置、五折交叉训练和模型特征重要性打印四个部分。数据处理部分参...
阅读全文
双边滤波原理及python实现 计算机视觉

双边滤波原理及python实现

双边滤波(Bilateral filter)是一种非线性的滤波方法,是结合图像的空间邻近度和像素值相似度的一种折衷处理,同时考虑空域信息和灰度相似性,达到保边去噪的目的。具有简单、非迭代、局部的特点。...
阅读全文
高斯滤波原理及python实现 计算机视觉

高斯滤波原理及python实现

高斯滤波器时一种线性平滑滤波器,主要适用处理高斯噪声,所以在了解高斯滤波之前,我们首先熟悉一下高斯噪声。噪声在图像中表现的通常是引起视觉效果的孤立像素点和像素块,简单说噪声点就是会给图像带来干扰,让图...
阅读全文