https://i.ancii.com/lipengcn/
研究方向:机器学习,深度学习,计算机视觉,图像处理,计算机算法等等
近日,2020 年度 IEEE 冯诺伊曼奖项结果正式公布。机器学习泰斗 Michael Jordan 摘得本年度奖项,获奖理由为「对机器学习和数据科学的重大贡献」。此外,IEEE 创始者奖章、 Jack S. Kilby 信号处理奖章等多项荣誉也已一并颁布
李航老师的《统计学习方法》是了解机器学习最好的教材之一,该书从 2005 年开始写作,一直到 2012 年完成,今年 5 月份又上线了第二版。最新版本包含众多主要的监督和无监督学习算法与模型,可以说是机器学习的入门宝典。许多机器学习培训班、互联网企业的面试
用 NumPy 手写所有主流 ML 模型,普林斯顿博士后 David Bourgin 最近开源了一个非常剽悍的项目。超过 3 万行代码、30 多个模型,这也许能打造「最强」的机器学习基石?NumPy 作为 Python 生态中最受欢迎的科学计算包,很多读者
或许每个经历过大学生涯的人都会有这样的感受:曾经努力收集各种课程资料,但在修完一门课程之后却会发现遗漏了很多重点内容。每一代前辈总结出的经验也常常因为无处传承而逐渐遗漏消失。为了减少重复劳动,让我们不再孤军奋战,来自浙江大学、北京大学等国内高校的贡献者们发
今天先来看看图像类,这类验证码大多是数字、字母的组合,国内也有使用汉字的。由于是实验性质的,文中用到的验证码均为程序生成而不是批量下载真实的网站验证码,这样做的好处就是可以有大量的知道明确结果的数据集。当需要真实环境下需要获取数据时,可以使用结合各个大码平
本文将介绍如何使用scikit-learn机器学习库保存Python机器学习模型、加载已经训练好的模型。学会了这个,你才能够用已有的模型做预测,而不需要每次都重新训练模型。本文将分为三部分,分别如下所示。第一部分讲解使用Pickle序列化、反序列化机器学习
学习意味着通过学习或经验获得知识或技能。基于此,我们可以定义机器学习如下 -. 基本上,机器学习的主要焦点是允许计算机自动学习而无需人为干预。机器学习算法帮助计算机系统学习而无需明确编程。这是最常用的机器学习算法。它被称为监督,因为从训练数据集学习算法的过
选自arXiv,作者:Paul J. Atzberger,机器之心编译,参与:路、思。数学在机器学习中非常重要,但我们通常只是借助它理解具体算法的理论与实际运算过程。近期研究人员越来越多地关注将机器学习方法应用到科学、工程应用中。在构建机器学习方法的理论前
机器之心报道,机器之心编辑部。谷歌的 AutoML 每小时收费 20 美元,是不是很肉疼?GitHub 上的一个开源项目为广大从业者带来了福音。这种名为 AutoKeras 的开源 Python 包为昂贵的 AutoML 提供了免费替代品。AutoKera
选自TowardsDataScience,作者:Suvro Banerjee,机器之心编译,参与:Pedro、张倩。在常见的自然语言处理系统中,单词的编码是任意的,因此无法向系统提供各个符号之间可能存在关系的有用信息,还会带来数据稀疏问题。使用向量对词进行
数据清理是数据科学和机器学习中的重要组成部分,本文介绍了如何在 Tensorflow.js中处理 MNIST 图像数据,并逐行解释代码。有人开玩笑说有 80% 的数据科学家在清理数据,剩下的 20% 在抱怨清理数据……一般而言,训练模型通常只占机器学习或数
语义图像分割旨在为图像中的每个像素生成分类标签,是视觉感知中的一个重要任务。卷积神经网络已在解决语义分割任务上取得了很好的效果 [23,6,7,40]。虽然深层神经网络在提取局部特征和利用小感受野进行良好预测方面效果显著,但它们缺乏利用全局上下文信息的能力
机器学习是近年来渐趋热门的一个领域,同时Python语言经过一段时间的发展也已逐渐成为主流的编程语言之一。本书结合了机器学习和Python语言两个热门的领域,通过易于理解的项目详细讲述了如何构建真实的机器学习应用程序。本书适合Python程序员、数据分析人
我们倾向于使用准确率,是因为熟悉它的定义,而不是因为它是评估模型的最佳工具!精度(查准率)和召回率(查全率)等指标对衡量机器学习的模型性能是非常基本的,特别是在不平衡分布数据集的案例中,在周志华教授的「西瓜书」中就特别详细地介绍了这些概念。换言之,随着精度
随着软件开发技术不断迭代升级,AI开发逐渐成为开发者最为关注的发展方向。面对AI开发,建模、训练、优化、应用开发,处处都有难题,迁移成本,分分都要考虑,在转型AI开发的过程中,作为开发者的你,都遇到了哪些问题?不管个人是否向AI转型,对于个人来说,了解AI
在解释机器学习的基本概念的时候,我发现自己总是回到有限的几幅图中。为什么低训练误差并不总是一件好的事情呢:上图以模型复杂度为变量的测试及训练错误函数。贝叶斯定理以他们预测的数据出现的程度成比例地反馈模型。黑色线条表示误分,均方误差以绿色线条表示。最后,想学
在学习过深度学习的基础知识之后,参与实践是继续提高自己的最好途径。本文将带你进入全球最大机器学习竞赛社区 Kaggle,教你如何选择自己适合的项目,构建自己的模型,提交自己的第一份成绩单。本文将介绍数据科学领域大家都非常关心的一件事。事先完成一门机器学习
训练机器学习模型的要点之一是避免过拟合。如果发生过拟合,模型的精确度会下降。这是由于模型过度尝试捕获训练数据集的噪声。本文介绍了两种常用的正则化方法,通过可视化解释帮助你理解正则化的作用和两种方法的区别。避免过拟合的方式之一是使用交叉验证,这有利于估计测试
挪威科技大学 Didrik Nielsen 的硕士论文《使用 XGBoost 的树提升:为什么 XGBoost 能赢得「每一场」机器学习竞赛?》研究分析了 XGBoost 与传统 MART 的不同之处以及在机器学习竞赛上的优势。机器之心技术分析师对这篇长达
我认为对抗样本很值得研究,应该引起高度的重视。我认为这是因为很多人将尚未解决的研究问题与现实世界的威胁模型混为一谈。对抗性样本是旨在导致机器学习模型出错的输入。例如,雾天、雪天、停车标志被恶意涂抹或者交叉路口施工等情况。
0 关注 0 粉丝 0 动态
Copyright © 2013 - 2019 Ancii.com
京ICP备18063983号-5 京公网安备11010802014868号