https://i.ancii.com/zidingxiangyu199/
机器学习,模式识别
本系列我们将总结机器学习基础并研究主要的机器学习算法。我们假设您对机器学习有了基本的接触,我们可能会跳过或仅仅简要介绍某些概念。在计算机科学中,我们把信息量看作是利用事件频率以最有效的编码方案编码信息的比特数。对于均匀硬币,正面编码方案为0b0,反面编码方
本文将简要介绍微软发布的供数据科学家和开发者们使用的最新机器学习工具,其中包括在微软全球开发者大会2019上发布的最新产品。一些人认为其取代了数据科学家的工作,然而AutoML的能力其实是有限的。AutoML当前仅支持解决分类、预测以及回归问题。AutoM
对于一个机器学习工程师来说,最往往会遇到这种情况:需要访问大量数据,但只有些许资源来加注它。处于这种困境中的每个人最终都会经历这样的疑问:当存在有限的监督数据,但有大量未标注的数据时,自己该做什么?本文给出了一个解决方案:半监督学习semi-supervi
在这篇文章中,我们将详细探讨如何评估机器学习模型结果,以及优化超参数的最佳实践。为此,我们将构建一个图像识别模型。模型评估机器学习模型在准备完成预期任务之前必须经过一个学习和训练的过程。在评估数据模型时,准确度是最常用的度量标准。在将数据传递给我们的机器学
“如果一只蝴蝶扇动翅膀”这个短语的变体描述了蝴蝶效应,这个词是由美国数学家爱德华·诺顿·洛伦茨创造的,他最初是这样说的:. “里约热内卢的一只蝴蝶翅膀在大气流中肆虐,两周后可能在德克萨斯州引发龙卷风” -爱德华·诺顿·洛伦茨。然而,训练RNN用于高维系统本
在许多(业务)案例中,同样重要的是不仅要有一个准确的机器学习模型,还要有一个可解释的机器学习模型。通常,除了想知道我们的机器学习模型的房价预测是什么之外,我们还想知道为什么它是这么高/低,以及哪些特征在确定预测时最重要。另一个例子是预测客户流失 - 拥有一
由于大多数算法的统计特性,机器学习存在固有的不确定性。这种不确定性的来源之一是不正确的标签,这是由于数据错误或难以确定正确标签的情况。例如,在回归类型的问题中,我们可以将我们的预测建模为:. 假设它遵循正态分布,我们可以将这情况的贡献写入到似然函数中:.
质量检测自动化的发展趋势是达到人的水平或更高的精度。为了保持竞争力,现代工业公司努力通过自动化实现数量和质量,而不会相互影响。深度学习的使用是多种多样的,从自动驾驶汽车中的物体检测到医学成像的疾病检测,深度学习已经证明可以达到人类水平的准确性和更好。深度学
2018年看到了许多令人兴奋和新颖的GAN应用。受pix2pix的启发,可以创建一个网络来改变源视频中演员的嘴唇动作。介绍给定两个人们说话的视频,我们想在第一个视频中重画嘴唇,以匹配第二个视频中的音频。为了清晰起见,我将这些视频称为source和trans
机器学习最重要的一个方面是它能够识别输出中的误差范围,并能够随着越来越多的数据集通过其神经网络输入而更精确地解释数据。通常被称为反向传播,它是一个不像你想象的那么复杂的过程。有多个任务组成了这台机器,以便你最终得到你想要的。您还可以调整作为此过程一部分的每
测量特征重要性没有灵丹妙药,排列重要性是常用的方法之一。与其他技术相比,它具有以下优点。在训练机器学习模型之后计算置换重要性。因此,对于一个具有高度重要性的特征,这种 random-reshuffle会对机器学习模型预测的准确性造成更大的损害。如果这一列对
本文我们将研究将机器学习应用于营销支出。我们将研究使用营销来预测销售,以及衡量不同营销活动的影响。我们会查看历史支出和销售额,并将每日营销支出与日常销售情况相对应。我们的环境简化为适合作为入门机器学习的学习工具。在这种情况下,我们有很多天的品牌销售,但每天
异常值检测是机器学习中查找具有与期望非常不同的行为的数据对象的过程。这些对象称为离群值或异常。离群值不是由与其他数据相同的机制生成的。财务数据欺诈通信网络中的入侵假新闻和错误信息医疗分析行业损坏检测安全和监视等等离群值检测和聚类分析是两个高度相关的任务。聚
U-NET是基于卷积神经网络,能够产生视觉信息。通过计算训练和明确定义的优化公式,可以获得合理的结果,同时在CT扫描上识别骨骼和肝脏,而无需对超参数进行进一步手动调整。进一步调整可能会带来更好的结果。该技术广泛用于几种不同情况下的医学诊断。来自人体的断层图
我最近开始学习关于主题建模的Latent Dirichlet Allocation,并且惊讶于它有多强大并且同时快速运行。主题建模是使用机器学习无监督学习来提取文档集合中出现的主要主题的任务。在这个数据集中,我事先了解了主要新闻主题,并且可以验证LDA是否
如果您是机器学习的新手,您可能会对这两者感到困惑 - Label Encoder和One Hot Encoder。这两个编码器是Python中SciKit Learn库的一部分,它们用于将分类数据或文本数据转换为数字,我们的预测模型可以更好地理解这些数字。
机器学习的重要方面包括“ 特征选择 ”和“ 特征提取 ”。选择学习算法的输入变量的某个子集的问题,它应该将注意力集中在这个子集上,而忽略其余的。换句话说,降维。作为人类,我们经常这样做!虽然上述两种思想共存,但我们将重点放在特征选择的动机上。用si表示对S
自然语言处理在当今非常流行,在深度学习发展的背景下尤其引人注目。NLP是一个人工智能领域,旨在从文本和基于文本数据的进一步训练中理解和提取重要信息。主要任务包括语音识别与生成、文本分析、情感分析、机器翻译等。在过去的几十年中,只有具有适当语文教育的专家才能
马尔可夫链蒙特卡罗是贝叶斯统计中广泛流行的技术。它用于后验分布采样,因为分析形式通常是不可跟踪的。但是,在这篇文章中,我们将使用它从静态图像/徽标生成动画。顺便提一下,它可以作为MCMC和拒绝采样的介绍。这个想法基于一个伟大的开源软件包imcmc,它基于P
本教程是使用数据科学解决实际问题的端到端示例。根据患者的信息,如血压,体重指数,年龄等,我们将使用机器学习来预测一个人是否患有糖尿病。特别是,本教程包含以下部分。从较大的数据库中选择这些实例有几个约束条件。首先,我们将导入pandas从CSV文件中读取我们
0 关注 0 粉丝 0 动态
Copyright © 2013 - 2019 Ancii.com
京ICP备18063983号-5 京公网安备11010802014868号