原文:
www.kdnuggets.com/2022/08/evolution-artificial-intelligence-machine-learning-data-science.html
图片由 DeepMind 提供,来源于 Unsplash
近年来,在人工智能(AI)、机器学习(ML)和数据科学领域取得了许多突破和发现。这些领域交叉如此之多,以至于它们变得同义。不幸的是,这导致了一些模糊性。
1. 谷歌网络安全证书 - 快速进入网络安全职业。
2. 谷歌数据分析专业证书 - 提升你的数据分析技能
3. 谷歌 IT 支持专业证书 - 支持你的组织的 IT 需求
本指南旨在通过定义术语并解释它们如何应用于商业和科学来澄清混乱。我们不会深入讨论这些内容;但是,到本文末尾时,你应该能够区分这些概念。
作为一个领域,人工智能专注于创建灵活的自动化系统。人工智能的终极目标是建立能够像人类一样智能和独立运作的系统。因此,人工智能必须能够模仿人类的一些感官。
它们必须至少能够听、看,有时还能感知触觉和嗅觉。然后,人工智能必须能够解释通过这些感官接收到的刺激并做出相应的反应。因此,人工智能领域及其分支致力于赋予机器和系统这些能力。
人工智能的主要分支包括:
-
机器学习(ML)
-
深度学习(DL)
-
自然语言处理(NLP)
-
模糊逻辑
-
专家系统
-
神经网络
这些概念并不是人工智能的独立领域,而是使现代和未来的人工智能实现成为可能。
人工智能的三个阶段如下:
-
人工狭义智能(ANI)是当前人工智能的发展阶段。它也被称为弱人工智能,描述了能够执行有限一组定义任务的人工智能系统。
-
人工通用智能(AGI):我们正在慢慢接近这一阶段,也称为强人工智能。它描述了能够像人类一样进行推理的人工智能。一些学者认为 AGI 标签应仅限于有感知的人工智能。
-
人工超级智能(ASI):这是一个假设的人工智能阶段,其中计算机的智能和能力超越了人类。目前,ASI 仍然存在于科幻领域之外。
上述信息对于商业用户来说可能显得有些术语化和深奥。这些在现实世界中如何转换,又是如何应用人工智能的?
-
图像处理在照片编辑软件中的功能
-
客户参与服务
-
社交媒体算法
-
在线广告平台
-
通过自然语言处理提供的翻译
-
机器人流程自动化(RPA)
-
营销和产品使用分析
-
视频和文本游戏中的非可玩和敌对角色
-
人工智能在增强现实(AR)中的提升
-
销售和趋势预测
-
自动驾驶汽车
-
交通检测
机器学习(ML)这个术语通常与人工智能互换使用。虽然它们不是同一个概念,但它们紧密相关。
应用程序和软件在代码上运行,这些代码大多是固定的。代码中包含的参数集有限,只能在程序员编辑或添加时进行更改。机器学习旨在使计算变得更加灵活,允许软件随意更改其源代码。这类似于人们学习新事物时,大脑结构会发生细微而剧烈的变化。
机器学习的四大主要分支是:
-
有监督学习
-
半监督学习
-
无监督学习
-
强化学习
当然,还有一些子集和新范式,如强化学习、降维等。机器学习通常是通过模型来实现的。
-
人工神经网络
-
决策树
-
支持向量机
-
回归分析
-
贝叶斯网络
-
遗传算法
-
联邦学习
-
强化学习
深度学习是机器学习的最知名和最常用的子集之一。它本质上由一个多层神经网络组成。神经网络试图通过密切模仿人脑的结构来模拟认知。它们被认为是实现通用人工智能(AGI)的最可行路径。
机器学习在商业和消费者产品中的一些应用示例包括:
产品推荐无疑是机器学习和人工智能中最流行的应用之一——特别是在电子商务领域。在这一应用中,商家的网站或应用程序会跟踪你的行为,基于你的活动使用机器学习。这些活动可能包括你的以前购买记录、搜索模式、点击、购物车历史等。商家随后会使用算法生成个性化的产品推荐。
在金融和银行领域应用机器学习后,金融机构能够发现隐藏的模式、检测可疑活动,并在为时已晚之前预见到文书错误。科技咨询公司 Capgemini 声称,经过良好训练的机器学习解决方案可以将所有欺诈事件减少70%,同时将交易准确率提高 90%。
机器学习提高了医疗诊断中异常检测的准确率,使医疗从业者能够做出更准确的诊断。最近,机器学习驱动的软件被证明能比经验丰富的医生更准确地诊断患者。它通过处理医疗记录和实时评估变化参数来实现这一点。其快速适应环境变化的能力是机器学习在医疗保健领域的最大优势之一。
数据科学是一个广泛的术语,指的是数据管理的所有方面,包括收集、存储、分析等。因此,这是一个涉及多个学科的领域,包括:
-
统计学
-
信息学
-
数据分析
-
计算机科学
-
数学
-
领域知识
-
信息科学等
每天(全球范围内)生成的估计2.5 万亿字节的数据中,很多数据是非结构化且噪声很大。数据科学家的大量精力用于结构化、排序并从这些数据中获得洞见。
因为数据科学是一门多学科的科学而非一个概念,所以它不能像人工智能和机器学习那样进行分类。然而,在我们探讨它在商业环境中的应用之前,让我们扩展一下数据科学中涉及的不同职业。
一些最常见的数据科学家类型包括:
-
机器学习科学家
-
数据工程师
-
软件工程师
-
精算科学家
-
统计学家
-
数字分析师
-
商业分析师
-
空间数据科学家
-
质量分析师
建议数据科学家必须能够开发软件(代码)、使用分析工具和软件、开发预测模型、分析数据完整性和质量,并能够优化数据收集流程。
数据科学对于企业来说是极其有用的工具。每天生成的大量数据都是潜在的消费者数据。例如,机器学习实现可以处理旧的医疗记录或观察并收集用户行为信息。这是一种数据挖掘。数据科学在商业中的其他应用包括:
-
定向广告:像 Google、Facebook 和百度这样的公司主要通过数字广告赚取收入。无论是经营博客还是在线商店,你都可以利用数据科学在发布定向广告活动之前进行客户细分或聚类。执行聚类和分组的最佳方式是通过无监督的机器学习模型。
-
库存管理的销售预测:你可以利用数据科学预测模型来预测未来的销售情况。预测模型试图基于历史数据预测未来的销售。
-
电商推荐引擎:你可以利用数据科学根据顾客的购买历史为忠实顾客构建定制的产品推荐。
数据科学(主要通过数据分析实现)也可以用于商业智能。公司可以从数据仓库中提取有价值的洞察,并利用这些洞察做出明智的商业决策。
上述指南作为一个简单的入门书,主要突出人工智能、机器学习和数据科学之间的区别,以及它们如何在商业环境中应用。要了解更多关于这些主题的信息,你可以访问 KDnuggets 网站上许多相关的指南和文章。
Nahla Davies 是一位软件开发人员和技术作家。在全职从事技术写作之前,她曾管理——在许多有趣的工作中——担任过一家 Inc. 5,000 体验品牌组织的首席程序员,该组织的客户包括三星、时代华纳、Netflix 和索尼。