java linux mysql Windows 编程 php nginx wordpress Python centos 云计算 shell 微软 Ubuntu Firefox apache 程序员 Android 开源 google

人工智能的今天

人工智能早在计算机学伊始时就已经产生,它最早是在1956年被作为一门学术学科建立起来。从那时起,科学界就认为每个十年左右就会在此方面有大的突破性进展。在1940年的神经学研究中,人们就已经发现人类的大脑实际上就是一条神经网络, Alan Turing 表示基于此概念,建造一个电子大脑是可行的。1951年,一个24岁的研究生, Marvin Minsky 建造了世界第一个神经网络机,这台机器也被称为 SNARC  它同时也是史上第一台人工自我学习机器。

但是,如果在那时我们就已经有了关于人工智能正确的概念,那为什么人工智能在近年来才突然崛起呢?其实是因为类似的程序需要极其庞大的计算能力,早年的逻辑运算只要依靠遍历树算法,这也使得当时的计算复杂性较现今的技术成爆炸式的增长。数学中,我们称它为组合爆炸,意思是作为组合性考虑的结果,所构成大系统种类可能的数目,比原有子系统的数量惊人地扩大。所以在当时,启发式算法被作为重点倾注了大量的精力,用来寻找更快速地解决问题的方法,为求速度,只有牺牲全面性和准确性。启发性算法帮助我们将备选项的的数量有指数级降低到多项式级。总的来说,启发式算法十分有效,但也并不保证适用于所有地方。

人工智能的威胁

近年来,大量的媒体聚焦在人工智能的优势上面,特别是在非武装无人机以及武器技术上。这确实是理所当然的,美国军方投入空前庞大的的资金在自感知机器人上面。一些学术界大咖领袖,包括物理学家 Stephen Hawking ,企业家 Elon Musk  以及亿万富翁,大慈善家 Bill Gates  近期共同发表了一封公开信来阐述如果我们不对人工智能技术的开发极端谨慎,它将会给我们人类所带来的危害。他们都认为,人工智能的创造是人类历史上浓墨重彩的一笔,但是如果我们不学会如何规避其带来的风险,恐怕它也可能将是人类史上最后一个大事件了。

那么,对于人工智能,我们应该有多害怕呢?我认为他们的顾虑确是合理的,但是我们日常所接触的大部分的人工智能属于弱人工智能。举例说明,平日里我们用来在两个地点间选取最有效路线的实时GPS地图应用就是一个弱人工智能。这种应用确实能以较人类千倍以上的速度完成路线规划,但是你会说它是在思考吗?不会,而这也正是与上述顾虑相悖的地方。

他们其实顾虑的是人们所说的强人工智能。那是一种能够自主思考的人工智能,也许还有意识和做决定的能力。有些科学家认为到了2025年,我们的人工智能将会和一个人类一样聪明,而到了2040年,单个人工智能的智慧也许将会是整个人类智慧的总和。这一个关于人工智能的问题也许可以分成两个,第一个是如何创造这种智慧,第二个是如何给人工智能一个安全的制约,或如何给它们一个等同于人类的价值。如果我们能够先将第二个问题解决,我们就没有任何问题需要担心。但是现在发生的一切也只是臆测,但是我也确实认为未知的才是可怕的。

“巨大的改变即将要来临。工作、企业,甚至整个行业将会被重新改写。”

  Paul Roetzer, CEO @pr 20/20

人工智能的今天

硅谷巨头Google和Facebook如今也正乘着人工智能发展的巨大浪潮。Google以4亿美金的价格收购人工智能公司DeepMind,现今也正对这项技术进行试验。Facebook使用人工智能对图片中人脸进行识别。然后我们也知道Google的全自动驾驶汽车能够安全无事故行驶100万英里。你的安卓手机能够知道你上班的路径,并且提醒你沿路是否通畅或者你所乘的巴士是否晚点。如果我在网上搜索周末去伦敦的旅游行程,那么Facebook和网上的其他页面就会被旅行广告所充斥。人工智能现在真正的是无处不在,我敢打赌未来的全球500强企业一定会沿用这个方程:拿掉X,加入AI。

但这仅仅是开始。所有的云服务业巨头,外加十多个初创企业,争先恐后的想启动一个像Watson(IBM的最新计算机系统)认知服务,语音识别软件,基本上所有与人工智能有关的东西。根据数量分析公司Quid的分析,人工智能从2009年起已经吸引了超过170亿美金的投资。单单2014年,就有20亿美金分别投资在322家公司的人工智能相关的技术上。

Facebook和Google早已开始招募研究员来壮大它们的人工智能研究团队。Yahoo, Intel, Dropbox, LinkedIn, Pinterest, 以及Twitter也从去年开始收购人工智能公司。过去的这四年中,在人工智能方面的私人投资平均每年增长了62%,这种迅猛增长的势头应该还会持续下去。

所以这一切对于我们来说意味着什么呢?难道我们就只能坐等硅谷大公司开发这项技术然后席卷整个市场份额吗?好吧,老实说答案是对也不对,这一切主要取决于你想做什么。创造一个人工智能需要巨大的资源和数据,自然,数据越多,人工智能就会越聪明,所以某些大的企业就有了竞争优势。比如所有人都会使用Google的搜索服务,所以它拥有最大量、最优质的数据来支持它的研究。因此我认为最终仅会有两、三家公司会制造出完善的人工智能。就像因特网就是冷战的产物一样,我们也可以从对人工智能的研究中获得很多其他的新技术。我们可以使用人工智能服务,利用人工智能的组件来探索、建立自己的构架,例如,机器学习或者深度神经网络。

深度神经网络

 “ 神经网络和深度学习至今能够给图像识别  语音识别和自然语言处理中产生的问题提供最好的解决途径 。-  Michael Nielsen 

人工神经网络的训练方式是通过向它展示大量的训练范例,然后逐渐对网络参数进行调整,直至它能够反馈出令人满意的分类。一个典型的网络是由10-30层人工神经元堆积架构而成的。举例说明,当将一个图片信息发送给一个神经网络时,输入层接收信息并且进行低层次的处理后将结果输出给下一个层级,周而复始,直到到达最后一个层级,来决定该图像的分析结果。

 “ 神经网络的一个挑战是要理解在每一层到底都发生了什么事。我们知道在(经过)训练之后,每一层会逐步提取越来越高级的图像特征,直到由最后一层做出显示为何的决定(本质上)。例如,第一层也许在寻找边缘或拐角。中间层分析基本的特征来寻找整体形状(即大体轮廓)或其组成部分,比如一扇门或一片叶子。最后几层将那些(要素)组合成完整的解释——(如此,)这些神经元对非常复杂的东西诸如整个建筑物或树木就有了反应。 

  Alexander Mordvintsev

机器学习

深度神经网络是深度学习的一个分支,也就成为机器学习中的一个分支。同样机器学习也属于人工智能的一个分支。此时此刻,机器学习是最实用、最有效的一个人工智能的分支。从定义上来说,机器学习探索和学习算法的结构,从而达到通过数据来学习和预测的目的。机器学习算法舍去了跟随编程中传统的严格逻辑,取而代之的是根据事例输入的模型来依照数据来做预测和决定。依照学习输入的本质,这些学习任务通畅被划分成三个大类, 它们分别是:

监督式学习: 这种学习算法是利用训练集合,指定理想的输入和所期望的输出来得到一个模型, 然后利用这个模型,将测试集合中的所有的输入映射为相应的输出,用来教授从输入映射到输出的一般规则。

非监督学习 :这种学习算法并不指定理想的输入和所期望的输出,直接对数据进行分析,令算法给出自己的解读结果。然而,你可以给它提供分组数据,以帮助它达到更有意义的结论。

强化学习  从人类学习的方式得到启发,该学习算法的仅仅指定了目标和一个动态交互环境,没有任何关于它是否已接近其目标的输入,该算法也会学习它各行为的后果。

其实大家也不需要把机器学习想的那么复杂。一个非常简单但是却很实用的例子来解释机器学习就是利用线性回归的概念。简单来说,你在所有的结果集合中取大量的数据点,然后尝试找到一条最符合该数据集的线性近似线。这篇文章的目的其实也并不是教授大家某一个具体的操作方式。我觉得,只要我们有足够的创造力,我们可以在几乎所有的我们正在开发的应用中找到人工智能的身影。举例来说,在反诈骗侦查和信用风险的评估中查找异常行为,或者电商应用中的动态定价和产品推荐,或者Spotify中根据用户所听过的歌曲来推荐新的歌曲。他们所做的实际上就是运用深度神经网络来分析每首音乐,然后根据结果来向用户进行推荐。所以,它其实需要的不仅仅是海量的云数据!

“它将会更注重音乐本身。你将能够通过音乐内容本身来搜索,而非通过音乐所附的文字信息。”- – Nicola Montecchio,  深度学习 总监 @Spotify

总结

我个人认为, 这些概念很多都十分容易理解,如果想要像开发人员一样保持身在其中,我们就需要在这些相关技能开始进行投资。我们正在逐步走向一个真正的大数据世界,想要保持竞争力,高效的分析技术在这个时代是必不可少的。请想象一下,使用这一技术,我们在应用程序中是可以创建怎样的的用户体验!

现在我想告诉大家一些我所做过的事情。我曾经在瑞典最大的数据电信公司工作过,他们的账单和客户信息储存在一个经济系统中,而他们将客户使用宽带网络的相关费用记录在另一个特制的系统中。然而,他们并没有将每条客户信息和客户使用宽带网络的费用关联起来,更糟糕的是,这里有成千上万的实体需要关联起来,所以他们没有办法靠人工处理。常规的脚本也无法解决这个问题,因为大部分的数据是手写的,有大量的拼写错误,并且因为该公司依照每个客户对网络的需求不同来调整相关费用,所以也并没有具体的规律可循。于是,我和我的前同事制造了一个人工智能程序来为每一个实体进行有根据的推测。这个程序能够一次性正确关联90%的数据,而剩下的10%则与相关的错误信息相关联,当然,有些资源数据无法关联是因为可能根本没有客户在使用它!

所以到最后,到遇到真正的业务问题,无法找到简单地解决方案,运用常规算法又会异常复杂时,我们会使用人工智能来解决。我们想要将人工智能当做我们工具箱中的一个工具,而最先意识到这件事的企业也将会占尽优势,成为行业中的巨头。

延伸阅读

评论