在李世石两战告负后,人工智能界相对平静,但围棋界却反响激烈。似乎围棋这个被认为是天才的领域被冒犯了。因为围棋需要大量直觉思维,需要在人类逻辑推理难以企及的巨大不确定空间做出最优决策。 其实,无论是“阿尔法围棋”(AlphaGo)赢,还是李世石赢,双方都是一个学习的过程。人工智能开始深度学习,而人类也从与机器的较量中不断学到新知,不断成熟心智。 各有优劣 博弈不限于棋局 曾打败李世石的中国九段柯洁放言:就算“阿尔法围棋”战胜了李世石,但它赢不了我。去年樊麾落败后曾感言,因为我们是人,人类有时会犯大的错误,会疲惫,会因为太想赢而有压力,但程序不会,它强大而且稳定。 据今年1月《自然》杂志上的论文介绍,“阿尔法围棋”的程序使用蒙特卡洛树搜索算法,并引入了两种神经网络技术,通过“值网络”评估大量位置的价值,通过“策略网络”选择落点。研究人员让“阿尔法围棋”模仿人类学习的过程,观看学习人类专家的对弈布局,训练这些深度神经网络,还自己跟自己下棋以增强学习。利用这种搜索算法,“阿尔法围棋”在和其他围棋程序的对弈中获胜率达到99.8%。 即使人工智能在各类游戏中击败人类,也并不意味着机器比人类更智慧。大多数人工智能系统是“专才”,只能完成一种特殊任务。虽然在理论上,“阿尔法围棋”学习围棋的方法和人类的学习过程一样,有很强的通用性,但要从“专才”变成“通才”,还有很长距离。 “阿尔法围棋”创始人德米什·哈萨比斯说,DeepMind的目标就是开发出人工通用智能(AGI)系统,要实现这一目标还有许多挑战。尤其是这种程序尚不能有效地把一种学习系统如围棋,转变成另一种新任务系统。而人类却能在各种学习任务之间无缝转接。“目前,我们还不知道怎样做到这一点。” (责任编辑:admin) |