我认为管理层取代人类太早了。但可以想象,当你走出一个繁琐的过程时,你就没有时间做更多的事情了。从另一个角度来看,只能做这种工作的人会更担心,所以我认为每个人至少应该培养一种不能被电脑取代的能力。这是未来人类进化的一个重要方向。
一段时间前,美国联合航空公司遇到了一个人。如果你是它的基金经理,你会先做什么? 首先要做的是检查世界上有多少主要基金持有人以及谁是他们的顾问。你应该首先找出它背后复杂的关系。这些东西都有数据,但数据不一定易于阅读和查询。一个非常重要的概念是知识地图。知识地图并不新鲜。区别在于图形效果是手动构建的还是计算机捕获的。
目前,深度学习使图像和文本成为可能。例如,我们正在谈论视觉任务。我给你一张图片。你必须写文字告诉我图片是关于什么的。他必须识别内容并将其转换为文本。未来还有什么可能? 既然我们能看到这样的图片,我们今年的比赛就有一个非常重要的话题,那就是让机器阅读K我们准备了成千上万张图片来阅读。但如果我们不给他价值,我们希望我们能找到我们不能注意的规则。
深层规则告诉我什么?每个人都能认出这是一只长颈鹿。你为什么能认出它? 是因为颜色吗? 是因为条纹吗? 性别。人们可以识别许多非常低级的特征。为什么我们找不到从图片中购买股票的机会,因为这些不是我们习惯的。
我刚才谈到了深度学习和所谓的机器人顾问。我认为还有很多不同。为什么 AlphaGo 击败了李世石,因为它使用了强化学习和其他技术。强化学习的一个非常重要的部分是通过互动实现战略优化的目标,即关键不是预测股价,而是赚钱。
AlphaGo和李世石有什么区别? 你演奏的每首歌都受到以前教育的限制。例如,这项工作在这里不好,或者在哪里不优雅,在哪里好。但计算机根本不在乎。计算机只关心我想赢,不管中间过程是什么。我们在这方面的目标是让它获得最高的利润,所以在这个过程中,我们可以使用强化学习来使计算机学习最好的策略。
有很多有趣的学习名称,比如模仿学习和学徒学习。事实上,他们都告诉你,从零开始学习太慢了。从模仿人开始是最快的。2008年全球股市崩盘期间,你的电脑还能做得更好吗? 电脑是怎么做到的? 其实它的概念是,只要在虚拟空间里,就可以进行1亿次随机交易,时间和金额都是随机的。能不能在这1亿次中找到最优解,是的。但是每笔交易能不能算一亿次,当然不能。因此,深度学习的作用在于如何优化过程的网络结构,不用数亿次就能知道最佳点在哪里。
这是。这是DQN,重点是两个不同的功能,AlphaGo是标准的DQN。一个被称为战略功能,它决定了如何与真实环境互动,以及外部环境将如何影响我。阿尔法狗用它来判断对手的行为。价值函数预测了这个操作将如何改变我未来的收入,所以我可以用它来找到最好的解决方案。
如何找到最好的解决方案,你可以帮助我们计算最少的数量,这可以帮助我们通过深度学习。定量交易的本质是预测股价,而深度学习的本质是让计算机学习如何找到最好的策略。这两件事完全不同。