低级人工智能 鹦鹉学舌,重复、模仿
高级人工智能 乌鸦喝水,因果驱动的人工智能
做自己的特色,相当于拿自己的专业知识去 “抢地盘”: 不同背景的人,在同一件事情时,大家各自有各种的优势,做为科学背景出身的人,不要想着去抢计算机出身该做的事情,原因有二,一如果这么做,自己需要付出比计算机人更多时间,学习冗余的知识;二在计算机科学中缺少掌握专业自然科学知识的人,如果自己不利用自己的优势去全力以赴,那么自己很难做出有影响力的工作,人活着一方面是活着,对于现在来说活着就是为了做一些有意义的事情,如果不是这样的话,和你存在不存在区别在哪里。
做自己行业的标准: 这个小标题我看起来真的很大,很没有头绪,但是这应该我奋斗的正确目标,方向大于努力。还要把一句话记在心头,不要指望靠调调别人的代码,就发文章。 不现实,这个赛道也不容易,自己已经有我经历了。要用一个架构把一个领域的问题统一起来。比如:薛定谔方程。
人工智能现状: “非基础学科” 领域不需要作出颠覆性的科学发现,多数时候只需要在已有的基础科学理论的基础上,基于已有的数据找出一定领域中变量之间的‘模式’即完成了科学发现。
但在一些 “基础学科” 领域,科学发现并不仅仅是找到数据和经验材料之间的 “联系” 这么简单,更多时候其实是在探索和发现新的变量,而由于人工智能当前更加擅长寻找 “相关性”,所以其在这些邻域应用的深度还不够;另一方面科学研究在多大程度上能够自动化,人工智能在科学发现的过程中能够起到多大的作用,还取决于人类对于科学研究活动和科学发现本质的理解。
名言: " If I have been able to see further, it was only beacuse I stood on the shoulders of giants." --Newton
机器学习数据来源:
- 理论计算可以快速产生大量数据。比较 “廉价易得”,但缺乏 “现实复杂度”。
- 过往的文献和数据库中有大量的数据。数据库的数据是结构化的,比较容易提取,但是文献中的数据是非结构化的,提取这些数据,往往需要具备一定的领域知识。然而手动提取效率太低、时间和经济成本太高。 可以借助自然语言处理技术来提取文献中的数据。
- 实验中获得的数据。非常稀少和珍贵。
深度语句收集:
朱松纯:说到了核心的一个问题,就是我们承认和接受未来社会就是大数据或者说是说不清楚的,而且这个模型就非得这个村,那个模型非得那个店,没有一个统一的说法,这是目前比较流行的说法。但我个人认为,这是一个很大的误区,科学的发展就是寻求最简化的解释,之所以变成现在这个局面,根本上是研究方法出现了问题。
什么意思呢?就是智能如果作为一个客观现象来拟合,那它的模型确实非常复杂。我们原来做了一个简单的判断物理与智能边界的实验(生命度),比如说一个房间里面两个物体碰撞,那是很简单的,几轮参数就可以拟合;但如果是两个人,一个人跑出去另外一个在追逐,有各种各样的社会关系,那物理模型(能量函数、大数据模型)是解决不了的,每一段的智能体运动都要用一个不同的模型来拟合,还是说不清楚。
但是,假设用一个唯心的价值函数,不再是能量函数来描述的时候,非常简单就把它描述清楚了。所以为什么我后来讨论 “理学” 和 “心学”?心学里面讲,“心即是理,心外无物”,它认为世界上那么复杂的智能现象都是由简单的价值观驱动,找到你的价值观,你所有的行为就不复杂。如果我专门去复制你的行为,那就是邯郸学步,拟合是拟合不完的。我一旦搞清楚你的价值取向、你的定位与格局,那你的一切行为都可以被很简单的动机所解释了。
所以我认为,现在整个人工智能,大家还是用原来的一个拟合方式,用大数据的办法想去解释人的所有的主观行为,这是走不通的。
- being 存在
- becoming 变化
- bdlieving 信念
吴家睿:对于青年科学家,我觉得破局涉及到三个方面。第一是涉及到理论的,大部分生命科学家都是在还原论的指导下开展工作,我们现在需要从系统论的角度来做,不然就会研究得越来越细,对一些很细节的事情过分得关注。从研究理论和思维方式来说,光看细节是不够的,要有系统的观点。
第二,研究方法,生命科学现在某种意义上是技术驱动,也有一个趋势就是研究内容追求流量、追求技术,我建议更多提倡思考、提倡理论。
第三,现在功利现象特别严重,要弘扬科学精神,比如日本花样滑冰运动员羽生结弦坚持跳 4A,他不追求金牌,而是追求超越人类极限。我们科学家不要去追求金牌、银牌、铜牌,而是要去跑得更高、更快、更远,奥运会精神应该发扬到科学研究上。福柯在他的自传里说了一段,如果科学不能带我们这些有知识的人走向迷途,那科学还有什么价值呢