以知识点为中心建设AI+X微专业

来源:上海高等研究院发布时间:2023-04-28浏览次数:10


        作者及简介:吴飞 陈为 孙凌云 肖俊


        吴飞,教授,浙江大学上海高等研究院常务副院长,浙江大学人工智能研究所所长;研究领域为人工智能和多媒体分析。


        陈为,教授,计算机辅助设计与图形学国家重点实验室副主任;研究领域为可视化和大数据智能。

    

        孙凌云,教授,浙江大学计算机科学与技术学院副院长;研究领域为人工智能和设计智能等。


        肖俊,教授,浙江大学人工智能研究所副所长;研究领域为机器学习和跨媒体计算等。

【摘  要】认知是人类智能的重要表现,其基石和燃料是规范化的知识(如概念、属性和关系等),基于规范化的知识就可形成对学习对象的理解和分类。不同学科之间知识点的交融汇通是向科学本质回归,助力产生科学新的增长点和突破点,人工智能(Artificial Intelligence, AI)在学科交叉中可发挥催化剂和使能器的重要作用。因此,在掌握本学科知识的同时,又掌握人工智能基本技术,具备跨学科潜力和迁移技能的专业人员变得越来越重要。文章探讨了以知识点为核心, “教材出版、课程设立和平台研制”三位一体来建设非计算机专业和非人工智能专业学生AI+X微专业的实践。


【关键词】学科交叉;AI+X微专业;人工智能;知识点


前言


 “科技发展的事实已经表明,重大科技问题的突破,新理论乃至新学科的创生,常常是不同学科理论交叉融合的结果。”[1]学科之间的交叉和渗透在现代科学技术发展历程中推动了链式创新。利用不同学科之间依存的内在逻辑关系,以及学科之间的相互渗透、交叉和综合,可实现科学的整体化,这是知识生产的前沿。学科交叉正在成为科学发展的主流,推动着科学技术的发展。“人工智能作为一种使能技术,天然具有与其他学科研究进行交叉的秉性”[2],从这个意义而言,人工智能可谓“至小有内涵,至大可交叉”。


因此,培养非计算机专业和人工智能专业(本文称为X专业)的学生使之掌握人工智能基础知识和技术手段,是高等学校构建人才优势资源,推动学科交叉的重要使命。针对人工智能所包含的内容过于庞大这一固有现象,本文介绍了以知识点为核心来建设AI+X微专业的思路和实践。AI+X微专业以若干人工智能知识点所构成的一系列微课程,帮助学习者在短时间内获得相对独立完整的人工智能体系化知识。为了说明通过知识点进行交叉专业能力培养的必要性,本文内容包括了知识点概念的早期形成、人工智能知识点历史演变、计算机领域本科教育教学改革试点工作计划(简称“101计划”)中人工智能知识点、AI+X知识点举例和AI+X微专业建设等。


知识点概念早期形成


认知是人类智能的重要表现,其基石和燃料是规范化的知识(如概念和关系等),基于规范化的知识形成对感知对象的辨识和分类,为进一步的智能活动提供基础。认知的英文单词“cognition”来源于拉丁语“cognitio”,表示学习和知识。


认知最重要的一种表现是分类,分类反映的是一个人的认知水平。一个人对周围事物分类越细致周全,越能明晰事物之间的边界和联系,认知就越清晰。为了正确分类,需要将不同知识概念有序组织起来,这涉及知识概念分类体系的规范化研究。早在13世纪末,加泰罗尼亚(现西班牙境内)诗人、哲学家、逻辑学家雷蒙•卢尔(Ramon Llull)提出了对知识进行规范化描述的“知识树”(tree of knowledge)或“科学树”(tree of science[3],这是目前已知最早的一种知识规范化努力。


卢尔所提出的知识树由16部分或16棵树组成。前14棵树分别表示现实世界中某一类别所包含的不同层次知识概念,如原子类、植物类、动物类、感性类、人类、道德类、神类等。另外2棵树分别是示例树(examples)和问题树(questions)。卢尔认为可以从前14棵树中获取概念,然后找到概念对应的示例(即概念的具体描述),接着形成问题以进一步推知现实世界中的未知性质。进一步地,卢尔对每一棵树定义了根、树干、树枝、嫩枝、叶子、花朵和果实等层次化结构。对每一棵树的根定义了一般性原则,诸如善良、伟大、持续、力量、智慧、意志、美德、真理、荣耀、差异、和谐、相反、开始、中间、结束、多数、平等和少数等。从这些一般性原则出发,就可以推知树中其他部分内容。卢尔的知识树给出了人类通过“归纳和演绎”等推理途径来产生新知识的手段和方法,好比笛卡尔(René Descartes)所提出的“人类思想字母表”(alphabet of human thought)。我们对“人类思想字母表”之中符号按照一定规则进行组合等操作,就可构造思想机器,实现思维的计算,从“神学辩论”向“哲学推理”进行飞跃。


卢尔所提出的知识树是一种对人类知识构成和生成的畅想,与人工智能这一使能技术所包含知识点需具有计算属性相去甚远。教育是培养学习者独立思考和判断的总体能力的过程,而不是获取特定的知识。对人工智能这一使能技术而言,所形成的知识点更应该凸显其自然科学属性,即计算属性。


在人类文明发展中,教育本身实际上也经历了由以哲学思辨为原点向以自然科学为原点不断演变发展的进程。1605年,培根(Francis Bacon)出版了《学术的进展》(The Advancement of Learning)这一著作,雄心勃勃地绘制了“人类知识全貌”(the general distribution of human knowledge),对其所处时代的人类知识进行分类规范,根据记忆、想象、理性三种人类能力将人类总体知识划分为历史、诗歌和哲学三个不同领域,其中历史被归于记忆范畴,诗歌被归为想象范畴,哲学则被归为理性范畴。在培根所给出的人类知识分类图谱中,哲学包括了自然神学、自然哲学和人类哲学三个大类。[4]其中,在人类哲学这一类别中,出现了阅读校勘(the art of criticism)和学校学习(school of learning)两个领域,二者用来表示教育中传播和学习人类文明成果的两种不同手段。从此,教育从哲学知识体系中分解出来,成为一门专门的科学。更为重要的是,与当时诡辩哲学所采用的从理论到理论的演绎推理研究方法不同,培根开创性地提出了归纳推理的研究方法,即从观察和实验的事实出发,通过排斥法来发现各种现象之间的关系。这一“经验的实验化”研究方法被马克思所认同,马克思认为其是“英国唯物主义和整个现代实验科学的真正始祖”[5]


在培根将教育从哲学中独立出来且提出了以“理性和实验”为核心的现代科学思想后,人们就开始思考是否可以从实验观察中发现提升教育效果的普遍化规律,进而用计算手段来模拟这些规律,从而使任何地方、任何民族和任何国家所取得的任何新的知识和智能,都可以很快被大多数人所认知,以便更加有效地传承人类创造和积累的知识与精神财富。实际上,不同时代研究者对教育研究范畴所包含的知识点有不同认识,因此在历史上不同学者从个人认识出发,提出了教育中应该关注的知识点。瑞士国家科学基金会(Swiss National Science Foundation)和日内瓦大学于2018年启动了“学科互动历史地图集”(Interactive Historical Atlas of the Disciplines)项目,该项目收集了公元前360年至1967年之间2000多年,由不同研究者提出的一共255个不同的人类知识图谱。[6]统计分析可知,这些知识图谱总共包含了18393个知识领域。分析这255个知识图谱所包含的18393个知识领域,可以发现人类学科知识整体上由以哲学思想思辨为原点向以自然科学实验为原点不断演变发展。


分析这些知识图谱,可发现教育首先被划为哲学范畴,然后归属精神与实践艺术范畴,再后来归属人文科学范畴。同时,教育与心理学、社会学以及历史学联系密切,呈现交叉性、实用性和主观性等特点(如图1所示)。


1 教育研究范畴的历史演变


人工智能知识点历史演变


为了规范计算机专业课程的教与学,美国计算机协会(Association for Computing Machinery,简称ACM)于1968年和1978年发布了计算机科学(Computer Science)课程体系Curriculum 68Curriculum 781985年,ACM和电气电子工程师学会计算机学会(Institute of Electrical and Electronics Engineers Computer Society,简称IEEE-CS)针对计算机科学课程体系成立了一个工作组(task force),共同制定计算机科学的课程体系。这个工作组几乎每隔10年发布一个新的计算机课程体系,目前已经发布了Computing Curricula 1991Computing Curricula 2001Computer Science Curricula 2013Computing Curricula 2020等重要版本。


1968年首次发布的计算机科学课程体系Curriculum 68强调算法思维,认为算法的概念应当和程序的概念清晰地区分开[16]170,并且强调了数学知识的学习(如微积分、线性代数和概率等)[16]163。在1968年的计算机科学课程体系中,“Artificial Intelligent and Heuristic Programming”(人工智能与启发式规划)术语首次出现[16]。回顾历史不由让人心生感叹,睿智学者在计算机专业课程体系形成之初就将人工智能作为重要的知识领域,让后来人能够沿着这一跑道犹如参加马拉松一样“接力前行”。正如ACMIEEE-CS联合工作组在2021年修订人工智能知识领域及知识点时指出:鉴于人工智能与其他领域知识交叉渗透,需要让计算机专业每个学生掌握人工智能基本知识和思维!


ACMIEEE-CS联合成立的工作组认为计算机专业是研究信息描述和转换的系统性算法过程,包括理论、分析、设计、效率、执行和应用。同时,工作组提出了计算科学的根本问题是“什么可以(有效地)自动化?”(What can be efficiently automated?)。1991年,这个工作组发布了计算机课程体系Computing Curricula 1991


ACMIEEE-CS发布的1991版课程体系[17]将计算机课程体系分为11个知识领域,并将人工智能与机器人学(Artificial Intelligence and Robotics)单列为一个知识领域,这说明人工智能在计算机课程体系中从此成为了一个独立的知识领域(如表1所示)。在2001年版[18]2013年版[19]的计算机科学课程体系中,“智能系统”(Intelligent Systems)这一术语取代了“人工智能与机器人学”。


1 ACMIEEE-CS发布的1991版、2001版、2013版计算机课程体系


2001年,ACMIEEE-CS联合工作组发布了计算机科学课程体系Computing Curricula 2001Computing Curricula 2001将计算机科学课程体系分为14个知识领域,其中用“智能系统”来指代人工智能。在这版计算机科学课程体系中,人工智能知识领域相关内容被分为智能系统基础、搜索与约束满足、知识表达和推理、高级搜索、高级知识表达和推理、智能体、自然语言处理、机器学习与神经网络、AI规划系统、机器人学等10个知识点。从2001年开始,人工智能知识点体系架构基本成型。


2013年,ACMIEEE-CS联合工作组发布了计算机科学课程体系Computer Science Curricula 2013。在Computer Science Curricula 2013中,计算机科学课程体系被称为一个“大篷”(big tent),其知识领域被拓展为18个。在这个课程体系中,用来描述人工智能知识领域的“智能系统”包括基本问题、基本搜索策略、基础知识表达和推理、基础机器学习、高级搜索、高级表达和推理、不确定下推理、智能体、自然语言处理、高级机器学习、机器人学、感知和计算机视觉等12个知识点。


2001版和2013版计算机科学课程体系中人工智能知识领域所涵盖的知识点如表2所示。


2 ACMIEEE-CS发布的2001版和2013版人工智能领域所涵盖的知识点


ACMIEEE-CS联合工作组从2021年开始修订人工智能知识领域及知识点。在这次修订中,ACMIEEE-CS联合工作组对人工智能知识领域进行如下修改(如表3所示):1.将智能系统(Intelligent Systems)修改为人工智能(Artificial Intelligence),以回应目前人工智能这一术语被广泛使用的客观情况。2.神经网络和表达学习(representation learning)越来越受到重视,反映了该领域的最新进展。由于搜索在整个人工智能中的关键作用,它仍然被强调,但符号主义人工智能方法略有减少,而倾向于对亚符号方法和习得的表达的理解。3.越来越重视人工智能在诸多方面的实际应用(如医学、可持续性、社交媒体等)。4.该课程反映了理解和评估人工智能方法和应用的更广泛的社会影响和意义的重要性,包括人工智能伦理、公平、信任和可解释性等问题。5.人工智能知识领域包括通过与数据管理的交叉联系与数据科学建立的联系。6.考虑到人工智能与其他知识领域在实践中的广泛联系,每个计算机科学学生都应有明确目标来养成基本的人工智能素养和批判性思维。


3 ACMIEEE-CS联合工作组正在制定的人工智能知识模块及知识点


3中展示了ACMIEEE-CS联合工作组正在制订的人工智能知识点,包括了基本问题、基本搜索策略、基础知识表达和推理、基础机器学习、应用和社会影响、高级搜索、高级表达和推理、不确定下推理、智能体、自然语言处理、高级机器学习、机器人学、感知和计算机视觉等13个模块。


101计划中人工智能知识点体系


教育部2021年末启动实施的“101计划”是中国学科建设和教育改革的一项品牌计划,围绕“以生为本、聚焦教学、剖析课堂、赋能教师”的理念,用两年时间建设包括“人工智能引论”在内的12门计算机核心专业课程,引领带动高校计算机人才培养质量的整体提升。


根据人工智能多学科交叉综合、渗透力和支撑性强、高度复杂等特点,呈现技术属性和社会属性高度融合特色,以“厚基础、强交叉、养品行、促应用”为理念,按照“厚算法基础、养伦理意识、匠工具平台、促赋能应用”的培养目标,“人工智能引论”设置了如下10个模块知识领域(含62个知识点,其中9个进阶知识点)。


模块1可计算理论与图灵机:可计算理论、图灵机模型和图灵测试、人工智能主流算法(符号主义、连接主义和行为主义)、国内外人工智能发展重要事件。


模块2知识表达与推理:知识表达方法、命题逻辑和谓词逻辑及其推理方法、知识图谱推理、贝叶斯网络与概率推理、因果推理。


模块3搜索探寻与问题求解:贪婪最佳优先搜索、启发式搜索A*搜索、搜索算法的性能分析、Minimax搜索、Alpha-Beta剪枝搜索和蒙特卡洛树搜索。


模块4机器学习:机器学习模型评估与参数估计、线性回归模型、决策树、聚类、特征降维、演化学习和进阶机器学习等。


模块5神经网络与深度学习:感知器模型、梯度下降和误差反向传播算法、卷积神经网络、循环神经网络、注意力机制、网络优化与正则化、进阶深度学习算法等。


模块6强化学习:马尔可夫决策过程、贝尔曼方程、基于表格求解法的策略评估与优化、强化学习中探索与利用的平衡、基于近似求解法的策略评估与优化以及基于策略的强化学习。


模块7人工智能博弈:博弈论概念与纳什均衡、虚拟遗憾最小化算法、Gale-Shapely算法、多智能体博弈算法。


模块8人工智能伦理与安全:可信公平人工智能、人工智能可解释性和算法攻击与防守。


模块9人工智能架构与系统:人工智能算法支撑技术链、人工智能芯片(GPUXPU和类脑芯片等)和分布式深度学习优化等。


模块10人工智能应用:利用人工智能模型和算法来实现自然语言中的机器翻译、视觉理解中的图像分类、机器人中的行为控制和科学计算等具体例子。


        10个知识点模块相互支撑、互为一体,将算法、模型、系统、应用和伦理规范等有机结合,在算法和模型方面,强调了从逻辑推理到问题求解、从策略搜索到数据建模、从浅层学习到深层学习、从学习结果误差评价到序贯式反馈收益评估、从最优解优化到均衡解博弈(如图2所示)。


2 101计划中《人工智能引论》知识点脉络图


AI+X知识点例子:社会合作

当前人工智能的发展引发了科学研究范式变革,正推动人类从实验观测科学(experimental science,从对自然现象的观测中总结规律)、理论推导科学(theoretical science,从科学实验中推导规律)和仿真模拟科学(computational science,从对复杂现象的模拟中进行科学研究),迈向以数据洪流(data torrent)为核心的数据密集型科学(data-intensive science),即第四范式发展[20]。第四范式科学要求研究者结合领域专业知识、计算机科学技能、数学和统计算法的学科,在计算过程中利用合适的领域知识,形成数据驱动和知识引导的双轮计算模式,支持决策、发现知识和预测未知等[21]


合作是人类社会的最大成功,也是社会学关注领域。2005在纪念《科学》(Science)杂志创刊125周年之际,科学家们将“合作行为如何演进”列为21世纪亟待解决的最为重要的25个科学问题之一。下面从可计算角度给出“社会合作”这一知识点的内容构成。


亲缘关系之间合作量化模型:1964年,英国进化生物学家、牛津大学教授威廉•汉密尔顿(William Hamilton)首次以被称为汉密尔顿法则(Hamilton’s rule)或亲缘选择(kin selection)的量化方式来解释亲缘之间利他合作行为,认为“亲缘关系越近,动物彼此合作倾向和利他行为也就越强烈;亲缘越远,则表现越弱”。[22]亲缘选择可用如下不等式来简洁表示:rB>Cr是行为者和行为接受者之间的亲缘系数,B指因为行为者实施了利他行为而给行为接受者的繁衍所带来的好处,C指利他行为给行为者本身的繁衍所带来的损失。


非亲缘关系之间强互惠模型:为了说明非亲缘关系人群中所出现的合作行为,美国经济学家、行为科学家和教育家赫伯特•金迪斯(Herbert Gintis)在2000年首次提出了强互惠(strong reciprocity)这一学说理论。所谓的强互惠是指“在群体中同他人合作,且不惜个人成本去惩罚破坏合作规范的人,即便在预期这些个人成本得不到补偿的时候也这样做”[23]。金迪斯通过计算机仿真发现,当强互惠行为者(正义者)比例达37.2%、单纯合作者达到24.6%时,一个群体才能建立稳定的合作秩序,并逐渐达到演化均衡,合作秩序从此产生。[24]


合作的神经学机制:恩斯特•费尔(Ernst Fehr)在2004年提出了产生强互惠行为的神经机制,即大脑内的背侧纹状体(dorsal striatum)被激活,[25]这就好比“少成则若性也,习惯若自然也”。


从社会合作这一知识点例子可以看出,以计算为桥梁,以机理为器械为手段,可实现人工智能与X学科在知识学习过程中的交叉融合,让同学们用人工智能这一工具更好助力X学科的发展。


以知识点为中心的AI+X微专业


202012月,浙江大学、上海交通大学、复旦大学、南京大学、中国科学技术大学和同济大学六所学校以“共建共选、学分互认、证书共签和小规模限制性在线课程(SPOC)”形式设置AI+X微专业[26]


AI+X微专业打破高校、院系、专业学科壁垒,联动政校企力量,汇聚一流的学者与产业专家共同开设课程,实现跨学校、跨学院、跨学科、跨专业教学与管理,使非计算机专业和人工智能专业的学生能够更为灵活、高效地学习和了解人工智能基本知识体系,掌握人工智能核心理论,提高人工智能实践应用能力,从而推动本学科今后研究的范式变革(如图3所示)。


3 AI+X微专业课程体系


AI+X微专业包括前置类课程、基础类课程、模块类课程、算法实践类课程、交叉选修类课程和线下实训实践等六大课程体系,涵盖人工智能主要技术方向和典型的交叉融合应用场景。


每位学生在1~2年内,获得至少12个学分(学习至少7门课程)就可被授予由浙江大学、上海交通大学、复旦大学、南京大学、中国科学技术大学和同济大学共同签章的AI+X微专业证书。


在建设AI+X微专业过程中,项目团队形成了“教材建设、课程共享和平台增效”三位一体的培养理念。教材体现了教育思想和教学内容,课程是教材的教学育人实践载体,平台则是将教材和课程增效的手段。


编写高水平一流教材。教材是国家事权,体现了教育思想、理念和内容,是教师教和学生学的依据,对学生和教师都至关重要。对于学生来说,有效的教材为他们期望学习的内容提供指导。对于教师来说,它提供了为什么应该教授一个特定的主题以及它所满足的教育目标的客观原因。20183月,高等教育出版社在北京组织成立了“新一代人工智能系列教材”编委会,潘云鹤院士担任编委会主任,郑南宁院士、高文院士、吴澄院士、陈纯院士和林金安副总编辑担任编委会副主任。“新一代人工智能系列教材”共有理论技术教材25本和实践教材11本,包含了人工智能基础理论、算法模型、技术系统、硬件芯片和伦理安全、“智能+”学科交叉以及实践等内容。


建设国家一流课程。课程是人才培养的核心要素,是影响学生发展最直接的中介和变量,课程质量直接决定着人才的培养质量。AI+X微专业中的每门课程都要求在线开放,若干课程入选首批国家级一流课程。在线课程让学生能够随时随地学习,这比传统教育更灵活、更个性化、更高效,发挥了优质教材的资源贡献优势。


搭建教学增效平台。当前教育教学目标正从“知识本位教育”向“能力本位教育”转变,AI+X微专业更加关注培养学生的知行统一能力。学习人工智能的最佳方法就是实践练习。一个人只有接受解决实际问题的实践培训,才能真正地学到应该掌握的知识。AI+X微专业中使用的培训平台是智海-Mohttps://momodel.cn/),它提供了一站式资源库来帮助AI+X课程学习者更好地了解特定领域AI的前景和影响,如机器学习驱动的药物发现。类似于MINIX操作系统,智海不仅仅是一个教学工具。MINIX的早期版本仅用于教育目的。从MINIX 3开始,开发的主要目标从教育转向创建高度可靠和可自我修复的微内核操作系统。由于注册学生需完成他们指定的项目,智海平台将收集开源代码,将其用于大量AI+X跨学科创新研究。因此,智海将成为链接研究和教育的有机组合——一个可以教育学生(未来的创新者)将尖端人工智能技术应用于众多行业的平台(如图4所示)。


4 智海新一代人工智能科教平台


AI+X微专业通过高校与产业界的互动建立人工智能开发协同创新系统。例如,公司提供其编程工具、行业需求和计算能力,以培养AI+X学生。


AI+X微专业于20214月正式向华东六校开放以来,来自工学、农学、药学和法学等非信息类专业的300名学生进入AI+X微专业学习。通过一年的学习,共有66名优秀的同学符合AI+X微专业辅修项目培养方案毕业要求,顺利完成修读任务,成为首批毕业学员,并且获颁由六校共同签章的AI+X微专业辅修证书。


挑战与结论


随着移动终端、互联网、传感器网、车联网、穿戴设备等兴起,计算与感知已广泛渗透,与人类密切相伴。网络不但遍布世界,更史无前例地连接着个体和群体,我们正从传统以“物理世界—人类社会”为主的二元空间逐步进入了“物理世界—人类社会—信息空间”所构成的三元空间。


三元空间这一新的信息环境与起源于1956年的人工智能相结合,使之成为一种通用的使能技术,进而成为引领本轮科技和产业发展的战略性的变革技术和驱动力量,被广泛应用于众多领域,如科学研究、经济调控、数字平台、智能城市、智能医疗、智能交通、智能物流、智能机器人、无人驾驶、智能手机、智能游戏、智能制造、智能社会、智能法治、智能翻译甚至智能创作等。


未来将是人和人工智能共同进化的时代,人和人造物的力量两者如影随形,协作共进,相得益彰。大多数研究领域越来越多地以人工智能来进行学科交叉研究。今后AI+X微专业还要面临如下挑战,如提供合格的教材以及相应的在线课程,以指导学生更好地在线学习;提供由数据、模型、教学场景和行业需求组成的灵活的培训平台;缩小AI+X跨学科研究之间的差距,为非人工智能专业的学生提供合适的AI+X教学项目。


加快发展新一代人工智能是中国的重要战略,是推动科技发展、提升工业领域质量、提高综合生产力的关键。构建人工智能生态系统对培养更多AI+X人才至关重要。在健康的人工智能生态系统中,跨行业和领域的每个参与者都可内驱成势、郁郁葱葱[27]


参考文献 略



        感谢吴超、陈立萌和朱雨萌对本文写作的支持和帮助。感谢国家自然科学基金重点项目(62037001)的支持。



引用此文:


吴飞,陈为,孙凌云,等.以知识点为中心建设AI+X微专业[J]. 科教发展研究,202331):96-116.

WU Fei, CHEN Wei, SUN Lingyun, et al. The Building of AI+X Micro-Program via the Tree of Knowledge[J]. Journal of Science, Technology and Education Studies, 2023, 3(1): 96-116.