摘要: 引导智能化技术在哲学社会科学领域的合理应用,推动我国哲学社会科学高质量发展。
党的二十届三中全会提出“完善生成式人工智能发展和管理机制”“加快适应信息技术迅猛发展新形势”。习近平总书记指出,如果不能及时研究、提出、运用新思想、新理念、新办法,理论就会苍白无力,哲学社会科学就会“肌无力”。为此,应顺应大数据、人工智能等的发展趋势,加快科研范式的转型步伐,推动哲学社会科学的高质量发展。
近年来,随着人工智能时代的到来,各种AI小工具开始涌现,一部分哲学社科工在文献综述、文字、可视化分析、参考书目编码、数据分析等环节尝试运用智能化辅助手段。国内相关数据供应商也开始加快科研领域的垂直大模型布局。万方数据利用标准的科技文献数据进行大模型训练,与科大讯飞合作开发的星火大模型进入内测阶段。上海交通大学全媒体资源中心于2024年4月8日上线试运行。2024年9月21日,同方知网与华为合作的“中华知识大模型5.0”在沪正式发布。关于哲学社会科学领域的智能化应用议题再度引起广泛关注,并引发了关于科研范式转型的诸多思考。
在Sora、ChatGPT等掀起的智能化热潮中,国内外越来越多的单位利用大模型逻辑推理、工具应用、规划决策、遵循指令等提供智能体服务。2023年4月,美国图书馆协会的调查显示,很多学术型、研究型图书馆和科研院所正在积极探索人工智能的科研应用潜能,人机对话、自动编目和个性化服务最受欢迎。加州大学戴维斯分校成立了机器学习小组项目,目前通过技术可行性和伦理评估的AI应用项目包括自动图像标注、自动提取数字化书籍、聊天机器人、自动编目、简报自动生成。斯坦福大学使用GPT-4来评估审阅研究人员发表的文章等。
智能化技术赋能科研,显著提高了实验及实证研究的效率,缩短了科研成果转化周期,其带来的变化主要表现在以下三方面:
一是人工智能的广泛应用将会改变现有哲学社会科学研究方式。如同工业化时代来临后,以重体力输出为主的产业工作方式瞬间发生剧变一样,智能化技术的应用对重复化、规律化的部分科研工作带来诸多冲击。传统哲学社会科学中高度依赖文献检索分析、实证调查、案例辩证归纳等方法的现状正在改变。面对多源且动态变化的庞大数据信息,研究的精准性和全局性很难保证。智能化技术不仅能快速处理大量复杂信息,并且能从多视角全面分析数据,发掘其内在联系,帮助哲学社会科学工精准判断、量化描述、合理预测。
二是人工智能的广泛应用将会拓展现有哲学社会科学的研究内容。人工智能技术本身就是一项全新的研究学科,科研伦理、自然语言处理、机器翻译、算法偏见、AI对齐、智能化抄袭等成为哲学社会科学研究的新兴议题。同时,智能化技术与经济、文化、社会等领域的碰撞也催生出了许多新生事物,如虚拟社区、机器伴侣、智能治理等问题的研究均与哲学社会科学息息相关。这不仅拓展了科研工的视阈和思维广度,而且要求学术共同体高度重视智能化应用产生的科研伦理与社会责任等。
三是人工智能的广泛应用将会转变现有哲学社会科学的研究范式。通过人工智能技术,哲学社会科学工有望突破地区、语言等障碍,获得当下最真实的研究进度和数据信息,避免因信息偏差而导致的重复研究、浅显研究、错误研究等,更加注重实证与学理的深度结合,强调数据驱动的研究设计,以及跨学科、跨领域的合作研究模式。
当然,我国哲学社会科学领域的智能化应用尚处于起步阶段。上海社会科学院图书馆2024年9月开展的一项面向全国的调查结果显示,我国在这一领域的总体态势呈现以下特征:一是哲学社会科学领域的智能化应用相对滞后于自然科学;二是主要数据供应商基于商业利益考量等显露出业务交叉、功能雷同的竞争态势;三是过早、过度商业化,用户使用成本及试错成本较大;四是数据主体与技术主体分离,个别企业存在套模、技术抄袭甚至概念炒作等现象;五是片面关注便捷性,忽视了科研伦理方面的风险与责任,对智能化技术渗透在该领域面临的瓶颈及风险认识不够,更无预案。
今后,要在坚持意识形态安全、文化安全和信息安全的前提下,逐步厘清智能化辅助工具与人的主体性、主动性之间的边界,加速智能化应用法律法规的完善,推进政策规范和数据协同,及早应对数据流动、算法偏见、智能化抄袭、隐私保护等领域的风险和挑战,引导哲学社会科学工优化自身的知识结构与能力结构。尤其是,运用互联网和大数据技术,加强哲学社会科学图书文献、网络、数据库等基础设施和信息化建设,加快国家哲学社会科学文献中心建设,构建方便快捷、资源共享的哲学社会科学研究信息化平台。哲学社会科学管理机构、主要供应商和广大的社科工要积极参与人工智能技术的实践探索、理论研究、规则制定等,共同引导智能化技术在哲学社会科学领域的合理应用,推动我国哲学社会科学基于智能化技术手段的高质量发展。
( 均为上海社会科学院图书馆馆员 )
倪梁康: 意识哲学研究
倪梁康教授在2022年5月4日的报告中探讨了人工智能与神经科学时代下的意识哲学,为我们揭示了意识本体论的新认识。 报告主要关注意识的层次、范式以及在不同学科领域中的探讨,包括意识哲学、神经科学意识、信息科学意识,以及意识的难问题和易问题。 哥德尔的见解提示我们,研究意识时应避免陷入大量材料的纠缠,而应专注于个体层面的理解。 意识研究分为三个层次:个体内心世界、神经科学和信息科学的易问题解决,以及意识本体论的深入探讨。 个体意识包括显意识和隐意识,情感和欲望的产生受精神动机而非自然科学因果规律影响。 神经科学与信息科学旨在通过还原到神经网络和人工智能来理解易问题,而意识的难问题如自由意志、意识的本体结构,则需要更深层次的哲学探讨。 汉斯·约纳斯预测,未来智能机器可能引发后生物时代的转变。 电影《超越》展示了人工智能与情感意识结合的潜在可能性,引发科学家们对于意识激活和人工意识的深入思考。 倪梁康教授的报告总结自浙江大学的“思想与时代”哲学公开课,提供了对这个复杂领域的深入洞察。 这些内容对于理解意识哲学在当前科技背景下的发展具有参考价值。
研究速递:人工智能学术生态的介观尺度图谱
近几十年来,人工智能的知识、工具和实践已经成为科学研究的支柱,而且在应用方面也迅速扩散到各个学科中。 通过构建人工智能研究领域的关键词共现网络和合作网络,这篇文章重构了人工智能生产在整个科学生态系统中扩散的时间动力学,并描述了人工智能应用的学科介观尺度格局。 最后发现,那些主要开发人工智能的学者和那些应用人工智能的学者之间很少有合作,只有一小群研究人员能够逐渐在这些社区之间建立桥梁。 从材料科学到新药研发,从量子物理到医学影像,人工智能越来越被认为是技术和科学创新的载体,可以从目前几乎所有科学和技术领域中的数据源提取信息,掌握隐藏模式和关系,并且不断扩散到其他学科领域,在这些学科中实现了向数据沉浸式科学的普遍范式转变。 这一现象背后的共同想法是,人工智能正在从其设计关键工具的“原生”学科(主要是计算机科学、数学和统计学)向各个知识领域的一系列应用扩散。 那么,人工智能作为一个研究领域的学科结构是怎么样的?人工智能知识是如何动态地嵌入到传统科学领域的?为了回答上述两个问题,这篇文章通过微软学术图谱(MAG),构建了人工智能研究领域的关键词共现网络和合作网络,分析了人工智能研究领域的介观尺度结构,并分析了人工智能嵌入到科学生态系统的动态过程。 人工智能研究的核心-边缘结构构建了人工智能关键词网络的 K-Shell 结构(图1),并将其划分为三个层面:超级核心、核心和外围。 其中超级核心包含一般的人工智能类别(“人工智能”、“机器学习”、“深度学习”、“神经网络”)和非常流行的方法类别(“随机森林”、“支持向量机”)。 核心也包含一般的方法(如“聚类分析”、“粒子群优化”、“随机梯度下降”),但它们之间的联系较少,而且分层次地取决于超核心术语(即只通过超核心术语与语料库相连)。 外围部分主要包含特定的算法和特定的方法,它们之间没有联系,只是与更核心的核心相连。 通过社区检测算法,确定了15个中尺度结构的存在,这些结构对应于网络在专业层面的划分(图2):专家系统、自然语言处理、降维、数据挖掘、分类器、神经网络、机器人学、遗传算法、语音识别、逻辑编程、人脸识别、图灵机、强化学习、计算机视觉和深度学习。 人工智能随时间的扩散为了衡量人工智能的扩散过程,使用了学科排名变得相当稳定排名雅卡德相似度指标,在图3中,可以观察到一些典型的学科轨迹,这些学科的排名从20世纪90年代至今发生了重要变化。 一些学科(首先是社会科学)经历了强烈的下降,确实与符号人工智能和专家系统等人工智能专业的下降密切相关。 像物理学和生物学这样的学科在人工智能应用方面显示出周期性的增长(有一个恒定的趋势),而其他学科,如神经影像学和绿色及可持续发展技术,自其创建以来显示出排名的突然攀升。 人工智能领域的的人工智能分数的分布显示出两个明显的峰值(图4A),一个是 0 左右(从未在人工智能期刊上发表过论文),另一个是 1 左右(只在人工智能期刊上发表过论文)。 这凸显了做人工智能研究的学者和用人工智能做研究的学者之间的明显分离。 人工智能在其他学科的应用主要不是由具有不同背景的之间的直接合作推动的。 只有一少部分群体的构成了人工智能的理论发展和学科应用之间的桥梁。 总结:人工智能研究的生态图谱揭示了其在科学领域中的动态演化过程和学科间合作的现状。 通过构建关键词共现网络和合作网络,文章揭示了人工智能研究的层次结构和学科扩散动态。 这有助于理解人工智能在跨学科环境中的角色以及其在科学创新中的作用。 同时,研究也强调了理论与应用间合作的重要性,指出一小群学者在促进不同社区间的交流与融合中起到了关键作用。
多研究一点 - 范式
在探索人工智能的深层结构中,范式这一概念反复出现,它是理解不同学派和研究方法的关键。 在多学习-做研究系列中,我扩展了研究领域,提出了多研究一点范式,因为范式是科学研究的核心范畴,它的理解和应用具有基础性与重要性。 首先,我们需要理解范式的理论基础,它由库恩在其《科学革命的结构》中提出,是科学活动的理论框架和实践规范,包括信念、理论、技术等多元素的综合。 范式不仅区分了科学共同体,还影响着理论体系的构建和问题解决的标准。 科学研究范式如实验科学、理论科学和计算科学,以及社会研究范式,都是范式理论的具体体现。 例如,理论科学从经验中提炼概念,通过逻辑推理形成数学模型,而计算科学则利用数据驱动解决问题。 社会研究范式关注行为与环境的交互,如行为主义强调感知与行为的动态闭环过程。 人工智能领域也深受范式影响,符号主义、联结主义和行为主义三种学派分别对应认知科学的符号范式、联结主义范式和具身认知范式。 这些范式在人工智能的发展历程中扮演着重要角色,影响了机器学习和决策系统的构建。 理解了范式的概念和应用后,我们需要深入研究其背后的科学发现哲学,如假设主义、逻辑经验主义和证伪主义等,它们揭示了科学知识的生成机制和检验标准。 通过范式的研究,我们可以更全面地看待科学的演进和跨学科的交融,认识到范式不仅是知识的集合,更是世界观和价值观的体现,它在科学研究的各个阶段中发挥着决定性作用,推动科学的进步和社会的发展。