当前位置:首页> IT石油

斯伦贝谢:为何您的下一项重大创新 可能取决于人工智能 / 机器学习

时间:2025-10-10 10:49 来源:2025年4月 作者:小编

斯伦贝谢(SLB)软件技术与创新中心高级机器学习工程师齐克里・拜拉克塔尔,
探讨了机器学习(ML)和人工智能(AI)这一不断拓展的话题,及人工智能在上游领域日益广泛的应用。
 
人工智能(AI)和机器学习(ML)常被互换使用。它们是否存在重叠?
 
拜拉克塔尔:尽管在一定程度上存在重叠,但实际上二者是不同的。人工智能广义上专注于模拟人类决策过程以解决问题的系统,包括基于规则的系统、机器学习中的基于数据的算法、机器人技术等。
 
机器学习可视为人工智能的一个子集,其算法能够从数据中学习、发现模式、改进结果或在无需明确指令的情况下实现某些任务的自动化。这两个领域都广泛利用现有数据,可能消耗大量计算资源,最终也可能产生随机结果。
 
20世纪50年代发表的三篇论文意义重大:《图灵测试》、《机器人三定律》和《感知机》,它们从生物抽象概念出发,奠定了神经网络(NN)的基础。十年后,通过反向传播训练的感知机为Transformer模型奠定了基础,而正是Transformer模型为我们带来了如今所使用的翻译工具、聊天机器人以及人工智能/机器学习解决方案!
 
能否分享一些几年前无法实现、但如今借助人工智能/机器学习实现的解决方案案例?
 
拜拉克塔尔:我住在旧金山湾区,这里的自动驾驶汽车越来越多。坐进一辆自动驾驶汽车,发现没有司机,一开始会让人感到不安。但在复杂的城市交通中平稳行驶几分钟后,你会放松下来,并对这项技术惊叹不已。在先进的机器学习算法和人工智能系统的部分推动下(这些系统能无缝融合各种传感器并做出决策),自动驾驶汽车已不再是幻想。
 
同样,如今能与人类语音、摄像头和文本交互的个人助理已成为我们日常生活的一部分:它们可以控制家用电器、开关水电、预警安全问题,甚至给宠物喂食。这些都得益于高精度的传感器数据、复杂的大型语言模型(LLMs)和人工智能代理。
 
运行人工智能/机器学习需要多大的计算机算力?我们可以在个人电脑上使用人工智能/机器学习工具吗?
 
拜拉克塔尔:这要视情况而定。计算资源的需求取决于可用数据量、人工智能模型类型、机器学习模型参数数量,以及用户愿意等待多久以获得良好结果。
 
一旦数据安全得到保障且隐私得到保护,根据架构不同,机器学习模型可以在配备中央处理器(CPU)或图形处理器(GPU)的笔记本电脑、台式工作站,或带有GPU、张量处理单元(TPUs)等硬件加速器的集群上进行训练。
 
如果目标是使用训练好的模型进行推理,那么经过蒸馏或量化的人工智能/机器学习模型(如大型语言模型)可以部署在个人电脑甚至手机上。经过适当量化的人工智能/机器学习模型所需硬件资源(内存、GPU 等)更少,同时不会大幅牺牲性能。
 
像ChatGPT或Gemini这类规模的大型模型通常在配备高端GPU的共享服务器上运行,因为执行速度对用户来说很重要。即便如此,我们也已在实时场景中部署了微型机器学习模型,这些模型可以适配现场工具的小内存,甚至能在现场可编程门阵列(FPGAs)或专用集成电路(ASICs)上运行。
 
如何获取人工智能/机器学习工具?
 
拜拉克塔尔:如今,几乎所有云服务提供商和科技公司都有自己的语言和视觉基础模型版本。通过可编程应用程序接口(APIs)和用户友好的图形用户界面(GUIs)访问这些模型的成本正在迅速下降。这些模型在云服务器上运行,用户提供的任何数据都存储在第三方服务器上。
 
开源人工智能社区已经取得了长足发展。微软的Phi系列和Meta的Llama系列是其复杂机器学习模型的免费版本。这使得在私有数据上进行本地部署变得更加容易,并促进了人工智能/机器学习技术的更广泛应用。
 
低代码或无代码的自动化机器学习工具对人工智能/机器学习新手特别有用。它们提供多种算法,用户只需导入数据即可。这些工具会建议如何清理和格式化数据、选择高效模型并进行训练,还能帮助分析结果。我发现这些工具对于在有限数据集上训练新模型以快速制作原型非常有帮助。这些软件包可以在第三方服务器上使用,也可以下载到个人电脑上。
 
人工智能/机器学习在石油和天然气领域有哪些应用场景?
 
拜拉克塔尔:当前的大型语言模型用途极为广泛。我们正迅速习惯人工智能语音代理生成会议摘要、处理复杂的财务文件或合同以提取准确信息,以及实现财务规划和预算应用的自动化。
 
在石油和天然气领域,人工智能/机器学习应用有助于测井信号分类、测量测井质量检查、井眼图像和目标分类、地震数据处理与自动化、复杂物理模型的替代模型、化学合成或材料筛选的机器学习模型、过程控制与自动化等诸多方面。
 
我工作的一个特定方向是将物理模型与基于机器学习的模型相融合或混合,以捕捉比以往更复杂的行为。
 
您曾发表过关于将人工智能/机器学习应用于测井分析和地质建模的文章。能否分享一下您的经验和成果?
 
拜拉克塔尔:在过去十年中,我开发、设计并构建了各种人工智能/机器学习模型。在早期工作中,我构建的替代神经网络模型比现有的电磁求解器快几个数量级,这些模型被用于反演问题。这次成功之后,我开始构建神经网络,输入原始仪器信号,生成油基泥浆微电阻率仪器的解释结果,旨在替代反演工作流程。
 
借助这些神经网络,我们实现了速度上几个数量级的提升,同时解释质量与基于反演的解释相当。随后,我们基于对沉积几何形态的理解,通过卷积神经网络(CNNs)开展井眼图像分类工作。从那以后,我们在材料筛选、任务自动化以及能理解我们所在领域的语言模型设计等方面发表了更多项目成果。
 
通过这些研究发现,主要挑战始终是获取高质量数据。一旦数据难题得到解决,设计能解决技术或业务问题的机器学习项目就需要机器学习工程师与领域专家协作、明确成功标准,并制定周密的部署策略。在工作流程的任何阶段,错误的决策都可能影响模型的可行性或部署效果。
 
在收集优质且足够大的训练数据方面存在哪些挑战?
 
拜拉克塔尔:在我们这个领域,数据受到合理保护是理所当然的。获取数据用于训练机器学习模型是一个重大挑战。如果数据量是问题,那么参数数量少的机器学习架构也能提供良好结果。然而,如果数据缺乏多样性,模型就会存在偏见,无法实现泛化。在这种情况下,基于局部或盆地的模型可以满足需求。数据量没有固定的最佳数值;人们总能调整出最佳模型架构、优化参数、扩充数据,并利用已知物理知识设置防护措施。
 
如果某个项目或机器学习方法是新的,那么利用公开可用的数据集降低该方法的风险是合理的。我会保持谨慎,确保在着手解决问题之前处理好数据许可问题。对于专有数据,必须采取适当步骤保障数据驻留、数据隐私,高效整合孤立数据集,建立长期的数据治理机制,并确保数据标注在全球范围内保持一致。
 
为加速石油和天然气领域人工智能/机器学习解决方案的开发,我们需要在哪些方面开展合作?
 
拜拉克塔尔:要成功应用人工智能/机器学习,我们行业可以与云行业、学术机构、政府机构、开源社区以及SPE等专业协会开展合作。
 
云技术公司拥有资源,可为学术和研究用途提供开源数据集共享支持。数据科学公司可以使其工具适应我们行业的需求。软件公司专注于行业标准数据模型,让处理海量数据变得更加容易。
 
大学可以鼓励并教授如何在人工智能项目中利用复杂的领域特定知识,政府机构可以促进知识和数据的共享(潜在地在全球范围内)。
 
SPE等专业组织可以推动这种知识共享,倡导加速人工智能合作的政策,提供低成本的培训和认证项目,并成为一个协作平台,让从学生到石油和天然气行业资深人士的各方都能为下一代人工智能/机器学习的发展贡献力量。
 
开源社区在人工智能/机器学习的未来发展中扮演什么角色?
 
拜拉克塔尔:我是开源的大力支持者,并且坚信开源能同时加快人工智能 / 机器学习方法的开发和应用速度。我曾多次从其他领域部署的人工智能方法中获得灵感,也受益于开源示例,这些都降低了我的学习难度,还让我能借鉴那些乍一看与石油和天然气行业无关的解决方案。研究表明,开源软件实践能为经济做出巨大贡献,创造激烈的竞争,并为安全、负责任的模型提供透明度。
 
Hugging Face是人工智能/机器学习领域一个成功的开源平台,我从它成立之初就一直关注。
 
他们不仅创建了一个模型共享平台,还在一定程度上统一了模型开发,围绕各种主题建立了开放社区,并分享机器学习开发的各个方面——从数据到在线部署模型,再到围绕该领域一些前沿话题构建免费教育资源。他们将开源与社区相结合的方式,为如今的各项发展做出了重大贡献,这一点值得称赞。
 
要成为石油和天然气领域的人工智能/机器学习专家,有哪些培训资源和职业发展路径?
 
拜拉克塔尔:如果您是受过训练的科学家或工程师,那么您很可能已经修过数学和编程基础课程,具备进入机器学习领域的条件。目前,顶尖大学在 YouTube及其各自的课程网站上提供了各种开源课程。
 
我强烈建议将学习资源与手头的项目相匹配,边学边用,将所学立即应用到实际问题中。我发现各种低成本的在线课程(带有实际编程作业)非常有用,无论是在理解基础理论方面,还是在基于现有数据训练模型的实践经验方面。
 
同样,SPE也提供了多种学习和实践人工智能/机器学习的资源。我的第一个机器学习项目(我们为此获得了专利)使用了简单的神经网络,但我们必须基于领域专业知识从头构建工作流程。如果有人拥有人工智能/机器学习学位,他们也可以与领域专家合作,运用自己的技能解决复杂的科学和工程问题。
 
您个人期待人工智能/机器学习领域有哪些新发展?
 
拜拉克塔尔:生成式人工智能代理是一项新兴且影响重大的发展,它让人工智能的使用变得更加便捷。借助现有工具,无需明确指令,它就能主动推理以实现用户分配的目标。这些专门的生成式人工智能模型可以访问 API、数据库或网络服务、自定义专有函数、简单的物联网(IoT)设备或大型系统。我相信我们才刚刚起步,这一领域将迅速发展。
此外,还有几个人工智能研究课题我希望能蓬勃发展。其中一个与石油和天然气领域相关的是模型的多模态性。我们人类学习和处理的数据具有多种形式。
 
人工智能在利用这类数据集方面可以做得更好。虽然大型语言模型开辟了新途径,但我认为文本应该与图像和声音相结合,以完成更复杂的任务。在石油和天然气领域,我们有各种数据模态,如果人工智能研究能专注于处理各种非结构化数据模态,我们将受益匪浅。
 
在我们行业之外,我期待看到人工智能天气预报模型取得更多成就,这些模型可以拯救生命并减少财产损失。在这方面,傅里叶神经算子、扩散模型和图神经网络在局部和全球范围内都展现出巨大潜力。
战略合作
战略合作 全球石油化工网 世伟洛克 北京石油展 API 斯伦贝谢