您所在的位置:
基于机器学习技术预测表面活性剂的临界胶束浓度


 概 述 

利用机器学习技术预测表面活性剂的临界胶束浓度


工业应用

家庭及个人护理,制药,精细化工品


挑战

预测临界胶束浓度

为产品开发提供高效指导

降低开发成本


模拟工作

开发预测临界胶束浓度的关联模型

验证QSPR模型


模拟结果

利用QSPR模型能够在几分钟内对阴离子型表面活性剂的CMC进行预测,其关联模型可被用于大量化合物库进行预筛选。通过这种方式可将精力集中于对最有可能的备选化合物进行测试,节约了实验成本与时间。


 分 类 

工业应用

家庭及个人护理

石油天然气及石油化工

精细化学品


软件

Engineering

MAPS

QSAR


性质

临界胶束浓度


应用

表面活性剂

表面活性剂在工业领域被广泛应用于清洁剂、发泡剂或增溶剂。尤其是在个人及家庭护理领域发挥着至关重要的作用。根据市场调研预测至2022年全球产量将增长至1.6千万吨,相应年收入将达到4百亿美元。企业不仅需要面对商业竞争,还需要面对环境、毒性、及可持续性等方面法规日益严格的要求。在产品设计与开发领域,可利用机器学习技术进行虚拟筛选及关键性质预测,如临界胶束浓度的预测。利用该技术可将主要精力集中在对最有前景的备选材料进行测试,从而降低原材料成本、缩短开发周期。

挑战

临界胶束浓度(CMC)是表面活性剂的一个关键性质。该浓度为继续添加更过表面活性剂时表面张力不再变化时的浓度。由于该浓度决定了控制液体张力所需的表面活性剂添加量,因此预测该浓度对产品的相设计极为重要。在本研究案例中,我们利用MAPS的QSPR模块开发了可预测阴离子表面活性剂CMC的关联模型。该类表面活性剂目前是最大的一类表面活性剂。

模拟工作

已知CMC的60个硫酸盐及磺酸盐构成的表面活性剂数据集被作为开发关联方程的基础。利用MAPS的建模工具构建了表面活性剂的结构并进行了结构优化。利用MAPS的Descriptors模块计算得到分子描述符,分子描述符即将分子的化学与物理信息转化为统计模型所需的有意义的数值。MAPS的QSPR 模块基于遗传算法(GA)搜索生成QSPR模型。采用训练/测试集方法对最佳模型进行了验证。

Figure 1:数据集中代表表面活性剂的分子

模拟结果

开发了预测阴离子表面活性剂临界胶束浓度的关联模型。确立了CMC与分子形状的关联被表达为拓扑描述符,及CMC与分子组成的关联被表达为范德华体积描述符。最终模型显示对R2与RMSE统计具有高的精确性。


该关联模型是进行MAPS筛选及工作流程创新的理想手段。利用该模型不仅能够对大量化合物库进行高效筛选,还可被用于系统性生成大量虚拟的结构各异的基本骨架结构。是确定适宜的备选物或潜在替代物的高效策略,从而将实验精力集中对最有希望的化合物进行测试,进而节约了开发成本。


此外机器学习技术的应用不局限于任何特定材料或性质,可适用于任何材料或所关注的性质。

Figure 2:QSPR log (CMC)的实验值与测试集(橘色)、测试集(绿色)及训练集(紫色)方程示意。为进行比较,绘制了y=x参考线。


MAPS材料及化工过程设计平台是集多款优秀的第三方材料设计软件的、多尺度、可扩展的平台;可应用于从量子化学计算到中尺度计算。MAPS包括友好的图形用户界面供用户建模、方便分析计算结果。MAPS适合描述含能材料、离子液体、高分子材料、合金材料、复合材料、电池材料等性质。MAPS软件拥有:(一)建模功能(二)分析功能

QSAR用PADEL或ALVADESC计算数千个描述符,从数千个分子描述符中建立定量构效关系(QSAR/QSPR),以描述生物活性或经验分子性质。

MAPS软件