adftrain

一般的

概述

adftrain是一个图形用户界面(GUI),用于处理培训集和REAXFF强制字段文件。

在优化一个力字段时,一个必须定义训练集和初始力字段文件,并确定要优化的参数(以及在什么范围内)。

adftrain显示培训集和强制字段,并允许您进行调整:

  • 调整培训集(新系统,删除系统,定义包含在目标函数,权重等中的内容)
  • 调整力字段(添加或删除术语,参数的初始值,优化细节)

保存后,您将有一个Trainset.in和Geo文件。这些定义了培训集。 您还将拥有FFIEL和PARAMS文件。这些定义了力字段以及如何优化它。

下一步是实际使用所有这些文件作为输入来实际优化FFIEL。 目前没有由adftra处理的。

最后,培训的结果(新FFIET和FORT.99)可以用adftrain显示。 Fort.99包含对目标函数的贡献,它们将与培训集一起显示。

基于结果,可以调整优化:改进培训集,或专注于FFIEL的其他参数以优化。

文件处理

打开

使用文件菜单中的“打开”命令打开特定文件。或者,可以通过命令行启动AdFtrain并指定文件以打开参数。

将清除当前设置(即,自动使用新命令)。

Adftrain将尝试确定您选择打开的文件。可能的选项是trainset.in文件(必须命名为trainset.in),geo文件(命名为geo或与.bgf扩展名),一个强制字段文件(命名为f菲尔德或与.ff扩展名),或参数文件(必须命名为params)。

要打开的其他文件的名称是与您选择打开的文件相同的目录中的默认名称(Trainset.in,Geo,FFioup,params和fort.99)。

添加

在“文件”菜单中使用“添加”命令时,将添加所选文件到当前的AdFtrain窗口。 只导入所选文件,只能添加Trainset.in,Geo或FField文件。

保存

首先,建议使用与在打开时使用的名称保存。

如果您不喜欢(可能是保存原始文件),请单击“否”。 将要求您选择要保存文件的目录。所有文件都将具有其默认名称。

桌子

训练集和力字段都显示为表。

标题菜单:排序和过滤

在表格之上是一个标题。 标题中的所有项目都是下拉菜单,您可以使用它们来对表进行排序(由相应列中的值)。

标题中的最左侧项目是“类型”菜单。它们提供相同的排序选项,但您也可以通过特定类型进行过滤。 您可以选择要显示的数据类型,一个或多种类型或全部。

选择

要在表中进行选择,请使用鼠标。

在训练集表中,您可以单击任意位置,在Force Field表中单击左侧两列的某个位置以进行选择。

左键单击:将选择设置为单击的行,
左键单击:范围可以选择和包括单击的行,
控制 - 左或右键单击:切换单击的行/删除选择。

BackSpace密钥:删除所选行。
逃生键:清除选择。

训练集中的所有线路对应于一个或多个系统(分子)。如果仅选择一个系统(或使用相同系统的多行),则会显示在左侧。当选择与能量术语一行,在能量表达所有系统被示出在左侧。使用箭头键(左右)通过能量表达中的不同系统。

您可以使用上下箭头键在表中移动所选行。

培训集

系统

培训集需要一个或多个系统。系统是分子或晶体,以及关于如何用它运行计算的细节。 因此,它可能是单点计算,几何优化,具有额外的详细信息(如约束,几何迭代的最大数量,......)。

如果选择一个系统线,如果是唯一选择的系统,则分子将显示在左侧。

您可以使用“视图”菜单中的命令更改左侧显示的详细信息,就像其他ADF-GUI模块一样。 当然,您可以使用鼠标旋转,缩放和选择原子。

无法在Adftrain内部创建系统,它们从各种来源导入:

  • adftrain:选择要导入的文件,支持ADF-GUI可以读取的所有格式(例如,例如,.ADF,.xyz,.bgf,.sdf,.pdb,但也像.t21,.rkf等结果文件
  • adfinput:使用'添加坐标到adftrain'menu命令(在文件菜单中)
  • adfmovie:使用“添加坐标”到Adftrain'菜单命令(在文件菜单中)将当前帧添加到Adftrain。注意您可以重复执行此操作,适用于您用作测试系统的任何帧
  • adfjobs:选择一个或多个作业,并使用'添加到adftrain'菜单命令(在文件菜单中)。在这种情况下,所选作业是(是)添加,而不仅仅是坐标。 Adftrain将尽力处理工作。例如:
    • 添加线性传输或PES扫描作业时,AdFtrain将其转换为具有约束的一系列几何优化,并且还将添加能量条目以匹配相应的LT / PE。,
    • 使用SDF文件的作业将使用SDF文件的所有条目作为单独的系统添加。

快捷方式:cmd / ctrl-t(在adftrain,adfinput,adfmovie和adfjobs中)。

在培训集表中的系统行中,您可以看到系统的详细信息:

  • systemid,
  • runtype(具有可能的额外细节),
  • 使用当前系统的文件。

通过在线移动鼠标可以看到更多信息,并在没有移动的情况下保持它。气球将弹出细节。

保存设置后,系统以BGF格式保存,在名为GEO的文件中或在您选择的.bgf文件中(通过打开命令)。

目前Reaxff限制了SystemIDS可能最多有20个字符。 要更轻松地重命名系统IID,请在“培训集”菜单中有一个菜单命令'更改systemids'。 使用此命令用其他文本替换所有选定的系统(或者所有系统)中的某些文本。 将要求您搜索要搜索的字符串,并为字符串替换为字符串。

“智能系统状态”将调整所有系统的状态:如果使用系统,则状态将处于活动状态,如果系统未使用状态已禁用状态。

培训集

培训集还定义了使用参数优化最小化的目标函数。 目标函数由许多术语组成,表中的每一行都是一个术语(除了注释行和系统线)。

要将术语添加到培训集,请使用“添加”菜单。通常,在添加术语时使用所选系统和所选原子。

例如,要为培训集添加距离术语:

  1. 选择要添加距离项的系统,
  2. 在系统中选择两个原子,
  3. 使用“添加”菜单中的“键”命令。

将在您的培训集中创建一个距离项。显然,当您要使用距离时,您的系统将需要成为几何优化。如果是单点计算,则距离将始终保持相同,因此该术语仅为常数(可能为零)。

原子选择确定添加了哪些距离项:

  • 如果没有选择原子(因此跳过步骤2),则将添加系统中的所有键。
  • 如果选择了两个原子(如实施例中):将添加这些原子之间的距离(即使它们不直接粘合)。
  • 如果选择了两种以上的原子:将添加系统中的所有选定键(因此所选原子之间存在存在的粘合)。

如果选择了多个系统,则对所有所选系统重复上述。 仍将使用原子选择标准,注意,如果系统没有以相同顺序具有相同的原子,则无意义。 处理原子选择的这种方式用于所有几何测试。

在距离术语线中,您可以看到:

  • 类型('几何:距离'),
  • systemid(某些名称,与所选系统名称相同),
  • 准确性(重量因子的倒数,将该术语的相对贡献设定为目标函数),
  • 细节(涉及该特定距离的原子编号和原子类型),
  • 值(参考值,使用当前系统计算),
  • 错误(在优化后打开培训设置时,对该术语的目标函数的实际贡献)。

错误列将填充培训的结果(从Fort.99文件读取)。 它显示对培训集中每个术语的目标函数的贡献。如果按此列排序,则特别方便。

可以添加的术语类型从“添加”菜单中是显而易见的:

  • 距离(债券)
  • 角度
  • Dihedrals(扭转)
  • 几种收费
  • 能量表达
  • 能量曲线
  • 力量
  • 形成热量
  • 细胞参数

能量曲线特殊:选择两个或多个系统,并使用Energy Curve命令。 这将为每个系统添加一组能量记录,该系统可以测试所选系统之间的能量差异。 所有差异都将相对于具有最低能量的系统。

您还可以添加评论,该评论在所选行之前添加。 它们附加到该选定的行,当您对培训集表进行排序时非常重要。

保存设置后,系统保存在名为“trainset.in”的文件中。

鼠标交互

除了选择的一般小鼠交互外,还提到):

  • 双击项目以编辑
  • 右键单击系统
  • 鼠标缩短以查看详细信息,错误信息等(如果您不移动鼠标,则会收到弹出窗口)。

编辑

要编辑某些内容,请双击它(或单击所选项目)。 接下来,您可以将其编辑到位,也可以在出现的窗口中编辑。

根据您正在编辑的内容,您所做的更改将应用​​于完整选择! 因此,在选择多个术语并编辑准确性时,将为所有所选项目设置该字段。 类似,在更改runtype选项时,如runtype或最大迭代次数,它适用于所有所选系统。 约束不会遍布,因为它们依赖于特定系统。

编辑SystemID时,您可以使用标签键循环通过所有符合您键入的产品的所有SystemID。 添加一个空格以使用当前建议,或键入更多字母以缩小搜索。 在更改SystemID的情况下以及编辑能源表达时,这会有效。

编辑runtype时(双击系统的详细信息字段),将出现一个窗口,使您可以选择runtype和几个选项。您还可以在此窗口中添加或删除约束。如果您在详细信息字段(如约束)中未显示的更改,则将图形方式指示。

表演

在“显示”菜单中,您可以选择是否要显示注释,主动或已禁用的项目。 使用培训集菜单中的激活和禁用命令,您可以使项目活动或禁用。

仍将保存到Trainset.in文件中的已禁用项目,但它将被评论出(具有特殊的评论,以将其与注释行区分开)。

在表格中,行可以具有不同的颜色:

  • 黄色背景:选择
  • 浅红色背景:警告或错误
  • 红色背景:警告或错误并选择
  • 灰色前景和背景:残疾
  • 灰色前景,浅黄色背景:禁用并选择

如果您记得选择的黄色,并为警告/错误的红色,这应该是直观的。

警告和错误

如果将鼠标悬停在红线上,您将获得额外的信息,即为什么它是红色,什么样的错误。

例如,检查未优化的系统的距离是无用的,或者具有任何术语不使用的系统。 对于能量表达,有一种检查化学计量是正确的检查(因此所有原子类型的净量应该为零)。

禁用一个项目使其无法使用,因此对于错误测试,这与未出现的项目相同。

您还可以使用“显示”菜单中的“副本”命令检测重复行。 它们也将被标记为警告/错误。默认情况下,此选项不符合大型培训集可能慢。

您可以在培训集菜单中使用“Select All Not En Force Field”命令,以在具有所提到的特定原子(几何测试,费用等)中选择所有项目,以及相应的显式项不存在的培训集中力场。 因此,当您在训练集中选择C-H距离时,强制字段没有任何C-H绑定记录,该行将在训练集中标记。如果需要强行字段中的额外条目,请考虑。

在“力字段”菜单中,存在类似的命令来选择不在培训集中的强制字段条目。

参考数据

生成参考作业

使用“生成ref作业...”命令从“培训集”菜单中生成所选系统的参考作业。

首先会要求您选择一个示例作业。这是使用ADFInput创建的一个.adf文件,该文件具有您要使用的计算设置。 这可能是使用ADF,DFTB等,根据您喜欢的基础,参数和所有其他选项。

接下来,您需要选择创建参考作业的目录。

一旦创建了它们,它们也被添加到ADFJOBS(如果打开ADFJOBS,则可见)。

运行参考作业

要运行参考作业,请使用ADFJOBS(只需选择作业并使用“运行”菜单命令)。 使用ADFJOBS,您还可以决定在其他计算机系统上运行这些作业。

从参考作业导入结果

使用“获取数据从REC作业”菜单命令从“培训集”菜单中,以更新培训中的所有选定项目,其中包含来自参考作业的数据(如果可用)。如果您没有选择,则培训集中的所有项目将被更新。

力场

类型:LgDispersion,Acks2或Ereaxff

如果您的力字段使用LgDispersion,Acks2或EreAxFF,则需要指定此项。 为此,请使用“强制字段”菜单中的“类型”命令。

您可以根据您的喜好打开或关闭这些选项。使用EreaxFF时,ACKS2将始终自动打开。

力字段(尤其是LgDispEnion)的类型确定了将参数保存到强制字段文件中。

强制场参数

有关Force Field文件中的记录的说明,请检查ReaxFF文档。 他们应该在Adftrain中提供自我解释。

请注意,当您在参数值上使用鼠标悬停时,气球将显示具有该参数的长名称,以及从力字段目录中的所有强制字段收集的统计信息。

添加记录

在“生效”菜单中,您将找到许多命令

  • 添加XXX(培训集)

这些将为训练集中的每个匹配项添加XXX记​​录(原子,键,角度等)。 因此,如果训练集具有用于原子的“Geo:距离”术语C-H,则将将键C-H记录添加到力场中。 在Force字段中的记录将不会再次添加。

如果未选择完整的训练集,则将考虑培训集中所选择的线路。

  • 添加xxx(全部)

这些命令将添加所有可能的原子,键等,可以通过组合训练集中的原子类型来制造。 忽略培训集中的选择。 在Force字段中的记录将不会再次添加。

  • 添加任何...

此命令将显示一个窗口,您可以在其中选择要添加的内容。 您需要指定类型和原子字符串(类似H-C-H)。 您可以选择明确允许重复记录(有时需要角度或扭转)。

Atom字符串可以使用一些特殊字符:

  • 匹配任何东西(也将是强制字段文件中的通配符)
  • 在Force Field文件中以Atom类型循环的“#”
  • 一种 '@'循环训练集中的原子类型

所以:

  1. 添加任何扭转H-C-O-n
  2. 添加任何键# - #
  3. 添加任何角度# - # - #
  4. 添加任何torsion# - # - # - #

将导致具有许多记录的力字段文件,H,C,O和N的所有组合。 这对于一个良好的力场来说太大,并且还需要考虑偏离对角线的氢键记录。

Force Field菜单也有命令'选择所有不在培训集中'。 对于力字段文件中的每一行,在训练集中搜索相应的几何测试。 因此,您在力字段中有键C-H线,该命令将检查训练集中是否出现了某些距离C-H。 如果不是,则选择力字段中的线。 这只是一个方便功能,可以在能量表达中使用线路,而不是在几何测试中。 由您考虑将额外的术语添加到培训集,或从力字段中删除线路,或留下它们。

编辑参数和优化详细信息

在将记录添加到强制字段文件时,需要为所有参数指定值。 Adftrain使用的值是RxFFUTILS报告的值。这些是力字段目录中所有强制字段中特定参数的平均值。有关合理的值,您可能需要设置自己的强制字段库(默认值是与我们的软件一起分发的所有Reaxff强制字段的集合)。

使用“rxffutil选项...”命令中的“rxffutil options ...”命令中,您可以设置与rxffutil程序一起使用的选项,尤其是强制字段目录。有关RXFFUTIL的更多信息,请参阅REAXFF文档。

对于Force Field Optimization不仅需要参数需要值,还需要与参数的允许范围,每个参数的允许范围,每个参数和标志指示是否需要优化特定参数。

使用左键单击选择一个或多个参数并左键单击。 第一个选定的参数将显示用黑色轮廓显示,另一个选定的参数将以微小的轮廓显示。 左键单击操作将在范围内设置与矩形内部的所有参数集的一组选定参数相对于第一个选定的参数(具有黑色轮廓的字段)。 单击所选参数以编辑这些值(因此如果如果没有选择双击参数)。 如果您将值留空,则将使用RxFFutil建议的值。

非常常见的编辑操作是更改优化标志。 适用于此的方便快捷方式是控制左键单击或右键单击参数。 使用快捷方式时,如果为所选参数更改,则优化状态将传播到所有选定的参数。

优化标志用颜色表示(橙色,优化时,否则没有特殊颜色)。

当您对参数的其他优化值进行更改时,将以图形方式指示。

将使用参数值保存的强制字段将保存到FFIEL文件中,并且有关优化的详细信息将保存到PARAMS文件中。

使用以下菜单命令重置您对rxffutil计算的值所做的更改:

  1. 重置Force Field菜单中的Param值:重置FFIEL文件中使用的参数值(可见的值)
  2. 重置参数范围在Force Field菜单中:重置优化范围,按双击参数设置

鼠标交互

除了选择的一般小鼠交互外,还提到):

  • 鼠标缩小以查看值的分布,默认值等(来自rxffutil的信息)
  • 控制左或右键单击参数:切换优化标志,传播到所有选定的参数
  • 单击选定的参数以编辑它
  • 左键单击参数:设置锚(用大纲显示)
  • 左转单击参数:选择一个参数块(WRT锚点)(所选的参数在一起标记))
  • 左键单击选定的参数(或双击未选择的参数):选择并编辑它
  • 左或右键单击原子字段:过滤使用这些原子的培训集