针对机器人过程自动化工作流的可重新配置工作台流水线的制作方法

专利查询2022-07-06 418

本申请要求了2019年12月9日提交的申请号为16/707,977的美国非临时专利申请和2019年10月15日提交的申请号为62/915,413的美国临时专利申请的权益。这些较早提交的申请的主题通过引用其整体而并入本文。

技术领域

本发明总体上涉及机器人过程自动化(RPA)，更具体地涉及针对RPA工作流的可重新配置工作台流水线。

背景技术

当前RPA工作流本质上是确定性的并且包括静态活动(activities)流水线。换句话说，在机器人执行工作流时，单个逻辑流由(多个)机器人创建并且应用。“流水线”指的是提取数据的一系列步骤和/或基于所提取的数据而采取的某些动作。然而，这种静态流水线可能并非针对所有情况都是最佳的，特别是那些随时间而变化或者针对特定用户的情况。因此，改进的解决方案可能是有益的。

技术实现要素：

本发明的某些实施例可以针对当前RPA技术尚未被完全标识、理解或者解决的本领域中的问题和需求提供解决方案。例如，本发明的一些实施例涉及针对RPA工作流的可重新配置工作台流水线。

在一个实施例中，一种使用ML提供针对RPA工作流的可重新配置工作台流水线的计算机实现的方法包括：由RPA机器人执行全局工作流。计算机实现的方法还包括：确定全局工作流的流水线针对场景没有正确地运行，以及采用AI驱动的测试来标识一个或多个ML模型或者其他组件，该一个或多个ML模型或者其他组件要被应用于流水线和/或要在全局工作流的流水线中被修改，以针对场景修复全局工作流或者专门化全局工作流。计算机实现的方法还包括：在本地工作流的流水线中实现被标识的ML模型和/或其他组件。

在另一个实施例中，一种使用ML提供针对RPA工作流的可重新配置工作台流水线的计算机实现的方法，包括：确定全局工作流的流水线针对场景没有正确地运行，以及采用AI驱动的测试来标识一个或多个ML模型或者其他组件，该一个或多个ML模型或者其他组件要被应用于流水线和/或要在全局工作流的流水线中被修改，以针对场景修复全局工作流或者专门化全局工作流。计算机实现的方法还包括：在本地工作流的流水线中实现被标识的ML模型和/或其他组件。

在另一实施例中，一种使用ML提供针对RPA工作流的可重新配置工作台流水线的计算机实现的方法，包括：采用AI驱动的测试来标识一个或多个ML模型或者其他组件，该一个或多个ML模型或者其他组件要被应用于流水线和/或要在全局工作流的流水线中被修改，以针对场景修复全局工作流或者专门化全局工作流；以及在本地工作流的流水线中实现被标识的ML模型和/或其他组件。AI驱动的测试包括：检查流水线的第一组件的输出；以及当第一组件的输出不正确时，重新配置或者替换第一组件。AI驱动的测试还包括：检查流水线中每个后续组件的输出，并且重新配置或者替换每个不正确操作的组件，直到流水线的输出正确或者所有组件的输出已经被检查。

附图说明

为了便于理解本发明某些实施例的优点，将参考附图中所示的具体实施例，对上文简要描述的本发明进行更详细的描述。虽然应当理解，这些附图仅描绘了本发明的典型实施例，因此不被认为是对其范围的限制，但是将通过使用附图以附加的特征和细节来描述和解释本发明，在附图中：

图1是图示根据本发明实施例的RPA系统的架构图。

图2是图示根据本发明实施例的已部署的RPA系统的架构图。

图3是图示根据本发明实施例的设计方、活动和驱动器之间关系的架构图。

图4是图示根据本发明实施例的RPA系统的架构图。

图5是图示根据本发明实施例的被配置为实施针对RPA工作流的可重新配置工作台流水线的计算系统的架构图。

图6图示了根据本发明实施例的不产生输出(或者不产生正确的输出)的可重新配置工作台流水线以及校正其性能的操作。

图7是图示根据本发明实施例的使用ML实现针对RPA工作流的可重新配置工作台流水线的过程的流程图。

具体实施方式

一些实施例涉及针对RPA工作流的可重新配置工作台流水线。在一些实施例中，可重新配置工作台流水线可以应用试图修复或者改进流水线的操作的机器学习(ML)模型。在某些实施例中，这可以是基于规则的操作，而不是ML模型。在一些实施例中，系统可以具有能够建议模型和/或转换组件来满足给定使用情况的控件。

例如，考虑接收可能具有各种附件(例如，发票、采购订单等)的电子邮件的情况。可能希望在流水线中具有作为门控功能来操作的组件，以在将经标记的发票发送到ML模型进行发票处理之前标识和标记电子邮件中的发票。但是，流水线可能不会在所有情况下都正确地运行。当运行发票通过流水线时，系统因此可以观察在流水线的末端处是否有输出。当没有输出时，系统可以通过对不同的流水线阶段应用一系列转换来对流水线进行修改。例如，系统可以从第一阶段开始，然后检查随后的每个阶段，以查找故障源。系统可以检查流水线的组件1，然后是组件2，然后是组件3等。如果流水线未能正确地识别电子邮件中的文档，则系统可以尝试应用流水线组件的不同实例和/或配置来尝试寻找解决方案。如果找不到解决方案，系统可以通知RPA开发方。

一些实施例的可重新配置流水线可以应用于文件处理、其他数据转换流水线、数据提取流水线等。可重新配置流水线可以涉及用于人工输入的组件和/或用于分类、提取等的专门模型。例如，最初全局工作流(例如，收据提取器)可以被构建并且被使用，但是该工作流对于某个用户或者某个任务可能无法以最佳方式工作或者根本无法工作。可以采用机器学习(ML)模型(潜在地具有人类在回环(human-in-the-loop)中)，以专门化给定任务的全局工作流。在一些实施例中，人类输入可以被跟踪并且被用于重新训练ML模型，使得ML模型随着越来越多的人类输入被收集并且被用于重新训练而变得更加智能。

在文件处理和其他复杂的人工智能(AI)应用的背景下，用户倾向于具有不同的数据、用例、与之交互的系统和结果。例如，虽然和小型“夫妻店”零售商都可以从发票处理解决方案中受益，但他们的需求却有很大不同。小型零售商的发票处理解决方案可以涉及从传入的电子邮件中取回发票，使用光学字符识别(OCR)和/或图像识别(例如，使用下面更详细描述的计算机视觉(CV)技术)对发票进行文本识别，从被OCR/CV识别的数据中取回发票信息，并且将取回的发票信息输入中。

然而，的发票处理解决方案可能实质上要复杂得多。这样一家大型零售商处理不同类型的大量发票，这些发票应该进入不同的系统，而且除了收据之外还会有其他项目。例如，可能包括多种文档类型，并且可能需要使用分类器来挑选正确的文档。因此，大型零售商可能希望分类器识别该数据中的发票类型，并且基于发票类型将发票传递至正确的下游工作流。此类大型零售商也可能具有以不同语言书写的发票，语言处理器例如可能有利于将这些发票转换成英语。

一些实施例的工作台流水线允许模型的“块”或者其他逻辑被应用于工作流，以便根据全局要求将定制工作流适应到本地应用。这些块和/或逻辑是流水线的阶段(或者组件)。首先，在一些实施例中，RPA开发方创建初始工作流作为针对内置智能的特定应用的“全局”工作流(例如，通过调用ML模型)。ML模型可以监控正在执行的机器人的行为，并且自动确定某些活动应该被包括在工作流中、被其他活动替换或者被修改。例如，如果监视ML模型确定在机器人处理发票之后用户频繁地进入并且校正某个字段，则ML模型可以取用不同的文本识别模型或者CV模型(例如，文本被风格化并且位于具有风格化的单词和图像的公司标志内)并且修改文本识别活动转而使用该模型。

在一些实施例中，基础ML模型可以被用于全局工作流，定制模型可以稍后被添加。在这个意义上，工作流可以具有允许在初始实现之后添加、移除和/或改变块的即插即用功能。例如，全局模型可以是收据数据提取模型，但是西班牙语翻译器模型可以被添加为本地模型以解析西班牙语收据。

图1是图示根据本发明实施例的RPA系统100的架构图。RPA系统100包括允许开发方设计和实现工作流的设计方110。设计方110可以提供用于应用集成以及自动化第三方应用、管理信息技术(IT)任务和商业IT过程的解决方案。设计方110可以促进自动化项目的开发，该自动化项目是业务过程的图形表示。简而言之，设计方110促进工作流和机器人的开发和部署。

自动化项目通过给予开发方对执行顺序和在工作流中开发的自定义步骤集之间的关系的控制，来启用基于规则的过程的自动化，在本文中工作流被限定为“活动”。设计方110的实施例的一个商业示例是UiPath Studio^TM。每个活动可以包括动作，诸如点击按钮、读取文件、写入记录面板等。在一些实施例中，工作流可以是嵌套的或者嵌入的。

工作流的一些类型可以包括但不限于序列、流程图、有限状态机(FSM)和/或全局异常处理程序。序列可以特别适合线性过程，使能够从一个活动流向另一活动，而不会使工作流变得混乱。流程图可以特别适合更复杂的业务逻辑，通过多个分支逻辑操作符以更多样化的方式启用决策的集成和活动的连接。FSM可以特别适合大型工作流。FSM可以在它们的执行中使用有限数目的状态，这些状态由条件(即，转换)或者活动触发。全局异常处理程序可以特别适合用于在遇到执行错误时确定工作流行为以及用于调试过程。

一旦在设计方110中开发出工作流之后，指挥方120协调业务过程的执行，指挥方120协调一个或多个机器人130执行设计方110中已开发的工作流。指挥方120的实施例的一个商业示例是UiPath Orchestrator^TM。指挥方120促进管理环境中资源的创建、监控和部署。指挥方120可以充当与第三方解决方案和应用的集成点。

指挥方120可以管理机器人130的编队、从集中点连接和执行机器人130。可以被管理的机器人130的类型包括但不限于：有人参与机器人132、无人参与机器人134、开发机器人(类似于无人参与机器人134，但用于开发和测试目的)和非生产机器人(类似于有人参与机器人132，但用于开发和测试目的)。有人参与机器人132由用户事件触发，并且在同一计算系统上与人类一起工作。有人参与机器人132可以与指挥方120一起用于集中式过程部署和记录介质。有人参与机器人132可以帮助人类用户完成各种任务，并且可以由用户事件触发。在一些实施例中，过程不能从这种类型的机器人上的指挥方120启动，和/或它们不能在锁定的屏幕下运行。在某些实施例中，有人参与机器人132只能从机器人托盘或者从命令提示符来启动。在一些实施例中，有人参与机器人132应当在人类的监督下运行。

无人参与机器人134在虚拟环境中无人参与地运行并且可以自动化数个过程。无人参与机器人134可以负责远程执行、监控、调度和针对工作队列提供支持。在一些实施例中，针对所有机器人类型的调试可以在设计方110中运行。有人参与机器人和无人参与机器人两者可以自动化各种系统和应用，包括但不限于大型机、web应用、VM、企业应用(例如，由等生产的应用)、以及计算系统应用(例如，桌面和膝上型应用、移动设备应用、可穿戴计算机应用等)。

指挥方120可以具有各种功能，包括但不限于供应、部署、配置、排队、监控、记录和/或提供互连性。供应可以包括：创建和维护机器人130与指挥方120之间的连接(例如，web应用)。部署可以包括：确保将数据包版本正确地递送给指定的机器人130用于执行。配置可以包括机器人环境和过程配置的维护和递送。排队可以包括：提供队列和队列项的管理。监控可以包括：跟踪机器人标识数据和维护用户许可。记录可以包括：将记录存储到和索引到数据库(例如，SQL数据库)和/或另一存储机制(例如，提供存储和快速查询大型数据集的能力的)。指挥方120可以通过充当针对第三方解决方案和/或应用的集中通信点来提供互连性。

机器人130是运行设计方110内置工作流的执行代理。(多个)机器人130的一些实施例的一个商业示例是UiPath Robots^TM。在一些实施例中，机器人130默认安装微软服务控制管理器(SCM)管理的服务。因此，此类机器人130可以在本地系统账户下打开交互式会话，并且具有服务的权限。

在一些实施例中，机器人130可以以用户模式安装。针对这种机器人130，这意味着它们具有与已经安装的给定机器人130的用户相同的权利。此功能也可以用于高密度(HD)机器人，确保机器中的每个机器的最大潜能得到充分利用。在一些实施例中，可以在HD环境中配置任何类型的机器人130。

某些实施例中的机器人130分为多个组件，每个组件专用于特定的自动化任务。一些实施例中的机器人组件包括但不限于SCM管理的机器人服务、用户模式机器人服务、执行方、代理和命令行。SCM管理的机器人服务对会话进行管理和监控，并且充当指挥方120与执行主机(即，机器人130在其上被执行的计算系统)之间的代理。这些服务可以被委托并且管理针对机器人130的凭证。本地系统下的SCM启动控制台应用。

在一些实施例中，用户模式机器人服务管理和监控会话，并且充当指挥方120与执行主机之间的代理。用户模式机器人服务可以被委托并且管理针对机器人130的凭证。如果没有安装SCM管理的机器人服务，则应用可以自动启动。

执行方可以在会话下运行给定作业(即，它们可以执行工作流)。执行方可以知道每个监控器的每英寸点数(DPI)设置。代理可以是在系统托盘窗口中显示可用作业的呈现基础(WPF)应用。代理可以是服务的客户端。代理可以请求启动或者停止作业以及更改设置。命令行是服务的客户端。命令行是控制台应用，其可以请求启动作业并且等待其输出。

如上所述地将机器人130的组件分开有助于开发方、支持用户和计算系统更轻松地运行、标识和跟踪每个组件正在执行什么。可以以这种方式为每个组件配置特殊行为，诸如针对执行方和服务设置不同的防火墙规则。在一些实施例中，执行方可以总是知道每个监控器的DPI设置。因此，工作流可以在任何DPI处执行，而无论创建工作流的计算系统的配置如何。在一些实施例中，来自设计方110的项目也可以独立于浏览器缩放级别。对于不知道DPI或者故意地标记为不知道的应用，在一些实施例中可以禁用DPI。

图2是图示根据本发明实施例的已部署RPA系统200的架构图。在一些实施例中，RPA系统200可以是图1的RPA系统100，或者可以是其部分。应当注意，客户端侧、服务器侧或两者可以包括任何期望数目的计算系统，而不脱离本发明的范围。在客户端侧，机器人应用210包括执行方212、代理214和设计方216。然而，在一些实施例中，设计方216可以不在计算系统210上运行。执行方212正在运行过程。多个业务项目可以同时运行，如图2所示。在本实施例中，代理214(例如，服务)是针对所有执行方212的单联系点。本实施例中的所有消息都被记录到指挥方230中，指挥方230经由数据库服务器240、索引器服务器250或两者进一步处理它们。如上关于图1所述，执行方212可以是机器人组件。

在一些实施例中，机器人代表机器名称与用户名之间的关联。机器人可以同时管理多个执行方。在支持同时运行的多个交互式会话的计算系统(例如，服务器2012)上，多个机器人可以同时运行，每个机器人使用唯一的用户名在单独的会话中运行。这就是上面提到的HD机器人。

代理214还负责发送机器人的状态(例如，定期地发送指示机器人仍在运行的“心跳”消息)和下载要执行的数据包的所需版本。在一些实施例中，代理214与指挥方230之间的通信总是由代理214发起。在通知场景中，代理214可以打开随后由指挥方230用来向机器人发送命令(例如，开始、停止等)的WebSocket通道。

在服务器侧，包括了表示层(web应用232、开放数据协议(OData)代表状态传输(REST)应用编程接口(API)端点234以及通知和监控236)、服务层(API实现/业务逻辑238)和持久层(数据库服务器240和索引器服务器250)。指挥方230包括web应用232、OData REST API端点234、通知和监控236以及API实现/业务逻辑238。在一些实施例中，用户在指挥方220的界面中执行的大多数动作(例如，经由浏览器220)是通过调用各种API来执行的。这种动作可以包括但不限于在机器人上启动作业、在队列中添加/移除数据、调度作业以进行无人参与运行等，而不脱离本发明的范围。Web应用232是服务器平台的可视层。在本实施例中，web应用232使用超文本标记语言(HTML)和JavaScript(JS)。然而，在不脱离本发明的范围的情况下，可以使用任何期望的标记语言、脚本语言或者任何其他格式。在本实施例中，用户经由浏览器220与来自web应用232的网页交互，以便执行各种动作来控制指挥方230。例如，用户可以创建机器人组、向机器人分配数据包、分析每个机器人的和/或每个过程的记录、启动和停止机器人等。

除了web应用232，指挥方230还包括公开OData REST API端点234的服务层。然而，可以包括其他端点，而不脱离本发明的范围。REST API由web应用232和代理214两者消费。在本实施例中，代理214是客户端计算机上的一个或多个机器人的监管方。

本实施例中的REST API涵盖配置、记录、监控和排队功能。在一些实施例中，配置端点可以用于限定和配置应用用户、许可、机器人、资产、发布和环境。记录REST端点可以用于记录不同的信息，诸如错误、由机器人发送的明确消息以及其他特定于环境的信息。如果在指挥方230中使用启动作业命令，则机器人可以使用部署REST端点来查询应该被执行的数据包版本。排队REST端点可以负责队列和队列项管理，诸如向队列添加数据、从队列获取事务(transaction)、设置事务的状态等。

监控REST端点可以监控web应用232和代理214。通知和监控API 236可以是REST端点，其用于注册代理214、向代理214递送配置设置、以及用于从服务器和代理214发送/接收通知。在一些实施例中，通知和监控API 236也可以使用WebSocket通信。

在本实施例中，持久层包括服务器对——数据库服务器240(例如，SQL服务器)和索引器服务器250。本实施例中的数据库服务器240存储机器人、机器人组、相关过程、用户、角色、调度等的配置。在一些实施例中，该信息通过web应用232而被管理。数据库服务器240可以管理队列和队列项。在一些实施例中，数据库服务器240可以存储由机器人记录的消息(附加于索引器服务器250或者代替索引器服务器250)。

索引器服务器250(其在一些实施例中为可选的)存储并且索引由机器人记录的信息。在某些实施例中，可以通过配置设置来禁用索引器服务器250。在一些实施例中，索引器服务器250使用(其是开源项目全文搜索引擎)。由机器人记录的消息(例如，使用记录消息或者写入行等的活动)可以通过(多个)记录REST端点而被发送到索引器服务器250，在索引器服务器250处它们被索引用于将来使用。

图3是图示根据本发明实施例的设计方310、活动320、330和驱动器340之间的关系300的架构图。如上所述，开发方使用设计方310来开发由机器人执行的工作流。工作流可以包括用户限定的活动320和UI自动化活动330。一些实施例能够标识图像中的非文本视觉成分，这在本文中被称为计算机视觉(CV)。与这些组件相关的一些CV活动可以包括但不限于点击、键入、获取文本、悬停、元素存在、刷新范围、突出显示等。在一些实施例中，点击使用例如CV、光学字符标识(OCR)、模糊文本匹配和多锚点来标识元素，并且点击元素。键入可以使用上述和元素中的类型来标识元素。获取文本可以标识特定文本的位置并且使用OCR对其扫描。悬停可以标识元素并且悬停在其上。元素存在可以使用上述技术来检查元素是否存在于屏幕上。在一些实施例中，可能有数百甚至数千个活动可以在设计方310中实现。然而，任何数目和/或类型的活动都是可用的，而不脱离本发明的范围。

UI自动化活动330是以较低等级代码编写的特殊较低等级活动的子集(例如，CV活动)并且有益于与屏幕的互动。UI自动化活动330经由驱动器340来促进这些交互，该驱动器340允许机器人与期望的软件交互。例如，驱动器340可以包括OS驱动器342、浏览器驱动器344、VM驱动器346、企业应用驱动器348等。

驱动器340可以在较低等级处与OS互动，寻找挂钩，监控密钥等。它们可以促进与等的集成。例如，“点击”活动经由驱动器340在这些不同的应用中执行相同的角色。

图4是图示根据本发明实施例的RPA系统400的架构图。在一些实施例中，RPA系统400可以是或者可以包括图1和/或图2的RPA系统100和/或200。RPA系统400包括运行机器人的多个客户端计算系统410。计算系统410能够经由运行在其上的web应用来与指挥方计算系统420通信。指挥方计算系统420转而又能够与数据库服务器430和可选的索引器服务器440通信。

关于图1和图3，应注意的是，虽然在这些实施例中使用了web应用，可以使用任何合适的客户/服务器软件，而不脱离本发明范围。例如，指挥方可以运行与客户端计算系统上的非基于网络的客户软件应用通信的服务器侧应用。

图5是图示根据本发明实施例的被配置为实现针对RPA工作流的的可重新配置工作台流水线的计算系统500的架构图。在一些实施例中，计算系统500可以是本文描绘和/或描述的计算系统中的一个或多个计算系统。计算系统500包括总线505或者用于传递信息的其他通信机制，以及耦合到总线505用于处理信息的(多个)处理器510。(多个)处理器510可以是任何类型的通用处理器或者专用处理器，包括中央处理单元(CPU)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、图形处理单元(GPU)、其多个实例和/或其任何组合。(多个)处理器510还可以具有多个处理核，并且这些核中的至少一些核可以被配置为执行特定功能。在一些实施例中可以使用多并行处理。在某些实施例中，(多个)处理器510中的至少一个处理器可以是包括模拟生物神经元的处理元件的神经形态电路。在一些实施例中，神经形态电路可以不需要冯诺依曼计算架构的典型组件。

计算系统500还包括存储器515，用于存储信息和要由(多个)处理器510执行的指令。存储器515可以由随机存取存储器(RAM)、只读存储器(ROM)、闪存、高速缓存、诸如磁盘或者光盘静态存储器或者任何其他类型的非暂态计算机可读介质或者其组合的任意组合组成。非暂态计算机可读介质可以是能够由(多个)处理器510访问的任何可用介质，并且可以包括易失性介质、非易失性介质或两者。介质也可以是可移动的、不可移动的或两者。

附加地，计算系统500包括通信设备520，诸如收发器，以经由无线和/或有线连接提供对通信网络的访问。在一些实施例中，通信设备520可以被配置为使用频分多址(FDMA)、单载波FDMA(SC-FDMA)、时分多址(TDMA)、码分多址(CDMA)、正交频分复用(OFDM)、正交频分多址(OFDMA)、全局移动通信系统(GSM)、通用分组无线业务(GPRS)、通用移动电信系统(UMTS)、cdma2000、宽带CDMA(W-CDMA)、高速下行链路分组接入(HSDPA)、高速上行链路分组接入(HSUPA)、高速分组接入(HSPA)高级LTE(LTE-A)、802.11x、Wi-Fi、Zigbee、超宽带(UWB)、802.16x、802.15、家庭节点B(HnB)、蓝牙、射频标识(RFID)、红外数据协会(IrDA)、近场通信(NFC)、第五代(5G)、新无线电(NR)、它们的任何组合、和/或任何其他当前存在的或者未来实现的通信标准和/或协议，而不脱离本发明的范围。在一些实施例中，通信设备520可以包括一个或多个天线，这些天线是单一的、阵列的、相控的、切换的、波束成形的、波束控制的、它们的组合，和/或任何其他天线配置，而不脱离本发明的范围。

(多个)处理器510还经由总线505耦合至显示器525，诸如等离子显示器、液晶显示器(LCD)、发光二极管(LED)显示器、场发射显示器(FED)、有机发光二极管(OLED)显示器、柔性OLED显示器、柔性基板显示器、投影显示器、4K显示器、高清显示器、显示器、面内切换(IPS)显示器或者任何其他适用于向用户显示信息的显示器。显示器525可以被配置为触摸(触觉)显示器、三维(3D)触摸显示器、多输入触摸显示器、多点触摸显示器等。使用电阻、电容、表面声波(SAW)电容、红外、光学成像、色散信号技术、声脉冲标识、受抑全内反射等。可以使用任何合适的显示设备和触觉I/O，而不脱离本发明的范围。

键盘530和光标控制设备535(诸如，计算机鼠标、触摸板等)还耦合至总线505，以使用户能够与计算系统交互。然而，在某些实施例中，可以不存在物理键盘和鼠标，并且用户可以仅通过显示器525和/或触摸板(未示出)来与设备交互。根据设计选择，可以使用任何类型和组合的输入设备。在某些实施例中，不存在物理输入设备和/或显示器。例如，用户可以经由与计算系统500通信的另一计算系统远程地与计算系统500交互，或者计算系统500可以自主地操作。

存储器515存储由(多个)处理器510执行时提供功能的软件模块。这些模块包括针对计算系统500的操作系统540。这些模块还包括工作台流水线模块545，其被配置为执行本文描述的全部或部分过程或者其导出。计算系统500可以包括一个或多个包括附加功能的附加功能模块550。

本领域技术人员将理解，“系统”可以被具化为服务器、嵌入式计算系统、个人计算机、控制台、个人数字助理(PDA)、蜂窝电话、平板计算设备、量子计算系统或者任何其他合适的计算设备或者设备组合，而不脱离本发明范围。将上述功能表示为由“系统”执行并且不旨在以任何方式限制本发明的范围，而是旨在提供本发明的多个实施例中的一个示例。实际上，本文公开的方法、系统和设备可以以与计算技术(包括云计算系统)一致的局部化和分布式形式来实现。

应注意的是，本说明书中描述的一些系统特征已作为模块而被表示，以便更具体地强调其实现独立性。例如，模块可以被实现为硬件电路，包括定制的超大规模集成(VLSI)电路或门阵列、诸如逻辑芯片、晶体管或者其他分立元件的现成半导体。模块也可以在可编程硬件设备中实现，例如现场可编程门阵列、可编程阵列逻辑、可编程逻辑设备、图形处理单元等。

模块也可以至少部分地在软件中实现，用于由各种类型的处理器执行。可执行代码的标识的单元可以例如包括计算机指令的一个或多个物理块或逻辑块，其可以例如被组织为对象、程序或者功能。然而，标识的模块的可执行文件不需要在物理上位于一起，而是可以包括存储在不同位置的不同指令，当这些指令在逻辑上结合在一起时，构成该模块并且实现针对该模块的所描述目的。此外，模块可以存储在计算机可读介质上，计算机可读介质可以是例如硬盘驱动、闪存设备、RAM、磁带和/或用于存储数据的任何其他这种非暂态计算机可读介质，而不脱离本发明的范围。

实际上，可执行代码模块可以为单个指令或者多个指令，甚至可以在多个不同代码段上、不同程序中以及跨多个存储设备中分布。类似地，操作数据在本文可以在模块内被标识和示出，并且可以以任何合适的形式被具化并且被组织在任何合适类型的数据结构内。操作数据可以作为单个数据集来收集，或者可以分布在不同的位置，包括在不同的存储设备上，并且可以至少部分地仅作为系统或者网络上的电子信号而存在。

图6图示了根据本发明实施例的不产生输出(或者不产生正确的输出)的可重新配置工作台流水线600以及校正其性能的操作。在初始状态A中，四个组件1、2、3和4被链接以产生输出。然而，由于来自组件2的输出，输出没有被产生或者错误的输出被产生了，如右边的“X”所示。工作台流水线首先检查处于状态B的组件1的输入和输出。这些被确定为是正确的，因此工作台流水线继续检查处于状态C的组件2的输出。针对该用例，组件2的输出被确定为有错误。

然后，系统尝试通过测试新组件(例如，ML模型、条件逻辑等)查找问题的解决方案。在此示例中，系统确定插入组件5为流水线提供了正确的输出，并且在步骤D处用组件5替换了组件2。如此修改了流水线以产生正确的输出，从而“修复”了流水线并且使流水线可重新配置。

图7是图示根据本发明实施例的使用ML实现针对RPA工作流的可重新配置工作台流水线的过程700的流程图。该过程开始于在710处由RPA机器人执行全局工作流。然后在720处确定全局工作流的流水线针对场景没有在正确地工作(例如，通过RPA机器人、另一软件应用、计算系统等)。在730处AI驱动的测试被采用，以标识要应用于流水线和/或在全局工作流的流水线中修改的一个或多个ML模型或者其他组件，从而修复针对场景的全局工作流或者专门化该全局工作流。

在一些实施例中，要应用于流水线的模型或者其他组件的标识可以类似于上文针对图6所描述的过程。例如，当流水线不产生输出或者不产生正确的输出时，可以检查第一组件的输入和输出。如果输入和输出中的一个或两个不正确，则校正措施可以被采取(例如，在输入错误的情况下通过分析数据源，或者在存在输出错误的情况下通过重新配置或者替换第一组件)。分析数据源可以包括检查正在产生输入的软件、系统、机器人等中的逻辑。例如，数据库操作中的一个或多个SQL命令可能不正确。重新配置第一组件可以包括修改该组件的参数、改变其逻辑、使该组件调用不同的ML模型、其任何组合等。如果第一组件的输入和输出是正确的，则可以检查第二个组件的输出，然后是第三组件，依此类推，直到流水线中所有工作不正常的组件都被识别和解决。

在一些实施例中，当流水线的一个或多个ML模型和/或其他组件在730处无法被确定时，系统在732处通知RPA开发方流水线运行不正确(例如，发送包括工作流、运行不正常的流水线组件、指示针对现有组件哪些(多个)替换组件和/或修改被尝试过的日志数据、或者其任何组合)的信息，并且在734处接收RPA开发方的指导。在一些实施例中，来自RPA开发方的指导可以包括流水线的修复版本、本地工作流、新的流水线组件、其任何组合等。然后，在740处系统在本地工作流的流水线中实现所标识的ML模型和/或其他组件。然后，在750处RPA机器人的新版本被生成以执行本地工作流。在760处RPA机器人的新版本被部署，并且在770处本地工作流由RPA机器人的新版本执行。

根据本发明的实施例，图7中执行的过程步骤可以由计算机程序执行，针对(多个)处理器的指令进行编码，以执行图7中描述的至少部分过程。计算机程序可以被具化在非暂态计算机可读介质上。计算机可读介质可以是但不限于硬盘驱动器、闪存设备、RAM、磁带和/或用于存储数据的任何其他这样的介质或者介质的组合。计算机程序可以包括用于控制计算系统的(多个)处理器(例如，图5的计算系统500的(多个)处理器510)以实现图7中描述的全部或者部分过程步骤的编码指令，该编码指令也可以存储在计算机可读介质上。

计算机程序可以在硬件、软件或者混合实施方式中实现。计算机程序可以由彼此可操作通信的模块组成，并且被设计为传递信息或者指令以显示。计算机程序可以被配置为在通用计算机、ASIC或者任何其他合适的设备上运行。

容易理解的是，本发明各种实施例的组件，如本文附图中一般描述和说明的，可以按各种不同配置进行排列和设计。因此，如附图中所示，本发明的实施例的详细描述不旨在限制所要求保护的本发明的范围，而仅是本发明的所选择的实施例的代表。

本说明书中描述的本发明的特征、结构或者特性可以在一个或多个实施例中以任何合适的方式进行组合。例如，在整个说明书中，对“某些实施例”、“一些实施例”或者类似语言的引用意味着结合本实施例所描述的特定特征、结构或者特性包括在本发明的至少一个实施例中。因此，在整个说明书中出现的短语“在某些实施例中”、“在一些实施例中”、“在其他实施例中”或者类似语言不必然都指同一组实施例，并且所描述的特征、结构或者特性可以以任何合适的方式组合在一个或多个实施例中。

应注意，贯穿本说明书中提及的特征、优点或者类似语言并且不意味着本发明可以实现的所有特征和优点应当位于本发明的任何单个实施例中。相反，关于特征和优点的语言被理解为意味着结合实施例描述的特定特征、优点或者特性被包括在本发明的至少一个实施例中。因此，贯穿本说明书的特征和优点的讨论以及类似的语言可以但不必然指同一实施例。

此外，本发明的所述特征、优点和特性可以在一个或多个实施例中以任何合适的方式进行组合。相关领域的技术人员将认识到，本发明可以在没有特定实施例的一个或多个具体特征或者优点的情况下实践。在其他实例中，可以在某些实施例中认识到附加的特征和优点，这些特征和优点可能不存在于本发明的所有实施例中。

本领域普通技术人员将容易理解，上述本发明可以利用不同顺序的步骤和/或利用不同于所公开配置的硬件元件而被实践。因此，尽管已经基于这些优选实施例描述了本发明，但是对于本领域的技术人员，在保持在本发明的精神和范围内的同时，某些修改、变型和备选结构将是明显的。因此，为了确定本发明的界限和边界，应当参考所附权利要求。

转载请注明原文地址:https://tc.8miu.com/read-35.html

专利

最新回复(0)