本申请要求2019年12月9日提交的申请号为16/708,132的美国非临时专利申请和2019年10月15日提交的申请号为62/915,442的美国临时专利申请的权益。这些较早提交的申请的主题通过引用其整体而并入本文。
技术领域
本发明总体上涉及机器人流程自动化(RPA),更具体地涉及RPA的过程演进和/或RPA工作流微优化。
背景技术
RPA自动化的实现通常是零碎完成的,其中单个实现被计划并且被实现。然而,这种脱节的过程不是最优的。此外,机器人可能并不总是最优的。因此,改进的过程可以是有益的。
技术实现要素:
本发明的某些实施例可以针对当前RPA技术尚未被完全标识、理解或者解决的现有技术中的问题和需求提供解决方案。例如,本发明的一些实施例涉及RPA的过程演进和/或RPA工作流微优化。
在实施例中,一种计算机实现的方法包括:由计算系统接收用于机器人流程自动化(RPA)实现的计划。计划包括业务数据。计算机实现的方法还包括:由计算系统对与计划相关联的业务数据进行分析,以测量、报告RPA操作并且使RPA操作与战略业务成果相一致。计算机实现的方法还包括:由计算系统基于分析生成实现自动化的一个或多个RPA工作流;以及由计算系统经由RPA机器人生成和部署一个或多个RPA工作流。
在另一实施例中,一种计算机实现的方法,包括:由计算系统对与用于机器人流程自动化(RPA)实现的计划相关联的业务数据执行分析,以测量、报告RPA操作并且使RPA操作与战略业务成果相一致。计算机实现的方法还包括:由计算系统基于分析生成实现自动化的一个或多个RPA工作流;以及由计算系统经由RPA机器人生成和部署一个或多个RPA工作流。
在另一实施例中,一种计算机实现的方法包括:由计算系统基于性能标准来分析和优先化机器人流程自动化(RPA)工作流中的每个活动。计算机实现的方法还包括:由计算系统向RPA工作流添加活动或者从RPA工作流删除活动,以创建修改的RPA工作流;以及由计算系统生成并且运行实现修改的RPA工作流的RPA机器人。计算机实现的方法还包括:由计算系统测试生成的RPA机器人,以确定RPA机器人是否达到目标并且实现性能标准的改进。
附图说明
为了便于理解本发明某些实施例的优点,将参考附图中所示的具体实施例,对上文简要描述的本发明进行更详细的描述。虽然应当理解,这些附图仅描绘了本发明的典型实施例,因此不被认为是对其范围的限制,但是将通过使用附图利用附加的特征和细节来描述和解释本发明,在附图中:
图1是图示根据本发明实施例的RPA系统的架构图。
图2是图示根据本发明实施例的已部署的RPA系统的架构图。
图3是图示根据本发明实施例的设计器、活动和驱动器之间关系的架构图。
图4是图示根据本发明实施例的RPA系统的架构图。
图5是图示根据本发明实施例的被配置为执行用于RPA的过程演进的计算系统的架构图。
图6是图示根据本发明实施例的被配置为实现用于RPA的过程演进和/或执行RPA工作流微优化的系统的架构图。
图7是图示根据本发明实施例的被配置为用于实现用于RPA的过程演进的过程的流程图。
图8是图示根据本发明实施例的被配置为用于执行RPA工作流微优化的过程的流程图。
具体实施方式
一些实施例涉及RPA的过程演进和/或RPA工作流微优化。通常,当考虑自动化时,应该考虑集成系统。该集成系统可以将诸如计划组件、测量组件和实现组件等的多个组件集合在一起。
最初,可以使用人工智能(AI)科学地计划RPA实现。可以使用嵌入式分析以测量、报告RPA操作并且使RPA操作与战略业务成果保持一致。然后RPA可以通过AI架构来部署AI技能(例如,以机器学习(ML)模型的形式)而被实现,AI架构无缝地应用、缩放和管理用于机器人的RPA工作流的AI。这种计划、测量和报告的循环可以被重复,可以被越来越多的AI指导,以迭代地提高RPA的有效性以用于业务。RPA实现也可以基于它们的估计投资回报(ROI)而被标识和被实现。
在一些实施例中,主题专家(SME)可以显示和记录特定过程是如何被执行的。SME然后可以基于这些过程生成机器人。在某些实施例中,监听器(例如,挖掘关于用户操作的数据的机器人)可以被部署在用户计算系统上,以确定计算系统的用户正在采取什么路径、用户正在使用哪些应用、用户正在如何使用这些应用等。
在一些实施例中,存在发现和记录过程的不同的方法。例如,计算系统的用户可以提交自动化的想法。在另一示例中,用户可以基于自动化的概念协作地进行构建或者协作地为企业构建自动化库。被开发的机器人可以被添加到其他用户可以访问和使用的档案中。在一些实施例中,机器人可以访问其他机器人的档案。
在某些实施例中,如果用户知道他或她希望自动化哪个过程,用户可以记录该过程(例如,通过记录了用户正在使用他或她的计算系统的视频)。然后视频可以被分析以确定自动化是否可行。在某些实施例中,用户可以使用能够进行记录的监督文档工具来定义用例。
一些实施例提供了过程的微优化。例如,考虑用户为RPA机器人构建了包含20个步骤的工作流但是其中2个步骤实际上并不需要的情况。系统可以删除一个或多个步骤,并且生成实现修改后的工作流的机器人,以检查工作流是否中断。如果它没有中断,修改后的工作流可以用于生成机器人的新版本,该机器人的新版本然后可以被部署来替换先前的版本。
在某些实施例中,某些步骤可以相较于其他步骤被作为目标。例如,系统可以确定每个步骤需要多长时间来执行和删除步骤,并且以最长完成时间到最短完成时间的顺序测试修改的工作流。因此,系统可以确定可以被移除并且对总工作流执行时间也有显著影响的步骤。
在一些实施例中,系统可以添加和/或删除步骤,以基于奖励函数(例如,强化学习的奖励函数)查看实现的ROI是否得到改进。这可以由所产生的收入的增加、处理时间的减少、员工生产率的提高等来确定。如果添加和/或移除一个或多个步骤导致了改进,则可以生成和部署实现修改的工作流的机器人。
图1是图示根据本发明实施例的RPA系统100的架构图。RPA系统100包括允许开发方设计和实现工作流的设计器110。设计器110可以提供用于应用集成以及自动化第三方应用、管理信息技术(IT)任务和商业IT过程的解决方案。设计器110可以促进自动化项目的开发,该自动化项目是业务过程的图形表示。简而言之,设计器110促进工作流和机器人的开发和部署。
自动化项目通过给予开发方对执行顺序和在工作流中开发的自定义步骤集之间的关系的控制,来启用基于规则的过程的自动化,在本文中工作流被限定为“活动”。设计器110的实施例的一个商业示例是UiPath StudioTM。每个活动可以包括动作,诸如点击按钮、读取文件、写入记录面板等。在一些实施例中,工作流可以是嵌套的或者嵌入的。
工作流的一些类型可以包括但不限于序列、流程图、有限状态机(FSM)和/或全局异常处理程序。序列可以特别适合线性过程,使能够从一个活动流向另一活动,而不会使工作流变得混乱。流程图可以特别适合更复杂的业务逻辑,通过多个分支逻辑操作符以更多样化的方式启用决策的集成和活动的连接。FSM可以特别适合大型工作流。FSM可以在它们的执行中使用有限数目的状态,这些状态由条件(即,转换)或者活动触发。全局异常处理程序可以特别适合用于在遇到执行错误时确定工作流行为以及用于调试过程。
一旦在设计器110中开发出工作流之后,指挥方120协调业务过程的执行,指挥方120协调一个或多个机器人130执行设计器110中已开发的工作流。指挥方120的实施例的一个商业示例是UiPath OrchestratorTM。指挥方120促进管理环境中资源的创建、监控和部署。指挥方120可以充当与第三方解决方案和应用的集成点。
指挥方120可以管理机器人130的编队、从集中点连接和执行机器人130。可以被管理的机器人130的类型包括但不限于:有人值守机器人132、无人值守机器人134、开发机器人(类似于无人值守机器人134,但用于开发和测试目的)和非生产机器人(类似于有人值守机器人132,但用于开发和测试目的)。有人值守机器人132由用户事件触发,并且在同一计算系统上与人类一起工作。有人值守机器人132可以与指挥方120一起用于集中式过程部署和记录介质。有人值守机器人132可以帮助人类用户完成各种任务,并且可以由用户事件触发。在一些实施例中,过程不能从这种类型的机器人上的指挥方120启动,和/或它们不能在锁定的屏幕下运行。在某些实施例中,有人值守机器人132只能从机器人托盘或者从命令提示符来启动。在一些实施例中,有人值守机器人132应当在人类的监督下运行。
无人值守机器人134在虚拟环境中无人值守地运行并且可以自动化数个过程。无人值守机器人134可以负责远程执行、监控、调度和针对工作队列提供支持。在一些实施例中,针对所有机器人类型的调试可以在设计器110中运行。有人值守机器人和无人值守机器人两者可以自动化各种系统和应用,包括但不限于大型机、web应用、VM、企业应用(例如,由等生产的应用)、以及计算系统应用(例如,桌面和膝上型应用、移动设备应用、可穿戴计算机应用等)。
指挥方120可以具有各种功能,包括但不限于供应、部署、配置、排队、监控、记录和/或提供互连性。供应可以包括:创建和维护机器人130与指挥方120之间的连接(例如,web应用)。部署可以包括:确保将数据包版本正确地递送给指定的机器人130用于执行。配置可以包括机器人环境和过程配置的维护和递送。排队可以包括:提供队列和队列项的管理。监控可以包括:跟踪机器人标识数据和维护用户许可。记录可以包括:将记录存储到和索引到数据库(例如,SQL数据库)和/或另一存储机制(例如,提供存储和快速查询大型数据集的能力的)。指挥方120可以通过充当针对第三方解决方案和/或应用的集中通信点来提供互连性。
机器人130是运行设计器110内置工作流的执行代理。(多个)机器人130的一些实施例的一个商业示例是UiPath RobotsTM。在一些实施例中,机器人130默认安装微软服务控制管理器(SCM)管理的服务。因此,此类机器人130可以在本地系统账户下打开交互式会话,并且具有服务的权限。
在一些实施例中,机器人130可以以用户模式安装。针对这种机器人130,这意味着它们具有与已经安装的给定机器人130的用户相同的权利。此功能也可以用于高密度(HD)机器人,确保机器中的每个机器的最大潜能得到充分利用。在一些实施例中,可以在HD环境中配置任何类型的机器人130。
某些实施例中的机器人130分为多个组件,每个组件专用于特定的自动化任务。一些实施例中的机器人组件包括但不限于SCM管理的机器人服务、用户模式机器人服务、执行方、代理和命令行。SCM管理的机器人服务对会话进行管理和监控,并且充当指挥方120与执行主机(即,机器人130在其上被执行的计算系统)之间的代理。这些服务可以被委托并且管理针对机器人130的凭证。本地系统下的SCM启动控制台应用。
在一些实施例中,用户模式机器人服务管理和监控会话,并且充当指挥方120与执行主机之间的代理。用户模式机器人服务可以被委托并且管理针对机器人130的凭证。如果没有安装SCM管理的机器人服务,则应用可以自动启动。
执行方可以在会话下运行给定作业(即,它们可以执行工作流)。执行方可以知道每个监控器的每英寸点数(DPI)设置。代理可以是在系统托盘窗口中显示可用作业的呈现基础(WPF)应用。代理可以是服务的客户端。代理可以请求启动或者停止作业以及更改设置。命令行是服务的客户端。命令行是控制台应用,其可以请求启动作业并且等待其输出。
如上所述地将机器人130的组件分开有助于开发方、支持用户和计算系统更轻松地运行、标识和跟踪每个组件正在执行什么。可以以这种方式为每个组件配置特殊行为,诸如针对执行方和服务设置不同的防火墙规则。在一些实施例中,执行方可以总是知道每个监控器的DPI设置。因此,工作流可以在任何DPI处执行,而无论创建工作流的计算系统的配置如何。在一些实施例中,来自设计器110的项目也可以独立于浏览器缩放级别。对于不知道DPI或者故意地标记为不知道的应用,在一些实施例中可以禁用DPI。
图2是图示根据本发明实施例的已部署RPA系统200的架构图。在一些实施例中,RPA系统200可以是图1的RPA系统100,或者可以是其部分。应当注意,客户端侧、服务器侧或两者可以包括任何期望数目的计算系统,而不脱离本发明的范围。在客户端侧,机器人应用210包括执行方212、代理214和设计器216。然而,在一些实施例中,设计器216可以不在计算系统210上运行。执行方212正在运行过程。多个业务项目可以同时运行,如图2所示。在本实施例中,代理214(例如,服务)是针对所有执行方212的单联系点。本实施例中的所有消息都被记录到指挥方230中,指挥方230经由数据库服务器240、索引器服务器250或两者进一步处理它们。如上关于图1所述,执行方212可以是机器人组件。
在一些实施例中,机器人代表机器名称与用户名之间的关联。机器人可以同时管理多个执行方。在支持同时运行的多个交互式会话的计算系统(例如,服务器2012)上,多个机器人可以同时运行,每个机器人使用唯一的用户名在单独的会话中运行。这就是上面提到的HD机器人。
代理214还负责发送机器人的状态(例如,定期地发送指示机器人仍在运行的“心跳”消息)和下载要执行的数据包的所需版本。在一些实施例中,代理214与指挥方230之间的通信总是由代理214发起。在通知场景中,代理214可以打开随后由指挥方230用来向机器人发送命令(例如,开始、停止等)的WebSocket通道。
在服务器侧,包括了表示层(web应用232、开放数据协议(OData)代表状态传输(REST)应用编程接口(API)端点234以及通知和监控236)、服务层(API实现/业务逻辑238)和持久层(数据库服务器240和索引器服务器250)。指挥方230包括web应用232、OData REST API端点234、通知和监控236以及API实现/业务逻辑238。在一些实施例中,用户在指挥方230的界面中执行的大多数动作(例如,经由浏览器220)是通过调用各种API来执行的。这种动作可以包括但不限于在机器人上启动作业、在队列中添加/移除数据、调度作业以进行无人值守运行等,而不脱离本发明的范围。Web应用232是服务器平台的可视层。在本实施例中,web应用232使用超文本标记语言(HTML)和JavaScript(JS)。然而,在不脱离本发明的范围的情况下,可以使用任何期望的标记语言、脚本语言或者任何其他格式。在本实施例中,用户经由浏览器220与来自web应用232的网页交互,以便执行各种动作来控制指挥方230。例如,用户可以创建机器人组、向机器人分配数据包、分析每个机器人的和/或每个过程的记录、启动和停止机器人等。
除了web应用232,指挥方230还包括公开OData REST API端点234的服务层。然而,可以包括其他端点,而不脱离本发明的范围。REST API由web应用232和代理214两者消费。在本实施例中,代理214是客户端计算机上的一个或多个机器人的监管方。
本实施例中的REST API涵盖配置、记录、监控和排队功能。在一些实施例中,配置端点可以用于限定和配置应用用户、许可、机器人、资产、发布和环境。记录REST端点可以用于记录不同的信息,诸如错误、由机器人发送的明确消息以及其他特定于环境的信息。如果在指挥方230中使用启动作业命令,则机器人可以使用部署REST端点来查询应该被执行的数据包版本。排队REST端点可以负责队列和队列项管理,诸如向队列添加数据、从队列获取事务(transaction)、设置事务的状态等。
监控REST端点可以监控web应用232和代理214。通知和监控API 236可以是REST端点,其用于注册代理214、向代理214递送配置设置、以及用于从服务器和代理214发送/接收通知。在一些实施例中,通知和监控API 236也可以使用WebSocket通信。
在本实施例中,持久层包括服务器对——数据库服务器240(例如,SQL服务器)和索引器服务器250。本实施例中的数据库服务器240存储机器人、机器人组、相关过程、用户、角色、调度等的配置。在一些实施例中,该信息通过web应用232而被管理。数据库服务器240可以管理队列和队列项。在一些实施例中,数据库服务器240可以存储由机器人记录的消息(附加于索引器服务器250或者代替索引器服务器250)。
索引器服务器250(其在一些实施例中为可选的)存储并且索引由机器人记录的信息。在某些实施例中,可以通过配置设置来禁用索引器服务器250。在一些实施例中,索引器服务器250使用(其是开源项目全文搜索引擎)。由机器人记录的消息(例如,使用记录消息或者写入行等的活动)可以通过(多个)记录REST端点而被发送到索引器服务器250,在索引器服务器250处它们被索引用于将来使用。
图3是图示根据本发明实施例的设计器310、活动320、330和驱动器340之间的关系300的架构图。如上所述,开发方使用设计器310来开发由机器人执行的工作流。工作流可以包括用户限定的活动320和UI自动化活动330。一些实施例能够标识图像中的非文本视觉成分,这在本文中被称为计算机视觉(CV)。与这些组件相关的一些CV活动可以包括但不限于点击、键入、获取文本、悬停、元素存在、刷新范围、突出显示等。在一些实施例中,点击使用例如CV、光学字符标识(OCR)、模糊文本匹配和多锚点来标识元素,并且点击元素。键入可以使用上述和元素中的类型来标识元素。获取文本可以标识特定文本的位置并且使用OCR对其扫描。悬停可以标识元素并且悬停在其上。元素存在可以使用上述技术来检查元素是否存在于屏幕上。在一些实施例中,可能有数百甚至数千个活动可以在设计器310中实现。然而,任何数目和/或类型的活动都是可用的,而不脱离本发明的范围。
UI自动化活动330是以较低等级代码编写的特殊较低等级活动的子集(例如,CV活动)并且有益于与屏幕的互动。UI自动化活动330经由驱动器340来促进这些交互,该驱动器340允许机器人与期望的软件交互。例如,驱动器340可以包括OS驱动器342、浏览器驱动器344、VM驱动器346、企业应用驱动器348等。
驱动器340可以在较低等级处与OS互动,寻找挂钩,监控密钥等。它们可以促进与等的集成。例如,“点击”活动经由驱动器340在这些不同的应用中执行相同的角色。
图4是图示根据本发明实施例的RPA系统400的架构图。在一些实施例中,RPA系统400可以是或者可以包括图1和/或图2的RPA系统100和/或200。RPA系统400包括运行机器人的多个客户端计算系统410。计算系统410能够经由运行在其上的web应用来与指挥方计算系统420通信。指挥方计算系统420转而又能够与数据库服务器430和可选的索引器服务器440通信。
关于图1和图3,应注意的是,虽然在这些实施例中使用了web应用,可以使用任何合适的客户/服务器软件,而不脱离本发明范围。例如,指挥方可以运行与客户端计算系统上的非基于网络的客户软件应用通信的服务器侧应用。
图5是图示根据本发明实施例的被配置为执行用于RPA的过程演进的计算系统500的架构图。在一些实施例中,计算系统500可以是本文描绘和/或描述的计算系统中的一个或多个计算系统。计算系统500包括总线505或者用于传递信息的其他通信机制,以及耦合到总线505用于处理信息的(多个)处理器510。(多个)处理器510可以是任何类型的通用处理器或者专用处理器,包括中央处理单元(CPU)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、图形处理单元(GPU)、其多个实例和/或其任何组合。(多个)处理器510还可以具有多个处理核,并且这些核中的至少一些核可以被配置为执行特定功能。在一些实施例中可以使用多并行处理。在某些实施例中,(多个)处理器510中的至少一个处理器可以是包括模拟生物神经元的处理元件的神经形态电路。在一些实施例中,神经形态电路可以不需要冯诺依曼计算架构的典型组件。
计算系统500还包括存储器515,用于存储信息和要由(多个)处理器510执行的指令。存储器515可以由随机存取存储器(RAM)、只读存储器(ROM)、闪存、高速缓存、诸如磁盘或者光盘静态存储器或者任何其他类型的非暂态计算机可读介质或者其组合的任意组合组成。非暂态计算机可读介质可以是能够由(多个)处理器510访问的任何可用介质,并且可以包括易失性介质、非易失性介质或两者。介质也可以是可移动的、不可移动的或两者。
附加地,计算系统500包括通信设备520,诸如收发器,以经由无线和/或有线连接提供对通信网络的访问。在一些实施例中,通信设备520可以被配置为使用频分多址(FDMA)、单载波FDMA(SC-FDMA)、时分多址(TDMA)、码分多址(CDMA)、正交频分复用(OFDM)、正交频分多址(OFDMA)、全局移动通信系统(GSM)、通用分组无线业务(GPRS)、通用移动电信系统(UMTS)、cdma2000、宽带CDMA(W-CDMA)、高速下行链路分组接入(HSDPA)、高速上行链路分组接入(HSUPA)、高速分组接入(HSPA)高级LTE(LTE-A)、802.11x、Wi-Fi、Zigbee、超宽带(UWB)、802.16x、802.15、家庭节点B(HnB)、蓝牙、射频标识(RFID)、红外数据协会(IrDA)、近场通信(NFC)、第五代(5G)、新无线电(NR)、它们的任何组合、和/或任何其他当前存在的或者未来实现的通信标准和/或协议,而不脱离本发明的范围。在一些实施例中,通信设备520可以包括一个或多个天线,这些天线是单一的、阵列的、相控的、切换的、波束成形的、波束控制的、它们的组合,和/或任何其他天线配置,而不脱离本发明的范围。
(多个)处理器510还经由总线505耦合至显示器525,诸如等离子显示器、液晶显示器(LCD)、发光二极管(LED)显示器、场发射显示器(FED)、有机发光二极管(OLED)显示器、柔性OLED显示器、柔性基板显示器、投影显示器、4K显示器、高清显示器、显示器、面内切换(IPS)显示器或者任何其他适用于向用户显示信息的显示器。显示器525可以被配置为触摸(触觉)显示器、三维(3D)触摸显示器、多输入触摸显示器、多点触摸显示器等。使用电阻、电容、表面声波(SAW)电容、红外、光学成像、色散信号技术、声脉冲标识、受抑全内反射等。可以使用任何合适的显示设备和触觉I/O,而不脱离本发明的范围。
键盘530和光标控制设备535(诸如,计算机鼠标、触摸板等)还耦合至总线505,以使用户能够与计算系统交互。然而,在某些实施例中,可以不存在物理键盘和鼠标,并且用户可以仅通过显示器525和/或触摸板(未示出)来与设备交互。根据设计选择,可以使用任何类型和组合的输入设备。在某些实施例中,不存在物理输入设备和/或显示器。例如,用户可以经由与计算系统500通信的另一计算系统远程地与计算系统500交互,或者计算系统500可以自主地操作。
存储器515存储由(多个)处理器510执行时提供功能的软件模块。这些模块包括针对计算系统500的操作系统540。这些模块还包括过程演进模块545,其被配置为执行本文描述的全部或部分过程或者其得出。计算系统500可以包括一个或多个包括附加功能的附加功能模块550。
本领域技术人员将理解,“系统”可以被具化为服务器、嵌入式计算系统、个人计算机、控制台、个人数字助理(PDA)、蜂窝电话、平板计算设备、量子计算系统或者任何其他合适的计算设备或者设备组合,而不脱离本发明范围。将上述功能表示为由“系统”执行并且不旨在以任何方式限制本发明的范围,而是旨在提供本发明的多个实施例中的一个示例。实际上,本文公开的方法、系统和设备可以以与计算技术(包括云计算系统)一致的局部化和分布式形式来实现。
应注意的是,本说明书中描述的一些系统特征已作为模块而被表示,以便更具体地强调其实现独立性。例如,模块可以被实现为硬件电路,包括定制的超大规模集成(VLSI)电路或门阵列、诸如逻辑芯片、晶体管或者其他分立元件的现成半导体。模块也可以在可编程硬件设备中实现,例如现场可编程门阵列、可编程阵列逻辑、可编程逻辑设备、图形处理单元等。
模块也可以至少部分地在软件中实现,用于由各种类型的处理器执行。可执行代码的标识的单元可以例如包括计算机指令的一个或多个物理块或逻辑块,其可以例如被组织为对象、程序或者功能。然而,标识的模块的可执行文件不需要在物理上位于一起,而是可以包括存储在不同位置的不同指令,当这些指令在逻辑上结合在一起时,构成该模块并且实现针对该模块的所描述目的。此外,模块可以存储在计算机可读介质上,计算机可读介质可以是例如硬盘驱动、闪存设备、RAM、磁带和/或用于存储数据的任何其他这种非暂态计算机可读介质,而不脱离本发明的范围。
实际上,可执行代码模块可以为单个指令或者多个指令,甚至可以在多个不同代码段上、不同程序中以及跨多个存储设备中分布。类似地,操作数据在本文可以在模块内被标识和示出,并且可以以任何合适的形式被具化并且被组织在任何合适类型的数据结构内。操作数据可以作为单个数据集来收集,或者可以分布在不同的位置,包括在不同的存储设备上,并且可以至少部分地仅作为系统或者网络上的电子信号而存在。
图6是图示根据本发明实施例的被配置实现用于RPA的过程演进和/或执行RPA工作流微优化的系统600的架构图。系统600包括用户计算系统,诸如台式计算机602、平板计算机604和智能电话606。然而,可以使用任何期望的计算系统,包括但不限于智能手表、膝上型计算机、物联网(IoT)设备、车辆计算系统等,而不脱离本发明范围。
每个计算系统602、604、606上都安装有监听器610。监听器610可以是经由RPA设计器应用、操作系统的部分、用于个人计算机(PC)或者智能电话的可下载应用、或者任何其他软件和/或硬件生成的机器人,而不脱离本发明的范围。实际上,在一些实施例中,一个或多个监听器610的逻辑部分地或者完全地通过物理硬件来实现。
监听器610生成与相应的计算系统602、604、606的用户交互的日志,和/或与运行于其上的机器人的操作相关的日志数据。然后监听器610通过网络620(例如,局域网(LAN)、移动通信网络、卫星通信网络、互联网、其任何组合等)将日志数据发送至服务器630。被记录的数据可以包括但不限于哪些按钮曾被点击、鼠标曾被移动到哪里、在字段中曾输入的文本、一个窗口曾被最小化而另一窗口曾被打开、与窗口相关联的应用等。在一些实施例中,服务器630可以运行指挥方方应用,并且数据可以作为心跳消息的部分被周期性地发送。在某些实施例中,一旦预先确定的数量的日志数据已经被收集、在预先确定的时间段已经过去后、或者在这两种情况下,日志数据可以被发送至服务器630。服务器630将从监听器610接收的日志数据存储在数据库640中。
当由人类用户(例如,RPA工程师或者数据科学家)指示时、当预先确定的数量的日志数据已被收集时、当自上次分析以来预先确定的数量的时间已过去时等,服务器630从数据库640访问由监听器610从各种用户收集的日志数据,并且通过多个AI层632运行日志数据。AI层632处理日志数据并且标识其中ROI改进的一个或多个潜在过程,标识对现有过程的改进,或者两者。AI层632可以执行统计建模(例如,隐马尔可夫模型(HMM))并且利用深度学习技术(例如,长短期记忆(LSTM)深度学习、先前隐藏状态的编码等)并且执行案例标识以标识过程的原子实例。例如,对于发票处理,完成一张发票可以是一个案例。因此,系统确定一个案例在哪里结束,下一个案例在哪里开始。例如,打开电子邮件可以是案例的开始,并且可以分析案例的模式以确定变化和共性。
如果已存在类似过程,服务器630可以标识该相似性,并且知道已被标识的过程应当替代现有过程,用于工作效果不佳的类似自动化。例如,过程之间的相似性可以由共同的开始和结束以及其间采取的步骤中的一些统计共性来确定。共性可以通过熵、过程检测目标函数的最小化等来确定。在一些实施例中,可以自动设置目标函数阈值,并且如果曾被系统标识为不相似的过程被用户指示为相似的,则这可以在训练期间被修改。服务器630然后可以自动生成包括被标识的过程的工作流,生成实现工作流的机器人(或者替代机器人),并且将所生成的机器人推送到用户计算系统602、604、606以在其上执行。
备选地,在某些实施例中,可以通过计算系统650上的设计器应用652向RPA工程师展示来自AI层632的建议过程。RPA工程师然后能够审查工作流,做出任何期望的改变,然后经由机器人将工作流部署到计算系统602、604、606,或者使机器人被部署。例如,部署可以经由在服务器630或者另一服务器上运行的指挥方方应用来发生,该指挥方应用可以将实现过程的机器人推送到用户计算系统602、604、606。在一些实施例中,此工作流部署可以经由设计器应用中的自动化管理器功能来实现,并且RPA工程师可以仅点击按钮以在机器人中实现过程。
监听器
为了提取与用户在计算系统602、604、606上采取的行动有关的数据,可以在客户端侧在驱动器级(例如,图3的驱动器340)采用监听器610,以从列入白名单的应用中提取数据。例如,监听器610可以记录用户曾在屏幕上点击何处以及在哪个应用中进行点击、键击、哪个按钮曾被点击、用户在应用之间切换的实例、焦点改变、电子邮件曾被发送以及所述电子邮件与什么有关等。附加地或者备选地,监听器610可以收集与在计算系统602、604、606上运行的机器人有关的数据。在一些实施例中,执行实现工作流的各种任务的机器人可以充当它们自己的操作的监听器。这种数据可以用于生成用户与计算系统602、604、606的交互和/或在其上运行的机器人的(多个)操作的高保真日志。
除了或者替代生成用于过程提取的日志数据,一些实施例可以提供对用户实际上正在进行的操作的洞察。例如,监听器610可以确定用户实际上正在使用哪些应用、用户正在使用给定应用的时间百分比、用户正在使用应用中的哪些功能以及他们没有正在使用哪些功能等。此信息可以被提供给管理者,以做出关于以下内容的明智决定:是否更新应用的许可、是否不更新功能的许可或者降级到缺少功能的较便宜的版本、用户是否没有使用倾向于使其他员工更有效率的应用以便该用户可以被适当地培训、用户是否花费大量时间进行非工作活动(例如,检查个人电子邮件或者网上冲浪)或者离开他或者她的办公桌(例如,不与计算系统交互)等。
在一些实施例中,检测更新能够被推送至监听器,以改善其驱动器级用户交互和/或机器人操作检测和捕捉过程。在某些实施例中,监听器610可以在其检测中采用AI。在某些实施例中,实现来自自动化工作流的过程的机器人可以经由相应的监听器610被自动推送到计算系统602、604、606。
图7是图示根据本发明实施例的被配置为用于实现用于RPA的过程演进的过程700的流程图。过程在710处开始,接收用于RPA实现的计划。计划包括业务数据,业务数据可以包括但不限于与计算系统的员工交互、财务信息、执行机器人操作和/或工作流步骤所花费的时间等。在一些实施例中,计划可以从根据由机器人使用AI收集的数据中而被自动标识的过程中得出。然后在720处对业务数据执行分析,以测量、报告RPA操作并且使RPA操作与战略业务成果保持一致。例如,可以采用分析来确定由员工和/或机器人生成的收入、由机器人执行工作流操作所花费的时间、由员工完成业务过程所花费的时间等。
然后在730处生成实现所需自动化的RPA工作流,在740处以RPA机器人的形式部署RPA工作流。在一些实施例中,RPA机器人可以通过AI架构访问AI技能。在实现之后,在750处从业务计算系统收集数据并且进行分析,以及在760处经由ML模型自动标识和建议潜在自动化的新过程。然后过程可以被迭代地重复,在企业中提高RPA的有效性。
图8是图示根据本发明实施例的被配置为用于执行用于RPA工作流微优化的过程800的流程图。过程开始于(或者从图7继续)在810处基于性能标准分析并且优先化RPA工作流中的每个活动。性能标准可以包括但不限于处理速度、生成的收入、员工生产率(例如,速度)等。在820处将活动添加到RPA工作流或者从RPA工作流中删除活动,以创建修改的RPA工作流。在一些实施例中,要添加的活动可以从由工作流想要完成的目标类型所分类的活动池中选择(例如,发票处理、协助生成线索、自动化员工以其他方式采取的动作等)。然后在830处生成并且运行实现修改的RPA工作流的RPA机器人。
然后在840处测试生成的RPA机器人,以检查机器人是否达到目标并且实现性能标准的改进。在850处当RPA机器人没有达到目标、没有实现性能标准的改进、或者没有实现两者时,系统回复到修改之前的原始RPA工作流,并且返回到步骤820,添加或移除另一活动。然而,当RPA机器人在850处达到目标并且实现性能标准的改进时,RPA机器人在870处被部署,替代RPA机器人的早期版本。
图7和图8中的处理步骤可以由计算机程序执行,对用于处理器的指令进行编码以执行图7和图8中描述的(多个)过程的至少一部分。参照图7,根据本发明的实施例。计算机程序可以具化在非暂态计算机可读介质上。计算机可读介质可以是但不限于硬盘驱动器、闪存设备、RAM、磁带和/或用于存储数据的任何其他此类介质或介质组合。计算机程序可以包括用于控制计算系统的处理器(例如,图5的计算系统500的处理器510)以实现图7和图8中描述的全部或部分处理步骤的编码指令,它也可以存储在计算机可读介质上。
计算机程序可以在硬件、软件或者混合实施方式中实现。计算机程序可以由彼此可操作通信的模块组成,并且被设计为传递信息或者指令以显示。计算机程序可以被配置为在通用计算机、ASIC或者任何其他合适的设备上运行。
容易理解的是,本发明各种实施例的组件,如本文附图中一般描述和说明的,可以按各种不同配置进行排列和设计。因此,如附图中所示,本发明的实施例的详细描述不旨在限制所要求保护的本发明的范围,而仅是本发明的所选择的实施例的代表。
本说明书中描述的本发明的特征、结构或者特性可以在一个或多个实施例中以任何合适的方式进行组合。例如,在整个说明书中,对“某些实施例”、“一些实施例”或者类似语言的引用意味着结合本实施例所描述的特定特征、结构或者特性包括在本发明的至少一个实施例中。因此,在整个说明书中出现的短语“在某些实施例中”、“在一些实施例中”、“在其他实施例中”或者类似语言不必然都指同一组实施例,并且所描述的特征、结构或者特性可以以任何合适的方式组合在一个或多个实施例中。
应注意,贯穿本说明书中提及的特征、优点或者类似语言并且不意味着本发明可以实现的所有特征和优点应当位于本发明的任何单个实施例中。相反,关于特征和优点的语言被理解为意味着结合实施例描述的特定特征、优点或者特性被包括在本发明的至少一个实施例中。因此,贯穿本说明书的特征和优点的讨论以及类似的语言可以但不必然指同一实施例。
此外,本发明的所述特征、优点和特性可以在一个或多个实施例中以任何合适的方式进行组合。相关领域的技术人员将认识到,本发明可以在没有特定实施例的一个或多个具体特征或者优点的情况下实践。在其他实例中,可以在某些实施例中认识到附加的特征和优点,这些特征和优点可能不存在于本发明的所有实施例中。
本领域普通技术人员将容易理解,上述本发明可以利用不同顺序的步骤和/或利用不同于所公开配置的硬件元件而被实践。因此,尽管已经基于这些优选实施例描述了本发明,但是对于本领域的技术人员,在保持在本发明的精神和范围内的同时,某些修改、变型和备选结构将是明显的。因此,为了确定本发明的界限和边界,应当参考所附权利要求。