1.本公开涉及计算机技术领域,进一步涉及数据处理领域,尤其涉及一种文档处理方法、装置、电子设备及存储介质。
背景技术:
2.超文本标记语言(hyper text markup language,html)与word/wps互转技术是指在样式不变的情况下,将html文本内容生成word/wps文档,且能将word/wps文档内容生成html文本。
3.相关方案中,html与word/wps互转后会,文本内容的样式丢失,互转效果较差,对用户的使用体验带来较多的负面影响。
技术实现要素:
4.本公开提供了一种文档处理方法、装置、电子设备及存储介质,以至少解决相关方案中html文本与word/wps文档互转效果差的技术问题。
5.根据本公开的一方面,提供了一种文档处理方法,包括:获取待转换文档;基于待转换文档生成目标数据结构,其中,目标数据结构用于描述待转换文档的内容结构和/或样式属性;将目标数据结构发送至客户端,以通过客户端上的网页编辑器将目标数据结构转换为待展示的页面数据。
6.根据本公开的又一方面,提供了一种文档处理方法,包括:接收来自于服务端的目标数据结构,其中,目标数据结构由服务端基于待转换文档得到,目标数据结构用于描述待转换文档的内容结构和/或样式属性;通过客户端上的网页编辑器将目标数据结构转换为待展示的页面数据。
7.根据本公开的又一方面,提供了一种文档处理装置,包括:获取模块,用于获取待转换文档;生成模块,用于基于待转换文档生成目标数据结构,其中,目标数据结构用于描述待转换文档的内容结构和/或样式属性;发送模块,用于将目标数据结构发送至客户端,以通过客户端上的网页编辑器将目标数据结构转换为待展示的页面数据。
8.根据本公开的又一方面,提供了一种文档处理装置,包括:接收模块,用于接收来自于服务端的目标数据结构,其中,目标数据结构由服务端基于待转换文档得到,目标数据结构用于描述待转换文档的内容结构和/或样式属性;处理模块,用于通过客户端上的网页编辑器将目标数据结构转换为待展示的页面数据。
9.根据本公开的又一方面,提供了一种文档处理系统:包括:服务器和终端;服务器,用于获取待转换文档,基于待转换文档生成目标数据结构,以及将目标数据结构发送至终端,其中,目标数据结构用于描述待转换文档的内容结构和/或样式属性;终端,用于利用网页编辑器将目标数据结构转换为待展示的页面数据。
10.根据本公开的又一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指
令被至少一个处理器执行,以使至少一个处理器能够执行本公开提出的文档处理方法。
11.根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开提出的文档处理方法。
12.根据本公开的又一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行本公开提出的文档处理方法。
13.在本公开中,通过获取待转换文档,进而基于待转换文档生成目标数据结构,目标数据结构用于描述待转换文档的内容结构和/或样式属性,最后将目标数据结构发送至客户端,以通过客户端上的网页编辑器将目标数据结构转换为待展示的页面数据,达到了html文本与word/wps文档互转的目的,实现了在互转过程中文档内容及样式保持不变的效果,从而解决了相关方案中html文本与word/wps文档互转效果差的技术问题。
14.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
15.附图用于更好地理解本方案,不构成对本公开的限定。其中:
16.图1是根据本公开实施例的一种用于实现文档处理方法的计算机终端(或移动设备)的硬件结构框图;
17.图2是根据本公开实施例的一种文档处理方法流程图;
18.图3是根据本公开实施例的又一种文档处理方法流程图;
19.图4是根据本公开实施例的又一种文档处理方法流程图;
20.图5是根据本公开实施例的一种文档处理装置的结构框图;
21.图6是根据本公开实施例的一种文档处理装置的结构框图。
具体实施方式
22.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
23.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
24.html与word/wps互转技术在当今互联网环境中广泛应用,例如,在自媒体的内容生产中,作者会在网页编辑器中写文章,并在网页中使用各种辅助功能对文章进行修缮,最终保存为word/wps文档,或者上传本地已有的word/wps文档,在网页编辑器中进行内容编辑。
25.目前,一般采用以下三种方式实现文档的转换处理:
26.方式一:apache poi。apache提供的开源java库,包括一系列的应用程序接口(application programming interface,api),可以操作文档格式。这种转换方式实现简单,免费开源,支持跨平台,并支持wps。
27.方式二:java-com bridge(jacob)。在java与微软的com组件之间构建一座桥梁。通过jacob实现了在java平台上对微软office的com接口进行调用,只支持windows平台。这种转换方式功能强大,底层通过对office的com组件调用实现功能。
28.方式三:docx4j。docx4j是一个开源(aslv2)java库,底层使用开放式可扩展标记语言(extensible markup language,xml)结构。这种转换方式实现简单,免费开源,支持跨平台,但不支持将html文本转换为wps文档。
29.相关方案在实现文档的转换处理时会丢失文档内容的样式,给用户体验带来负面影响,并且当部分不支持html与wps互转。
30.根据本公开实施例,提供了一种文档处理方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
31.本公开实施例所提供的方法实施例可以在移动终端、计算机终端或者类似的电子设备中执行。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。图1示出了一种用于实现文档处理方法的计算机终端(或移动设备)的硬件结构框图。
32.如图1所示,计算机终端100包括计算单元101,其可以根据存储在只读存储器(rom)102中的计算机程序或者从存储单元108加载到随机访问存储器(ram)103中的计算机程序,来执行各种适当的动作和处理。在ram 103中,还可存储计算机终端100操作所需的各种程序和数据。计算单元101、rom 102以及ram 103通过总线104彼此相连。输入/输出(i/o)接口105也连接至总线104。
33.计算机终端100中的多个部件连接至i/o接口105,包括:输入单元106,例如键盘、鼠标等;输出单元107,例如各种类型的显示器、扬声器等;存储单元108,例如磁盘、光盘等;以及通信单元109,例如网卡、调制解调器、无线通信收发机等。通信单元109允许计算机终端100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
34.计算单元101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元101的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元101执行本文所描述的文档处理方法。例如,在一些实施例中,文档处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元108。在一些实施例中,计算机程序的部分或者全部可以经由rom 102和/或通信单元109而被载入和/或安装到计算机终端100上。当计算机程序加载到ram 103并由计算单元101执行时,可以执行本文描述的文档处理方法的一个或多个步骤。备选地,
在其他实施例中,计算单元101可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行文档处理方法。
35.本文中描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
36.此处需要说明的是,在一些可选实施例中,上述图1所示的电子设备可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述电子设备中的部件的类型。
37.在上述运行环境下,本公开提供了如图2所示的文档处理方法,该方法可以由图1所示的计算机终端或者类似的电子设备执行。图2是根据本公开实施例提供的一种文档处理方法流程图,该方法可以应用于服务端。如图2所示,该方法可以包括如下步骤:
38.步骤s21,获取待转换文档;
39.上述待转换文档可以为word文档或者wps文档。
40.步骤s22,基于待转换文档生成目标数据结构,其中,目标数据结构用于描述待转换文档的内容结构和/或样式属性;
41.上述目标数据结构为js对象简谱(javascript object notation,json)数据结构。json数据结构是一种轻量级的数据交换格式,易于解析和生成,能够有效提高数据的传输效率。json数据结构用于描述待转换文档的内容结构和/或样式属性。
42.上述内容结构为文章结构,文章结构包括:一个标题和多个段落,每个段落包括以下至少之一:至少一个文本、至少一个表格、至少一张图片,每个表格包括:至少一个表格行,每个表格行包括:至少一个单元格,每个单元格包括:至少一个文本。具体的,文章结构中的图片可以为图片链接或者采用base64编码后的图片。
43.上述样式属性包括以下之一:文章结构的全局样式属性;文章结构中子结构的局部样式属性。
44.具体的,样式属性包括:字体,颜色,文本是否加粗,文本是否斜体展示,文本是否有下划线,文本大小,对齐方式,图片、表格、表格行、单元格的高度、宽度等。其中,对齐方式包括对每个段落中的至少一个文本、一个表格、一张图片进行居左对齐,或者居中对齐,或者居右对齐。
45.具体的,基于待转换文档生成目标数据结构,的实现过程可以参照对于本公开实施例的进一步介绍,不予赘述。
46.步骤s23,将目标数据结构发送至客户端,以通过客户端上的网页编辑器将目标数据结构转换为待展示的页面数据。
47.上述网页编辑器为html编辑器,待展示的页面数据为html文本数据。
48.根据本公开上述步骤s21至步骤s23,通过获取待转换文档,进而基于待转换文档生成目标数据结构,目标数据结构用于描述待转换文档的内容结构和/或样式属性,最后将目标数据结构发送至客户端,以通过客户端上的网页编辑器将目标数据结构转换为待展示的页面数据,达到了html文本与word/wps文档互转的目的,实现了在互转过程中文档内容及样式保持不变的效果,从而解决了相关方案中html文本与word/wps文档互转效果差的技术问题。
49.下面对上述实施例的文档处理方法进行进一步介绍。
50.作为一种可选的实施方式,在步骤s22,基于待转换文档生成目标数据结构包括:
51.步骤s221,遍历待转换文档,识别待转换文档的结构类型和/或样式类型;
52.例如,在遍历word/wps文档时,识别word/wps文档的结构类型,如段落、文本、图片、表格等,同时识别该结构类型对应的样式类型,如字体、大小、颜色等。
53.具体的,采用apache开源的poi java库遍历待转换文档,识别待转换文档的结构类型和/或样式类型。
54.步骤s222,响应于结构类型和/或样式类型在预定义范围内,按照结构类型和/或样式类型生成目标数据结构,其中,预定义范围为目标数据结构支持的结构类型范围和/或样式类型范围。
55.基于上述步骤s221至步骤s222,通过遍历待转换文档,识别待转换文档的结构类型和/或样式类型,进而响应于结构类型和/或样式类型在预定义范围内,按照结构类型和/或样式类型生成目标数据结构,能够快速准确地生成待转换文档对应的目标数据结构。
56.作为一种可选的实施方式,上述实施例的文档处理方法还包括:
57.步骤s24,接收来自于客户端的待转换数据结构,其中,待转换数据结构用于描述目标文档的内容结构和/或样式属性;
58.步骤s25,基于待转换数据结构生成目标文档。
59.具体的,在生成word/wps文档时,接收来自客户端的json数据结构,基于json数据结构调用对应的api生成word/wps文档。
60.基于上述步骤s24至s25,通过接收来自于客户端的待转换数据结构,进而基于待转换数据结构生成目标文档,能够基于待转换数据结构快速生成对应的目标文档。
61.作为一种可选的实施方式,上述实施例的文档处理方法还包括:
62.步骤s26,在目标数据结构内添加新的结构类型和/或新的结构类型对应的样式类型,以扩展目标数据结构支持的结构类型范围和/或样式类型范围。
63.例如,在json数据结构中添加列表数据结构类型,该新增结构类型用于保存列表数据内容和样式属性。
64.基于上述步骤s26,可以灵活扩展目标数据结构支持的结构类型范围和/或样式类型范围。
65.图3是根据本公开实施例提供的又一种文档处理方法流程图,该方法可以应用于客户端。如图3所示,该方法可以包括如下步骤:
66.步骤s31,接收来自于服务端的目标数据结构,其中,目标数据结构由服务端基于待转换文档得到,目标数据结构用于描述待转换文档的内容结构和/或样式属性;
67.步骤s32,通过客户端上的网页编辑器将目标数据结构转换为待展示的页面数据。
68.例如,利用客户端上的html编辑器将json数据结构转换为html文本,其中,html编辑器可以为javascript。
69.根据本公开上述步骤s31至步骤s32,接收来自于服务端的目标数据结构,其中,目标数据结构由服务端基于待转换文档得到,目标数据结构用于描述待转换文档的内容结构和/或样式属性,进而通过客户端上的网页编辑器将目标数据结构转换为待展示的页面数据,达到了html文本与word/wps文档互转的目的,实现了在互转过程中文档内容及样式保持不变的效果,从而解决了相关方案中html文本与word/wps文档互转效果差的技术问题。
70.下面对上述实施例的文档处理方法进行进一步介绍。
71.作为一种可选的实施方式,上述实施例的文档处理方法还包括:
72.步骤s33,向服务端发送待转换数据结构,以使服务端基于待转换数据结构生成目标文档,其中,待转换数据结构用于描述目标文档的内容结构和/或样式属性。
73.例如,在浏览器端利用javascript将html文本转换为json数据结构后,向服务端发送该json数据结构,以使得服务端基于json数据结构调用对应的api生成word/wps文档。
74.基于上述步骤s33,通过向服务端发送待转换数据结构,以使服务端基于待转换数据结构生成目标文档,能够基于待转换数据结构快速生成对应的目标文档。
75.作为一种可选的实施方式,上述实施例的文档处理方法还包括:
76.步骤s34,响应对页面数据执行的编辑操作,同步更新页面数据与目标数据结构。
77.具体的,在客户端内存维护json数据结构,相应于html文本数据执行的编辑操作,同步更新html文本数据和内存中的json数据结构。
78.基于上述步骤s34,通过响应对页面数据执行的编辑操作,同步更新页面数据与目标数据结构,能够及时根据编辑操作更新html文本数据及其对应的json数据结构,以保持数据的一致性。
79.图4是根据本公开实施例的又一种文档处理方法流程图,如图4所示,该方法包括以下步骤:
80.步骤s401,获取待转换文档;
81.步骤s402,遍历待转换文档,识别待转换文档的结构类型和/或样式类型;
82.步骤s403,响应于结构类型和/或样式类型在预定义范围内,按照结构类型和/或样式类型生成目标数据结构;
83.步骤s404,将目标数据结构发送至客户端;
84.步骤s405,接收来自于服务端的目标数据结构;
85.步骤s406,通过客户端上的网页编辑器将目标数据结构转换为待展示的页面数据;
86.步骤s407,响应对页面数据执行的编辑操作,同步更新页面数据与目标数据结构;
87.步骤s408,向服务端发送待转换数据结构;
88.步骤s409,接收来自于客户端的待转换数据结构;
89.步骤s410,基于待转换数据结构生成目标文档。
90.基于上述步骤s401至步骤s410,通过html文本与目标数据结构的互转以及word/wps文档互转与目标数据结构的互转,达到了html文本与word/wps文档互转的目的,实现了在互转过程中文档内容及样式保持不变的效果,从而解决了相关方案中html文本与word/
wps文档互转效果差的技术问题。
91.本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
92.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本公开各个实施例所述的方法。
93.在本公开中还提供了一种文档处理装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
94.图5是根据本公开其中一实施例的一种文档处理装置的结构框图,如图5所示,文档处理装置包括:
95.获取模块501,用于获取待转换文档;
96.生成模块502,用于基于待转换文档生成目标数据结构,其中,目标数据结构用于描述待转换文档的内容结构和/或样式属性;
97.发送模块503,用于将目标数据结构发送至客户端,以通过客户端上的网页编辑器将目标数据结构转换为待展示的页面数据。
98.可选地,生成模块502还用于:遍历待转换文档,识别待转换文档的结构类型和/或样式类型,响应于结构类型和/或样式类型在预定义范围内,按照结构类型和/或样式类型生成目标数据结构,其中,预定义范围为目标数据结构支持的结构类型范围和/或样式类型范围。
99.可选地,文档处理装置还包括:接收模块504,用于接收来自于客户端的待转换数据结构,其中,待转换数据结构用于描述目标文档的内容结构和/或样式属性;生成模块502,还用于基于待转换数据结构生成目标文档。
100.可选地,文档处理装置还包括:添加模块505,用于在目标数据结构内添加新的结构类型和/或新的结构类型对应的样式类型,以扩展目标数据结构支持的结构类型范围和/或样式类型范围。
101.可选地,内容结构为文章结构,文章结构包括:一个标题和多个段落,每个段落包括以下至少之一:至少一个文本、至少一个表格、至少一张图片,每个表格包括:至少一个表格行,每个表格行包括:至少一个单元格,每个单元格包括:至少一个文本。
102.可选地,内容结构为文章结构,样式属性包括以下之一:文章结构的全局样式属性;文章结构中子结构的局部样式属性。
103.图6是根据本公开实施例的一种文档处理装置的结构框图,如图6所示,该文档处理装置包括:
104.接收模块601,用于接收来自于服务端的目标数据结构,其中,目标数据结构由服务端基于待转换文档得到,目标数据结构用于描述待转换文档的内容结构和/或样式属性;
105.处理模块602,用于通过客户端上的网页编辑器将目标数据结构转换为待展示的页面数据。
106.可选地,文档处理装置还包括:发送模块603,用于向服务端发送待转换数据结构,以使服务端基于待转换数据结构生成目标文档,其中,待转换数据结构用于描述目标文档的内容结构和/或样式属性。
107.可选地,文档处理装置还包括:更新模块604,用于响应对页面数据执行的编辑操作,同步更新页面数据与目标数据结构。
108.需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
109.根据本公开的实施例,本公开还提供了一种文档处理系统:包括:服务器和终端,其中,终端可以替代性地描述为为本技术实施例中的客户端。
110.可选地,在本公开中,上述服务器可以被设置为通过计算机程序执行以下步骤:
111.s1,获取待转换文档;
112.s2,基于待转换文档生成目标数据结构,其中,目标数据结构用于描述待转换文档的内容结构和/或样式属性;
113.s3,将目标数据结构发送至客户端,以通过客户端上的网页编辑器将目标数据结构转换为待展示的页面数据。
114.可选地,在本公开中,上述客户端还可以被设置为通过计算机程序执行以下步骤:
115.s1,接收来自于服务端的目标数据结构,其中,目标数据结构由服务端基于待转换文档得到,目标数据结构用于描述待转换文档的内容结构和/或样式属性;
116.s2,通过客户端上的网页编辑器将目标数据结构转换为待展示的页面数据。
117.可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
118.根据本公开的实施例,本公开还提供了一种电子设备,包括存储器和至少一个处理器,该存储器中存储有计算机指令,该处理器被设置为运行计算机指令以执行上述方法实施例中的步骤。
119.可选地,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
120.可选地,在本公开中,上述处理器可以被设置为通过计算机程序执行以下步骤:
121.s1,获取待转换文档;
122.s2,基于待转换文档生成目标数据结构,其中,目标数据结构用于描述待转换文档的内容结构和/或样式属性;
123.s3,将目标数据结构发送至客户端,以通过客户端上的网页编辑器将目标数据结构转换为待展示的页面数据。
124.可选地,在本公开中,上述处理器还可以被设置为通过计算机程序执行以下步骤:
125.s1,接收来自于服务端的目标数据结构,其中,目标数据结构由服务端基于待转换文档得到,目标数据结构用于描述待转换文档的内容结构和/或样式属性;
126.s2,通过客户端上的网页编辑器将目标数据结构转换为待展示的页面数据。
127.可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
128.根据本公开的实施例,本公开还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该非瞬时计算机可读存储介质中存储有计算机指令,其中,该计算机指令被设置为运行时执行上述方法实施例中的步骤。
129.可选地,在本实施例中,上述非瞬时计算机可读存储介质可以被设置为存储用于执行以下步骤的计算机程序:
130.s1,获取待转换文档;
131.s2,基于待转换文档生成目标数据结构,其中,目标数据结构用于描述待转换文档的内容结构和/或样式属性;
132.s3,将目标数据结构发送至客户端,以通过客户端上的网页编辑器将目标数据结构转换为待展示的页面数据。
133.可选地,在本实施例中,上述非瞬时计算机可读存储介质还可以被设置为存储用于执行以下步骤的计算机程序:
134.s1,接收来自于服务端的目标数据结构,其中,目标数据结构由服务端基于待转换文档得到,目标数据结构用于描述待转换文档的内容结构和/或样式属性;
135.s2,通过客户端上的网页编辑器将目标数据结构转换为待展示的页面数据。
136.可选地,在本实施例中,上述非瞬时计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
137.根据本公开的实施例,本公开还提供了一种计算机程序产品。用于实施本公开方法实施例的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
138.在本公开的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
139.在本公开所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
140.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个
单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
141.另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
142.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom)、随机存取存储器(ram)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
143.以上所述仅是本公开的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本公开原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本公开的保护范围。
技术特征:
1.一种文档处理方法,包括:获取待转换文档;基于所述待转换文档生成目标数据结构,其中,所述目标数据结构用于描述所述待转换文档的内容结构和/或样式属性;将所述目标数据结构发送至客户端,以通过所述客户端上的网页编辑器将所述目标数据结构转换为待展示的页面数据。2.根据权利要求1所述的文档处理方法,其中,基于所述待转换文档生成所述目标数据结构包括:遍历所述待转换文档,识别所述待转换文档的结构类型和/或样式类型;响应于所述结构类型和/或所述样式类型在预定义范围内,按照所述结构类型和/或所述样式类型生成所述目标数据结构,其中,所述预定义范围为所述目标数据结构支持的结构类型范围和/或样式类型范围。3.根据权利要求2所述的文档处理方法,其中,所述文档处理方法还包括:接收来自于客户端的待转换数据结构,其中,所述待转换数据结构用于描述目标文档的内容结构和/或样式属性;基于所述待转换数据结构生成所述目标文档。4.根据权利要求2所述的文档处理方法,其中,所述文档处理方法还包括:在所述目标数据结构内添加新的结构类型和/或所述新的结构类型对应的样式类型,以扩展所述目标数据结构支持的结构类型范围和/或样式类型范围。5.根据权利要求1-4中任一项所述的文档处理方法,其中,所述内容结构为文章结构,所述文章结构包括:一个标题和多个段落,每个段落包括以下至少之一:至少一个文本、至少一个表格、至少一张图片,每个表格包括:至少一个表格行,每个表格行包括:至少一个单元格,每个单元格包括:至少一个文本。6.根据权利要求1-4中任一项所述的文档处理方法,其中,所述内容结构为文章结构,所述样式属性包括以下之一:所述文章结构的全局样式属性;所述文章结构中子结构的局部样式属性。7.一种文档处理方法,包括:接收来自于服务端的目标数据结构,其中,所述目标数据结构由所述服务端基于待转换文档得到,所述目标数据结构用于描述所述待转换文档的内容结构和/或样式属性;通过客户端上的网页编辑器将所述目标数据结构转换为待展示的页面数据。8.根据权利要求7所述的文档处理方法,其中,所述文档处理方法还包括:向服务端发送待转换数据结构,以使所述服务端基于所述待转换数据结构生成目标文档,其中,所述待转换数据结构用于描述所述目标文档的内容结构和/或样式属性。9.根据权利要求7所述的文档处理方法,其中,所述文档处理方法还包括:响应对所述页面数据执行的编辑操作,同步更新所述页面数据与所述目标数据结构。10.一种文档处理装置,包括:获取模块,用于获取待转换文档;生成模块,用于基于所述待转换文档生成目标数据结构,其中,所述目标数据结构用于
描述所述待转换文档的内容结构和/或样式属性;发送模块,用于将所述目标数据结构发送至客户端,以通过所述客户端上的网页编辑器将所述目标数据结构转换为待展示的页面数据。11.根据权利要求10所述的文档处理装置,其中,所述生成模块,用于遍历所述待转换文档,识别所述待转换文档的结构类型和/或样式类型,响应于所述结构类型和/或所述样式类型在预定义范围内,按照所述结构类型和/或所述样式类型生成所述目标数据结构,其中,所述预定义范围为所述目标数据结构支持的结构类型范围和/或样式类型范围。12.根据权利要求11所述的文档处理装置,其中,所述文档处理装置还包括:接收模块,用于接收来自于客户端的待转换数据结构,其中,所述待转换数据结构用于描述目标文档的内容结构和/或样式属性;所述生成模块,还用于基于所述待转换数据结构生成所述目标文档。13.根据权利要求11所述的文档处理装置,其中,所述文档处理装置还包括:添加模块,用于在所述目标数据结构内添加新的结构类型和/或所述新的结构类型对应的样式类型,以扩展所述目标数据结构支持的结构类型范围和/或样式类型范围。14.根据权利要求10-13中任一项所述的文档处理装置,其中,所述内容结构为文章结构,所述文章结构包括:一个标题和多个段落,每个段落包括以下至少之一:至少一个文本、至少一个表格、至少一张图片,每个表格包括:至少一个表格行,每个表格行包括:至少一个单元格,每个单元格包括:至少一个文本。15.根据权利要求10-13中任一项所述的文档处理装置,其中,所述内容结构为文章结构,所述样式属性包括以下之一:所述文章结构的全局样式属性;所述文章结构中子结构的局部样式属性。16.一种文档处理装置,包括:接收模块,用于接收来自于服务端的目标数据结构,其中,所述目标数据结构由所述服务端基于待转换文档得到,所述目标数据结构用于描述所述待转换文档的内容结构和/或样式属性;处理模块,用于通过客户端上的网页编辑器将所述目标数据结构转换为待展示的页面数据。17.根据权利要求16所述的文档处理装置,其中,所述文档处理装置还包括:发送模块,用于向服务端发送待转换数据结构,以使所述服务端基于所述待转换数据结构生成目标文档,其中,所述待转换数据结构用于描述所述目标文档的内容结构和/或样式属性。18.根据权利要求16所述的文档处理装置,其中,所述文档处理装置还包括:更新模块,用于响应对所述页面数据执行的编辑操作,同步更新所述页面数据与所述目标数据结构。19.一种文档处理系统,包括:服务器和终端;所述服务器,用于获取待转换文档,基于所述待转换文档生成目标数据结构,以及将所述目标数据结构发送至所述终端,其中,所述目标数据结构用于描述所述待转换文档的内容结构和/或样式属性;
所述终端,用于利用网页编辑器将所述目标数据结构转换为待展示的页面数据。20.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。21.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-9中任一项所述的方法。22.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-9中任一项所述的方法。
技术总结
本公开提供了一种文档处理方法、装置、电子设备及存储介质,涉及计算机技术领域,尤其涉及数据处理领域。具体实现方案为:获取待转换文档;基于待转换文档生成目标数据结构,其中,目标数据结构用于描述待转换文档的内容结构和/或样式属性;将目标数据结构发送至客户端,以通过客户端上的网页编辑器将目标数据结构转换为待展示的页面数据。构转换为待展示的页面数据。构转换为待展示的页面数据。
技术研发人员:王新 李正晖
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2022.02.17
技术公布日:2022/5/25
转载请注明原文地址:https://tc.8miu.com/read-10407.html