1.实施方式涉及词典编辑装置、词典编辑方法以及记录有词典编辑程序的记录介质。
背景技术:
2.在声音识别技术中,为了提高声音识别的精度,重要的是将在实际利用的场景中经常表达的专业术语以及对于声音识别引擎而言是未知的未知词预先登记于在声音识别引擎中使用的声音识别词典。然而,难以人工地列出这样的专业术语、未知词以及加这些词的读音。
3.相对于此,如果声音识别引擎想要识别与利用的场景关联的文本数据例如大学讲课的声音,则只要具有读入其讲义资料的文本数据,自动地抽取专业词以及未知词,对这些抽取出的专业术语以及未知词自动地赋予读音的功能,专业术语以及未知词向词典的登记自身就变得容易。然而,自动地抽取出的专业术语以及未知词、自动地赋予的读音有可能是错误的。因此,需要人工地进行所登记的专业术语以及未知词和它们的读音的最终的确认。在该情况下,当抽取出的专业术语以及未知词的候补数多时,仅凭人工难以全部进行确认。
技术实现要素:
4.实施方式提供易于进行关于登记于声音识别词典的单词的确认的词典编辑装置、词典编辑方法以及记录有词典编辑程序的记录介质。
5.实施方式的词典编辑装置具备单词抽取部、读音赋予部、可靠度计算部以及修正候补确定部。单词抽取部从文本数据抽取单词。读音赋予部对抽取出的单词赋予读音。可靠度计算部计算表示抽取出的单词的可靠度的第1可靠度和表示所赋予的读音的可靠度的第2可靠度中的至少任意一个可靠度。修正候补确定部根据第1可靠度来确定作为修正候补的单词,根据第2可靠度来确定作为修正候补的读音。
6.实施方式能够提供易于进行关于登记于声音识别词典的单词的确认的词典编辑装置、词典编辑方法以及记录有词典编辑程序的记录介质。
附图说明
7.图1是示出一个实施方式的词典编辑装置的框图。
8.图2是示出词典编辑装置的硬件结构的一个例子的图。
9.图3是示出词典编辑装置的动作的流程图。
10.图4是示出强调显示的一个例子的图。
11.符号说明
12.100:词典编辑装置;101:单词抽取部;102:读音赋予部;103:可靠度计算部;104:修正候补确定部;105:显示部;201:处理器;202:存储器;203:输入装置;204:显示装置;
205:通信装置;206:存储装置;207:总线;2061:词典编辑程序;2062:词素词典;2063:带读音的单词词典;2064:声音识别词典。
具体实施方式
13.以下,说明实施方式。图1是示出一个实施方式的词典编辑装置的框图。词典编辑装置100具有单词抽取部101、读音赋予部102、可靠度计算部103、修正候补确定部104以及显示部105。词典编辑装置100是声音识别词典的编辑装置。该声音识别词典是将各个单词的字符串、该单词的读音以及与该读音对应的音素对应起来存储的词典。
14.单词抽取部101从文本数据抽取单词。然后,单词抽取部101将抽取出的单词发送到读音赋予部102以及可靠度计算部103。文本数据例如是与能够使用声音识别词典的场景关联的文本数据。另外,单词能够由1个以上的词素构成。单词抽取部101通过对文本数据进行词素解析,从而抽取单词。例如,单词抽取部101参照词素词典,将文本数据分割为词素的单位,将分割后的1个以上的词素进行组合而抽取单词。此时,单词抽取部101抽取文本数据上的出现频度多的单词。另外,单词抽取部101抽取通过几个名词的连结而组成的复合名词。另外,单词抽取部101将在其它领域的文本数据中不易出现的单词作为专业术语而抽取。另外,单词抽取部101将带读音的单词词典或者声音识别词典所未包含的单词作为未知词而抽取。单词抽取部101也可以将这多个单词的抽取手法进行组合,综合地抽取单词。例如,单词抽取部101也可以从声音识别词典所未包含的单词之中抽取出现频度多的单词、复合名词、在其它领域的文本数据中不易出现的单词。单词抽取部101可以包括现有的单词抽取法在内,按照任意的手法抽取单词。
15.读音赋予部102对由单词抽取部101抽取出的单词赋予读音。然后,读音赋予部102将所赋予的读音发送到可靠度计算部103。读音赋予部102例如参照带读音的单词词典,如果抽取出的单词登记于单词词典,则直接赋予该读音。另外,读音赋予部102在抽取出的单词是登记于单词词典的多个单词的组合的情况下,将这些单词的读音是一边还考虑连浊等一边进行连结来赋予读音。进而,读音赋予部102也可以预先用大量的数据学习针对各字符的读音,使用该学习结果对抽取出的单词赋予读音。读音赋予部102可以包括现有的读音附加法在内,按照任意的手法赋予读音。
16.可靠度计算部103实施针对由单词抽取部101抽取出的单词的第1可靠度的计算和针对由读音赋予部102赋予的读音的第2可靠度的计算中的至少任意一个计算。然后,可靠度计算部103将计算出的第1可靠度和第2可靠度中的至少任意一个可靠度发送到修正候补确定部104。
17.例如,在通过统计的手法进行词素解析的情况下,可靠度计算部103可以使用与词素解析相伴地得到的各个词素的得分来计算第1可靠度。例如,在以使得分的合计变高的方式进行单词的抽取的情况下,可靠度计算部103以得分的合计越高,则具有越大的值的方式计算第1可靠度。另外,第1可靠度可以根据在文本数据上存在于抽取出的单词的周边的单词来调整。例如,在抽取出的单词是字母串或者数字串,抽取出的单词的前后的单词也同样地包含字母或者数字的情况下,抽取出的单词及其周边的字母或者数字也包括在内有可能是1个单词。因而,关于在这样的前后包含字母或者数字的字母串或者数字串,可靠度计算部103可以以比原始的值降低的方式计算第1可靠度。同样地,在抽取出的单词是名词,抽取
出的单词的前后的单词也是名词的情况下,抽取出的单词及其周边的单词也包括在内有可能是1个复合名词。因而,关于这样的多个名词排列的单词,可靠度计算部103可以以比原始的值下降的方式计算第1可靠度。
18.另外,在文本数据原本就是利用其它应用制作出的情况下,有时由于显示范围的限制等而在单词的中途被换行。在该情况下,有时即使有换行,在其前后的文章中也具有意思的连结,所以认为最好将换行前后的文章进行连结而进行单词抽取。相反,有时在换行前后意思被截断的部分被连结,所以抽取不需要的单词。因此,可靠度计算部103也可以在从包括换行的部位抽取单词的情况下,以降低第1可靠度的方式进行计算。
19.除此之外,在抽取出的单词与其前后的单词连结了时,在用与连结之前不同的词素的组合且登记于词典的单词的组合来表达时,可靠度计算部103也可以进而根据该不同的词素的得分来重新计算第1可靠度。例如对“業務完全自動”这样的单词进行词素解析的结果,还受到周边的单词的影响而被分割为“業務完”和“全自動”这两个单词。“業務完”这样的单词是不存在于带读音的单词词典的单词。另一方面,在“業務完”与作为其周边的单词的“全自動”连结的情况下,能够得到“業務完全自動”这样的单词。当仅对该“業務完全自動”这样的单词实施了词素解析时,分割为“業務”、“完全”、“自動”这3个词素的可能性高。各个词素也是带读音的单词词典所包含的单词。进而,认为进行了这样的词素解析时的各个词素的得分也高。因而,可靠度计算部103可以降低关于“業務完”的第1可靠度。
20.另外,可靠度计算部103可以以在所赋予的读音是根据带读音的单词词典所包含的单词各自的读音而被赋予的读音时具有高的值的方式计算第2可靠度。另一方面,关于第2可靠度,在所赋予的读音是根据带读音的单词词典所包含的多个单词的组合而被赋予的读音时,可靠度计算部103也可以以具有比针对根据各个单词而赋予的读音的值低的值的方式计算第2可靠度。进而,在所赋予的读音是未根据带读音的单词词典所包含的单词而赋予的读音时,可靠度计算部103也可以以具有比针对根据单词词典所包含的多个单词而赋予的读音的值低的值的方式计算第2可靠度。另外,在统计性地赋予读音的情况下与该读音赋予相伴地得到的得分能够被用作第2可靠度。除此之外,包含字母、数字的单词难以进行读音赋予,所以可靠度计算部103也可以一律降低第2可靠度的值。
21.修正候补确定部104根据由可靠度计算部103计算出的可靠度,确定应作为修正候补的单词以及读音。然后,修正候补确定部104将应作为修正候补的单词以及读音信息发送到显示部105。修正候补确定部104也可以仅确定应作为修正候补的单词和读音的一方。作为具体的确定方法,修正候补确定部104可以将具有低于阈值的第1可靠度的单词以及具有低于阈值的第2可靠度的读音作为修正候补。此外,第1可靠度的阈值与第2可靠度的阈值既可以相同,也可以不同。除此之外,修正候补确定部104也可以在存在具有低于阈值的第1可靠度的单词时,将该单词的读音也作为修正候补,或者相反,在存在具有低于阈值的第2可靠度的读音时,将具有该读音的单词也作为修正候补。另外,修正候补确定部104也可以仅在第1可靠度和第2可靠度都低于阈值时,将这些单词和读音作为修正候补。
22.显示部105在显示画面上强调显示由修正候补确定部104确定的修正候补的单词或者读音。
23.在此,在图1的例子中,按照单词的抽取、读音的赋予、可靠度的计算的顺序进行处理。相对于此,既可以在先进行读音的赋予之后进行单词的抽取,也可以并行地进行单词的
抽取和读音的赋予并进行可靠度的计算。另外,既可以作为针对单词的可靠度的第1可靠度用于作为针对读音的可靠度的第2可靠度的计算,相反,也可以第2可靠度用于第1可靠度的计算。
24.图2是示出词典编辑装置100的硬件结构的一个例子的图。词典编辑装置100例如作为硬件而具有处理器201、存储器202、输入装置203、显示装置204、通信装置205以及存储装置206。处理器201、存储器202、输入装置203、显示装置204、通信装置205以及存储装置206连接于总线207。词典编辑装置100可以是个人计算机(pc)、智能手机、平板终端这样的终端装置。
25.处理器201是控制词典编辑装置100的整体性的动作的处理器。处理器201例如通过执行存储于存储装置206的词典编辑程序,从而作为单词抽取部101、读音赋予部102、可靠度计算部103、修正候补确定部104以及显示部105进行动作。处理器201例如是cpu。处理器201也可以是mpu、gpu、asic、fpga等。处理器201既可以是单一的cpu等,也可以是多个cpu等。
26.存储器202包括rom以及ram。rom是非易失性的存储器。rom存储有词典编辑装置100的启动程序等。ram是易失性的存储器。ram例如被用作处理器201中的处理时的作业存储器。
27.输入装置203是触摸面板、键盘、鼠标等输入装置。在进行输入装置203的操作的情况下,与操作内容相应的信号经由总线207输入到处理器201。处理器201根据该信号来进行各种处理。输入装置203能够用于向词典的单词的登记及其修正。
28.显示装置204是液晶显示器、有机el显示器等显示装置。显示装置204显示各种图像。
29.通信装置205是用于词典编辑装置100与外部的设备进行通信的通信装置。通信装置205既可以是用于有线通信的通信装置,也可以是用于无线通信的通信装置。
30.存储装置206例如是闪存存储器、硬盘驱动器、固态硬盘这样的存储装置。存储装置206存储有词典编辑程序2061等由处理器201执行的各种程序。另外,存储装置206存储有词素词典2062。词素词典2062例如是将表示词素的字符串与各个词素的词性对应起来存储的词典。另外,存储装置206存储有带读音的单词词典2063。带读音的单词词典是将表示单词的字符串与该单词的读音对应起来存储的词典。另外,存储装置206存储有声音识别词典2064。在此,词素词典2062、带读音的单词词典2063以及声音识别词典2064不一定非要存储于存储装置206。例如,词素词典2062、带读音的单词词典2063以及声音识别词典2064也可以存储于词典编辑装置100的外部的服务器。在该情况下,词典编辑装置100通过使用通信装置205访问服务器,从而获取所需的信息。
31.总线207是用于处理器201、存储器202、输入装置203、显示装置204、通信装置205以及存储装置206之间的数据的交换的数据转送路。
32.接下来,说明词典编辑装置100的动作。图3是示出词典编辑装置100的动作的流程图。图3的处理由处理器201执行。
33.在步骤s1中,处理器201获取文本数据。文本数据例如能够由词典编辑装置100的用户输入。除此之外,文本数据也能够通过利用图像识别等来读取打印在纸面上的文本而输入。如这样,文本数据的获取不限定于特定的手法。
34.在步骤s2中,处理器201从文本数据抽取单词。处理器201参照词素词典2062将文本数据分割为词素的单位,将分割后的1个以上的词素进行组合而抽取单词。
35.在步骤s3中,处理器201对抽取出的单词赋予读音。处理器201参照带读音的单词词典2063,对各个单词赋予读音。
36.在步骤s4中,处理器201计算表示单词的可靠度的第1可靠度。例如,处理器201使用与词素解析相伴地得到的各个词素的得分来计算第1可靠度。然后,处理器201依照抽取出的单词与存在于其周边的单词的关系而调整第1可靠度的值。
37.在步骤s5中,处理器201判定是否存在具有低于阈值的第1可靠度的单词。当在步骤s5中被判定为存在具有低于阈值的第1可靠度的单词时,处理转移到步骤s6。当在步骤s5中被判定为不存在具有低于阈值的第1可靠度的单词时,处理转移到步骤s7。
38.在步骤s6中,处理器201对与低于阈值的第1可靠度对应的单词设定标志。该标志是表示抽取出的单词是修正候补的标志。之后,处理转移到步骤s7。
39.在步骤s7中,处理器201计算表示读音的可靠度的第2可靠度。例如,处理器201基于读音是否根据登记于带读音的单词词典2063的单词而被赋予等,计算第2可靠度。
40.在步骤s8中,处理器201判定是否存在具有低于阈值的第2可靠度的读音。当在步骤s8中被判定为存在具有低于阈值的第2可靠度的读音时,处理转移到步骤s9。当在步骤s8中被判定为不存在具有低于阈值的第2可靠度的读音时,处理转移到步骤s10。
41.在步骤s9中,处理器201对具有低于阈值的第2可靠度的读音设定标志。该标志是表示所赋予的读音是修正候补的标志。之后,处理转移到步骤s10。
42.在步骤s10中,处理器201将新抽取出的单词及其读音的一览例如以表的形式显示于显示装置204。
43.在步骤s11中,处理器201判定是否存在设定有标志的单词或者读音。当在步骤s11中被判定为不存在设定有标志的单词或者读音时,图3的处理结束。在该情况下,例如在通过用户对输入装置203的操作来指示了单词及其读音的登记时,处理器201将新抽取出的单词及其读音与音素关联起来,登记于声音识别词典2064。另外,在通过用户对输入装置203的操作来指示了单词及其读音的编辑时,处理器201在根据用户的操作修正新抽取出的单词及其读音的基础上登记于声音识别词典2064。另外,当在步骤s11中被判定为存在设定有标志的单词或者读音时,处理转移到步骤s12。
44.在步骤s12中,处理器201强调显示设定有标志的单词或者读音。之后,图3的处理结束。在该情况下,例如在通过用户对输入装置203的操作来指示了单词及其读音的登记时,处理器201将新抽取出的单词及其读音与音素关联起来,登记于声音识别词典2064。另外,在通过用户对输入装置203的操作来指示了单词及其读音的编辑时,处理器201在根据用户的操作修正新抽取出的单词及其读音的基础上登记于声音识别词典2064。
45.说明步骤s12的强调显示。图4是示出强调显示的一个例子的图。在图4中,示出了对线性代数(線形代数)的文本数据实施单词的抽取和读音的赋予的例子。通过步骤s10的处理,在显示装置204的显示画面显示抽取出的单词及其读音的一览表2041。在该一览表2041之中,可靠度低的单词或者读音被强调显示。
46.例如“直交補”这样的单词是线性代数(線形代数)学中的“直交補空間(
ちょっこうほくうかん
)”这样的单词的一部分。也就是说,“直交補”是根据前后的上下文而“空間”被抽
取之后剩余的单词。相对于此,可知当对“直交補空間”进行了再次的词素解析时,被分割为“直交”和“補空間”,“直交補”是“直交補空間”的一部分的可能性高。因而,关于单词“直交補”的第1可靠度下降。作为结果,单词“直交補”被强调显示。在图4中,显示单词“直交補”的单元用粗框显示。另一方面,关于读音
“ちょっこうほ”
,是根据带读音的单词词典所包含的各个单词的读音而赋予的,所以可以不强调显示。如前所述,被判定为针对对应的单词的第1可靠度低,所以读音
“ちょっこうほ”
可以也被强调显示。另外,在图4中,新抽取出的单词“直交補空間”及其读音
“ちょっこうほくうかん”
也被显示。该新抽取出的单词以及读音的显示也可以省略。
47.另外,读音
“ぐむれすほう”
是表示广义最小残差法的单词“gmres法”的读音。单词“gmres法”是由字母串构成的单词,所以作为其读音的
“ぐむれすほう”
在一览表2041中被强调显示。此外,即使进行再次的词素解析,单词“gmres法”也同样地被抽取。因而,关于单词“gmres法”,可以不强调显示。如前所述,被判定为针对对应的读音的第2可靠度低,所以单词“gmres法”可以也被强调显示。
48.在此,在图4的例子中,将显示修正候补的单词或者读音的单元用粗框显示,从而进行强调显示。强调显示并不限于此。例如,也可以变更单元的背景颜色,或者变更单元的框的颜色,或者变更单元的大小。另外,也可以变更单元的字符的颜色,或者变更字体(包括字符字体、粗字、斜体、下划线等),或者增大字符的大小。另外,也可以根据可靠度的值的大小来变更单元的框的粗细、颜色等。进而,也可以将它们进行组合而强调显示。
49.另外,在一览表2041中,也可以不仅显示单词和读音,还一并显示各自的可靠度的值。
50.如以上说明,根据实施方式,针对从文本数据自动地抽取出的单词以及自动地赋予的读音而计算可靠度,根据可靠度来确定作为修正候补的单词或者读音。根据这样的确定结果将作为修正候补的单词或者读音提示给用户,从而用户重点地确认修正候补的单词或者读音即可。因而,用户的确认作业以及修正作业变容易。
51.在此,在实施方式中,词典编辑装置100具有单词抽取部101、读音赋予部102、可靠度计算部103、修正候补确定部104以及显示部105。相对于此,词典编辑装置100也可以不必具有它们的全部。例如,词典编辑装置100也可以不具有单词抽取部101和读音赋予部102。在该情况下,词典编辑装置100除了获取抽取出的单词、所赋予的读音之外,还获取为了计算可靠度而所需的信息。为了计算可靠度而所需的信息例如是与词素解析相伴地计算出的各词素的得分。然后,词典编辑装置100根据为了计算可靠度而所需的信息来计算第1可靠度以及第2可靠度。另外,词典编辑装置100也可以不具有显示部105。在该情况下,词典编辑装置100可以构成为将所确定的修正候补的单词以及读音的信息输出到外部。
52.说明了本发明的几个实施方式,但这些实施方式是作为例子而提示的,未意图限定发明的范围。这些实施方式能够以其它各种方式被实施,能够在不脱离发明的要旨的范围进行各种省略、置换、变更。这些实施方式及其变形包含于发明的范围、要旨,同样地包含于专利权利要求书所记载的发明及与其均等的范围。
技术特征:
1.一种词典编辑装置,具备:单词抽取部,从文本数据抽取单词;读音赋予部,对抽取出的所述单词赋予读音;可靠度计算部,计算表示抽取出的所述单词的可靠度的第1可靠度和表示所赋予的所述读音的可靠度的第2可靠度中的至少任意一个可靠度;以及修正候补确定部,根据所述第1可靠度来确定作为修正候补的单词,根据所述第2可靠度来确定作为修正候补的读音。2.根据权利要求1所述的词典编辑装置,其中,所述可靠度计算部根据所述单词抽取部是否将所述文本数据上的换行前后的字符进行连结、从包含换行的字符串进行了单词的抽取,计算所述第1可靠度。3.根据权利要求1所述的词典编辑装置,其中,所述可靠度计算部使用在所述文本数据上存在于抽取出的所述单词的周边的单词的信息来计算所述第1可靠度。4.根据权利要求3所述的词典编辑装置,其中,所述可靠度计算部根据使用在所述文本数据上存在于抽取出的所述单词的周边的单词而进行词素解析的结果,重新计算所述第1可靠度。5.根据权利要求1所述的词典编辑装置,其中,所述可靠度计算部使用所述读音是否根据登记于用于进行读音赋予的词典中的单词而被赋予、赋予有所述读音的单词是否包含数字或者字母、所述读音是否根据登记于所述词典中的多个单词而被赋予中的至少任意一个,来计算所述第2可靠度。6.根据权利要求1至5中的任意一项所述的词典编辑装置,其中,所述词典编辑装置还具备显示部,该显示部对由所述修正候补确定部确定的修正候补的单词或者读音进行强调显示。7.根据权利要求6所述的词典编辑装置,其中,所述显示部通过将显示应作为所述修正候补的单词或者读音的单元的背景颜色、所述单元的框的粗细、所述单元的框的大小、所述单元的框的颜色、在所述单元中显示的字符的颜色、所述字符的字体、所述字符的大小中的至少任意一个进行变更,从而进行所述强调显示。8.一种词典编辑方法,具备:从文本数据抽取单词;对抽取出的所述单词赋予读音;计算表示抽取出的所述单词的可靠度的第1可靠度和表示所赋予的所述读音的可靠度的第2可靠度中的至少任意一个可靠度;以及根据所述第1可靠度来确定作为修正候补的单词,根据所述第2可靠度来确定作为修正候补的读音。9.一种处理器能够读取的记录介质,记录有词典编辑程序,该程序用于使处理器执行:从文本数据抽取单词;对抽取出的所述单词赋予读音;计算表示抽取出的所述单词的可靠度的第1可靠度和表示所赋予的所述读音的可靠度
的第2可靠度中的至少任意一个可靠度;以及根据所述第1可靠度来确定作为修正候补的单词,根据所述第2可靠度来确定作为修正候补的读音。
技术总结
实施方式涉及词典编辑装置、词典编辑方法以及记录有词典编辑程序的记录介质。该词典编辑装置具备单词抽取部、读音赋予部、可靠度计算部以及修正候补确定部。单词抽取部从文本数据抽取单词。读音赋予部对抽取出的单词赋予读音。可靠度计算部计算表示抽取出的单词的可靠度的第1可靠度和表示所赋予的读音的可靠度的第2可靠度中的至少任意一个可靠度。修正候补确定部根据第1可靠度来确定作为修正候补的单词,根据第2可靠度来确定作为修正候补的读音。根据第2可靠度来确定作为修正候补的读音。根据第2可靠度来确定作为修正候补的读音。
技术研发人员:岩田宪治 笼岛岳彦
受保护的技术使用者:株式会社东芝
技术研发日:2021.08.30
技术公布日:2022/5/25
转载请注明原文地址:https://tc.8miu.com/read-11979.html