本发明涉及一种用于将车辆数据匿名以使用车辆外部服务的方法。本发明还涉及一种适于使用该方法的车辆。
背景技术:
1、在当今的车辆中,来自车队中的车辆的许多数据与车辆外部的服务器循环交换,例如车辆制造商、车队运营商或车辆外部服务的提供商的服务器。随着车辆传感器系统和车辆内部传感器系统的技术进步和标准安装,以及由这些传感器系统记录的信息的交换,在车辆外部的位置创造了对人、其数据和其状态的强大监控可能性。在这种情况下,该数据可以包含车辆用户的个人数据或允许对车辆用户的个人得出结论的相应车辆数据。特别地,这种数据可用于创建用户简档、创建相应车辆的某种“指纹”等。因此,从数据保护的角度来看,其或多或少需要保护。一方面,使用车辆的人担心他们的数据使用,但同时他们希望能够继续使用现有的服务。
2、de 10 2020 003 188 a1描述了一种用于保护车辆乘员的个人数据的方法,其中车辆乘员在车辆中的情绪状态被记录为个人数据,并且被屏蔽的情绪状态在车辆外部的设备中被评估。然后将其与包含多个情绪模式的情绪组相关联,从而使车辆乘员的情绪状态去个性化以保护他。
3、de 10 2021 001 378 b3(在申请时未预先公布)描述了一种用于对配备有位置检测设备的道路使用者的运动数据进行匿名化的方法。这里的主要目标是监控交通流,然而,在这种情况下,应该防止需要保护的数据流入传输,但仍然有足够的数据准确性,以确保对交通流的可靠评估。
4、de 10 2015 213 393 a1描述了一种用于匿名车辆数据以使用车辆外部服务的方法。在这种情况下,除了指示车辆行驶的路线部分的原始车辆数据之外,还生成指示人工行驶路线的其他人工车辆数据。原始车辆数据和人工车辆数据一起存储或传送。
5、de 10 2015 226 650 a1公开了一种用于将车辆的行驶参数的第一值匿名传送到外部数据接收单元的方法。从车辆接收行驶参数的其他值,这些值从其他车辆传送到车辆。根据第一值和其他值计算行驶参数的第二值,使得第一值不能由外部数据接收单元重建。第二值被传送到外部数据接收单元。
技术实现思路
1、本发明的目的特别是提供一种用于在使用车辆外部服务时将车辆数据匿名的改进方法。
2、根据本发明,该目的通过具有权利要求1中的特征的方法来实现,这里特别是在权利要求1的特征部分中。根据本发明的方法的有利设计方案和改进方案在从属权利要求中给出。在权利要求13中还描述了一种适于执行该方法的车辆。
3、根据本发明的方法用于匿名车辆数据以使用车辆外部服务。在这种情况下,假设在由相同车辆组成的大型车队以及相关的大型非同质/各种各样的车辆用户组中,以高概率存在相似的车辆使用简档。此外,使用车辆外部服务,当使用这些服务时,信息从车辆发送到车辆外部服务的提供商。
4、安装在车辆中和车辆上的传感器连续确定描述车辆状态(例如,位置、速度、行驶路线、路线信息、车龄等)以及驾驶员和乘客的状态(例如,注意力水平、驾驶风格等)的车辆传感器值。根据本发明,在具有非同质车辆用户组的相同类型的车辆的车队内,为车辆中的每一个检测至少间接取决于记录的车辆传感器值的整数数量n的第一变量和至少间接取决于当前车辆传感器值的整数数量m的第二变量。
5、因此,为车队中的每辆车确定两个变量。第一变量是多达n个车辆传感器值的特征集合,并且由记录的车辆传感器值确定。其在时间上近似恒定(例如,载荷集合数据),因此这里可以说是静态变量。在极限情况下,变量也可以直接对应于单个传感器值。此外,第二变量是多达m个车辆传感器值的特征集合。其由当前车辆传感器值确定,并随时间动态变化(例如,位置、速度、加速度等),因此这里可以说是动态变量。在极限情况下,该变量也可以直接对应于单个传感器值。
6、第一变量,特别是当其基于多个车辆传感器值时,使得识别每个车辆成为可能,就像指纹一样,因为该变量基于单个车辆和使用行为,并且随时间变化很小。因此,从数据保护的角度来看,这些第一变量特别值得保护。另一方面,第二变量反映了车辆及其使用的当前数据。车辆的识别只能间接进行(例如,通过地理定位和本地图像信息的组合)。
7、现在确定车队中的几个或所有车辆的第一变量的相似性,根据该相似性,车辆被划分为关于至少一个变量的相似性相似的类别或不相似的类别。特别地,可以确定在第一和/或第二变量中具有相似车辆传感器值的车辆。为此,本发明的优选设计方案使用机器学习的聚类机制(例如,k均值、均值偏移或期望最大化(em)聚类)来生成第一和/或第二变量的相似性度量。在这种情况下,至少第二变量的相似性被连续地确定,因为后者在车队中随时间变化。
8、现在,在请求车辆外部服务的情况下,可以传输来自相似车辆的类别的车辆的相应变量、来自相似车辆的类别的多个车辆的相应变量的计算确定的变量或人工生成的相似变量,而不是传输包含与服务相关的信息的请求车辆的变量。
9、因此,创建了一个隐私层,在最简单的情况下,该隐私层使用来自车队中另一辆车的足够相似的信息,而不是车辆的真实信息,用于相应的车辆外部服务。在另一设计方案中,可以确定、例如平均或人工生成关于类似车辆的一组相关信息的相关信息。
10、因此,当第一车辆调用车辆外部服务时,传送与该服务相关的从类似车辆的变量的确定(例如通过平均)的变量或人工生成的数据信息。
11、此外,通常情况下,并非发送到车辆外部服务的提供商的所有信息都是提供服务所必需的,而是与服务不相关的大量信息被传送到车辆外部服务的提供商,使得这些附加信息可以被车辆外部服务的提供商货币化为附加值。通常,该信息基于相应的另一个变量。因此,根据本发明方法的非常有利的改进方案,可以提供传输来自不相似车辆的类别的车辆的相应变量、来自不相似车辆的类别的多个车辆的相应变量的计算确定的变量或人工生成的相似变量,而不是请求车辆的其他变量。
12、因此,我们实现了一个“隐私层”,其用与车辆外部服务相关的类似车辆的信息和不相似车辆的不相关信息替换车辆的信息,从而隐藏了值得保护的车辆的实际信息。
13、根据本发明的有利设计方案,人工生成的变量在这两种情况下都是可能的,但特别是在不太相关的信息中起决定性作用,可以通过生成式机器学习方法来生成。
14、为此,可以训练模型,并对其进行优化以生成尽可能“真实”的变量,然后这些变量可以用于随机变量,特别是第二变量。这种“真实感”是通过使用适当的功能来实现的,这些功能要么是通用的,要么是根据车辆希望使用的服务来定义的。因此,也可以设置n个或特别是m个车辆传感器值的内容焦点。
15、根据本发明方法的非常有利的设计方案,至少间接依赖于整数数量的车辆传感器值的变量,即第一变量和第二变量,可以形成为n或m个车辆传感器值的集合。因此,变量由相应的集合组成,或者,如果需要传感器值以预定顺序的特定排列,也由n元组或m元组组成。
16、相应变量的替代设计方案可以提供相应变量被形成为基于n维或m维空间中的相应车辆传感器值的向量。
17、因此,为车队中的每辆车确定两个向量,第一变量是从记录的车辆传感器值确定的特征n维向量。对应于第二变量的第二向量将是从当前车辆传感器值确定的m维向量。
18、特别地,第一向量允许非常简单地识别每辆车,就像指纹一样,因此特别值得保护。第二向量基本上反映了车辆在使用期间的当前值,并且在数据保护方面不太值得保护。
19、根据本发明方法的另一个非常有利的设计方案,作为其作为向量的设计方案的改进方案,这两个变量也可以以这样的方式实现,即相应的变量被形成为相应向量到具有更小或至多相同维数的值的映射。该映射可以优选地表示空间维度降低。借助于合适的映射/变换,例如根据英文术语“principal component analysis”称为pca的主成分分析,或者也借助于深度神经网络的映射,可以分别从具有n或m维度的向量生成具有n'或m'维度的相应值。在这种情况下,维度的数量优选地减少或最多等于先前维度的数量,即从不增加。由于具有n或m维度的向量现在分别被映射到具有n'或m'维度的空间中,其以某种方式被压缩和加密,使得已经不再能够从该新值直接推断出先前的向量或该向量所基于的车辆传感器值。因此,如果车辆外部服务的提供商能够处理这种向量或优选地从向量生成的映射值以提供他们的服务,则仅通过这种方式已经可以实现一定程度的匿名化。此外,如果这与“隐私层”的上述功能相结合,则通过传输相关的相似信息和必要时不太相关的不相似信息来实现非常好的数据保护。
20、根据本发明方法的非常有利的设计方案,现在还可以提供,为了确定相似和不相似变量的类别,使用机器学习的聚类机制来确定相似性度量,其中,基于默认值并将所确定的相似性度量与默认值进行比较来对变量进行分类。因此,根据本发明的方法的该有利设计方案使用机器学习的聚类机制。这些可以包括例如k均值、均值偏移或期望最大化(em)聚类。然后可以通过这种机制生成第一变量和/或第二变量的相似性度量,例如作为相应向量的向量或映射。基于默认值,然后可以通过该默认值对确定的相似性度量进行分类。如果相似性度量例如在0和100%之间,则可以通过例如80%的默认值来区分位于0和80%之间的不相似信息或位于80和100%之间的足够相似的信息。
21、在这种情况下,根据本发明方法的非常有利的设计方案,默认值可以根据车辆外部服务而变化。例如,相关车辆传感器的数据或其绝对值提供了改变或参数化该值的其他可能性,因为例如,在低速下可以使用与在相应快的速度下不同的相似性。这里的一个示例可能是天气应用程序,其在精确位置方面的相似性相对较低,因此确定精确到几公里或几百米的位置就足够了。然而,如果车辆外部服务是导航系统,这种关于位置的指示当然是不够的;为此,值之间的相似性要高得多。
22、根据本发明的方法的另一个非常有利的变型提供了变量至少部分地在车辆和中央数据中心之间交换,其中,信息的聚合和评估在中央数据中心中进行。因此,来自车队的车辆的信息和关于车队的车辆的信息可以通过数据中心,特别是云来交换,并且信息可以在数据中心/云中被聚合和评估。替代地或附加地,根据本发明,还可以提供变量在车队的车辆之间至少部分地交换、聚合和评估。在第二种方法中,通过车队中的车辆之间的信息交换,可以在车队中分散地聚合和评估信息。在这种情况下,有利的是,车辆可以分散地与附近的其他车辆直接通信,特别是与具有相似动态值的车辆(即,具有相似当前值(例如位置、速度、加速度等)的车辆),因为其在相同的位置,例如在相同的方向上行驶。
23、虽然前一种解决方案减少了数据传输时间和延迟,但分散的信息处理可以提高数据安全性(因为没有一个中心位置存储车队的所有信息),并且对单个节点,特别是中心节点的故障具有鲁棒性。这两种解决方案也可以结合起来,以便部分集中操作,部分分散操作。
24、根据该想法的一个非常有利的设计方案,为了确定与车队中的至少一些车辆的车辆外部服务相关的信息和不太相关的信息之间的区别,可以向车辆外部服务发送具有相似的第一变量的信息和分别具有不相似的第二变量的信息,之后评估服务。因此,车队用于测试车辆外部服务,以便确定哪些信息与服务结果相关(分析)。为此,具有第一变量和第二变量的多个编排请求被发送到车辆外部服务的提供商,其覆盖请求的可能值范围。在数据中心/云和/或车队中分析由车辆外部服务的提供商传送的对请求的响应的相似性。
25、为此,车队中的一组车辆首先向车辆外部服务的提供商发送请求,该提供商在两个变量中的一个上具有相似的数据,但在相应的另一个变量中具有不同的数据。因此,可以确定其中一个变量本身是否足以使用车辆外部服务。
26、该方法的一个非常有利的设计方案提供了随后记录单个车辆传感器值,并且随机化其他车辆传感器值,以确定与相应的车辆外部服务的使用相关和不太相关的车辆传感器值。因此,基于上述查询,记录来自变量的单个数据或数据组,并且在请求期间对剩余数据进行随机化,以便获得与车辆外部服务相关的最终组。因此,还可以通过“隐私层”最大限度地利用远离相应变量的值范围。
27、因此,根据本发明的方法现在特别适用于基本上相同类型的车辆的车队的车辆中,即例如私人使用的乘用车车队、用作公司用车的乘用车、品牌或品牌组合的车辆、商用车辆等。在这种情况下,根据本发明的车辆配备有多个传感器和至少一个通信接口,其被设置为与其他车辆和/或外部数据中心一起执行该方法。
1.一种用于将车辆数据匿名以使用车辆外部服务(fes)的方法,
2.根据权利要求1所述的方法,
3.根据权利要求1或2所述的方法,
4.根据权利要求1、2或3中任一项所述的方法,
5.根据权利要求1、2或3中任一项所述的方法,
6.根据权利要求5所述的方法,
7.根据权利要求1至6中任一项所述的方法,
8.根据权利要求7所述的方法,
9.根据权利要求1至8中任一项所述的方法,
10.根据权利要求1至9中任一项所述的方法,
11.根据权利要求1至10中任一项所述的方法,
12.根据权利要求11所述的方法,
13.一种车辆(11,12,13,14),具有多个传感器和至少一个通信接口(1),其被设置为与其他车辆(11,12,13,14)和/或外部数据中心(4)一起执行所述方法。