一种基于用户特征的鞋款类型推荐系统及方法

    专利查询2022-07-09  150



    1.本发明涉及推荐系统技术领域,具体为一种基于用户特征的鞋款类型推荐系统及方法。


    背景技术:

    2.随着互联网的普及和电子商务行业的快速发展,相比于线下购物,人们在网上消费的频率越来越高。鞋履作为人们日常生活中不可或缺的一样物品,占据了电子商务平台的一部分市场。越来越多的人开始在网上购买自己心仪的鞋款,但是网上琳琅满目的商品远远超出了日常线下货柜里陈列的商品数量、种类和风格,不能做到在众多品类中挑选到最符合每个用户购买需求的鞋款类型,且不同的用户对应不用的推荐数据,使得系统计算繁琐,而且在系统数据出现与用户历史数据不符的时候,无法精确判断用户的主观意愿,造成推荐鞋款类型不准确的问题。


    技术实现要素:

    3.本发明的目的在于提供一种基于用户特征的鞋款类型推荐系统及方法,以解决上述背景技术中提出的问题。
    4.为了解决上述技术问题,本发明提供如下技术方案:一种基于用户特征的鞋款类型推荐系统,包括中心数据库模块、数据分析模块、数据校正模块和数据推荐模块;
    5.中心数据库模块用于记录用户的特征数据,特征数据包括用户的历史订单数据和用户的浏览数据,且中心数据库模块将用户的历史订单数据存储为第一数据库,将用户的浏览数据存储为第二数据库;第一数据库包括用户的下单时间、用户的下单金额和用户的下单款式,第二数据库包括用户的搜索引擎关键词、询问客服关键词和用户的浏览内容相关数据;
    6.数据分析模块用于对中心数据库模块中的第二数据库进行分析,并将分析后得到的鞋款推荐模型传输给数据推荐模块,鞋款推荐模型包括推荐模型一和推荐模型二;
    7.数据校正模块用于对中心数据库模块中的第一数据库进行分析和校正,将校正后的鞋款校正模型传输给数据推荐模块,鞋款校正模型包括融合校正模型和特殊值校正模型;
    8.数据推荐模块用于接收数据分析模块发送的鞋款推荐模型和数据校正模块接收的鞋款校正模型并对用户进行推荐。
    9.进一步的,数据分析模块包括数据提取模块、龙头数据分析模块和凤尾数据分析模块;数据提取模块提取中心数据库模块的数据信息,并将该信息传输给龙头数据分析模块和凤尾数据分析模块;
    10.龙头数据分析模块用于分析用户在有浏览意愿时输入的搜索引擎关键词,和在有购买意愿时输入的询问客服关键词,龙头数据分析模块将两者进行综合分析,并将分析得到的推荐模型一传输给数据推荐模块;
    11.凤尾数据分析模块用于分析用户在进行关键词的搜索后,对显示的用户的浏览内容相关数据进行分析,并将该用户的浏览内容相关数据进行处理分析得到的推荐模型二传输到数据推荐模块。
    12.进一步的,数据校正模块包括融合校正模块和特征值校正模块;
    13.融合校正模块用于判断中心数据模块的第一数据库中不同用户的数据信息是否符合融合条件,若符合融合条件,融合校正模块将不同用户的数据分析模块中的推荐模型进行融合,将融合后的模型记为融合校正模型传输到数据推荐模块。
    14.特征值校正模块用于判断用户的中心数据库模块的数据信息是否存在特殊情况,并对该特殊情况下的特征值进行处理分析得到特征值校正模型,判断是否需要对数据分析模块进行校正。
    15.一种基于用户特征的鞋款类型推荐方法,包括以下具体步骤:
    16.步骤s1:获取用户的历史订单数据和用户的浏览数据;将用户的历史订单数据存储到第一数据库,第一数据库包括用户的下单时间、用户的下单金额和用户的下单款式;将用户的浏览数据存储到第二数据库,第二数据库包括搜索引擎关键词、询问客服关键词和用户的浏览内容相关数据;
    17.将用户的数据分别存入两个不同的数据库,有助于后续系统对用户的不同数据进行提取和分类;且第一数据库是用户实际确定的订单信息,用于作为数据评估的基准,第二数据库是用户的实时动态信息,用于判断用户的实时喜好趋向;
    18.步骤s2:提取步骤s1中第二数据库中的数据信息,对该数据信息进行关键词相似度分析,得到分析后的推荐模型一;
    19.分析推荐模型一是为了确定用户首要的购物意向,不管是在搜索引擎中对关键词的搜索还是询问客服的关键词都表明了用户的购买意向,属于先行趋势;
    20.步骤s3:提取步骤s1中的第二数据库中的数据信息,对该数据进行浏览内容相关数据分析,得到分析后的推荐模型二;
    21.分析推荐模型二是为了确定用户后继的浏览趋势,在搜索过后对显示内容的喜好判断;
    22.步骤s4:提取步骤s1中的第一数据库和第二数据库信息,对第一数据库信息进行融合校正的判断以及对符合条件后的第二数据库进行融合操作,得到融合校正模型;
    23.步骤s5:提取步骤s1中的第一数据库和第二数据库信息,对第二数据库中出现的异常特征值结合第一数据库中的信息进行分析处理,判断是否需要对数据分析模块进行校正,得到特征值校正模型;
    24.步骤s6:基于上述步骤s2-s5的数据分析结果,将上述模型按规则推荐给用户。
    25.进一步的,步骤s2的具体过程为:
    26.步骤s20:设定搜索引擎中的关键词集合为{ri},i={1,2......n},ri表示集合{ri}中第i种关键词;设定询问客服时的关键词为集合{gi},i={1,2......n},gi表示集合{gi}中第i中关键词;关键词包含但不限于:鞋款材质、码数大小、颜色和跟高程度;
    27.步骤s21:基于步骤s20的分析过程,记录单次完整搜索过程中搜索引擎中关键词ri的频次为ti,t为任意自然数,ti表示第i种关键词ri出现的频次;记录单次完整搜索过程中询问客服的关键词gi的频次为pi,p为任意自然数,pi表示第i种关键词gi出现的频次;并
    将{ri}和{gi}中出现的所有词均在对应的集合中用对应的频次表示出来;
    28.将关键词出现的频率转变成次数,表示如果关键词相似则代表用户的搜索方向是相似的;
    29.步骤s22:将步骤s21中的频次ti构成频次向量将步骤s21中的频次pi构成频次向量利用公式:
    [0030][0031]
    求得搜索引擎的关键词与询问客服时的关键词的相似度cos(α),其中表示向量的模,表示向量的模;当取得的相似度值大于系统预设的关键词相似度阈值,记录此时的关键词构成推荐模型一,推荐模型一为该情况下关键词集合的对应鞋款。
    [0032]
    将搜索引擎的关键词和询问客服时的关键词想象成空间中的两条线段,都是从原点([0,0,...])出发,指向不同的方向;两条线段之间形成一个夹角,如果夹角为0度,意味着方向相同、线段重合,这是表示两个向量代表的文本完全相等;如果夹角为90度,意味着形成直角,方向完全不相似;如果夹角为180度,意味着方向正好相反。因此,我们可以通过夹角的大小,来判断向量的相似程度;夹角越小,就代表越相似;当相似度cos(α)越接近1时,表示搜索引擎的关键词与询问客服时的关键词的相似度越高,反之,当相似度cos(α)越接近0时,表示搜索引擎的关键词与询问客服时的关键词的相似度越低。
    [0033]
    进一步的,步骤s3的具体过程为:
    [0034]
    步骤s30:将用户浏览内容相关数据进行划分,包括颜色相关数据、材质相关数据、风格相关数据和其他,颜色相关数据包括放大浏览图片颜色的和浏览内容的总图片数,记放大浏览图片颜色的次数为o1、浏览内容的总图片数为o2;材质相关数据包括停留在材质介绍的时间和进入内容介绍到退出内容介绍浏览的总时间,记停留在材质介绍的时间为p1、进入内容介绍到退出内容介绍浏览的总时间为p2;风格相关数据包括手指在搭配风格详情页面的划动次数和进入详情页面到推出详情页面的总划动次数,记手指在搭配风格详情页面的划动次数为q1、进入详情页面到推出详情页面的总划动次数为q2;
    [0035]
    步骤s31:基于步骤s30中的数据,利用公式计算用户颜色喜好度o,利用公式计用户材质喜好度p,利用公式计算用户风格喜好度;计算用户综合平均喜好度为
    [0036]
    计算其综合平均喜好度用于与后面对用户的不同数据进行加权赋值后作比较,来分析用户在受到加权影响下的真实偏好;
    [0037]
    步骤s32:基于步骤s31中的数据,对用户的颜色喜好度设置权重值a、用户材质喜好度设置权重值b和用户风格喜好度设置权重值c,且1≤{a、b、c};对三种喜好度进行从大到小的排序,并在对应的权重值设定过程中,令权重值的大小顺序与其对应喜好度的顺序相反,利用公式求得该用户综合加权平均喜好度;
    [0038]
    求加权平均值的目的是增加干扰因素,在用户喜好度最高的用户数据上加以最小
    的权重值,用来干扰用户的喜好度,以此判断用户在干扰情况下真实的偏好;
    [0039]
    步骤s33:基于步骤s31和步骤s32的数据,利用公式γ=n-w分析用户的最终偏好值;若γ》0,将最小权重值对应的用户浏览内容数据构成推荐模型二,若γ≤0,将该用户浏览内容数据包含的颜色相关数据、材质相关数据和风格相关数据进行组合构成推荐模型二。
    [0040]
    将用户的综合加权平均喜好度与综合平均喜好度作差比较,当大于0时,说明在权重值影响着作用轻重的情况下,仍使综合水平有所提高,进一步说明最小权重值对应的用户数据喜好度的影响作用是最高的,故将该数据构成推荐模型推送给用户。
    [0041]
    进一步的,步骤s4的具体过程为:
    [0042]
    步骤s40:记用户x和用户y的第一数据库的用户下单金额为u
    x
    、uy;给定系统的用户下单金额界值为d,当用户下单金额u
    x
    、uy≥d时,记此时属性特征值为1,当用户下单金额u
    x
    、uy《d时,记此时属性特征值为0,分别记录用户x和用户y在属性特征值为均1的次数为j
    11
    ,用户x在属性特征值为1且用户y在属性特征值为0的次数为j
    10
    ,j属于任意自然数;记录用户x和用户y在属性特征值均为0的次数为r
    00
    ,用户x在属性特征值为0且用户y在属性特征值为1的次数为r
    01

    [0043]
    步骤s41:利用公式:
    [0044][0045][0046]
    求得用户x和用户y在下单金额上的相似性,其中j(u
    x
    ,uy)表示相似性系数,d(u
    x
    ,uy)表示相似性距离;且d(u
    x
    ,uy)∈(0,1);系统内设相似性阈值,当d(u
    x
    ,uy)小于该系统内设相似性阈值,记为用户x和用户y具有相似性,可以进行融合;若不满足d(u
    x
    ,uy)∈(0,1)或d(u
    x
    ,uy)大于等于该系统内设相似性阈值,则不进行融合;
    [0047]
    利用上述公式表示两个用户下单金额之间的差异性,当系统对不同用户在相同下单顺序下对应的下单金额进行分析,将两者进行关联构成非对称二元属性,并计算属性之间两用户的距离表示相似性,且相似性系数为样本交集个数和样本并集个数的比值,相似性系数相反的即为相似性距离,用两个集合中不同元素所占元素的比例来衡量两个样本之间的相似度,且当相似性距离d(u
    x
    ,uy)越大表示用户x和用户y在下单金额上的相似性越低。
    [0048]
    步骤s42:基于步骤s41进行融合的基础上,将用户x和用户y的第二数据库中的推荐模型一和推荐模型二进行相互融合推荐,形成融合校正模型,并结合第一数据库在用户各自对应的下单时间进行推荐。
    [0049]
    进一步的,步骤s5的具体过程为:
    [0050]
    步骤s50:将第一数据库中的用户下单款式进行记录,用户下单款式包括鞋款码数和鞋款类型,并将该鞋款码数和鞋款类型按购买顺序分别绘制在二维坐标系中,对比第二数据库中的鞋款码数和鞋款类型并将其刻画在对应的二维坐标系中;二维坐标系的横坐标为鞋款购买顺序,纵坐标为鞋款码数,且鞋款码数以坐标原点为起点,等间隔从小至大依次分布,另一纵坐标为鞋款类型,鞋款类型包括春夏季童鞋、秋冬季童鞋、春夏季女鞋、秋冬季女鞋、春夏季男鞋和秋冬季男鞋,且该鞋款类型从坐标原点依次等间隔排序;
    [0051]
    步骤s51:当二维坐标系中第二数据库对应的数据出现极值时,极值包括极大值和极小值,且对应出现极值后的第一数据库对应的数据同样出现相同的极值,则判定该极值为异常特征值,此时对推荐模型进行校正,将校正后的特征值校正模型推送给用户;并在异常特征值消失后继续推送此时对应的推荐模型一和推荐模型二。
    [0052]
    设定对异常特征值的监测是为了提高用户购鞋的精确度和多元化,因在用户购鞋时,有时会出现为自己的孩子或者父母买鞋的现象,在第二数据库的监测下,需要判断这些异常的浏览内容是误触还是真实的购买意向,故查看第一数据库的实际订单可以准确判断,进而将这些异常现象进行校正,并对此类用户推送相关的特征值校正模型。
    [0053]
    与现有技术相比,本发明所达到的有益效果是:本发明根据用户的历史订单和浏览数据进行分析,快捷有效的推送出符合用户满意度、并能构成消费的推荐模型,且在不同用户之间相似的鞋款选择偏好可以进行数据的融合,增加了用户之间的选择性且减少了系统数据存储的压力,除此之外,该发明还能对用户的异常数据进行精准的校正,对用户的选择进行多元化的判断,对鞋款类型进行多元化的推送。
    附图说明
    [0054]
    附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
    [0055]
    图1是本发明一种基于用户特征的鞋款类型推荐系统的模块结构示意图;
    [0056]
    图2是本发明一种基于用户特征的鞋款类型推荐方法的整体步骤图;
    [0057]
    图3是本发明一种基于用户特征的鞋款类型推荐方法的推荐模型一的形成步骤图;
    [0058]
    图4是本发明一种基于用户特征的鞋款类型推荐方法的推荐模型二的形成步骤图;
    [0059]
    图5是本发明一种基于用户特征的鞋款类型推荐方法的融合校正模型的形成步骤图;
    [0060]
    图6是本发明一种基于用户特征的鞋款类型推荐方法的特征值校正模型的形成步骤图。
    具体实施方式
    [0061]
    下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
    [0062]
    请参阅图1-图6,本发明提供技术方案:一种基于用户特征的鞋款类型推荐系统,包括中心数据库模块、数据分析模块、数据校正模块和数据推荐模块;
    [0063]
    中心数据库模块用于记录用户的特征数据,特征数据包括用户的历史订单数据和用户的浏览数据,且中心数据库模块将用户的历史订单数据存储为第一数据库,将用户的浏览数据存储为第二数据库;第一数据库包括用户的下单时间、用户的下单金额和用户的下单款式,第二数据库包括用户的搜索引擎关键词、询问客服关键词和用户的浏览内容相
    关数据;
    [0064]
    数据分析模块用于对中心数据库模块中的第二数据库进行分析,并将分析后得到的鞋款推荐模型传输给数据推荐模块,鞋款推荐模型包括推荐模型一和推荐模型二;
    [0065]
    数据校正模块用于对中心数据库模块中的第一数据库进行分析和校正,将校正后的鞋款校正模型传输给数据推荐模块,鞋款校正模型包括融合校正模型和特殊值校正模型;
    [0066]
    数据推荐模块用于接收数据分析模块发送的鞋款推荐模型和数据校正模块接收的鞋款校正模型并对用户进行推荐。
    [0067]
    数据分析模块包括数据提取模块、龙头数据分析模块和凤尾数据分析模块;数据提取模块提取中心数据库模块的数据信息,并将该信息传输给龙头数据分析模块和凤尾数据分析模块;
    [0068]
    龙头数据分析模块用于分析用户在有浏览意愿时输入的搜索引擎关键词,和在有购买意愿时输入的询问客服关键词,龙头数据分析模块将两者进行综合分析,并将分析得到的推荐模型一传输给数据推荐模块;
    [0069]
    凤尾数据分析模块用于分析用户在进行关键词的搜索后,对显示的用户的浏览内容相关数据进行分析,并将该用户的浏览内容相关数据进行处理分析得到的推荐模型二传输到数据推荐模块。
    [0070]
    数据校正模块包括融合校正模块和特征值校正模块;
    [0071]
    融合校正模块用于判断中心数据模块的第一数据库中不同用户的数据信息是否符合融合条件,若符合融合条件,融合校正模块将不同用户的数据分析模块中的推荐模型进行融合,将融合后的模型记为融合校正模型传输到数据推荐模块。
    [0072]
    特征值校正模块用于判断用户的中心数据库模块的数据信息是否存在特殊情况,并对该特殊情况下的特征值进行处理分析得到特征值校正模型,判断是否需要对数据分析模块进行校正。
    [0073]
    一种基于用户特征的鞋款类型推荐方法,包括以下具体步骤:
    [0074]
    步骤s1:获取用户的历史订单数据和用户的浏览数据;将用户的历史订单数据存储到第一数据库,第一数据库包括用户的下单时间、用户的下单金额和用户的下单款式;将用户的浏览数据存储到第二数据库,第二数据库包括搜索引擎关键词、询问客服关键词和用户的浏览内容相关数据;
    [0075]
    将用户的数据分别存入两个不同的数据库,有助于后续系统对用户的不同数据进行提取和分类;且第一数据库是用户实际确定的订单信息,用于作为数据评估的基准,第二数据库是用户的实时动态信息,用于判断用户的实时喜好趋向;
    [0076]
    步骤s2:提取步骤s1中第二数据库中的数据信息,对该数据信息进行关键词相似度分析,得到分析后的推荐模型一;
    [0077]
    分析推荐模型一是为了确定用户首要的购物意向,不管是在搜索引擎中对关键词的搜索还是询问客服的关键词都表明了用户的购买意向,属于先行趋势;
    [0078]
    步骤s2的具体过程为:
    [0079]
    步骤s20:设定搜索引擎中的关键词集合为{ri},i={1,2......n},ri表示集合{ri}中第i种关键词;设定询问客服时的关键词为集合{gi},i={1,2......n},gi表示集合
    {gi}中第i中关键词;关键词包含但不限于:鞋款材质、码数大小、颜色和跟高程度;
    [0080]
    例如:搜索引擎中的关键词集合{r3}={皮质,黑色,低跟,37码},询问客服时的关键词为集合{g3}={皮质,棕色,中跟,37码};
    [0081]
    步骤s21:基于步骤s20的分析过程,记录单次完整搜索过程中搜索引擎中关键词ri的频次为ti,t为任意自然数,ti表示第i种关键词ri出现的频次;记录单次完整搜索过程中询问客服的关键词gi的频次为pi,p为任意自然数,pi表示第i种关键词gi出现的频次;并将{ri}和{gi}中出现的所有词均在对应的集合中用对应的频次表示出来;
    [0082]
    将关键词出现的频率转变成次数,表示如果关键词相似则代表用户的搜索方向是相似的;
    [0083]
    步骤s22:将步骤s21中的频次ti构成频次向量将步骤s21中的频次pi构成频次向量利用公式:
    [0084][0085]
    求得搜索引擎的关键词与询问客服时的关键词的相似度cos(α),其中表示向量的模,表示向量的模;当取得的相似度值大于系统预设的关键词相似度阈值,记录此时的关键词构成推荐模型一,推荐模型一为该情况下关键词集合的对应鞋款。
    [0086]
    例如:关键词集合{r3}中的频次分别为{皮质2,黑色2,棕色0,低跟1,中跟0,37码2},关键词集合{g3}中的频次分别为{皮质1,黑色0,棕色1,低跟0,中跟2,37码1};
    [0087][0088][0089]
    设系统预设的关键词相似度阈值为0.6,则0.64》0.6,此时的关键词构成推荐模型一,该推荐模型一为关键词皮质、37码对应的鞋款;其中皮质2代表“皮质”这个关键词在搜索引擎的关键词出现了两次,依次类推,且将所有关键词均记录在两种集合中,将对应的频次系数提取获得对应的频次向量。
    [0090]
    将搜索引擎的关键词和询问客服时的关键词想象成空间中的两条线段,都是从原点([0,0,...])出发,指向不同的方向;两条线段之间形成一个夹角,如果夹角为0度,意味着方向相同、线段重合,这是表示两个向量代表的文本完全相等;如果夹角为90度,意味着形成直角,方向完全不相似;如果夹角为180度,意味着方向正好相反。因此,我们可以通过夹角的大小,来判断向量的相似程度;夹角越小,就代表越相似;当相似度cos(α)越接近1时,表示搜索引擎的关键词与询问客服时的关键词的相似度越高,反之,当相似度cos(α)越接近0时,表示搜索引擎的关键词与询问客服时的关键词的相似度越低。
    [0091]
    步骤s3:提取步骤s1中的第二数据库中的数据信息,对该数据进行浏览内容相关数据分析,得到分析后的推荐模型二;
    [0092]
    分析推荐模型二是为了确定用户后继的浏览趋势,在搜索过后对显示内容的喜好判断;
    [0093]
    步骤s3的具体过程为:
    [0094]
    步骤s30:将用户浏览内容相关数据进行划分,包括颜色相关数据、材质相关数据、风格相关数据和其他,颜色相关数据包括放大浏览图片颜色的和浏览内容的总图片数,记放大浏览图片颜色的次数为o1、浏览内容的总图片数为o2;材质相关数据包括停留在材质介绍的时间和进入内容介绍到退出内容介绍浏览的总时间,记停留在材质介绍的时间为p1、进入内容介绍到退出内容介绍浏览的总时间为p2;风格相关数据包括手指在搭配风格详情页面的划动次数和进入详情页面到推出详情页面的总划动次数,记手指在搭配风格详情页面的划动次数为q1、进入详情页面到推出详情页面的总划动次数为q2;
    [0095]
    步骤s31:基于步骤s30中的数据,利用公式计算用户颜色喜好度o,利用公式计用户材质喜好度p,利用公式计算用户风格喜好度;计算用户综合平均喜好度为
    [0096]
    例如:用户浏览内容的总图片数为6张,放大浏览图片颜色的次数为4张,此时用户进入内容介绍到退出内容介绍浏览的总时间为20min,停留在材质介绍的时间为3min,此时用户进入详情页面到推出详情页面的总划动次数为8次,手指在搭配风格详情页面的划动次数为2次,此时则用户综合平均喜好度
    [0097]
    计算其综合平均喜好度用于与后面对用户的不同数据进行加权赋值后作比较,来分析用户在受到加权影响下的真实偏好;
    [0098]
    步骤s32:基于步骤s31中的数据,对用户的颜色喜好度设置权重值a、用户材质喜好度设置权重值b和用户风格喜好度设置权重值c,且1≤{a、b、c};对三种喜好度进行从大到小的排序,并在对应的权重值设定过程中,令权重值的大小顺序与其对应喜好度的顺序相反,利用公式求得该用户综合加权平均喜好度;
    [0099]
    例如:分析用户颜色喜好度、用户材质喜好度和用户风格喜好度的数值大小,可得出即用户颜色喜好度》用户风格喜好度》用户材质喜好度,则此时设定的权重值顺序为:用户材质喜好度权重值》用户风格喜好度权重值》用户颜色喜好度,即设置a=2,b=8,c=5;则
    [0100]
    求加权平均值的目的是增加干扰因素,在用户喜好度最高的用户数据上加以最小的权重值,用来干扰用户的喜好度,以此判断用户在干扰情况下真实的偏好;
    [0101]
    步骤s33:基于步骤s31和步骤s32的数据,利用公式γ=n-w分析用户的最终偏好值;若γ》0,将最小权重值对应的用户浏览内容数据构成推荐模型二,若γ≤0,将该用户浏览内容数据包含的颜色相关数据、材质相关数据和风格相关数据进行组合构成推荐模型二。
    [0102]
    例如:此时此时最小权重值对应的用户数据为用户颜色喜好,并将该推荐模型二为用户颜色喜好对应的鞋款类型推荐给用户;
    [0103]
    将用户的综合加权平均喜好度与综合平均喜好度作差比较,当大于0时,说明在权重值影响着作用轻重的情况下,仍使综合水平有所提高,进一步说明最小权重值对应的用户数据喜好度的影响作用是最高的,故将该数据构成推荐模型推送给用户。
    [0104]
    步骤s4:提取步骤s1中的第一数据库和第二数据库信息,对第一数据库信息进行融合校正的判断以及对符合条件后的第二数据库进行融合操作,得到融合校正模型;
    [0105]
    步骤s4的具体过程为:
    [0106]
    步骤s40:记用户x和用户y的第一数据库的用户下单金额为u
    x
    、uy;给定系统的用户下单金额界值为d,当用户下单金额u
    x
    、uy≥d时,记此时属性特征值为1,当用户下单金额u
    x
    、uy《d时,记此时属性特征值为0,分别记录用户x和用户y在属性特征值为均1的次数为j
    11
    ,用户x在属性特征值为1且用户y在属性特征值为0的次数为j
    10
    ,j属于任意自然数;记录用户x和用户y在属性特征值均为0的次数为r
    00
    ,用户x在属性特征值为0且用户y在属性特征值为1的次数为r
    01

    [0107]
    例如:用户x的第一数据库的下单金额依次为320元、180元、230元、120元、540元;用户y对应的第一数据库的下单金额依次为230元、100元、120元、420元、380元,给定系统的用户下单金额界值为200元;则用户x和用户y在属性特征值为均1的次数为2,用户x在属性特征值为1且用户y在属性特征值为0的次数为1,用户x和用户y在属性特征值均为0的次数为1,用户x在属性特征值为0且用户y在属性特征值为1的次数为1;
    [0108]
    步骤s41:利用公式:
    [0109][0110][0111]
    求得用户x和用户y在下单金额上的相似性,其中j(u
    x
    ,uy)表示相似性系数,d(u
    x
    ,uy)表示相似性距离;且d(u
    x
    ,uy)∈(0,1);系统内设相似性阈值,当d(u
    x
    ,uy)小于该系统内设相似性阈值,记为用户x和用户y具有相似性,可以进行融合;若不满足d(u
    x
    ,uy)∈(0,1)或d(u
    x
    ,uy)大于等于该系统内设相似性阈值,则不进行融合;
    [0112]
    例如:基于步骤s41的结果,则例如:基于步骤s41的结果,则此时d(u
    x
    ,uy)∈(0,1),设系统内设相似性阈值为故d(u
    x
    ,uy)大于等于该系统内设相似性阈值,则不进行融合。
    [0113]
    利用上述公式表示两个用户下单金额之间的差异性,当系统对不同用户在相同下单顺序下对应的下单金额进行分析,将两者进行关联构成非对称二元属性,并计算属性之间两用户的距离表示相似性,且相似性系数为样本交集个数和样本并集个数的比值,相似性系数相反的即为相似性距离,用两个集合中不同元素所占元素的比例来衡量两个样本之间的相似度,且当相似性距离d(u
    x
    ,uy)越大表示用户x和用户y在下单金额上的相似性越低。
    [0114]
    步骤s42:基于步骤s41进行融合的基础上,将用户x和用户y的第二数据库中的推
    荐模型一和推荐模型二进行相互融合推荐,形成融合校正模型,并结合第一数据库在用户各自对应的下单时间进行推荐。
    [0115]
    步骤s5:提取步骤s1中的第一数据库和第二数据库信息,对第二数据库中出现的异常特征值结合第一数据库中的信息进行分析处理,判断是否需要对数据分析模块进行校正,得到特征值校正模型;
    [0116]
    步骤s5的具体过程为:
    [0117]
    步骤s50:将第一数据库中的用户下单款式进行记录,用户下单款式包括鞋款码数和鞋款类型,并将该鞋款码数和鞋款类型按购买顺序分别绘制在二维坐标系中,对比第二数据库中的鞋款码数和鞋款类型并将其刻画在对应的二维坐标系中;二维坐标系的横坐标为鞋款购买顺序,纵坐标为鞋款码数,且鞋款码数以坐标原点为起点,等间隔从小至大依次分布,另一纵坐标为鞋款类型,鞋款类型包括春夏季童鞋、秋冬季童鞋、春夏季女鞋、秋冬季女鞋、春夏季男鞋和秋冬季男鞋,且该鞋款类型从坐标原点依次等间隔排序;
    [0118]
    步骤s51:当二维坐标系中第二数据库对应的数据出现极值时,极值包括极大值和极小值,且对应出现极值后的第一数据库对应的数据同样出现相同的极值,则判定该极值为异常特征值,此时对推荐模型进行校正,将校正后的特征值校正模型推送给用户;并在异常特征值消失后继续推送此时对应的推荐模型一和推荐模型二。
    [0119]
    例如:在鞋款码数二维坐标系中,第一数据库的数据均在坐标系中平稳显示,表示用户购买的码数均为相近码数,当第二数据库出现极大值时,说明码数增加出现异常特征值,判断出现该值后的第一数据库是否出现相同的极大值;若出现,表明用户在购买与平时购买习惯不同的鞋款,则可将推荐模型进行校正得到特征值校正模型,且该特征值校正模型中的内容即为出现异常特征值时对应用户的浏览内容。
    [0120]
    设定对异常特征值的监测是为了提高用户购鞋的精确度和多元化,因在用户购鞋时,有时会出现为自己的孩子或者父母买鞋的现象,在第二数据库的监测下,需要判断这些异常的浏览内容是误触还是真实的购买意向,故查看第一数据库的实际订单可以准确判断,进而将这些异常现象进行校正,并对此类用户推送相关的特征值校正模型。
    [0121]
    步骤s6:基于上述步骤s2-s5的数据分析结果,将上述模型按规则推荐给用户。
    [0122]
    需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
    [0123]
    最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
    转载请注明原文地址:https://tc.8miu.com/read-3562.html

    最新回复(0)