实现税务缴纳追踪和税款流失预警方法及系统与流程

    专利查询2022-08-27  100



    1.本发明涉及大数据处理技术领域,具体地说是一种实现税务缴纳追踪和税款流失预警方法及系统。


    背景技术:

    2.伴随主播带货和电子商务的快速发展,现在税务方面的重点越来越偏向新兴行业,主播偷税漏税等事件频发。由此可见,在各类新兴行业进行税务的核查与稽查明显不足。
    3.故目前传统税务方案应对直播带货行业偷税漏税难以快速判定且无预警机制是目前亟待解决的技术问题。


    技术实现要素:

    4.本发明的技术任务是提供一种实现税务缴纳追踪和税款流失预警方法及系统,来解决目前传统税务方案应对直播带货行业偷税漏税难以快速判定且无预警机制的问题。
    5.本发明的技术任务是按以下方式实现的,一种实现税务缴纳追踪和税款流失预警方法,该方法具体如下:
    6.利用大数据爬虫技术采集网络数据;
    7.将纳税企业信息与网络数据对比:结合企业数据与所属地点进行企业信息同步,确保数据与税务系统进行同步建立企业数据档案,方便后续人工智能训练和行业销售额预估;
    8.通过人工智能分析生成对应企业预估销售额:对企业生成预估销售额和年报数据做对比,标注刷单、退货率以及销售额预估的行业信息,同时对于无相关信息的中小企业利用行业数据生成对应企业预估销售额;
    9.与企业申报销售额进行对比分析:接入税务系统,获取企业纳税申报信息,对网络采集预估信息和纳税信息进行对比,收集相关数据,更新企业相关评级;
    10.对税务流失企业进行预警并监控:对排除出的税款流失企业进行追踪建档,同时利用人工智能分析训练,查找各类共同性,为接下来企业划分和税务追踪提供依据;
    11.追踪预警名单企业,提高相关企业采集优先度:根据生成的数据调整采集信息的频率优先度,建立针对税务流失企业的数据监控实现重点监控布防;
    12.根据上一申报周期的税务数据,再利用大数据爬虫技术采集网络数据,建立大数据分析收集单元。
    13.作为优选,利用大数据爬虫技术采集网络数据包括如下情况:
    14.①
    、对于互联网公开的平台企业,采集对应网络渠道的网络销售额数据;
    15.②
    、对于上市或者披露年报企业行业,采集相关网络销售额与全平台渠道销售额相关信息,为后续人工智能训练分析提供数据源。
    16.作为优选,同步建立企业数据档案具体如下:
    17.采集数据生成互联网销售信息;
    18.经过人工智能处理训练对应的互联网销售所在行业企业的销售信息进行推算得出企业预估销售税务信息,信息来源以企业年报或企业公布信息为主;
    19.按照纳税周期月将该信息同步到税务系统大数据平台,从税务内网中建立企业档案。
    20.作为优选,同步建立企业数据档案的同时,对企业类型进行标签标注,标签标注标名行业及网络销售额依赖度,利用标签标注生成同类型企业或同行业企业的销售额预估量。
    21.作为优选,企业预估销售额具体如下:
    22.通过外网采集的销售额与实际企业公布申报的销售额的计算预估系数,不同行业不同系数,重点企业可以有单独系数等;
    23.根据互联网采集销售额数据,即企业各个平台互联网销售金额,与其公布的年报或者其他公开的销售额进行外网的人工智能训练,得到该行业初步企业销售额;
    24.结合税务数据,在税务内网大数据平台进行数据训练,得出企业销售额并结合预估系数对企业下一周期的销售额进行预估。
    25.更优地,大数据分析收集单元的工作过程具体如下:
    26.根据档案采集补充网络采集销售额;
    27.人工智能分析预计行业平台全领域销售额;
    28.税务申报销售额以及年报数据;
    29.判断企业是否税务流失,优化预计销售额算法建立档案。
    30.一种实现税务缴纳追踪和税款流失预警系统,该系统包括,
    31.采集模块,用于利用大数据爬虫技术采集网络数据;
    32.对比模块,用于将纳税企业信息与网络数据对比,即结合企业数据与所属地点进行企业信息同步,确保数据与税务系统进行同步建立企业数据档案,方便后续人工智能训练和行业销售额预估;
    33.生成模块,用于通过人工智能分析生成对应企业预估销售额,即对企业生成预估销售额和年报数据做对比,标注刷单、退货率以及销售额预估的行业信息,同时对于无相关信息的中小企业利用行业数据生成对应企业预估销售额;
    34.分析模块,用于与企业申报销售额进行对比分析,即接入税务系统,获取企业纳税申报信息,对网络采集预估信息和纳税信息进行对比,收集相关数据,更新企业相关评级;
    35.预警模块,用于对税务流失企业进行预警并监控,即对排除出的税款流失企业进行追踪建档,同时利用人工智能分析训练,查找各类共同性,为接下来企业划分和税务追踪提供依据;
    36.追踪模块,用于追踪预警名单企业,提高相关企业采集优先度,即根据生成的数据调整采集信息的频率优先度,建立针对税务流失企业的数据监控实现重点监控布防;
    37.构建模块,用于根据上一申报周期的税务数据,再利用大数据爬虫技术采集网络数据,建立大数据分析收集单元。
    38.作为优选,大数据分析收集单元包括,
    39.补充模块,用于根据档案采集补充网络采集销售额;
    40.预估模块,用于人工智能分析预估行业平台全领域销售额;
    41.申报模块,用于税务申报销售额以及年报数据;
    42.判断模块,用于判断企业是否税务流失,优化预计销售额算法建立档案。
    43.本发明的实现税务缴纳追踪和税款流失预警方法及系统具有以下优点:
    44.(一)本发明对主流主播带货销售或者网络店铺销售缴税等销售行为的税款预计追踪和实际税款缴纳对比进行预警,基本建立在企业和主播销售数据进行大数据采集,确保有明确的销售额度对比,结合税务系统的相关增值税申报数据进行对比,合理判断税费是否流失并对其进行主动预警;同时也对各类电子商务平台的店铺刷单行为进行统计,合理杜绝税费流失;
    45.(二)本发明实现了对电商数据和税务数据进行自动关联保持监控更新,标注高危企业和主播,运用大数据处理采集的方式,响应速度快,预估销售额采集准确可以合理比对网络销售额应纳税款情况,有效应对新兴销售方式对于税款流失造成的不利影响;
    46.(三)本发明基于大数据技术的采集和存储,人工智能技术分析和预测,实现对于税务系统开展工作进行辅助的方法及系统;目的是针对新兴行业和传统税务涉及较少的电子商务领域提供基于大数据收集人工智能分析的报告和辅助;主要是应用于税务机关对增值税和营业税等税种,针对于涉及电子商务销售渠道的企业或者以直播带货主播构成的销售企业相关税务数据的分析,解决目前传统税务方案应对主播薇娅偷税之类难以快速判断定完且没有预警的情况;
    47.(四)本发明可以高效响应税款流失问题,对头部主播和电商有明确销售追踪;
    48.(五)本发明减少了人工干预,利用人工智能和大数据挖掘技术,用最少的人员监控最多的企业;
    49.(六)本发明对数据中的税款流失企业进行实时监控和标识,有助于预防刷单行为和逃税等行为的发生;
    50.(七)本发明提供了税务信息追踪,方便对企业行业税款缴纳进行统计画像,有助于分析行业以及各类企业发展情况,是优质的大数据数据源;
    51.(八)本发明优化了对于现有税务数据的数字化,为后续智能税务系统提供了基础。
    附图说明
    52.下面结合附图对本发明进一步说明。
    53.附图1为实现税务缴纳追踪和税款流失预警方法的流程示意图;
    54.附图2为大数据分析收集单元的工作流程示意图。
    具体实施方式
    55.参照说明书附图和具体实施例对本发明的实现税务缴纳追踪和税款流失预警方法及系统作以下详细地说明。
    56.实施例1:
    57.如附图1所示,本发明的实现税务缴纳追踪和税款流失预警方法,该方法具体如下:
    58.s1、利用大数据爬虫技术采集网络数据;
    59.s2、将纳税企业信息与网络数据对比:结合企业数据与所属地点进行企业信息同步,确保数据与税务系统进行同步建立企业数据档案,方便后续人工智能训练和行业销售额预估;
    60.s3、通过人工智能分析生成对应企业预估销售额:对企业生成预估销售额和年报数据做对比,标注刷单、退货率以及销售额预估的行业信息,同时对于无相关信息的中小企业利用行业数据生成对应企业预估销售额;
    61.s4、与企业申报销售额进行对比分析:接入税务系统,获取企业纳税申报信息,对网络采集预估信息和纳税信息进行对比,收集相关数据,更新企业相关评级;其中,网络信息是网络平台销售额,为主流平台即天猫,淘宝,京东,拼多多等,收集店铺销售额,企业销售信息,商品销售信息等,已经有成熟的系统和数据。纳税数据是内网数据,里面有增值税申报收入等企业上报信息,这二者对比,可以明显推算出企业刷单等行为造成的税务流失。大量互联网销售渠道销售额大于企业申报收入,这部分数据定性,目前税务机关认为是风险企业,不能算偷税漏税。
    62.s5、对税务流失企业进行预警并监控:对排除出的税款流失企业进行追踪建档,同时利用人工智能分析训练,查找各类共同性,为接下来企业划分和税务追踪提供依据;其中,对风险企业进行追踪销售额,查看互联网是否刷单等虚报销售额,然后给予税务可以提供的信息,大量企业在网络销售额达到一定程度后,才进行税务注册,高网络销售额的新注册企业,可能就是总结规律进行;监控的企业,这是距离,实际训练是从风险企业进行共性分析,然后针对共性,进行数据采集分析,对比一定周期内的数据实现,人工智能训练处理,最后人工智能训练出来的名单需要人工进行评判,之后定制为处理逻辑与规则。
    63.s6、追踪预警名单企业,提高相关企业采集优先度:根据生成的数据调整采集信息的频率优先度,建立针对税务流失企业的数据监控实现重点监控布防;其中,风险企业网络店铺进行短周期监控采集,如天猫淘宝,频率一般为月度采集,风险企业日采集,避免其进行长期刷单或者短期虚报等方式减少纳税信息,重点布防就是扩充采集渠道,目前风险企业都是网络销售额远大于税务申报金额的存在信息。
    64.s7、根据上一申报周期的税务数据,再利用大数据爬虫技术采集网络数据,建立大数据分析收集单元。
    65.本实施例步骤s1中的利用大数据爬虫技术采集网络数据包括如下情况:
    66.①
    、对于互联网公开的平台企业,采集对应网络渠道的网络销售额数据;
    67.②
    、对于上市或者披露年报企业行业,采集相关网络销售额与全平台渠道销售额相关信息,为后续人工智能训练分析提供数据源。
    68.本实施例步骤s2中的同步建立企业数据档案具体如下:
    69.s201、采集数据生成互联网销售信息;
    70.s202、经过人工智能处理训练对应的互联网销售所在行业企业的销售信息进行推算得出企业预估销售税务信息,信息来源以企业年报或企业公布信息为主;
    71.s203、按照纳税周期月将该信息同步到税务系统大数据平台,从税务内网中建立企业档案。
    72.本实施例步骤s2中的同步建立企业数据档案的同时,对企业类型进行标签标注,
    标签标注标名行业及网络销售额依赖度,利用标签标注生成同类型企业或同行业企业的销售额预估量。
    73.本实施例步骤s3中的企业预估销售额具体如下:
    74.s301、通过外网采集的销售额与实际企业公布申报的销售额的计算预估系数,不同行业不同系数,重点企业可以有单独系数等;
    75.s302、根据互联网采集销售额数据,即企业各个平台互联网销售金额,与其公布的年报或者其他公开的销售额进行外网的人工智能训练,得到该行业初步企业销售额;
    76.s303、结合税务数据,在税务内网大数据平台进行数据训练,得出企业销售额并结合预估系数对企业下一周期的销售额进行预估。
    77.如附图2所示,本实施例步骤s7中的大数据分析收集单元的工作过程具体如下:
    78.s701、根据档案采集补充网络采集销售额;
    79.s702、人工智能分析预计行业平台全领域销售额;
    80.s703、税务申报销售额以及年报数据;
    81.s704、判断企业是否税务流失,优化预计销售额算法建立档案。
    82.analytic visualizations(可视化分析):不管是对数据分析专家还是普通用户,数据可视化是数据分析工具最基本的要求。可视化可以直观的展示数据,让数据自己说话,让观众听到结果。
    83.data mining algorithms(数据挖掘算法):可视化是给人看的,数据挖掘就是给机器看的。集群、分割、孤立点分析还有其他的算法让我们深入数据内部,挖掘价值。这些算法不仅要处理大数据的量,也要处理大数据的速度。
    84.predictive analytic capabilities(预测性分析能力):数据挖掘可以让分析员更好的理解数据,而预测性分析可以让分析员根据可视化分析和数据挖掘的结果做出一些预测性的判断。
    85.semantic engines(语义引擎):由于非结构化数据的多样性带来了数据分析的新的挑战,我们需要一系列的工具去解析,提取,分析数据。语义引擎需要被设计成能够从“文档”中智能提取信息。
    86.data quality and master data management(数据质量和数据管理):数据质量和数据管理是一些管理方面的最佳实践。通过标准化的流程和工具对数据进行处理可以保证一个预先定义好的高质量的分析结果。假如大数据真的是下一个重要的技术革新的话,最好把精力关注在大数据能给我们带来的好处,而不仅仅是挑战。
    87.数据存储,数据仓库:数据仓库是为了便于多维分析和多角度展示数据按特定模式进行存储所建立起来的关系型数据库。在商业智能系统的设计中,数据仓库的构建是关键,是商业智能系统的基础,承担对业务系统数据整合的任务,为商业智能系统提供数据抽取、转换和加载(etl),并按主题对数据进行查询和访问,为联机数据分析和数据挖掘提供数据平台。
    88.机器学习(多领域交叉学科):机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能核心,是使计算机具有智能的根本途径。机器学习是一门多学科交叉专业,涵盖
    概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率。
    89.机器学习有下面几种定义:
    90.(1)机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。
    91.(2)机器学习是对能通过经验自动改进的计算机算法的研究。
    92.(3)机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。
    93.使用机器学习预估对比网路销售和申报销售额,通过学习对应企业年报数据和网络销售额占比进行税务申报推算确保税款可以进行追缴。
    94.数据预估:依据目前现有的数据对网络销售额占比进行折算预估,或者根据企业行业信息由网络销售额自动计算估计对应全平台渠道销售额,并统一进行多方位预估,智能匹配估计对应企业销售额数据相关信息。根据建模统计,同期等同行业网络销售额占比进行人工智能分析推算企业应申报销售额并进行申报比对确认是否。
    95.实施例2:
    96.本发明的实现税务缴纳追踪和税款流失预警系统,该系统包括,
    97.采集模块,用于利用大数据爬虫技术采集网络数据;
    98.对比模块,用于将纳税企业信息与网络数据对比,即结合企业数据与所属地点进行企业信息同步,确保数据与税务系统进行同步建立企业数据档案,方便后续人工智能训练和行业销售额预估;
    99.生成模块,用于通过人工智能分析生成对应企业预估销售额,即对企业生成预估销售额和年报数据做对比,标注刷单、退货率以及销售额预估的行业信息,同时对于无相关信息的中小企业利用行业数据生成对应企业预估销售额;
    100.分析模块,用于与企业申报销售额进行对比分析,即接入税务系统,获取企业纳税申报信息,对网络采集预估信息和纳税信息进行对比,收集相关数据,更新企业相关评级;
    101.预警模块,用于对税务流失企业进行预警并监控,即对排除出的税款流失企业进行追踪建档,同时利用人工智能分析训练,查找各类共同性,为接下来企业划分和税务追踪提供依据;
    102.追踪模块,用于追踪预警名单企业,提高相关企业采集优先度,即根据生成的数据调整采集信息的频率优先度,建立针对税务流失企业的数据监控实现重点监控布防;
    103.构建模块,用于根据上一申报周期的税务数据,再利用大数据爬虫技术采集网络数据,建立大数据分析收集单元。
    104.本实施例中的大数据分析收集单元包括,
    105.补充模块,用于根据档案采集补充网络采集销售额;
    106.预估模块,用于人工智能分析预估行业平台全领域销售额;
    107.申报模块,用于税务申报销售额以及年报数据;
    108.判断模块,用于判断企业是否税务流失,优化预计销售额算法建立档案。
    109.最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进
    行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

    技术特征:
    1.一种实现税务缴纳追踪和税款流失预警方法,其特征在于,该方法具体如下:利用大数据爬虫技术采集网络数据;将纳税企业信息与网络数据对比:结合企业数据与所属地点进行企业信息同步,确保数据与税务系统进行同步建立企业数据档案;通过人工智能分析生成对应企业预估销售额:对企业生成预估销售额和年报数据做对比,标注刷单、退货率以及销售额预估的行业信息,同时对于无相关信息的中小企业利用行业数据生成对应企业预估销售额;与企业申报销售额进行对比分析:接入税务系统,获取企业纳税申报信息,对网络采集预估信息和纳税信息进行对比,收集相关数据,更新企业相关评级;对税务流失企业进行预警并监控:对排除出的税款流失企业进行追踪建档,同时利用人工智能分析训练,查找各类共同性;追踪预警名单企业,提高相关企业采集优先度:根据生成的数据调整采集信息的频率优先度,建立针对税务流失企业的数据监控实现重点监控布防;根据上一申报周期的税务数据,再利用大数据爬虫技术采集网络数据,建立大数据分析收集单元。2.根据权利要求1所述的实现税务缴纳追踪和税款流失预警方法,其特征在于,利用大数据爬虫技术采集网络数据包括如下情况:

    、对于互联网公开的平台企业,采集对应网络渠道的网络销售额数据;

    、对于上市或者披露年报企业行业,采集相关网络销售额与全平台渠道销售额相关信息。3.根据权利要求1所述的实现税务缴纳追踪和税款流失预警方法,其特征在于,同步建立企业数据档案具体如下:采集数据生成互联网销售信息;经过人工智能处理训练对应的互联网销售所在行业企业的销售信息进行推算得出企业预估销售税务信息,信息来源以企业年报或企业公布信息为主;按照纳税周期月将该信息同步到税务系统大数据平台,从税务内网中建立企业档案。4.根据权利要求1所述的实现税务缴纳追踪和税款流失预警方法,其特征在于,同步建立企业数据档案的同时,对企业类型进行标签标注,标签标注标名行业及网络销售额依赖度,利用标签标注生成同类型企业或同行业企业的销售额预估量。5.根据权利要求1所述的实现税务缴纳追踪和税款流失预警方法,其特征在于,企业预估销售额具体如下:通过外网采集的销售额与实际企业公布申报的销售额的计算预估系数;根据互联网采集销售额数据,即企业各个平台互联网销售金额,与其公布的年报或者其他公开的销售额进行外网的人工智能训练,得到该行业初步企业销售额;结合税务数据,在税务内网大数据平台进行数据训练,得出企业销售额并结合预估系数对企业下一周期的销售额进行预估。6.根据权利要求1-5中任一所述的实现税务缴纳追踪和税款流失预警方法,其特征在于,大数据分析收集单元的工作过程具体如下:根据档案采集补充网络采集销售额;
    人工智能分析预计行业平台全领域销售额;税务申报销售额以及年报数据;判断企业是否税务流失,优化预计销售额算法建立档案。7.一种实现税务缴纳追踪和税款流失预警系统,其特征在于,该系统包括,采集模块,用于利用大数据爬虫技术采集网络数据;对比模块,用于将纳税企业信息与网络数据对比,即结合企业数据与所属地点进行企业信息同步,确保数据与税务系统进行同步建立企业数据档案;生成模块,用于通过人工智能分析生成对应企业预估销售额,即对企业生成预估销售额和年报数据做对比,标注刷单、退货率以及销售额预估的行业信息,同时对于无相关信息的中小企业利用行业数据生成对应企业预估销售额;分析模块,用于与企业申报销售额进行对比分析,即接入税务系统,获取企业纳税申报信息,对网络采集预估信息和纳税信息进行对比,收集相关数据,更新企业相关评级;预警模块,用于对税务流失企业进行预警并监控,即对排除出的税款流失企业进行追踪建档,同时利用人工智能分析训练,查找各类共同性;追踪模块,用于追踪预警名单企业,提高相关企业采集优先度,即根据生成的数据调整采集信息的频率优先度,建立针对税务流失企业的数据监控实现重点监控布防;构建模块,用于根据上一申报周期的税务数据,再利用大数据爬虫技术采集网络数据,建立大数据分析收集单元。8.根据权利要求7所述的实现税务缴纳追踪和税款流失预警系统,其特征在于,大数据分析收集单元包括,补充模块,用于根据档案采集补充网络采集销售额;预估模块,用于人工智能分析预估行业平台全领域销售额;申报模块,用于税务申报销售额以及年报数据;判断模块,用于判断企业是否税务流失,优化预计销售额算法建立档案。

    技术总结
    本发明公开了实现税务缴纳追踪和税款流失预警方法及系统,属于大数据处理技术领域,本发明要解决的技术问题为目前传统税务方案应对直播带货行业偷税漏税难以快速判定且无预警机制,采用的技术方案为:该方法具体如下:利用大数据爬虫技术采集网络数据;将纳税企业信息与网络数据对比:结合企业数据与所属地点进行企业信息同步,确保数据与税务系统进行同步建立企业数据档案;通过人工智能分析生成对应企业预估销售额;与企业申报销售额进行对比分析;对税务流失企业进行预警并监控;追踪预警名单企业,提高相关企业采集优先度;根据上一申报周期的税务数据,再利用大数据爬虫技术采集网络数据,建立大数据分析收集单元。建立大数据分析收集单元。建立大数据分析收集单元。


    技术研发人员:左舜天 张帆 国靖
    受保护的技术使用者:浪潮卓数大数据产业发展有限公司
    技术研发日:2022.02.17
    技术公布日:2022/5/25
    转载请注明原文地址:https://tc.8miu.com/read-11484.html

    最新回复(0)