一种基于人机对弈数据的对弈指导调整方法与流程

专利查询2026-05-06 5

本发明涉及信息，尤其涉及一种基于人机对弈数据的对弈指导调整方法。

背景技术：

1、围棋作为一种具有悠久历史的战略性棋类游戏，深受全球各地棋手的喜爱。然而，在围棋学习和训练过程中，传统的教学方法存在诸多局限性。随着科技的进步，尤其是人工智能技术的发展，围棋教学方式逐渐向智能化方向发展。然而，现有的围棋学习系统在落子提示策略和个性化指导方面仍存在诸多问题，严重影响了用户的学习体验和效率。现有的围棋学习系统难以准确判断用户的学习阶段。围棋学习是一个逐步递进的过程，不同阶段的学习者在技巧、策略理解和决策能力上有着显著差异。传统的围棋教学大多采用一刀切的方式，无法针对不同水平的棋手提供精准的教学内容和策略指导。这种缺乏个性化的教学方法，往往导致初学者难以掌握基本技巧，而高级棋手则难以突破瓶颈，整体学习效率低下。用户在围棋对弈中的行为模式多种多样，现有系统难以灵活识别和适应。围棋学习过程中，用户的行为模式会随着学习阶段的不同而发生变化，例如依赖提示型、独立思考型、快速决策型、深度思考型等。这些行为模式在不同的学习阶段有着不同的指导需求。然而，现有的围棋学习系统大多缺乏对用户行为模式的识别能力，无法根据用户的实际情况调整提示策略，导致用户在学习过程中缺乏针对性的指导，学习效果不佳。围棋对弈过程中，棋局的复杂度是影响用户学习的重要因素。围棋棋局变化多端，特别是在复杂局面中，用户往往难以做出正确的决策。现有的落子提示策略大多基于简单的规则或预设的策略，无法实时评估和适应棋局的复杂度变化。这种固定的提示策略在面对复杂局面时，难以提供有效的指导，导致用户在关键时刻得不到所需的帮助，影响对弈水平的提高。更为重要的是，现有系统缺乏有效的反馈机制来评估落子提示策略的有效性。围棋学习是一个动态调整的过程，提示策略需要根据用户的实时表现不断优化。然而，目前大多数系统没有完善的机制来收集和分析用户的实时落子提示效果数据，无法评估提示策略的有效性，导致提示策略不能随用户的进步而调整优化。这不仅影响了用户的学习效率，还可能导致用户对系统的信任度下降，进一步影响其学习积极性。因此，现有的围棋学习系统在个性化学习体验、行为模式识别、动态调整提示策略、实时评估棋局复杂度和优化提示策略有效性方面存在显著不足。这些问题的存在，严重制约了用户的学习效果和对弈水平的提升。为了解决这些问题，需要发展更加智能化和个性化的围棋学习指导方法，提供实时、动态的落子提示策略，提升用户的整体学习体验和效果。

技术实现思路

1、本发明对上述现有技术存在的问题，提供一种基于人机对弈数据的对弈指导调整方法，主要包括：

2、通过用户的历史人机对弈数据，构建学习阶段识别模型，判断用户的学习阶段；

3、通过用户的历史对弈行为数据，构建用户对弈行为模式识别模型，识别用户不同学习阶段的对弈行为模式；

4、根据用户的学习阶段和对弈行为模式，设计落子提示策略，并基于用户的学习阶段变化和对弈行为模式变化，调整落子提示频率和落子提示详细程度；

5、根据实时棋局数据、用户的学习阶段和用户的对弈行为模式，构建棋局复杂度评估模型，判断当前棋局复杂度，并基于实时对弈的棋局复杂度调整落子提示频率和落子提示详细程度；

6、通过用户的实时落子提示效果数据，确定落子提示策略的有效性评分，并优化落子提示策略。

7、进一步地，所述通过用户的历史人机对弈数据，构建学习阶段识别模型，判断用户的学习阶段，包括:

8、通过历史对弈记录，获取用户的历史人机对弈数据，并对历史对弈数据进行学习阶段标注，人机对弈数据包括每局的胜负结果、每步棋的落子思考时间、整体对局时长、人机难度，学习阶段包括初学阶段、中级阶段和高级阶段；根据获取的历史人机对弈数据，采用数据清洗技术，去除缺失值、异常值，并对数据进行标准化处理，得到清洗后的历史人机对弈数据；根据清洗后的历史人机对弈数据，使用决策树算法进行模型训练，构建学习阶段识别模型，判断用户的学习阶段；获取实时人机对弈数据，使用学习阶段识别模型，判断用户的学习阶段。

9、进一步地，所述通过用户的历史对弈行为数据，构建用户对弈行为模式识别模型，识别用户不同学习阶段的对弈行为模式，包括:

10、通过历史对弈记录，获取用户的历史对弈行为数据，并对历史对弈行为数据标注学习阶段，对弈行为数据包括每局棋的平均落子思考时间和每局棋的落子提示使用频率，每局棋的平均落子思考时间＝每局棋的总思考时间/总步数，每局棋的落子提示使用频率＝每局棋中落子提示使用次数/总步数；根据获取的历史对弈行为数据，采用数据清洗技术，去除缺失值、异常值，并对历史对弈行为数据进行标准化处理；根据经数据清洗后的历史对弈行为数据，使用决策树算法进行模型训练，构建用户对弈行为模式识别模型，识别用户不同学习阶段的对弈行为模式，对弈行为模式包括依赖提示型、独立思考型、快速决策型、深度思考型。

11、进一步地，所述根据用户的学习阶段和对弈行为模式，设计落子提示策略，并基于用户的学习阶段变化和对弈行为模式变化，调整落子提示频率和落子提示详细程度，包括:

12、根据用户的学习阶段和对弈行为模式，设计落子提示策略，包括设定每个学习阶段的基础落子提示频率和基础落子提示详细程度，并基于用户的对弈行为模式，调整落子提示频率和落子提示详细程度；对于依赖提示型用户，增加落子提示频率和落子提示详细程度；对于独立思考型、快速决策型、深度思考型的对弈行为模式用户，减少提示频率和提示详细程度；根据获取的实时人机对弈数据，使用学习阶段识别模型和用户对弈行为模式识别模型，判断用户的学习阶段和用户的对弈行为模式是否发生变化；若用户的学习阶段和对弈行为模式发生变化，则调整落子提示频率和落子提示详细程度。

13、进一步地，所述根据实时棋局数据、用户的学习阶段和用户的对弈行为模式，构建棋局复杂度评估模型，判断当前棋局复杂度，并基于实时对弈的棋局复杂度调整落子提示频率和落子提示详细程度，包括:

14、根据用户实时对弈记录，获取实时棋局数据，棋局数据包括手数信息、落子信息、棋子分布信息、棋局创新指数、潜在的最佳落子、局势的变化趋势，局势的变化趋势包括优势方的变化、双方的地盘控制范围；根据棋局数据、用户的学习阶段和用户的行为对弈模式，使用循环神经网络构建棋局复杂度评估模型，判断当前棋局复杂度，复杂度包括简单、中等和复杂；根据实时棋局数据、用户的学习阶段和用户的行为对弈模式，使用棋局复杂度评估模型，判断当前棋局复杂度；若当前棋局复杂度为复杂，则增加落子提示频率和落子提示详细程度；根据用户实时对弈记录，持续获取并更新棋局数据，使用棋局复杂度评估模型实时评估棋局复杂度，并基于实时对弈的棋局复杂度调整落子提示频率和落子提示详细程度。

15、还包括，根据当前棋局落子数据，历史落子数据，构建棋局创新指数评估公式，评估当前棋局的创新程度。

16、所述根据当前棋局落子数据，历史落子数据，构建棋局创新指数评估公式，评估当前棋局的创新指数，具体包括:

17、通过历史对弈记录，获取不同学习阶段和策略棋局的历史落子数据；通过余弦相似度的计算方法，计算当前棋局落子数据与历史落子数据中相似度最高的落子的匹配度；根据历史落子数据和当前棋局的落子数据，构建棋局创新指数评估公式计算棋局创新指数，其中，n是到目前为止的落子数，mi是第i步的落子，h是历史落子数据集，p(mi，h)表示第i步落子与历史落子数据中最相似落子的匹配度，m是可能的最大匹配度，根据棋种和历史数据集定义。

18、进一步地，所述通过用户的实时落子提示效果数据，确定落子提示策略的有效性评分，并优化落子提示策略，包括：

19、通过用户对弈记录，获取用户的实时落子提示效果数据，使用落子提示策略有效性评估公式确定落子提示策略的有效性评分，其中e为提示策略的有效性评分，tr为每次落子提示的响应时间，tt为用户的平均思考时间，aa为落子提示接受率，k为调整接受率的平滑因子，a0为接受率的平衡点，取值在0到1之间，qp为用户在落子提示后的表现评分，qe为用户在提示后的错误表现评分，落子提示效果数据包括每次落子提示的响应时间、用户的平均思考时间、落子提示接受率、落子提示后的表现评分和落子提示后的错误表现评分，落子提示后的表现评分和落子提示后的错误表现评分基于最佳策略的偏离程度确定；若落子提示策略的有效性评分小于预设有效性评分阈值，则识别落子提示的响应时间大于预设时间阈值、落子提示接受率低于预设接受率阈值、落子提示后的表现评分低于预设评分阈值的落子提示策略部分，优化该落子提示策略部分的落子提示策略参数；获取用户的实时对弈记录，计算优化后的落子提示策略有效性评分，若有效性评分仍未超过预设有效性评分阈值，则进一步调整和优化落子提示策略，直到落子提示策略有效性评分超过预设有效性评分阈值。

20、本发明实施例提供的技术方案可以包括以下有益效果：

21、本发明提供了一种基于人机对弈数据的对弈指导调整方法，通过对用户的学习阶段和对弈行为模式的精准识别，实现了个性化的围棋学习指导。系统能够根据用户的实际需求，提供量身定制的落子提示策略，从而显著提高学习效率和效果。通过动态调整落子提示策略，系统能够在用户学习阶段和行为模式发生变化时，及时调整提示频率和详细程度，确保用户在需要帮助时获得适当的指导，而在自主学习时不受过度干预，这不仅提高了用户的自主学习能力，还激发了用户的创造力和思维能力。本发明还通过实时评估棋局的复杂度，根据当前棋局的复杂度动态调整落子提示的频率和详细程度，使用户在面对复杂局面时，可以得到更精准和及时的指导，提升其决策能力和对弈水平。此外，通过持续评估和优化落子提示策略的有效性，系统能够根据用户的实时表现，不断调整和优化提示策略的参数，确保提示策略随着用户的进步而持续改进。这不仅提高了提示策略的有效性和精准度，还增强了用户的学习体验和信任感，进一步激发了用户的学习积极性。本发明提供了一种智能化和个性化的围棋学习指导方法，通过实时、动态的落子提示策略，显著提升了用户的整体学习体验和效果，有效解决了现有技术中存在的个性化不足、提示策略僵化、缺乏有效反馈等问题，为围棋学习的智能化发展提供了有力支持。

技术特征：

1.一种基于人机对弈数据的对弈指导调整方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其中，所述通过用户的历史人机对弈数据，构建学习阶段识别模型，判断用户的学习阶段，包括:

3.根据权利要求1所述的方法，其中，所述通过用户的历史对弈行为数据，构建用户对弈行为模式识别模型，识别用户不同学习阶段的对弈行为模式，包括:

4.根据权利要求1所述的方法，其中，所述根据用户的学习阶段和对弈行为模式，设计落子提示策略，并基于用户的学习阶段变化和对弈行为模式变化，调整落子提示频率和落子提示详细程度，包括:

5.根据权利要求1所述的方法，其中，所述根据实时棋局数据、用户的学习阶段和用户的对弈行为模式，构建棋局复杂度评估模型，判断当前棋局复杂度，并基于实时对弈的棋局复杂度调整落子提示频率和落子提示详细程度，包括:

6.根据权利要求5所述的方法，其中，所述根据当前棋局落子数据，历史落子数据，构建棋局创新指数评估公式，评估当前棋局的创新指数，包括:

7.根据权利要求1所述的方法，其中，所述通过用户的实时落子提示效果数据，确定落子提示策略的有效性评分，并优化落子提示策略，包括:

技术总结
本发明公开一种基于人机对弈数据的对弈指导调整方法，包括通过用户的历史人机对弈数据，判断用户的学习阶段；通过用户的历史对弈行为数据，识别用户不同学习阶段的对弈行为模式；根据用户的学习阶段和对弈行为模式，设计落子提示策略；根据实时棋局数据、用户的学习阶段和用户的对弈行为模式，判断当前棋局复杂度，并调整落子提示频率和落子提示详细程度；通过用户的实时落子提示效果数据，确定落子提示策略的有效性评分，并优化落子提示策略。本发明提供一种智能化和个性化的围棋学习指导方法，通过实时、动态的落子提示策略，显著提升了用户的整体学习体验和效果，有效解决了现有技术中存在的个性化不足、提示策略僵化、缺乏有效反馈等问题。

技术研发人员：侯景昆,谢芝山
受保护的技术使用者：珠海赤子芯智能科技有限公司
技术研发日：
技术公布日：2024/11/26

转载请注明原文地址:https://tc.8miu.com/read-35389.html

专利

最新回复(0)