Avec le développement de la société et de l’économie, la demande en machines augmente de jour en jour et son domaine d’application s’élargit. Une interaction homme-machine efficace et conviviale est un lien très important qui influe sur sa large application. Dans les applications pratiques, il existe différents modes d'interaction, notamment: interaction tactile, interaction somatosensorielle, interaction vocale, etc. Parmi les nombreuses méthodes d’interaction, le moyen le plus direct et le plus pratique consiste à interagir avec les machines par la parole, en particulier en langage naturel. La technologie d'interaction vocale basée sur le langage naturel est particulièrement importante, particulièrement pour les utilisateurs âgés et les utilisateurs ayant des activités physiques incommodes. Sa mise en œuvre repose principalement sur des technologies telles que la reconnaissance de la parole, la synthèse de la parole et la compréhension sémantique. Les technologies de reconnaissance vocale et de synthèse vocale sont relativement matures, alors que les technologies de compréhension sémantique rencontrent encore de nombreuses difficultés. Le schéma général d'un système d'interaction de parole basé sur un langage naturel est représenté sur la figure 1. La présente invention est appliquée à un module de compréhension intentionnelle. Dans un système d'interaction vocale traditionnel, le système peut uniquement répondre à des instructions utilisateur spécifiques, c'est-à-dire simplement faire correspondre les instructions utilisateur aux instructions de la base de données. Les utilisateurs doivent étudier le système pendant longtemps, le coût d'apprentissage est trop élevé et l'expérience utilisateur est considérablement réduite, ce qui affecte sérieusement la promotion de la technologie. Au cours des dernières années, certains systèmes d’interaction de la parole basés sur le langage naturel, tels que la compréhension du langage naturel basée sur la grammaire, peuvent remplir la fonction de compréhension sémantique, mais le langage parlé est souvent très irrégulier, voire grammatical, ce qui conduit à la reconnaissance. Échec ou erreur. Dans le même temps, il est difficile de généraliser la compréhension du langage naturel basée sur la grammaire à d’autres applications: une fois définie selon un scénario spécifique, il est difficile de l’étendre.