Réserver une démonstration
  • PatentBench - Recherche de nouveauté
  • Méthodologie
  • Cas d'utilisation

Recherche Patsnap PatentBench :
Évaluation comparative des outils d'IA pour la recherche de nouveauté

Décembre 2025

Aperçu

Le Patsnap PatentBench est un benchmark spécialement conçu pour les tâches de recherche de nouveauté dans des scénarios réels liés aux brevets.

Il évalue les performances de trois outils d'IA : l'agent IA Novelty Search de Patsnap, ChatGPT-o3 (avec recherche sur le Web) et DeepSeek-R1 (avec recherche sur le Web).

La référence est basée sur un groupe d'échantillons de test, chacun comprenant une « question test » et une « réponse standard » : un ensemble sélectionné de X documents provenant de divers offices de brevets qui représentent fidèlement les références idéales utilisées dans les recherches de nouveauté réelles.

Comprendre la recherche de nouveauté

La recherche de nouveauté est une tâche essentielle en matière de brevets qui consiste à identifier systématiquement l'état de la technique à l'échelle mondiale afin de déterminer si une solution technique est nouvelle et inventive au regard du droit des brevets.

Il joue un rôle essentiel tout au long du processus d'innovation, notamment :

Planification de la R&D : orienter la direction et la faisabilité des nouveaux développements

Pré-dépôt : vérifier qu'une invention est brevetable avant sa soumission

Examen des brevets : aider les examinateurs à évaluer la nouveauté des demandes

Principales conclusions

L'ensemble de données d'évaluation est réparti de manière uniforme entre les classifications IPC, couvrant à la fois les technologies courantes et les domaines de niche. En termes de langue, 68 % des données sont en anglais et 32 % en chinois, ce qui garantit la bonne performance du modèle sur l'ensemble du contenu multilingue des brevets. En ce qui concerne la répartition par office récepteur, les demandes provenant des États-Unis (US) et de Chine (CN) représentent chacune environ 32 %, tandis que celles provenant de l'Office européen des brevets (EP) et de l'OMPI (WO) représentent chacune environ 18 %. Cette répartition équilibrée reflète les différents styles d'examen des principales juridictions en matière de brevets et garantit une évaluation plus réaliste et représentative à l'échelle mondiale.

Répartition linguistique des textes de brevets dans 340 échantillons testés

Répartition des échantillons IPC parmi 340 échantillons testés

Répartition des bureaux de réception pour 340 échantillons d'essai

Les résultats des tests comparatifs montrent que l'agent IA Novelty Search de Patsnap a atteint un taux de détection X de 81 % et un taux de rappel X de 36 % parmi les 100 premiers résultats, surpassant largement deux outils IA polyvalents de premier plan.

1) Taux de réussite X

L'agent IA de recherche de nouveauté de Patsnap a réussi à identifier au moins un document X pertinent dans 81 % des cas testés, une capacité essentielle pour accélérer la prise de décision dans l'examen des brevets et la R&D en phase initiale.

Taux de réussite X

Pourcentage de tests avec des résultats exacts dans les 100 premiers résultats

2) Taux de rappel X

L'agent IA de recherche de nouveauté de Patsnap a récupéré 36 % de tous les documents X pertinents, permettant ainsi une analyse plus approfondie et une rédaction plus éclairée des revendications de brevet.
Un taux de rappel X élevé est essentiel lors de la planification de la R&D et avant le dépôt d'un brevet. L'agent IA de recherche de nouveauté de Patsnap aide les équipes, qu'il s'agisse de chercheurs internes, de professionnels des brevets ou d'agents externes, à trouver des documents X plus pertinents. Cela permet de prendre de meilleures décisions techniques et de renforcer les revendications de brevet, augmentant ainsi les chances d'obtention du brevet.

Taux de rappel X

Part des documents X trouvés dans les 100 premiers résultats

3) Exemple de résultat de test type

Dans ce test, le cahier des charges du brevet (l'« énoncé du problème ») a été soumis à chaque outil d'IA. Leurs résultats ont ensuite été évalués par rapport à un ensemble prédéfini de X documents (la « réponse modèle »).

L'agent IA de recherche de nouveauté de Patsnap a réussi à identifier les quatre familles de brevets pertinentes parmi les 100 premiers résultats, atteignant un taux de réussite X de 100 % et un taux de rappel X de 100 %.

En comparaison, ChatGPT-o3 et DeepSeek-R1 ont également atteint un taux de réussite X de 100 %. Cependant, ChatGPT n'a récupéré qu'une seule famille de brevets pertinente, ce qui a conduit à un taux de rappel X beaucoup plus faible de 25 %, tandis que DeepSeek n'a récupéré aucun brevet, ce qui a conduit à un taux de rappel X de 0 %.

Ces résultats soulignent que, si les modèles linguistiques généraux (LLM) excellent dans le raisonnement, ils peinent à accomplir des tâches hautement spécialisées telles que la recherche de nouveauté dans le domaine des brevets. En comparaison, les outils d'IA spécifiques à un domaine, tels que l'agent IA de recherche de nouveauté de Patsnap, offrent une précision et une pertinence supérieures, soulignant leur rôle essentiel dans les flux de travail axés sur les brevets.

Test de référence à échantillon unique

Recherches futures

Les futurs benchmarks élargiront encore cet ensemble de données et affineront les méthodes d'évaluation pour une plus grande précision et une meilleure couverture.