Réserver une démonstration

Décembre 2025

PatSnap PatentBench for Novelty Search

Try Novelty Search AI Agent
  • PatentBench - Recherche de nouveauté
  • Méthodologie
  • Cas d'utilisation

Comprendre la recherche de nouveauté

La recherche de nouveauté est une tâche essentielle en matière de brevets qui consiste à identifier systématiquement l'état de la technique à l'échelle mondiale afin de déterminer si une solution technique est nouvelle et inventive au regard du droit des brevets.

Il joue un rôle essentiel tout au long du processus d'innovation, notamment :

Planification de la R&D : orienter la direction et la faisabilité des nouveaux développements

Pré-dépôt : vérifier qu'une invention est brevetable avant sa soumission

Examen des brevets : aider les examinateurs à évaluer la nouveauté des demandes

Principales conclusions

This benchmark evaluates the performance of three AI tools: PatSnap's Novelty Search AI Agent, ChatGPT-o3 (with web search), and DeepSeek-R1 (with web search). The evaluation dataset is evenly distributed across IPC classifications, covering both mainstream technologies and niche domains. In terms of language, 68% of the data is in English and 32% of the data is in Chinese, ensuring the model performs well across multilingual patent content. For receiving-office distribution, applications from United States (US) and China (CN) each make up about 32%, while those from the European Patent Office (EP) and WIPO (WO) each account for roughly 18%. This balanced mix reflects the different examination styles across major patent jurisdictions and ensures more realistic, globally representative evaluation.

Répartition linguistique des textes de brevets dans 340 échantillons testés

Répartition des échantillons IPC parmi 340 échantillons testés

Répartition des bureaux de réception pour 340 échantillons d'essai

Benchmark results show that PatSnap’s Novelty Search AI Agent achieved a 81% X Detection Rate and a 36% X Recall Rate within the top 100 results—significantly outperforming two leading general-purpose AI tools.

1) Taux de réussite X

PatSnap’s Novelty Search AI Agent successfully identified at least one relevant X document in 81% of test cases—an essential capability for speeding up decision-making in patent examination and early-stage R&D.

Taux de réussite X

Pourcentage de tests avec des résultats exacts dans les 100 premiers résultats

2) Taux de rappel X

PatSnap’s Novelty Search AI Agent retrieved 36% of all relevant X documents, enabling more thorough analysis and more informed patent claim drafting.
A high X Recall Rate is key during R&D planning and before filing a patent. PatSnap’s Novelty Search AI Agent helps teams—whether in-house researchers, patent professionals, or external agents—find more relevant X documents. This supports better technical decisions and stronger patent claims, increasing the chances of patent approval.

Taux de rappel X

Part des documents X trouvés dans les 100 premiers résultats

3) Exemple de résultat de test type

Dans ce test, le cahier des charges du brevet (l'« énoncé du problème ») a été soumis à chaque outil d'IA. Leurs résultats ont ensuite été évalués par rapport à un ensemble prédéfini de X documents (la « réponse modèle »).

PatSnap’s Novelty Search AI Agent successfully identified all four relevant patent families within the top 100 results, achieving an X Hit Rate of 100% and an X Recall Rate of 100%.

En comparaison, ChatGPT-o3 et DeepSeek-R1 ont également atteint un taux de réussite X de 100 %. Cependant, ChatGPT n'a récupéré qu'une seule famille de brevets pertinente, ce qui a conduit à un taux de rappel X beaucoup plus faible de 25 %, tandis que DeepSeek n'a récupéré aucun brevet, ce qui a conduit à un taux de rappel X de 0 %.

These findings highlight that while general-purpose LLMs excel in reasoning, they struggle with highly specialized tasks like patent novelty search. In comparison, domain-specific AI tools like PatSnap’s Novelty Search AI Agent offer superior accuracy and relevance, underscoring their essential role in patent-focused workflows.

Test de référence à échantillon unique

Recherches futures

Les futurs benchmarks élargiront encore cet ensemble de données et affineront les méthodes d'évaluation pour une plus grande précision et une meilleure couverture.