Eine Demo buchen
  • PatentBench-Neuheitsrecherche
  • Methodik
  • Anwendungsfälle

Patsnap PatentBench-Forschung:
Benchmarking von KI-Tools für die Neuheitssuche

Dezember 2025

Überblick

Die Patsnap PatentBench ist ein Benchmark speziell für Neuheitsrecherchen in realen Patentszenarien.

Es bewertet die Leistung von drei KI-Tools: Patsnap's Novelty Search AI Agent, ChatGPT-o3 (mit Websuche) und DeepSeek-R1 (mit Websuche).

Der Benchmark basiert auf einer Gruppe von Testbeispielen, die jeweils aus einer „Testfrage“ und einer „Standardantwort“ bestehen – einer kuratierten Sammlung von X Dokumenten aus verschiedenen Patentämtern, die die idealen Referenzen, die bei tatsächlichen Neuheitsrecherchen verwendet werden, genau widerspiegeln.

Neuheitssuche verstehen

Die Neuheitsrecherche ist eine wichtige Aufgabe im Patentwesen, bei der weltweit systematisch der Stand der Technik ermittelt wird, um festzustellen, ob eine technische Lösung nach dem Patentrecht neu und erfinderisch ist.

Es spielt eine entscheidende Rolle im gesamten Innovationsprozess, darunter:

F&E-Planung: Festlegung der Ausrichtung und Machbarkeit neuer Entwicklungen

Vorabprüfung: Überprüfung der Patentierbarkeit einer Erfindung vor der Einreichung

Patentprüfung: Unterstützung der Prüfer bei der Beurteilung der Neuheit von Anmeldungen

Wichtigste Ergebnisse

Der Bewertungsdatensatz ist gleichmäßig über die IPC-Klassifikationen verteilt und deckt sowohl Mainstream-Technologien als auch Nischenbereiche ab. Was die Sprache betrifft, so sind 68 % der Daten in Englisch und 32 % in Chinesisch, wodurch sichergestellt wird, dass das Modell bei mehrsprachigen Patentinhalten gute Leistungen erbringt. Was die Verteilung nach Empfangsämtern betrifft, so machen Anmeldungen aus den Vereinigten Staaten (US) und China (CN) jeweils etwa 32 % aus, während Anmeldungen aus dem Europäischen Patentamt (EP) und der WIPO (WO) jeweils etwa 18 % ausmachen. Diese ausgewogene Mischung spiegelt die unterschiedlichen Prüfungsstile in den wichtigsten Patentgerichtsbarkeiten wider und gewährleistet eine realistischere, global repräsentative Bewertung.

Sprachverteilung von Patenttexten in 340 Testbeispielen

Verteilung der IPC-Proben auf 340 Testproben

Verteilung der Empfangsstellen für 340 Testproben

Benchmark-Ergebnisse zeigen, dass der Novelty Search AI Agent von Patsnap eine Erkennungsrate von 81 % und eine Wiederauffindungsrate von 36 % innerhalb der Top-100-Ergebnisse erzielte und damit zwei führende Allzweck-KI-Tools deutlich übertraf.

1) X-Trefferquote

Der Novelty Search AI Agent von Patsnap hat in 81 % der Testfälle mindestens ein relevantes X-Dokument erfolgreich identifiziert – eine wesentliche Fähigkeit, um die Entscheidungsfindung bei der Patentprüfung und in der frühen Phase der Forschung und Entwicklung zu beschleunigen.

X Trefferquote

Der Prozentsatz der Tests mit genauen Treffern in den Top-100-Ergebnissen

2) X Rückrufquote

Der Novelty Search AI Agent von Patsnap hat 36 % aller relevanten X-Dokumente gefunden und damit eine gründlichere Analyse und eine fundiertere Ausarbeitung von Patentansprüchen ermöglicht.
Eine hohe X-Rückrufquote ist während der F&E-Planung und vor der Einreichung eines Patents von entscheidender Bedeutung. Der KI-Agent für Neuheitssuche von Patsnap hilft Teams – egal ob interne Forscher, Patentfachleute oder externe Vertreter – dabei, relevantere X-Dokumente zu finden. Dies unterstützt bessere technische Entscheidungen und stärkere Patentansprüche, wodurch sich die Chancen auf eine Patentgenehmigung erhöhen.

X Rückrufquote

Anteil der X Dokumente, die in den Top 100 Ergebnissen gefunden wurden

3) Beispiel für ein typisches Testergebnis

In diesem Test wurde die Patentschrift (die „Problemstellung“) jedem KI-Tool vorgelegt. Die Ergebnisse wurden dann anhand eines vordefinierten Satzes von X Dokumenten (der „Musterlösung“) bewertet.

Der Novelty Search AI Agent von Patsnap hat alle vier relevanten Patentfamilien innerhalb der Top-100-Ergebnisse erfolgreich identifiziert und damit eine X-Trefferquote von 100 % und eine X-Rückrufquote von 100 % erzielt.

Im Vergleich dazu erzielten sowohl ChatGPT-o3 als auch DeepSeek-R1 ebenfalls eine X-Trefferquote von 100 %. Allerdings fand ChatGPT nur eine relevante Patentfamilie, was zu einer deutlich niedrigeren X-Rückrufquote von 25 % führte, während DeepSeek keine einzige Patentfamilie fand, was zu einer X-Rückrufquote von 0 % führte.

Diese Ergebnisse zeigen, dass allgemeine LLMs zwar hervorragende Fähigkeiten im Bereich des logischen Denkens aufweisen, jedoch bei hochspezialisierten Aufgaben wie der Suche nach Patentneuheiten Schwierigkeiten haben. Im Vergleich dazu bieten domänenspezifische KI-Tools wie der Novelty Search AI Agent von Patsnap eine überlegene Genauigkeit und Relevanz, was ihre wesentliche Rolle in patentbezogenen Arbeitsabläufen unterstreicht.

Ein Benchmark-Test mit einer einzigen Probe

Zukünftige Forschung

Zukünftige Benchmarks werden diesen Datensatz weiter ausbauen und die Bewertungsmethoden verfeinern, um eine höhere Genauigkeit und Abdeckung zu erreichen.