縮退シーケンス検索による FTO 検索の強化 |パットスナップ

生物学的配列はバイオテクノロジーにおける革新の基盤を形成しており、これらの配列を中心に無数の進歩が行われています。しかし、生物学的配列の独特な性質は、従来のキーワードベースの情報検索方法に課題をもたらし、重要な情報や潜在的なリスクの見落としにつながることがよくあります。

特許請求の範囲に示される配列は、配列自体を説明するだけでなく、特定のレベルの相同性も必要とする広範囲のバリエーションを包含する。その結果、研究者は相同性配列アライメントアルゴリズムに大きく依存して配列データベースを探索し、事前に定義された相同性閾値を使用して包括的な結果を保証します。このアプローチは、現在の生物学的配列データベースの検索で広く採用されています。

それにもかかわらず、差し迫った疑問が残っている：これらの類似配列検索は、すべての潜在的な標的配列を真に特定できるのか？これらの方法は効果的であることが証明されていますが、関連するすべての配列を捕捉できる能力については、さらに検討する必要があります。現在の検索方法の限界を調査し、潜在的な標的配列を発見しないままにするアプローチの強化に努めることが重要です。 

特許における特殊な配列 

類似配列検索とキーワードベースの結果集計を組み合わせることで、重要な情報や FTO の問題を見落とすリスクが大幅に軽減されます。

ただし、特許内の配列は、多くの「特許固有の」特徴を示すため、他の生物学的データベースで見つかる配列とは異なります。特許の保護範囲を拡大し、競合他社に対する検索障壁を設けるために、特許起草者はよく「マルクーシュ構造」は化学で使われます。親シーケンスの位置間に縮退シンボル、ワイルドカード、演算子、その他の情報を導入し、説明文書を通じてこれらのシンボルの特定のパラメータを説明することにより、これらを「縮退シーケンス」と呼びます。

以下の画像は、特許請求の範囲に記載されている縮退シーケンスを示しています。 

縮重配列自体には生物学的な意味はありません。それらは特許の目的のみに役立ちます。しかし、このようなアプローチは、相同性範囲の記述と組み合わせると、革新的な成果を包括的に保護するだけでなく、現在の従来の配列相同性検索手法に対する「決定打」にもなります。以下に例を見てみましょう。

クエリシーケンス:

「EVGSYPAPSDACPSDYFYCDASGRSAGGGGTENLYFQGSGGS」 

ターゲット配列: 

「EVGSYXXXXXXCXXXXXXCXXSGRSAGGGG TENLYFQGSG GS」 

BLAST アルゴリズムから得られる類似性スコアはわずか 67% ですが、実際の類似性は 100% です。 

これは、従来の配列相同性アラインメントアルゴリズムが原因で発生します。 縮退シーケンスを含むシナリオを考慮しない 初期開発中。したがって、特別な処理を行わずに、従来のアルゴリズムを使用する場合、縮退シーケンスを除外すると、次の XNUMX つの状況が発生します。 

1) 配列を検索できない

２）類似性スコアが閾値を下回ったことによる配列の除外。 

どちらのシナリオも、配列と特許請求の範囲との比較を妨げるだけでなく、重要な配列情報を見落とす可能性も高まるため、配列検索者にとって重大な課題となります。 

パットスナップのソリューション

パツスナップさん生物学的配列データベース (Bio) 統計は、世界中の特許文献におけるこのような特殊な配列の出現が重要ではないことを示しています。ヌクレオチド配列は約 7.4 万個であり、総ヌクレオチド数の 7.12% を占め、タンパク質配列は 1.31 万個で 7.55% を占めます。これは、特殊シンボルの存在により検索結果に影響を与える可能性のある汎用配列が多数存在することを示しており、FTO 解析に重大なリスクをもたらします。 

したがって、これらの重要なシーケンスを見落とすリスクを軽減するには、 Patsnap のアルゴリズムエンジニアリングチームは、社内の NLP、CV、エンティティ認識、および共参照解決テクノロジを使用してディープラーニングモデルを開発しました。.

このモデルは、配列リストおよび全文特許における縮重配列とその置換を特定および解析するように設計されており、当社の Bio Professional パッケージの一部として縮重配列検索データベースを確立しました。

このデータベースは、特殊な配列アラインメントアルゴリズムを使用して、そのような配列の検索を可能にするだけでなく、真の類似性スコアも提供します。したがって、縮重配列データベース内で検索を実行することで、重要な情報をうっかり見落とすリスクを効果的に軽減できます。操作の自由 (FTO) およびノベルティ検索。

Patsnap のアルゴリズムエンジニアリングチームは、社内の NLP、CV、エンティティ認識、および共参照解決テクノロジを使用してディープラーニングモデルを開発しました。

縮重配列のバリエーションの潜在的なスケールは数百億に達する可能性があるため、従来の配列アライメントアルゴリズムではリアルタイム検索の要求を満たすことができません。 Patsnap は、取得プロセス中に縮退シーケンスの置換情報を動的にロードする、深くカスタマイズされたシーケンスアライメントアルゴリズムを採用することでこの課題に取り組み、妥当な時間枠内での正確な取得を保証します。

スキャン段階で、Patsnap は圧縮アルゴリズムを導入してヒューリスティック検索用のシードワードテーブルを構築し、不必要な比較を大幅に削減し、検索効率を向上させます。クエリ配列をターゲット配列とアラインメントする場合、Patsnap 独自のアルゴリズムには縮退置換情報が組み込まれており、その結果、クエリ配列とターゲット配列のさまざまなバリアントに対して、より正確なアラインメントとクエリ結果が得られるだけでなく、より直観的で視覚的に魅力的なアラインメント結果が得られます。

今すぐ縮退配列検索を体験してください

2023 年 XNUMX 月、Patsnap の生物学的配列 Bio データベースに強力な縮重配列検索機能が導入され、特許領域にパラダイムシフトを引き起こしました。この破壊的な進歩により、縮重配列の広範なコレクションを提供する非常に堅牢なツールが研究者に提供され、ユーザーは検索で最も正確で関連性の高い情報を簡単に取得できるようになります。

デモをスケジュールしたり、詳細を確認するには、次のサイトにアクセスしてください。 patsnap.com/solutions/bio.

パツスナップについて: 2007 年に設立された Patsnap は、世界をリードする AI を活用したイノベーションインテリジェンスプラットフォームを支える企業です。 Patsnap は、イノベーションのプロセスにおいてより適切な意思決定を行うのに役立つ、接続された使いやすいプラットフォームをグローバル企業に提供します。顧客は、農業と化学、消費財、食品と飲料、ライフサイエンス、自動車、石油とガス、プロフェッショナルサービス、航空と航空宇宙、教育など、複数の業界セクターにわたるイノベーターです。   

メディア連絡先：  

アンターシャ・ダービン

Email: [メール保護] 

IPインテリジェンス

研究開発インテリジェンス

ライフサイエンスインテリジェンス

その他サービス

Al-Powered イノベーションインテリジェンス

縮退シーケンス検索による FTO 検索の強化

特許における特殊な配列

パットスナップのソリューション

今すぐ縮退配列検索を体験してください

メディア連絡先：

あなたのおすすめコンテンツ

特許インテリジェンスの変革: Patsnap が BizInt Smart Charts と提携

Patsnap のアナリティクスがファミリーモード検索を開始

パットスナップが日本市場に本格進出

IPインテリジェンス

研究開発インテリジェンス

ライフ サイエンス インテリジェンス

その他サービス

Al-Powered イノベーション インテリジェンス

特許における特殊な配列

パットスナップのソリューション

今すぐ縮退配列検索を体験してください

メディア連絡先：

あなたのおすすめコンテンツ

特許インテリジェンスの変革: Patsnap が BizInt Smart Charts と提携

Patsnap のアナリティクスがファミリー モード検索を開始

パットスナップが日本市場に本格進出

ライフサイエンスインテリジェンス

Al-Powered イノベーションインテリジェンス

特許における特殊な配列 

メディア連絡先：  

Patsnap のアナリティクスがファミリーモード検索を開始