Jak scrapovat USPTO.gov | Scraper patentů a ochranných známek USPTO

Naučte se, jak scrapovat USPTO.gov pro data o patentech a ochranných známkách. Extrahujte čísla patentů, jména vynálezců a data podání pro právní analýzu...

USPTO (United States Patent and Trademark Office) favicon
uspto.govTěžké
Pokrytí:United States
Dostupná data9 polí
NázevMístoPopisObrázkyInfo o prodejciKontaktní údajeDatum zveřejněníKategorieAtributy
Všechna extrahovatelná pole
Název patentuČíslo patentuČíslo přihláškyDatum podáníDatum uděleníAbstraktÚplný popisTechnické nárokyJméno nabyvatele (Assignee)Jména vynálezcůNázev ochranné známkySériové číslo ochranné známkyRegistrační číslo ochranné známkyZboží a službyVlastník ochranné známkyAktuální stavZastupující advokátZáklad podáníURL loga ochranné známkyURL patentového výkresuDatum priority
Technické požadavky
Vyžadován JavaScript
Bez přihlášení
Má stránkování
Oficiální API dostupné
Detekována anti-bot ochrana
CloudflareRate LimitingIP BlockingSession-based URLsreCAPTCHA

Detekována anti-bot ochrana

Cloudflare
Podnikový WAF a správa botů. Používá JavaScript výzvy, CAPTCHA a analýzu chování. Vyžaduje automatizaci prohlížeče se stealth nastavením.
Omezení rychlosti
Omezuje požadavky na IP/relaci v čase. Lze obejít rotujícími proxy, zpožděním požadavků a distribuovaným scrapingem.
Blokování IP
Blokuje známé IP datových center a označené adresy. Vyžaduje rezidenční nebo mobilní proxy pro efektivní obejití.
Session-based URLs
Google reCAPTCHA
CAPTCHA systém od Google. v2 vyžaduje interakci uživatele, v3 běží tiše s hodnocením rizika. Lze vyřešit pomocí CAPTCHA služeb.

O USPTO (United States Patent and Trademark Office)

Objevte, co USPTO (United States Patent and Trademark Office) nabízí a jaká cenná data lze extrahovat.

United States Patent and Trademark Office (USPTO) je federální úřad zodpovědný za udělování amerických patentů a registraci ochranných známek. Spravuje masivní veřejnou databázi záznamů o duševním vlastnictví (IP), které dokumentují inovace a vlastnictví značek již od roku 1790. Web obsahuje komplexní vyhledávací portály jako TSDR (Trademark Status & Document Retrieval) a nástroj Patent Public Search.

Data z USPTO jsou zlatým standardem pro výzkum v oblasti duševního vlastnictví. Zahrnují podrobné detaily o vynálezech, technických nárocích, právních převodech a identifikátorech značek. Pro firmy a právní profesionály jsou tato data klíčová pro ověřování platnosti IP, provádění due diligence během akvizic a identifikaci vznikajících technologických trendů dříve, než se dostanou na hlavní trh.

Scrapování USPTO je vysoce hodnotné pro společnosti v oblasti legal tech, oddělení výzkumu a vývoje (R&D) a tržní analytiky. Umožňuje automatizaci sledování konkurence, sledování životního cyklu žádostí o ochranné známky a budování komplexních datových sad pro analýzu patentového prostředí.

O USPTO (United States Patent and Trademark Office)

Proč Scrapovat USPTO (United States Patent and Trademark Office)?

Objevte obchodní hodnotu a případy použití pro extrakci dat z USPTO (United States Patent and Trademark Office).

Sledování patentových podání konkurence pro strategii R&D

Sledování nových žádostí o ochranné známky pro ochranu značky

Provádění průzkumů freedom-to-operate (FTO)

Analýza patentového prostředí pro identifikaci mezer na trhu

Sběr dat pro právní due diligence a oceňování

Budování akademických datových sad pro výzkum inovací

Výzvy Scrapování

Technické výzvy, se kterými se můžete setkat při scrapování USPTO (United States Patent and Trademark Office).

Vysoce dynamická vyhledávací rozhraní vyžadující spuštění JS

Agresivní rate limiting u vyhledávacích dotazů

URL specifické pro relaci, které rychle vyprší

Komplexní, hluboce vnořené HTML tabulky

Časté aktualizace struktury u starších vládních systémů

Scrapujte USPTO (United States Patent and Trademark Office) pomocí AI

Žádný kód není potřeba. Extrahujte data během minut s automatizací poháněnou AI.

Jak to funguje

1

Popište, co potřebujete

Řekněte AI, jaká data chcete extrahovat z USPTO (United States Patent and Trademark Office). Stačí to napsat přirozeným jazykem — žádný kód ani selektory.

2

AI extrahuje data

Naše umělá inteligence prochází USPTO (United States Patent and Trademark Office), zpracovává dynamický obsah a extrahuje přesně to, co jste požadovali.

3

Získejte svá data

Získejte čistá, strukturovaná data připravená k exportu jako CSV, JSON nebo k odeslání přímo do vašich aplikací.

Proč používat AI pro scrapování

Zvládá komplexní vyhledávací portály s JavaScriptem bez kódování
Automaticky spravuje session cookies a dynamické timeouty
Naplánované spouštění pro automatickou detekci nových podání
Snadno extrahuje patentové výkresy a loga ochranných známek
Transformuje nepřehledné vládní tabulky na čisté CSV nebo JSON
Kreditní karta není vyžadovánaBezplatný plán k dispoziciŽádné nastavení není potřeba

AI usnadňuje scrapování USPTO (United States Patent and Trademark Office) bez psaní kódu. Naše platforma poháněná umělou inteligencí rozumí, jaká data chcete — stačí je popsat přirozeným jazykem a AI je automaticky extrahuje.

How to scrape with AI:
  1. Popište, co potřebujete: Řekněte AI, jaká data chcete extrahovat z USPTO (United States Patent and Trademark Office). Stačí to napsat přirozeným jazykem — žádný kód ani selektory.
  2. AI extrahuje data: Naše umělá inteligence prochází USPTO (United States Patent and Trademark Office), zpracovává dynamický obsah a extrahuje přesně to, co jste požadovali.
  3. Získejte svá data: Získejte čistá, strukturovaná data připravená k exportu jako CSV, JSON nebo k odeslání přímo do vašich aplikací.
Why use AI for scraping:
  • Zvládá komplexní vyhledávací portály s JavaScriptem bez kódování
  • Automaticky spravuje session cookies a dynamické timeouty
  • Naplánované spouštění pro automatickou detekci nových podání
  • Snadno extrahuje patentové výkresy a loga ochranných známek
  • Transformuje nepřehledné vládní tabulky na čisté CSV nebo JSON

No-code webové scrapery pro USPTO (United States Patent and Trademark Office)

Alternativy point-and-click k AI scrapingu

Několik no-code nástrojů jako Browse.ai, Octoparse, Axiom a ParseHub vám může pomoci scrapovat USPTO (United States Patent and Trademark Office) bez psaní kódu. Tyto nástroje obvykle používají vizuální rozhraní pro výběr dat, i když mohou mít problémy se složitým dynamickým obsahem nebo anti-bot opatřeními.

Typický workflow s no-code nástroji

1
Nainstalujte rozšíření prohlížeče nebo se zaregistrujte na platformě
2
Přejděte na cílový web a otevřete nástroj
3
Vyberte datové prvky k extrakci kliknutím
4
Nakonfigurujte CSS selektory pro každé datové pole
5
Nastavte pravidla stránkování pro scrapování více stránek
6
Vyřešte CAPTCHA (často vyžaduje ruční řešení)
7
Nakonfigurujte plánování automatických spuštění
8
Exportujte data do CSV, JSON nebo připojte přes API

Běžné výzvy

Křivka učení

Pochopení selektorů a logiky extrakce vyžaduje čas

Selektory se rozbijí

Změny webu mohou rozbít celý pracovní postup

Problémy s dynamickým obsahem

Weby s hodně JavaScriptem vyžadují složitá řešení

Omezení CAPTCHA

Většina nástrojů vyžaduje ruční zásah u CAPTCHA

Blokování IP

Agresivní scrapování může vést k zablokování vaší IP

No-code webové scrapery pro USPTO (United States Patent and Trademark Office)

Několik no-code nástrojů jako Browse.ai, Octoparse, Axiom a ParseHub vám může pomoci scrapovat USPTO (United States Patent and Trademark Office) bez psaní kódu. Tyto nástroje obvykle používají vizuální rozhraní pro výběr dat, i když mohou mít problémy se složitým dynamickým obsahem nebo anti-bot opatřeními.

Typický workflow s no-code nástroji
  1. Nainstalujte rozšíření prohlížeče nebo se zaregistrujte na platformě
  2. Přejděte na cílový web a otevřete nástroj
  3. Vyberte datové prvky k extrakci kliknutím
  4. Nakonfigurujte CSS selektory pro každé datové pole
  5. Nastavte pravidla stránkování pro scrapování více stránek
  6. Vyřešte CAPTCHA (často vyžaduje ruční řešení)
  7. Nakonfigurujte plánování automatických spuštění
  8. Exportujte data do CSV, JSON nebo připojte přes API
Běžné výzvy
  • Křivka učení: Pochopení selektorů a logiky extrakce vyžaduje čas
  • Selektory se rozbijí: Změny webu mohou rozbít celý pracovní postup
  • Problémy s dynamickým obsahem: Weby s hodně JavaScriptem vyžadují složitá řešení
  • Omezení CAPTCHA: Většina nástrojů vyžaduje ruční zásah u CAPTCHA
  • Blokování IP: Agresivní scrapování může vést k zablokování vaší IP

Příklady kódu

import requests
from bs4 import BeautifulSoup

# Poznámka: Hromadná data jsou jednodušší pro velké objemy
url = 'https://bulkdata.uspto.gov/'
headers = {'User-Agent': 'Mozilla/5.0'}

try:
    response = requests.get(url, headers=headers)
    response.raise_for_status()
    soup = BeautifulSoup(response.text, 'html.parser')
    # Hledání odkazů na týdenní zip soubory s patenty
    links = [a['href'] for a in soup.find_all('a', href=True) if '.zip' in a['href']]
    print(f'Nalezeno {len(links)} datových sad dostupných ke stažení')
except Exception as e:
    print(f'Chyba: {e}')

Kdy použít

Nejlepší pro statické HTML stránky s minimem JavaScriptu. Ideální pro blogy, zpravodajské weby a jednoduché e-commerce produktové stránky.

Výhody

  • Nejrychlejší provedení (bez režie prohlížeče)
  • Nejnižší spotřeba zdrojů
  • Snadná paralelizace s asyncio
  • Skvělé pro API a statické stránky

Omezení

  • Nemůže spustit JavaScript
  • Selhává na SPA a dynamickém obsahu
  • Může mít problémy se složitými anti-bot systémy

Jak scrapovat USPTO (United States Patent and Trademark Office) pomocí kódu

Python + Requests
import requests
from bs4 import BeautifulSoup

# Poznámka: Hromadná data jsou jednodušší pro velké objemy
url = 'https://bulkdata.uspto.gov/'
headers = {'User-Agent': 'Mozilla/5.0'}

try:
    response = requests.get(url, headers=headers)
    response.raise_for_status()
    soup = BeautifulSoup(response.text, 'html.parser')
    # Hledání odkazů na týdenní zip soubory s patenty
    links = [a['href'] for a in soup.find_all('a', href=True) if '.zip' in a['href']]
    print(f'Nalezeno {len(links)} datových sad dostupných ke stažení')
except Exception as e:
    print(f'Chyba: {e}')
Python + Playwright
from playwright.sync_api import sync_playwright

def scrape_uspto_trademark():
    with sync_playwright() as p:
        # USPTO vyžaduje reálný otisk prohlížeče, aby se zabránilo spuštění Cloudflare
        browser = p.chromium.launch(headless=True)
        page = browser.new_page()
        
        # Navigace na stránku stavu TSDR
        page.goto('https://tsdr.uspto.gov/')
        
        # Vyplnění sériového čísla (Příklad: 98021018)
        page.fill('#caseNumber', '98021018')
        page.click('#statusSearch')
        
        # Čekání na vykreslení sekce stavu přes JS
        page.wait_for_selector('.status-info')
        
        # Extrakce dat ze stránky
        mark_name = page.inner_text('.mark-name')
        print(f'Název ochranné známky: {mark_name}')
        
        browser.close()

scrape_uspto_trademark()
Python + Scrapy
import scrapy

class UsptoSpider(scrapy.Spider):
    name = 'uspto_spider'
    # Cílení na adresář Patent Grant Red Book
    start_urls = ['https://bulkdata.uspto.gov/data/patent/grant/redbook/2024/']

    def parse(self, response):
        # Scrapování všech odkazů na zip soubory pro rok 2024
        for file_link in response.css('a::attr(href)').getall():
            if file_link.endswith('.zip'):
                yield {
                    'file_url': response.urljoin(file_link),
                    'year': 2024
                }
        
        # Zde lze přidat logiku pro procházení adresářů
Node.js + Puppeteer
const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  
  // Přístup na úvodní stránku Patent Public Search
  await page.goto('https://ppubs.uspto.gov/pubwebapp/static/pages/landing.html');
  
  // Čekání na zobrazení tlačítka 'Basic Search'
  await page.waitForSelector('#basic-search-button');
  await page.click('#basic-search-button');
  
  // Další logika pro zadávání vyhledávacích dotazů a čekání na dynamické tabulky
  await page.waitForSelector('.result-item');
  
  const results = await page.evaluate(() => {
    return Array.from(document.querySelectorAll('.patent-title')).map(el => el.innerText);
  });
  
  console.log('Scrapované názvy:', results);
  await browser.close();
})();

Co Můžete Dělat S Daty USPTO (United States Patent and Trademark Office)

Prozkoumejte praktické aplikace a poznatky z dat USPTO (United States Patent and Trademark Office).

Konkurenční monitoring značek

Maloobchodníci a vlastníci značek mohou sledovat nová podání ochranných známek, aby se chránili před porušováním práv a vstupem konkurence na trh.

Jak implementovat:

  1. 1Scrapujte týdenní podání ochranných známek pro konkrétní klíčová slova související s vaší značkou.
  2. 2Porovnejte nová podání se stávajícími ochrannými známkami a průmyslovými vzory.
  3. 3Upozorněte právní týmy, pokud jsou v relevantních třídách IC podány podobné známky.

Použijte Automatio k extrakci dat z USPTO (United States Patent and Trademark Office) a vytvoření těchto aplikací bez psaní kódu.

Co Můžete Dělat S Daty USPTO (United States Patent and Trademark Office)

  • Konkurenční monitoring značek

    Maloobchodníci a vlastníci značek mohou sledovat nová podání ochranných známek, aby se chránili před porušováním práv a vstupem konkurence na trh.

    1. Scrapujte týdenní podání ochranných známek pro konkrétní klíčová slova související s vaší značkou.
    2. Porovnejte nová podání se stávajícími ochrannými známkami a průmyslovými vzory.
    3. Upozorněte právní týmy, pokud jsou v relevantních třídách IC podány podobné známky.
  • Mapování inovačních trendů

    R&D laboratoře mohou analyzovat udělené patenty a sledovat, do kterých technologií globální korporace masivně investují.

    1. Scrapujte abstrakty a kategorie patentů za klouzavé pětileté období.
    2. Použijte NLP k identifikaci trendových technických klíčových slov a klasifikací CPC.
    3. Vizualizujte růst konkrétních technologických sektorů, jako je AI, biotechnologie nebo zelená energie.
  • Právní due diligence

    Právní firmy mohou automatizovat sběr celého portfolia IP subjektu pro účely fúzí a akvizic (M&A) a oceňování.

    1. Vložte seznam názvů společností nebo ID nabyvatelů do scraperu.
    2. Extrahujte všechny aktivní záznamy o patentech a ochranných známkách pro tyto subjekty, včetně dat expirace.
    3. Vygenerujte zprávu o síle, rozmanitosti a termínech obnovy aktiv.
  • Lead generation pro služby v oblasti IP

    Právníci mohou identifikovat nové žadatele, kteří by mohli potřebovat specializované služby v oblasti ochranných známek nebo patentového řízení.

    1. Filtrujte nové žádosti o ochranné známky bez uvedeného právního zástupce.
    2. Extrahujte kontaktní údaje pro korespondenci a podrobnosti o vlastníkovi.
    3. Provádějte cílené oslovování s nabídkou právního zastoupení nebo služeb správy obnovy.
Vice nez jen prompty

Zrychlete svuj workflow s AI automatizaci

Automatio kombinuje silu AI agentu, webove automatizace a chytrych integraci, aby vam pomohl dosahnout vice za kratsi cas.

AI agenti
Webova automatizace
Chytre workflow

Profesionální Tipy Pro Scrapování USPTO (United States Patent and Trademark Office)

Odborné rady pro úspěšnou extrakci dat z USPTO (United States Patent and Trademark Office).

Upřednostněte Bulk Data Storage System (BDSS) pro potřeby velkého rozsahu dat, abyste se vyhnuli blokování na vyhledávacím portálu.

Použijte headless browser jako Playwright ke zvládnutí náročného JavaScriptu a stavů relací, které moderní portály vyžadují.

Sledujte plán údržby USPTO, protože databáze bývají o víkendech kvůli aktualizacím často offline.

Rotujte rezidenční proxy, abyste obešli přísné rate limits u vyhledávacích dotazů a výzvy Cloudflare.

Extrahujte URL adresy dokumentů, abyste získali originální TIFF nebo PDF soubory oficiálních podání ve vysokém rozlišení.

Pokud potřebujete technické nároky (claims), parsujte XML soubory z hromadného portálu, protože webové UI text často zkracuje.

Reference

Co rikaji nasi uzivatele

Pridejte se k tisicum spokojenych uzivatelu, kteri transformovali svuj workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Souvisejici Web Scraping

Casto kladene dotazy o USPTO (United States Patent and Trademark Office)

Najdete odpovedi na bezne otazky o USPTO (United States Patent and Trademark Office)