Jak scrapować USPTO.gov | Scraper patentów i znaków towarowych USPTO

Dowiedz się, jak scrapować USPTO.gov w celu pozyskania danych o patentach i znakach towarowych. Ekstrahuj numery patentów, wynalazców i daty zgłoszeń dla celów...

Zacznij Scrapować Za Darmo

scraping patentów dane USPTO scraper znaków towarowych legal tech własność intelektualna

uspto.govTrudny

Pokrycie:United States

Dostępne dane9 pól

TytułLokalizacjaOpisZdjęciaInfo o sprzedawcyDane kontaktoweData publikacjiKategorieAtrybuty

Wszystkie pola do ekstrakcji

Tytuł patentuNumer patentuNumer wnioskuData złożeniaData przyznaniaAbstraktPełny opisZastrzeżenia techniczne (claims)Nazwa cesjonariuszaNazwiska wynalazcówNazwa znaku towarowegoNumer seryjny znaku towarowegoNumer rejestracyjny znaku towarowegoTowary i usługiWłaściciel znaku towarowegoAktualny statusPełnomocnikPodstawa zgłoszeniaURL logo znaku towarowegoURL rysunku patentowegoData pierwszeństwa

Wymagania techniczne

Wymagany JavaScript

Bez logowania

Ma paginację

Oficjalne API dostępne

Wykryto ochronę przed botami

CloudflareRate LimitingIP BlockingSession-based URLsreCAPTCHA

Zobacz dokumentację API

O USPTO (United States Patent and Trademark Office)

Odkryj, co oferuje USPTO (United States Patent and Trademark Office) i jakie cenne dane można wyodrębnić.

United States Patent and Trademark Office (USPTO) to agencja federalna odpowiedzialna za przyznawanie patentów w USA i rejestrację znaków towarowych. Utrzymuje ona ogromną publiczną bazę danych rekordów własności intelektualnej (IP), dokumentującą innowacje i własność marek od 1790 roku. Witryna zawiera złożone portale wyszukiwania, takie jak TSDR (Trademark Status & Document Retrieval) oraz narzędzie Patent Public Search.

Dane z USPTO stanowią złoty standard w badaniach nad własnością intelektualną. Zawierają one szczegółowe informacje na temat wynalazków, technicznych zastrzeżeń (claims), cesji prawnych i identyfikatorów marek. Dla firm i prawników dane te mają kluczowe znaczenie dla weryfikacji ważności IP, przeprowadzania due diligence podczas przejęć oraz identyfikowania pojawiających się trendów technologicznych, zanim trafią one na rynek masowy.

Scraping USPTO jest niezwykle cenny dla firm z sektora legal tech, działów R&D oraz analityków rynkowych. Pozwala na automatyzację monitorowania konkurencji, śledzenie cyklu życia wniosków o znaki towarowe i budowanie kompleksowych zbiorów danych do analizy krajobrazu patentowego.

O USPTO (United States Patent and Trademark Office)

Dlaczego Scrapować USPTO (United States Patent and Trademark Office)?

Odkryj wartość biznesową i przypadki użycia ekstrakcji danych z USPTO (United States Patent and Trademark Office).

Monitorowanie zgłoszeń patentowych konkurencji dla strategii R&D

Śledzenie nowych wniosków o znaki towarowe w celu ochrony marki

Przeprowadzanie badań czystości patentowej (freedom-to-operate - FTO)

Analiza krajobrazu patentowego w celu identyfikacji luk rynkowych

Gromadzenie danych do due diligence prawnego i wyceny

Budowanie akademickich zbiorów danych dla badań nad innowacyjnością

Wyzwania Scrapowania

Wyzwania techniczne, które możesz napotkać podczas scrapowania USPTO (United States Patent and Trademark Office).

Wysoce dynamiczne interfejsy wyszukiwania wymagające wykonywania kodu JS

Agresywne rate limiting dla zapytań wyszukiwania

Adresy URL specyficzne dla sesji, które szybko wygasają

Złożone, głęboko zagnieżdżone tabele HTML

Częste aktualizacje struktury w starszych systemach rządowych

Scrapuj USPTO (United States Patent and Trademark Office) z AI

Bez kodowania. Wyodrębnij dane w kilka minut dzięki automatyzacji opartej na AI.

Jak to działa

Opisz, czego potrzebujesz

Powiedz AI, jakie dane chcesz wyodrębnić z USPTO (United States Patent and Trademark Office). Po prostu wpisz to w języku naturalnym — bez kodu czy selektorów.

AI wyodrębnia dane

Nasza sztuczna inteligencja nawiguje po USPTO (United States Patent and Trademark Office), obsługuje dynamiczną treść i wyodrębnia dokładnie to, o co prosiłeś.

Otrzymaj swoje dane

Otrzymaj czyste, ustrukturyzowane dane gotowe do eksportu jako CSV, JSON lub do bezpośredniego przesłania do twoich aplikacji.

Dlaczego warto używać AI do scrapowania

Obsługuje złożone portale wyszukiwania JavaScript bez kodowania

Automatycznie zarządza ciasteczkami sesyjnymi i dynamicznymi timeoutami

Zaplanowane przebiegi do automatycznego wykrywania nowych zgłoszeń

Łatwo ekstrahuje rysunki patentowe i logo znaków towarowych

Transformuje nieuporządkowane tabele rządowe w czysty format CSV lub JSON

Zacznij scrapować za darmo

Karta kredytowa nie wymaganaDarmowy plan dostępnyBez konfiguracji

Scrapery No-Code dla USPTO (United States Patent and Trademark Office)

Alternatywy point-and-click dla scrapingu opartego na AI

Różne narzędzia no-code jak Browse.ai, Octoparse, Axiom i ParseHub mogą pomóc w scrapowaniu USPTO (United States Patent and Trademark Office) bez pisania kodu. Te narzędzia używają wizualnych interfejsów do wyboru danych, choć mogą mieć problemy ze złożoną dynamiczną zawartością lub zabezpieczeniami anti-bot.

Typowy Workflow z Narzędziami No-Code

Zainstaluj rozszerzenie przeglądarki lub zarejestruj się na platformie

Przejdź do docelowej strony i otwórz narzędzie

Wybierz elementy danych do wyodrębnienia metodą point-and-click

Skonfiguruj selektory CSS dla każdego pola danych

Ustaw reguły paginacji do scrapowania wielu stron

Obsłuż CAPTCHA (często wymaga ręcznego rozwiązywania)

Skonfiguruj harmonogram automatycznych uruchomień

Eksportuj dane do CSV, JSON lub połącz przez API

Częste Wyzwania

Krzywa uczenia

Zrozumienie selektorów i logiki ekstrakcji wymaga czasu

Selektory się psują

Zmiany na stronie mogą zepsuć cały przepływ pracy

Problemy z dynamiczną treścią

Strony bogate w JavaScript wymagają złożonych obejść

Ograniczenia CAPTCHA

Większość narzędzi wymaga ręcznej interwencji przy CAPTCHA

Blokowanie IP

Agresywne scrapowanie może prowadzić do zablokowania IP

Przykłady kodu

import requests
from bs4 import BeautifulSoup

# Uwaga: Dane bulk są łatwiejsze przy dużych wolumenach
url = 'https://bulkdata.uspto.gov/'
headers = {'User-Agent': 'Mozilla/5.0'}

try:
    response = requests.get(url, headers=headers)
    response.raise_for_status()
    soup = BeautifulSoup(response.text, 'html.parser')
    # Znajdowanie linków do cotygodniowych plików zip z patentami
    links = [a['href'] for a in soup.find_all('a', href=True) if '.zip' in a['href']]
    print(f'Znaleziono {len(links)} zestawów danych gotowych do pobrania')
except Exception as e:
    print(f'Błąd: {e}')

Kiedy Używać

Najlepsze dla statycznych stron HTML z minimalnym JavaScript. Idealne dla blogów, serwisów informacyjnych i prostych stron produktowych e-commerce.

Zalety

●Najszybsze wykonanie (bez narzutu przeglądarki)
●Najniższe zużycie zasobów
●Łatwe do zrównoleglenia z asyncio
●Świetne dla API i stron statycznych

Ograniczenia

●Nie może wykonywać JavaScript
●Zawodzi na SPA i dynamicznej zawartości
●Może mieć problemy ze złożonymi systemami anti-bot

from playwright.sync_api import sync_playwright

def scrape_uspto_trademark():
    with sync_playwright() as p:
        # USPTO wymaga realnego fingerprintu przeglądarki, aby uniknąć triggerów Cloudflare
        browser = p.chromium.launch(headless=True)
        page = browser.new_page()
        
        # Nawigacja do strony statusu TSDR
        page.goto('https://tsdr.uspto.gov/')
        
        # Wpisanie numeru seryjnego (Przykład: 98021018)
        page.fill('#caseNumber', '98021018')
        page.click('#statusSearch')
        
        # Czekanie na wyrenderowanie sekcji statusu przez JS
        page.wait_for_selector('.status-info')
        
        # Ekstrakcja danych ze strony
        mark_name = page.inner_text('.mark-name')
        print(f'Trademark Name: {mark_name}')
        
        browser.close()

scrape_uspto_trademark()

Kiedy Używać

Idealny dla stron z dużą ilością JavaScript, SPA i stron wymagających interakcji użytkownika jak nieskończone przewijanie lub kliknięcia.

Zalety

●Pełne wykonanie JavaScript
●Obsługuje dynamiczną zawartość i SPA
●Wbudowane mechanizmy oczekiwania
●Wsparcie dla wielu przeglądarek

Ograniczenia

●Wolniejsze niż żądania HTTP
●Większe zużycie pamięci
●Bardziej złożona konfiguracja
●Może być wykryte przez systemy anti-bot

import scrapy

class UsptoSpider(scrapy.Spider):
    name = 'uspto_spider'
    # Celowanie w katalog Patent Grant Red Book
    start_urls = ['https://bulkdata.uspto.gov/data/patent/grant/redbook/2024/']

    def parse(self, response):
        # Scrapowanie wszystkich linków do plików zip dla roku 2024
        for file_link in response.css('a::attr(href)').getall():
            if file_link.endswith('.zip'):
                yield {
                    'file_url': response.urljoin(file_link),
                    'year': 2024
                }
        
        # Tutaj można dodać logikę przechodzenia przez katalogi

Kiedy Używać

Idealny dla dużych projektów scrapingowych wymagających strukturyzowanych pipeline'ów danych, middleware i rozproszonego crawlingu.

Zalety

●Wbudowane planowanie i throttling żądań
●Potężny system middleware
●Eksport do wielu formatów
●Doskonały dla dużych projektów

Ograniczenia

●Stroma krzywa uczenia
●Brak wsparcia JavaScript bez wtyczek
●Przesadzony dla prostych zadań scrapingowych

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  
  // Dostęp do strony głównej Patent Public Search
  await page.goto('https://ppubs.uspto.gov/pubwebapp/static/pages/landing.html');
  
  // Czekanie na pojawienie się przycisku 'Basic Search'
  await page.waitForSelector('#basic-search-button');
  await page.click('#basic-search-button');
  
  // Dodatkowa logika do wprowadzania zapytań i czekania na dynamiczne tabele
  await page.waitForSelector('.result-item');
  
  const results = await page.evaluate(() => {
    return Array.from(document.querySelectorAll('.patent-title')).map(el => el.innerText);
  });
  
  console.log('Scraped Titles:', results);
  await browser.close();
})();

Kiedy Używać

Najlepszy dla automatyzacji specyficznej dla Chrome, generowania PDF lub robienia zrzutów ekranu. Świetny dla stron zoptymalizowanych pod Chrome.

Zalety

●Doskonała integracja Chrome DevTools
●Świetny do generowania PDF i zrzutów ekranu
●Silne wsparcie społeczności
●Dobry dla funkcji specyficznych Chrome

Ograniczenia

●Tylko Chrome/Chromium
●Większe zużycie zasobów
●Może być wykryte przez systemy anti-bot
●Wolniejsze niż metody oparte na HTTP

Jak scrapować USPTO (United States Patent and Trademark Office) za pomocą kodu

Python + Requests

import requests
from bs4 import BeautifulSoup

# Uwaga: Dane bulk są łatwiejsze przy dużych wolumenach
url = 'https://bulkdata.uspto.gov/'
headers = {'User-Agent': 'Mozilla/5.0'}

try:
    response = requests.get(url, headers=headers)
    response.raise_for_status()
    soup = BeautifulSoup(response.text, 'html.parser')
    # Znajdowanie linków do cotygodniowych plików zip z patentami
    links = [a['href'] for a in soup.find_all('a', href=True) if '.zip' in a['href']]
    print(f'Znaleziono {len(links)} zestawów danych gotowych do pobrania')
except Exception as e:
    print(f'Błąd: {e}')

Python + Playwright

from playwright.sync_api import sync_playwright

def scrape_uspto_trademark():
    with sync_playwright() as p:
        # USPTO wymaga realnego fingerprintu przeglądarki, aby uniknąć triggerów Cloudflare
        browser = p.chromium.launch(headless=True)
        page = browser.new_page()
        
        # Nawigacja do strony statusu TSDR
        page.goto('https://tsdr.uspto.gov/')
        
        # Wpisanie numeru seryjnego (Przykład: 98021018)
        page.fill('#caseNumber', '98021018')
        page.click('#statusSearch')
        
        # Czekanie na wyrenderowanie sekcji statusu przez JS
        page.wait_for_selector('.status-info')
        
        # Ekstrakcja danych ze strony
        mark_name = page.inner_text('.mark-name')
        print(f'Trademark Name: {mark_name}')
        
        browser.close()

scrape_uspto_trademark()

Python + Scrapy

import scrapy

class UsptoSpider(scrapy.Spider):
    name = 'uspto_spider'
    # Celowanie w katalog Patent Grant Red Book
    start_urls = ['https://bulkdata.uspto.gov/data/patent/grant/redbook/2024/']

    def parse(self, response):
        # Scrapowanie wszystkich linków do plików zip dla roku 2024
        for file_link in response.css('a::attr(href)').getall():
            if file_link.endswith('.zip'):
                yield {
                    'file_url': response.urljoin(file_link),
                    'year': 2024
                }
        
        # Tutaj można dodać logikę przechodzenia przez katalogi

Node.js + Puppeteer

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  
  // Dostęp do strony głównej Patent Public Search
  await page.goto('https://ppubs.uspto.gov/pubwebapp/static/pages/landing.html');
  
  // Czekanie na pojawienie się przycisku 'Basic Search'
  await page.waitForSelector('#basic-search-button');
  await page.click('#basic-search-button');
  
  // Dodatkowa logika do wprowadzania zapytań i czekania na dynamiczne tabele
  await page.waitForSelector('.result-item');
  
  const results = await page.evaluate(() => {
    return Array.from(document.querySelectorAll('.patent-title')).map(el => el.innerText);
  });
  
  console.log('Scraped Titles:', results);
  await browser.close();
})();

Co Możesz Zrobić Z Danymi USPTO (United States Patent and Trademark Office)

Poznaj praktyczne zastosowania i wnioski z danych USPTO (United States Patent and Trademark Office).

Konkurencyjne monitorowanie marek

Sprzedawcy i właściciele marek mogą monitorować nowe zgłoszenia znaków towarowych, aby chronić się przed naruszeniami i wejściem konkurencji na rynek.

Jak wdrożyć:

1Scrapuj cotygodniowe zgłoszenia znaków towarowych pod kątem określonych słów kluczowych związanych z Twoją marką.
2Porównuj nowe zgłoszenia z istniejącymi znakami towarowymi i wzorami.
3Alertuj zespoły prawne, gdy podobne znaki zostaną zgłoszone w odpowiednich klasach towarowych (IC classes).

Użyj Automatio do wyodrębnienia danych z USPTO (United States Patent and Trademark Office) i budowania tych aplikacji bez pisania kodu.

Wiecej niz tylko prompty

Przyspiesz swoj workflow z automatyzacja AI

Automatio laczy moc agentow AI, automatyzacji web i inteligentnych integracji, aby pomoc Ci osiagnac wiecej w krotszym czasie.

Agenci AI

Automatyzacja web

Inteligentne workflow

Zacznij za darmo

Profesjonalne Porady dla Scrapowania USPTO (United States Patent and Trademark Office)

Porady ekspertów dotyczące skutecznej ekstrakcji danych z USPTO (United States Patent and Trademark Office).

Priorytetyzuj Bulk Data Storage System (BDSS) przy zapotrzebowaniu na dane o dużej skali, aby uniknąć zablokowania na głównym portalu wyszukiwania.

Używaj headless browser, takich jak Playwright, do obsługi złożonego JavaScriptu i stanów sesji wymaganych przez nowoczesne portale.

Monitoruj harmonogram prac konserwacyjnych USPTO, ponieważ bazy danych często przechodzą w tryb offline w celu aktualizacji w weekendy.

Rotuj residential proxies, aby ominąć rygorystyczne rate limits zapytań wyszukiwania i Cloudflare challenges.

Wyodrębniaj adresy URL obrazów dokumentów, aby uzyskać oryginalne pliki TIFF lub PDF zgłoszeń urzędowych w wysokiej rozdzielczości.

Parsuj pliki XML z portalu bulk, jeśli potrzebujesz technicznych zastrzeżeń (claims), ponieważ interfejs webowy często skraca tekst.

Opinie

Co mowia nasi uzytkownicy

Dolacz do tysiecy zadowolonych uzytkownikow, ktorzy przeksztalcili swoj workflow

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Powiazane Web Scraping

Często Zadawane Pytania o USPTO (United States Patent and Trademark Office)

Znajdź odpowiedzi na częste pytania o USPTO (United States Patent and Trademark Office)

Jak scrapować USPTO.gov | Scraper patentów i znaków towarowych USPTO

O USPTO (United States Patent and Trademark Office)

Dlaczego Scrapować USPTO (United States Patent and Trademark Office)?

Wyzwania Scrapowania

Scrapuj USPTO (United States Patent and Trademark Office) z AI

Jak to działa

Dlaczego warto używać AI do scrapowania

Scrapery No-Code dla USPTO (United States Patent and Trademark Office)

Typowy Workflow z Narzędziami No-Code

Częste Wyzwania

Przykłady kodu

Co Możesz Zrobić Z Danymi USPTO (United States Patent and Trademark Office)

Konkurencyjne monitorowanie marek

Mapowanie trendów innowacji

Due Diligence w Legal Tech

Lead Generation dla usług IP

Przyspiesz swoj workflow z automatyzacja AI

Profesjonalne Porady dla Scrapowania USPTO (United States Patent and Trademark Office)

Co mowia nasi uzytkownicy

Powiazane Web Scraping

How to Scrape Transportstyrelsen: Swedish Vehicle Registry Guide

How to Scrape GOV.UK | UK Government Web Scraper Guide

How to Scrape California Natural Resources Agency (resources.ca.gov)

Często Zadawane Pytania o USPTO (United States Patent and Trademark Office)

Czy scrapowanie danych z uspto.gov jest legalne?

Czy USPTO posiada oficjalne API?

Jak uniknąć zablokowania przez stronę USPTO?

W jakim formacie są scrapowane dane?

Czy mogę scrapować obrazy rysunków patentowych lub logo znaków towarowych?

Jak często aktualizowane są dane USPTO?

Dlaczego narzędzie Patent Public Search jest tak trudne do scrapowania?

Jak scrapować USPTO.gov | Scraper patentów i znaków towarowych USPTO

O USPTO (United States Patent and Trademark Office)

Dlaczego Scrapować USPTO (United States Patent and Trademark Office)?

Wyzwania Scrapowania

Scrapuj USPTO (United States Patent and Trademark Office) z AI

Jak to działa

Dlaczego warto używać AI do scrapowania

How to scrape with AI:

Why use AI for scraping:

Scrapery No-Code dla USPTO (United States Patent and Trademark Office)

Typowy Workflow z Narzędziami No-Code

Częste Wyzwania

Scrapery No-Code dla USPTO (United States Patent and Trademark Office)

Typowy Workflow z Narzędziami No-Code

Częste Wyzwania

Przykłady kodu

Jak scrapować USPTO (United States Patent and Trademark Office) za pomocą kodu

Python + Requests

Python + Playwright

Python + Scrapy

Node.js + Puppeteer

Co Możesz Zrobić Z Danymi USPTO (United States Patent and Trademark Office)

Konkurencyjne monitorowanie marek

Mapowanie trendów innowacji

Due Diligence w Legal Tech

Lead Generation dla usług IP

Co Możesz Zrobić Z Danymi USPTO (United States Patent and Trademark Office)

Przyspiesz swoj workflow z automatyzacja AI

Profesjonalne Porady dla Scrapowania USPTO (United States Patent and Trademark Office)

Co mowia nasi uzytkownicy

Powiazane Web Scraping

How to Scrape Transportstyrelsen: Swedish Vehicle Registry Guide

How to Scrape GOV.UK | UK Government Web Scraper Guide

How to Scrape California Natural Resources Agency (resources.ca.gov)

Często Zadawane Pytania o USPTO (United States Patent and Trademark Office)

Czy scrapowanie danych z uspto.gov jest legalne?

Czy USPTO posiada oficjalne API?

Jak uniknąć zablokowania przez stronę USPTO?

W jakim formacie są scrapowane dane?

Czy mogę scrapować obrazy rysunków patentowych lub logo znaków towarowych?

Jak często aktualizowane są dane USPTO?

Dlaczego narzędzie Patent Public Search jest tak trudne do scrapowania?