Hogyan gyűjtsünk adatokat az USPTO.gov-ról | USPTO Szabadalom és Védjegy Web Scraper

Ismerje meg, hogyan gyűjthet adatokat az USPTO.gov-ról szabadalmi és védjegyinformációkhoz. Nyerjen ki szabadalmi számokat, feltalálókat és dátumokat...

USPTO (United States Patent and Trademark Office) favicon
uspto.govNehéz
Lefedettség:United States
Elérhető adatok9 mező
CímHelyszínLeírásKépekEladó adataiKapcsolattartási adatokKözzététel dátumaKategóriákAttribútumok
Összes kinyerhető mező
Szabadalom címeSzabadalmi számÜgyszámBejelentési napMegadás napjaKivonatTeljes leírásMűszaki igénypontokJogosult neveFeltalálók neveVédjegy neveVédjegy ügyszámaVédjegy lajstromszámaÁruk és szolgáltatásokVédjegy tulajdonosaJelenlegi státuszEljáró ügyvédBejelentési alapVédjegy logó URLSzabadalmi rajz URLElsőbbségi dátum
Technikai követelmények
JavaScript szükséges
Nincs bejelentkezés
Van lapozás
Hivatalos API elérhető
Anti-bot védelem észlelve
CloudflareRate LimitingIP BlockingSession-based URLsreCAPTCHA

Anti-bot védelem észlelve

Cloudflare
Vállalati szintű WAF és botkezelés. JavaScript kihívásokat, CAPTCHA-kat és viselkedéselemzést használ. Böngészőautomatizálás szükséges rejtett beállításokkal.
Sebességkorlátozás
IP/munkamenet alapú kéréseket korlátoz időben. Forgó proxykkal, kéréskésleltetéssel és elosztott scrapinggel megkerülhető.
IP-blokkolás
Ismert adatközponti IP-ket és megjelölt címeket blokkol. Lakossági vagy mobil proxyk szükségesek a hatékony megkerüléshez.
Session-based URLs
Google reCAPTCHA
A Google CAPTCHA rendszere. v2 felhasználói interakciót igényel, v3 csendesen fut kockázatértékeléssel. CAPTCHA szolgáltatásokkal megoldható.

A(z) USPTO (United States Patent and Trademark Office) Névjegye

Fedezze fel, mit kínál a(z) USPTO (United States Patent and Trademark Office) és milyen értékes adatok nyerhetők ki.

Az Egyesült Államok Szabadalmi és Védjegyhivatala (USPTO) az a szövetségi ügynökség, amely az amerikai szabadalmak megadásáért és a védjegyek bejegyzéséért felelős. Hatalmas nyilvános adatbázist tart fenn a szellemi tulajdon (IP) rekordjairól, amelyek az innovációt és a márkatulajdont dokumentálják egészen 1790-ig visszamenőleg. A weboldal olyan komplex keresőportálokat tartalmaz, mint a TSDR (Trademark Status & Document Retrieval) és a Patent Public Search eszköz.

Az USPTO-tól származó adatok jelentik az arany standardot a szellemi tulajdonnal kapcsolatos kutatásokban. Részletes adatokat tartalmaznak találmányokról, technikai igénypontokról, jogi átruházásokról és márkaazonosítókról. Az üzleti és jogi szakemberek számára ezek az adatok kritikus fontosságúak az IP érvényességének ellenőrzéséhez, az akvizíciók során végzett átvilágításhoz (due diligence), valamint a feltörekvő technológiai trendek azonosításához, mielőtt azok megjelennének a tömegpiacon.

Az USPTO scrapelése rendkívül értékes a legal tech cégek, a K+F részlegek és a piaci elemzők számára. Lehetővé teszi a versenytársak figyelésének automatizálását, a védjegybejelentések életciklusának követését és átfogó adatkészletek építését a szabadalmi környezet elemzéséhez.

A(z) USPTO (United States Patent and Trademark Office) Névjegye

Miért Kell Scrapelni a(z) USPTO (United States Patent and Trademark Office)-t?

Fedezze fel a(z) USPTO (United States Patent and Trademark Office)-ból történő adatkinyerés üzleti értékét és felhasználási eseteit.

Versenytársak szabadalmi bejelentéseinek figyelése a K+F stratégia kidolgozásához

Új védjegybejelentések követése a márka védelme érdekében

Szabadalmi tisztasági vizsgálatok (FTO) elvégzése

Szabadalmi környezet elemzése a piaci rések azonosításához

Adatgyűjtés jogi átvilágításhoz és cégértékeléshez

Akadémiai adatkészletek építése innovációs kutatásokhoz

Scraping Kihívások

Technikai kihívások, amelyekkel a(z) USPTO (United States Patent and Trademark Office) scrapelésekor találkozhat.

Erősen dinamikus keresőfelületek, amelyek JS futtatást igényelnek

Agresszív rate limiting a keresési lekérdezéseken

Session-specifikus URL-ek, amelyek gyorsan lejárnak

Komplex, mélyen egymásba ágyazott HTML táblázatok

Gyakori struktúra-frissítések a régi kormányzati rendszereken

Scrapeld a USPTO (United States Patent and Trademark Office)-t AI-val

Nincs szükség kódolásra. Nyerj ki adatokat percek alatt AI-vezérelt automatizálással.

Hogyan működik

1

Írd le, mire van szükséged

Mondd el az AI-nak, milyen adatokat szeretnél kinyerni a USPTO (United States Patent and Trademark Office)-ról. Csak írd be természetes nyelven — nincs szükség kódra vagy szelektorokra.

2

Az AI kinyeri az adatokat

Mesterséges intelligenciánk navigál a USPTO (United States Patent and Trademark Office)-on, kezeli a dinamikus tartalmat, és pontosan azt nyeri ki, amit kértél.

3

Kapd meg az adataidat

Kapj tiszta, strukturált adatokat, amelyek készen állnak CSV, JSON exportra vagy közvetlenül az alkalmazásaidba küldésre.

Miért érdemes AI-t használni a scrapeléshez

Kezeli az összetett JavaScript keresőportálokat kódolás nélkül
Automatikusan kezeli a session cookie-kat és a dinamikus időtúllépéseket
Ütemezett futtatások az új bejelentések automatikus észleléséhez
Könnyen kinyeri a szabadalmi rajzokat és védjegy logókat
A rendezetlen kormányzati táblázatokat tiszta CSV vagy JSON formátumba alakítja
Nincs szükség bankkártyáraIngyenes csomag elérhetőNincs szükség beállításra

Az AI megkönnyíti a USPTO (United States Patent and Trademark Office) scrapelését kódírás nélkül. Mesterséges intelligenciával működő platformunk megérti, milyen adatokra van szükséged — csak írd le természetes nyelven, és az AI automatikusan kinyeri őket.

How to scrape with AI:
  1. Írd le, mire van szükséged: Mondd el az AI-nak, milyen adatokat szeretnél kinyerni a USPTO (United States Patent and Trademark Office)-ról. Csak írd be természetes nyelven — nincs szükség kódra vagy szelektorokra.
  2. Az AI kinyeri az adatokat: Mesterséges intelligenciánk navigál a USPTO (United States Patent and Trademark Office)-on, kezeli a dinamikus tartalmat, és pontosan azt nyeri ki, amit kértél.
  3. Kapd meg az adataidat: Kapj tiszta, strukturált adatokat, amelyek készen állnak CSV, JSON exportra vagy közvetlenül az alkalmazásaidba küldésre.
Why use AI for scraping:
  • Kezeli az összetett JavaScript keresőportálokat kódolás nélkül
  • Automatikusan kezeli a session cookie-kat és a dinamikus időtúllépéseket
  • Ütemezett futtatások az új bejelentések automatikus észleléséhez
  • Könnyen kinyeri a szabadalmi rajzokat és védjegy logókat
  • A rendezetlen kormányzati táblázatokat tiszta CSV vagy JSON formátumba alakítja

No-Code Web Scraperek a USPTO (United States Patent and Trademark Office) számára

Kattints-és-válassz alternatívák az AI-alapú scrapeléshez

Számos no-code eszköz, mint a Browse.ai, Octoparse, Axiom és ParseHub segíthet a USPTO (United States Patent and Trademark Office) scrapelésében kódírás nélkül. Ezek az eszközök általában vizuális felületeket használnak az adatok kiválasztásához, bár nehézségeik lehetnek összetett dinamikus tartalmakkal vagy anti-bot intézkedésekkel.

Tipikus Munkafolyamat No-Code Eszközökkel

1
Böngésző bővítmény telepítése vagy regisztráció a platformon
2
Navigálás a célweboldalra és az eszköz megnyitása
3
Adatelemek kiválasztása kattintással
4
CSS szelektorok konfigurálása minden adatmezőhöz
5
Lapozási szabályok beállítása több oldal scrapeléséhez
6
CAPTCHA kezelése (gyakran manuális megoldás szükséges)
7
Ütemezés konfigurálása automatikus futtatásokhoz
8
Adatok exportálása CSV, JSON formátumba vagy API-n keresztüli csatlakozás

Gyakori Kihívások

Tanulási görbe

A szelektorok és a kinyerési logika megértése időt igényel

Szelektorok elromlanak

A weboldal változásai tönkretehetik a teljes munkafolyamatot

Dinamikus tartalom problémák

JavaScript-gazdag oldalak komplex megoldásokat igényelnek

CAPTCHA korlátozások

A legtöbb eszköz manuális beavatkozást igényel CAPTCHA esetén

IP blokkolás

Az agresszív scraping az IP blokkolásához vezethet

No-Code Web Scraperek a USPTO (United States Patent and Trademark Office) számára

Számos no-code eszköz, mint a Browse.ai, Octoparse, Axiom és ParseHub segíthet a USPTO (United States Patent and Trademark Office) scrapelésében kódírás nélkül. Ezek az eszközök általában vizuális felületeket használnak az adatok kiválasztásához, bár nehézségeik lehetnek összetett dinamikus tartalmakkal vagy anti-bot intézkedésekkel.

Tipikus Munkafolyamat No-Code Eszközökkel
  1. Böngésző bővítmény telepítése vagy regisztráció a platformon
  2. Navigálás a célweboldalra és az eszköz megnyitása
  3. Adatelemek kiválasztása kattintással
  4. CSS szelektorok konfigurálása minden adatmezőhöz
  5. Lapozási szabályok beállítása több oldal scrapeléséhez
  6. CAPTCHA kezelése (gyakran manuális megoldás szükséges)
  7. Ütemezés konfigurálása automatikus futtatásokhoz
  8. Adatok exportálása CSV, JSON formátumba vagy API-n keresztüli csatlakozás
Gyakori Kihívások
  • Tanulási görbe: A szelektorok és a kinyerési logika megértése időt igényel
  • Szelektorok elromlanak: A weboldal változásai tönkretehetik a teljes munkafolyamatot
  • Dinamikus tartalom problémák: JavaScript-gazdag oldalak komplex megoldásokat igényelnek
  • CAPTCHA korlátozások: A legtöbb eszköz manuális beavatkozást igényel CAPTCHA esetén
  • IP blokkolás: Az agresszív scraping az IP blokkolásához vezethet

Kod peldak

import requests
from bs4 import BeautifulSoup

# Megjegyzés: A bulk data egyszerűbb nagy mennyiség esetén
url = 'https://bulkdata.uspto.gov/'
headers = {'User-Agent': 'Mozilla/5.0'}

try:
    response = requests.get(url, headers=headers)
    response.raise_for_status()
    soup = BeautifulSoup(response.text, 'html.parser')
    # Linkek keresése a heti szabadalmi zip fájlokhoz
    links = [a['href'] for a in soup.find_all('a', href=True) if '.zip' in a['href']]
    print(f'{len(links)} letölthető adatkészletet találtam')
except Exception as e:
    print(f'Hiba: {e}')

Mikor Használjuk

A legjobb statikus HTML oldalakhoz, ahol a tartalom szerver oldalon töltődik. A leggyorsabb és legegyszerűbb megközelítés, amikor JavaScript renderelés nem szükséges.

Előnyök

  • Leggyorsabb végrehajtás (nincs böngésző overhead)
  • Legalacsonyabb erőforrás-fogyasztás
  • Könnyen párhuzamosítható asyncio-val
  • Kiváló API-khoz és statikus oldalakhoz

Korlátok

  • Nem tudja végrehajtani a JavaScriptet
  • Nem működik SPA-knál és dinamikus tartalmaknál
  • Problémái lehetnek összetett anti-bot rendszerekkel

How to Scrape USPTO (United States Patent and Trademark Office) with Code

Python + Requests
import requests
from bs4 import BeautifulSoup

# Megjegyzés: A bulk data egyszerűbb nagy mennyiség esetén
url = 'https://bulkdata.uspto.gov/'
headers = {'User-Agent': 'Mozilla/5.0'}

try:
    response = requests.get(url, headers=headers)
    response.raise_for_status()
    soup = BeautifulSoup(response.text, 'html.parser')
    # Linkek keresése a heti szabadalmi zip fájlokhoz
    links = [a['href'] for a in soup.find_all('a', href=True) if '.zip' in a['href']]
    print(f'{len(links)} letölthető adatkészletet találtam')
except Exception as e:
    print(f'Hiba: {e}')
Python + Playwright
from playwright.sync_api import sync_playwright

def scrape_uspto_trademark():
    with sync_playwright() as p:
        # Az USPTO valódi browser fingerprint-et igényel a Cloudflare elkerüléséhez
        browser = p.chromium.launch(headless=True)
        page = browser.new_page()
        
        # Navigálás a TSDR státusz oldalra
        page.goto('https://tsdr.uspto.gov/')
        
        # Ügyszám megadása (Példa: 98021018)
        page.fill('#caseNumber', '98021018')
        page.click('#statusSearch')
        
        # Várakozás a státusz szekció JS általi renderelésére
        page.wait_for_selector('.status-info')
        
        # Adatok kinyerése az oldalról
        mark_name = page.inner_text('.mark-name')
        print(f'Védjegy neve: {mark_name}')
        
        browser.close()

scrape_uspto_trademark()
Python + Scrapy
import scrapy

class UsptoSpider(scrapy.Spider):
    name = 'uspto_spider'
    # A Patent Grant Red Book könyvtár célzása
    start_urls = ['https://bulkdata.uspto.gov/data/patent/grant/redbook/2024/']

    def parse(self, response):
        # Az összes 2024-es zip fájl linkjének kigyűjtése
        for file_link in response.css('a::attr(href)').getall():
            if file_link.endswith('.zip'):
                yield {
                    'file_url': response.urljoin(file_link),
                    'year': 2024
                }
        
        # A könyvtárak bejárására vonatkozó logika itt adható hozzá
Node.js + Puppeteer
const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  
  // A Patent Public Search kezdőoldalának elérése
  await page.goto('https://ppubs.uspto.gov/pubwebapp/static/pages/landing.html');
  
  // Várakozás a 'Basic Search' gomb megjelenésére
  await page.waitForSelector('#basic-search-button');
  await page.click('#basic-search-button');
  
  // További logika a keresési lekérdezésekhez és a dinamikus táblázatok megvárásához
  await page.waitForSelector('.result-item');
  
  const results = await page.evaluate(() => {
    return Array.from(document.querySelectorAll('.patent-title')).map(el => el.innerText);
  });
  
  console.log('Kinyert címek:', results);
  await browser.close();
})();

Mit Tehet a(z) USPTO (United States Patent and Trademark Office) Adataival

Fedezze fel a(z) USPTO (United States Patent and Trademark Office) adataiból származó gyakorlati alkalmazásokat és betekintéseket.

Versenytársi márkafigyelés

A kiskereskedők és márkátulajdonosok nyomon követhetik az új védjegybejelentéseket a jogsértések elleni védekezés és a piacra lépés figyelése érdekében.

Hogyan implementáljuk:

  1. 1A heti védjegybejelentések scrapelése a márkájához kapcsolódó specifikus kulcsszavakra.
  2. 2Az új bejelentések összehasonlítása a meglévő védjegyekkel és formatervezési mintákkal.
  3. 3Értesítés küldése a jogi csapatnak, ha hasonló megjelöléseket jelentenek be a releváns áruosztályokban (IC classes).

Használja az Automatio-t adatok kinyeréséhez a USPTO (United States Patent and Trademark Office)-ből és építse meg ezeket az alkalmazásokat kódírás nélkül.

Mit Tehet a(z) USPTO (United States Patent and Trademark Office) Adataival

  • Versenytársi márkafigyelés

    A kiskereskedők és márkátulajdonosok nyomon követhetik az új védjegybejelentéseket a jogsértések elleni védekezés és a piacra lépés figyelése érdekében.

    1. A heti védjegybejelentések scrapelése a márkájához kapcsolódó specifikus kulcsszavakra.
    2. Az új bejelentések összehasonlítása a meglévő védjegyekkel és formatervezési mintákkal.
    3. Értesítés küldése a jogi csapatnak, ha hasonló megjelöléseket jelentenek be a releváns áruosztályokban (IC classes).
  • Innovációs trendtérképezés

    A K+F laboratóriumok elemezhetik a szabadalmi megadásokat, hogy lássák, mely technológiák kapnak jelentős befektetést a globális vállalatoktól.

    1. Szabadalmi kivonatok és kategóriák kinyerése egy gördülő 5 éves időszakra vonatkozóan.
    2. NLP használata a trendi technikai kulcsszavak és CPC osztályozások azonosítására.
    3. Specifikus technológiai szektorok, például AI, biotech vagy zöld energia növekedésének vizualizálása.
  • Legal Tech átvilágítás (Due Diligence)

    Az ügyvédi irodák automatizálhatják egy entitás teljes IP-portfóliójának összegyűjtését M&A tevékenységekhez és értékelésekhez.

    1. Vállalatnevek vagy jogosult-azonosítók (assignee ID) listájának betöltése a scraperbe.
    2. Az ezen entitásokhoz tartozó összes aktív szabadalmi és védjegyrekord kinyerése, beleértve a lejárati dátumokat is.
    3. Jelentés készítése az eszközök erősségéről, diverzitásáról és a megújítási határidőkről.
  • Lead generálás IP szolgáltatásokhoz

    Az ügyvédek azonosíthatják azokat az új bejelentőket, akiknek speciális védjegy- vagy szabadalomügyvivői szolgáltatásokra lehet szükségük.

    1. Szűrés az olyan új védjegybejelentésekre, ahol nincs megadva eljáró ügyvéd.
    2. A kapcsolattartási adatok és a tulajdonos részleteinek kinyerése.
    3. Célzott megkeresés jogi képviselet vagy védjegymegújítás-kezelési szolgáltatások felajánlására.
Tobb, mint promptok

Turbozd fel a munkafolyamatodat AI automatizalasal

Az Automatio egyesiti az AI ugynokk, a web automatizalas es az okos integraciok erejet, hogy segitsen tobbet elerni kevesebb ido alatt.

AI ugynokk
Web automatizalas
Okos munkafolyamatok

Profi Tippek a(z) USPTO (United States Patent and Trademark Office) Scrapeléséhez

Szakértői tanácsok a(z) USPTO (United States Patent and Trademark Office)-ból történő sikeres adatkinyeréshez.

Részesítse előnyben a Bulk Data Storage System-et (BDSS) a nagy léptékű adatigények esetén, hogy elkerülje a keresőportálon való blokkolást.

Használjon headless browser eszközt, például Playwright-ot a modern portálok által megkövetelt nehéz JavaScript és session állapotok kezeléséhez.

Figyelje az USPTO karbantartási ütemtervét, mivel az adatbázisok hétvégente gyakran offline állapotba kerülnek frissítések miatt.

Használjon rotált residential proxy-kat a keresési lekérdezésekre vonatkozó szigorú rate limits és a Cloudflare kihívások megkerüléséhez.

Gyűjtse ki a Document Image URL-eket a hivatalos beadványok eredeti, nagy felbontású TIFF vagy PDF fájljainak eléréséhez.

Ha technikai igénypontokra (claims) van szüksége, dolgozza fel a bulk portálról származó XML fájlokat, mivel a webes felület gyakran levágja a szöveget.

Velemenyek

Mit mondanak a felhasznaloink

Csatlakozz tobb ezer elegedett felhasznalohoz, akik atalakitottak a munkafolyamatukat

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Kapcsolodo Web Scraping

Gyakran ismetelt kerdesek a USPTO (United States Patent and Trademark Office)-rol

Talalj valaszokat a USPTO (United States Patent and Trademark Office)-val kapcsolatos gyakori kerdesekre