Hogyan gyűjtsünk adatokat az USPTO.gov-ról | USPTO Szabadalom és Védjegy Web Scraper
Ismerje meg, hogyan gyűjthet adatokat az USPTO.gov-ról szabadalmi és védjegyinformációkhoz. Nyerjen ki szabadalmi számokat, feltalálókat és dátumokat...
Anti-bot védelem észlelve
- Cloudflare
- Vállalati szintű WAF és botkezelés. JavaScript kihívásokat, CAPTCHA-kat és viselkedéselemzést használ. Böngészőautomatizálás szükséges rejtett beállításokkal.
- Sebességkorlátozás
- IP/munkamenet alapú kéréseket korlátoz időben. Forgó proxykkal, kéréskésleltetéssel és elosztott scrapinggel megkerülhető.
- IP-blokkolás
- Ismert adatközponti IP-ket és megjelölt címeket blokkol. Lakossági vagy mobil proxyk szükségesek a hatékony megkerüléshez.
- Session-based URLs
- Google reCAPTCHA
- A Google CAPTCHA rendszere. v2 felhasználói interakciót igényel, v3 csendesen fut kockázatértékeléssel. CAPTCHA szolgáltatásokkal megoldható.
A(z) USPTO (United States Patent and Trademark Office) Névjegye
Fedezze fel, mit kínál a(z) USPTO (United States Patent and Trademark Office) és milyen értékes adatok nyerhetők ki.
Az Egyesült Államok Szabadalmi és Védjegyhivatala (USPTO) az a szövetségi ügynökség, amely az amerikai szabadalmak megadásáért és a védjegyek bejegyzéséért felelős. Hatalmas nyilvános adatbázist tart fenn a szellemi tulajdon (IP) rekordjairól, amelyek az innovációt és a márkatulajdont dokumentálják egészen 1790-ig visszamenőleg. A weboldal olyan komplex keresőportálokat tartalmaz, mint a TSDR (Trademark Status & Document Retrieval) és a Patent Public Search eszköz.
Az USPTO-tól származó adatok jelentik az arany standardot a szellemi tulajdonnal kapcsolatos kutatásokban. Részletes adatokat tartalmaznak találmányokról, technikai igénypontokról, jogi átruházásokról és márkaazonosítókról. Az üzleti és jogi szakemberek számára ezek az adatok kritikus fontosságúak az IP érvényességének ellenőrzéséhez, az akvizíciók során végzett átvilágításhoz (due diligence), valamint a feltörekvő technológiai trendek azonosításához, mielőtt azok megjelennének a tömegpiacon.
Az USPTO scrapelése rendkívül értékes a legal tech cégek, a K+F részlegek és a piaci elemzők számára. Lehetővé teszi a versenytársak figyelésének automatizálását, a védjegybejelentések életciklusának követését és átfogó adatkészletek építését a szabadalmi környezet elemzéséhez.

Miért Kell Scrapelni a(z) USPTO (United States Patent and Trademark Office)-t?
Fedezze fel a(z) USPTO (United States Patent and Trademark Office)-ból történő adatkinyerés üzleti értékét és felhasználási eseteit.
Versenytársak szabadalmi bejelentéseinek figyelése a K+F stratégia kidolgozásához
Új védjegybejelentések követése a márka védelme érdekében
Szabadalmi tisztasági vizsgálatok (FTO) elvégzése
Szabadalmi környezet elemzése a piaci rések azonosításához
Adatgyűjtés jogi átvilágításhoz és cégértékeléshez
Akadémiai adatkészletek építése innovációs kutatásokhoz
Scraping Kihívások
Technikai kihívások, amelyekkel a(z) USPTO (United States Patent and Trademark Office) scrapelésekor találkozhat.
Erősen dinamikus keresőfelületek, amelyek JS futtatást igényelnek
Agresszív rate limiting a keresési lekérdezéseken
Session-specifikus URL-ek, amelyek gyorsan lejárnak
Komplex, mélyen egymásba ágyazott HTML táblázatok
Gyakori struktúra-frissítések a régi kormányzati rendszereken
Scrapeld a USPTO (United States Patent and Trademark Office)-t AI-val
Nincs szükség kódolásra. Nyerj ki adatokat percek alatt AI-vezérelt automatizálással.
Hogyan működik
Írd le, mire van szükséged
Mondd el az AI-nak, milyen adatokat szeretnél kinyerni a USPTO (United States Patent and Trademark Office)-ról. Csak írd be természetes nyelven — nincs szükség kódra vagy szelektorokra.
Az AI kinyeri az adatokat
Mesterséges intelligenciánk navigál a USPTO (United States Patent and Trademark Office)-on, kezeli a dinamikus tartalmat, és pontosan azt nyeri ki, amit kértél.
Kapd meg az adataidat
Kapj tiszta, strukturált adatokat, amelyek készen állnak CSV, JSON exportra vagy közvetlenül az alkalmazásaidba küldésre.
Miért érdemes AI-t használni a scrapeléshez
Az AI megkönnyíti a USPTO (United States Patent and Trademark Office) scrapelését kódírás nélkül. Mesterséges intelligenciával működő platformunk megérti, milyen adatokra van szükséged — csak írd le természetes nyelven, és az AI automatikusan kinyeri őket.
How to scrape with AI:
- Írd le, mire van szükséged: Mondd el az AI-nak, milyen adatokat szeretnél kinyerni a USPTO (United States Patent and Trademark Office)-ról. Csak írd be természetes nyelven — nincs szükség kódra vagy szelektorokra.
- Az AI kinyeri az adatokat: Mesterséges intelligenciánk navigál a USPTO (United States Patent and Trademark Office)-on, kezeli a dinamikus tartalmat, és pontosan azt nyeri ki, amit kértél.
- Kapd meg az adataidat: Kapj tiszta, strukturált adatokat, amelyek készen állnak CSV, JSON exportra vagy közvetlenül az alkalmazásaidba küldésre.
Why use AI for scraping:
- Kezeli az összetett JavaScript keresőportálokat kódolás nélkül
- Automatikusan kezeli a session cookie-kat és a dinamikus időtúllépéseket
- Ütemezett futtatások az új bejelentések automatikus észleléséhez
- Könnyen kinyeri a szabadalmi rajzokat és védjegy logókat
- A rendezetlen kormányzati táblázatokat tiszta CSV vagy JSON formátumba alakítja
No-Code Web Scraperek a USPTO (United States Patent and Trademark Office) számára
Kattints-és-válassz alternatívák az AI-alapú scrapeléshez
Számos no-code eszköz, mint a Browse.ai, Octoparse, Axiom és ParseHub segíthet a USPTO (United States Patent and Trademark Office) scrapelésében kódírás nélkül. Ezek az eszközök általában vizuális felületeket használnak az adatok kiválasztásához, bár nehézségeik lehetnek összetett dinamikus tartalmakkal vagy anti-bot intézkedésekkel.
Tipikus Munkafolyamat No-Code Eszközökkel
Gyakori Kihívások
Tanulási görbe
A szelektorok és a kinyerési logika megértése időt igényel
Szelektorok elromlanak
A weboldal változásai tönkretehetik a teljes munkafolyamatot
Dinamikus tartalom problémák
JavaScript-gazdag oldalak komplex megoldásokat igényelnek
CAPTCHA korlátozások
A legtöbb eszköz manuális beavatkozást igényel CAPTCHA esetén
IP blokkolás
Az agresszív scraping az IP blokkolásához vezethet
No-Code Web Scraperek a USPTO (United States Patent and Trademark Office) számára
Számos no-code eszköz, mint a Browse.ai, Octoparse, Axiom és ParseHub segíthet a USPTO (United States Patent and Trademark Office) scrapelésében kódírás nélkül. Ezek az eszközök általában vizuális felületeket használnak az adatok kiválasztásához, bár nehézségeik lehetnek összetett dinamikus tartalmakkal vagy anti-bot intézkedésekkel.
Tipikus Munkafolyamat No-Code Eszközökkel
- Böngésző bővítmény telepítése vagy regisztráció a platformon
- Navigálás a célweboldalra és az eszköz megnyitása
- Adatelemek kiválasztása kattintással
- CSS szelektorok konfigurálása minden adatmezőhöz
- Lapozási szabályok beállítása több oldal scrapeléséhez
- CAPTCHA kezelése (gyakran manuális megoldás szükséges)
- Ütemezés konfigurálása automatikus futtatásokhoz
- Adatok exportálása CSV, JSON formátumba vagy API-n keresztüli csatlakozás
Gyakori Kihívások
- Tanulási görbe: A szelektorok és a kinyerési logika megértése időt igényel
- Szelektorok elromlanak: A weboldal változásai tönkretehetik a teljes munkafolyamatot
- Dinamikus tartalom problémák: JavaScript-gazdag oldalak komplex megoldásokat igényelnek
- CAPTCHA korlátozások: A legtöbb eszköz manuális beavatkozást igényel CAPTCHA esetén
- IP blokkolás: Az agresszív scraping az IP blokkolásához vezethet
Kod peldak
import requests
from bs4 import BeautifulSoup
# Megjegyzés: A bulk data egyszerűbb nagy mennyiség esetén
url = 'https://bulkdata.uspto.gov/'
headers = {'User-Agent': 'Mozilla/5.0'}
try:
response = requests.get(url, headers=headers)
response.raise_for_status()
soup = BeautifulSoup(response.text, 'html.parser')
# Linkek keresése a heti szabadalmi zip fájlokhoz
links = [a['href'] for a in soup.find_all('a', href=True) if '.zip' in a['href']]
print(f'{len(links)} letölthető adatkészletet találtam')
except Exception as e:
print(f'Hiba: {e}')Mikor Használjuk
A legjobb statikus HTML oldalakhoz, ahol a tartalom szerver oldalon töltődik. A leggyorsabb és legegyszerűbb megközelítés, amikor JavaScript renderelés nem szükséges.
Előnyök
- ●Leggyorsabb végrehajtás (nincs böngésző overhead)
- ●Legalacsonyabb erőforrás-fogyasztás
- ●Könnyen párhuzamosítható asyncio-val
- ●Kiváló API-khoz és statikus oldalakhoz
Korlátok
- ●Nem tudja végrehajtani a JavaScriptet
- ●Nem működik SPA-knál és dinamikus tartalmaknál
- ●Problémái lehetnek összetett anti-bot rendszerekkel
How to Scrape USPTO (United States Patent and Trademark Office) with Code
Python + Requests
import requests
from bs4 import BeautifulSoup
# Megjegyzés: A bulk data egyszerűbb nagy mennyiség esetén
url = 'https://bulkdata.uspto.gov/'
headers = {'User-Agent': 'Mozilla/5.0'}
try:
response = requests.get(url, headers=headers)
response.raise_for_status()
soup = BeautifulSoup(response.text, 'html.parser')
# Linkek keresése a heti szabadalmi zip fájlokhoz
links = [a['href'] for a in soup.find_all('a', href=True) if '.zip' in a['href']]
print(f'{len(links)} letölthető adatkészletet találtam')
except Exception as e:
print(f'Hiba: {e}')Python + Playwright
from playwright.sync_api import sync_playwright
def scrape_uspto_trademark():
with sync_playwright() as p:
# Az USPTO valódi browser fingerprint-et igényel a Cloudflare elkerüléséhez
browser = p.chromium.launch(headless=True)
page = browser.new_page()
# Navigálás a TSDR státusz oldalra
page.goto('https://tsdr.uspto.gov/')
# Ügyszám megadása (Példa: 98021018)
page.fill('#caseNumber', '98021018')
page.click('#statusSearch')
# Várakozás a státusz szekció JS általi renderelésére
page.wait_for_selector('.status-info')
# Adatok kinyerése az oldalról
mark_name = page.inner_text('.mark-name')
print(f'Védjegy neve: {mark_name}')
browser.close()
scrape_uspto_trademark()Python + Scrapy
import scrapy
class UsptoSpider(scrapy.Spider):
name = 'uspto_spider'
# A Patent Grant Red Book könyvtár célzása
start_urls = ['https://bulkdata.uspto.gov/data/patent/grant/redbook/2024/']
def parse(self, response):
# Az összes 2024-es zip fájl linkjének kigyűjtése
for file_link in response.css('a::attr(href)').getall():
if file_link.endswith('.zip'):
yield {
'file_url': response.urljoin(file_link),
'year': 2024
}
# A könyvtárak bejárására vonatkozó logika itt adható hozzáNode.js + Puppeteer
const puppeteer = require('puppeteer');
(async () => {
const browser = await puppeteer.launch();
const page = await browser.newPage();
// A Patent Public Search kezdőoldalának elérése
await page.goto('https://ppubs.uspto.gov/pubwebapp/static/pages/landing.html');
// Várakozás a 'Basic Search' gomb megjelenésére
await page.waitForSelector('#basic-search-button');
await page.click('#basic-search-button');
// További logika a keresési lekérdezésekhez és a dinamikus táblázatok megvárásához
await page.waitForSelector('.result-item');
const results = await page.evaluate(() => {
return Array.from(document.querySelectorAll('.patent-title')).map(el => el.innerText);
});
console.log('Kinyert címek:', results);
await browser.close();
})();Mit Tehet a(z) USPTO (United States Patent and Trademark Office) Adataival
Fedezze fel a(z) USPTO (United States Patent and Trademark Office) adataiból származó gyakorlati alkalmazásokat és betekintéseket.
Versenytársi márkafigyelés
A kiskereskedők és márkátulajdonosok nyomon követhetik az új védjegybejelentéseket a jogsértések elleni védekezés és a piacra lépés figyelése érdekében.
Hogyan implementáljuk:
- 1A heti védjegybejelentések scrapelése a márkájához kapcsolódó specifikus kulcsszavakra.
- 2Az új bejelentések összehasonlítása a meglévő védjegyekkel és formatervezési mintákkal.
- 3Értesítés küldése a jogi csapatnak, ha hasonló megjelöléseket jelentenek be a releváns áruosztályokban (IC classes).
Használja az Automatio-t adatok kinyeréséhez a USPTO (United States Patent and Trademark Office)-ből és építse meg ezeket az alkalmazásokat kódírás nélkül.
Mit Tehet a(z) USPTO (United States Patent and Trademark Office) Adataival
- Versenytársi márkafigyelés
A kiskereskedők és márkátulajdonosok nyomon követhetik az új védjegybejelentéseket a jogsértések elleni védekezés és a piacra lépés figyelése érdekében.
- A heti védjegybejelentések scrapelése a márkájához kapcsolódó specifikus kulcsszavakra.
- Az új bejelentések összehasonlítása a meglévő védjegyekkel és formatervezési mintákkal.
- Értesítés küldése a jogi csapatnak, ha hasonló megjelöléseket jelentenek be a releváns áruosztályokban (IC classes).
- Innovációs trendtérképezés
A K+F laboratóriumok elemezhetik a szabadalmi megadásokat, hogy lássák, mely technológiák kapnak jelentős befektetést a globális vállalatoktól.
- Szabadalmi kivonatok és kategóriák kinyerése egy gördülő 5 éves időszakra vonatkozóan.
- NLP használata a trendi technikai kulcsszavak és CPC osztályozások azonosítására.
- Specifikus technológiai szektorok, például AI, biotech vagy zöld energia növekedésének vizualizálása.
- Legal Tech átvilágítás (Due Diligence)
Az ügyvédi irodák automatizálhatják egy entitás teljes IP-portfóliójának összegyűjtését M&A tevékenységekhez és értékelésekhez.
- Vállalatnevek vagy jogosult-azonosítók (assignee ID) listájának betöltése a scraperbe.
- Az ezen entitásokhoz tartozó összes aktív szabadalmi és védjegyrekord kinyerése, beleértve a lejárati dátumokat is.
- Jelentés készítése az eszközök erősségéről, diverzitásáról és a megújítási határidőkről.
- Lead generálás IP szolgáltatásokhoz
Az ügyvédek azonosíthatják azokat az új bejelentőket, akiknek speciális védjegy- vagy szabadalomügyvivői szolgáltatásokra lehet szükségük.
- Szűrés az olyan új védjegybejelentésekre, ahol nincs megadva eljáró ügyvéd.
- A kapcsolattartási adatok és a tulajdonos részleteinek kinyerése.
- Célzott megkeresés jogi képviselet vagy védjegymegújítás-kezelési szolgáltatások felajánlására.
Turbozd fel a munkafolyamatodat AI automatizalasal
Az Automatio egyesiti az AI ugynokk, a web automatizalas es az okos integraciok erejet, hogy segitsen tobbet elerni kevesebb ido alatt.
Profi Tippek a(z) USPTO (United States Patent and Trademark Office) Scrapeléséhez
Szakértői tanácsok a(z) USPTO (United States Patent and Trademark Office)-ból történő sikeres adatkinyeréshez.
Részesítse előnyben a Bulk Data Storage System-et (BDSS) a nagy léptékű adatigények esetén, hogy elkerülje a keresőportálon való blokkolást.
Használjon headless browser eszközt, például Playwright-ot a modern portálok által megkövetelt nehéz JavaScript és session állapotok kezeléséhez.
Figyelje az USPTO karbantartási ütemtervét, mivel az adatbázisok hétvégente gyakran offline állapotba kerülnek frissítések miatt.
Használjon rotált residential proxy-kat a keresési lekérdezésekre vonatkozó szigorú rate limits és a Cloudflare kihívások megkerüléséhez.
Gyűjtse ki a Document Image URL-eket a hivatalos beadványok eredeti, nagy felbontású TIFF vagy PDF fájljainak eléréséhez.
Ha technikai igénypontokra (claims) van szüksége, dolgozza fel a bulk portálról származó XML fájlokat, mivel a webes felület gyakran levágja a szöveget.
Velemenyek
Mit mondanak a felhasznaloink
Csatlakozz tobb ezer elegedett felhasznalohoz, akik atalakitottak a munkafolyamatukat
Jonathan Kogan
Co-Founder/CEO, rpatools.io
Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.
Mohammed Ibrahim
CEO, qannas.pro
I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!
Ben Bressington
CTO, AiChatSolutions
Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!
Sarah Chen
Head of Growth, ScaleUp Labs
We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.
David Park
Founder, DataDriven.io
The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!
Emily Rodriguez
Marketing Director, GrowthMetrics
Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.
Jonathan Kogan
Co-Founder/CEO, rpatools.io
Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.
Mohammed Ibrahim
CEO, qannas.pro
I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!
Ben Bressington
CTO, AiChatSolutions
Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!
Sarah Chen
Head of Growth, ScaleUp Labs
We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.
David Park
Founder, DataDriven.io
The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!
Emily Rodriguez
Marketing Director, GrowthMetrics
Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.
Kapcsolodo Web Scraping
Gyakran ismetelt kerdesek a USPTO (United States Patent and Trademark Office)-rol
Talalj valaszokat a USPTO (United States Patent and Trademark Office)-val kapcsolatos gyakori kerdesekre


