چگونه از USPTO.gov اسکرپ کنیم | اسکرپر وب پتنت و علامت تجاری USPTO
بیاموزید چگونه برای دریافت دادههای پتنت و علائم تجاری از USPTO.gov اسکرپ کنید. استخراج شماره پتنت، مخترعان و تاریخهای ثبت برای هوش حقوقی رقابتی.
حفاظت ضد ربات شناسایی شد
- Cloudflare
- WAF و مدیریت ربات در سطح سازمانی. از چالشهای JavaScript، CAPTCHA و تحلیل رفتاری استفاده میکند. نیاز به اتوماسیون مرورگر با تنظیمات مخفی دارد.
- محدودیت نرخ
- درخواستها را بر اساس IP/جلسه در طول زمان محدود میکند. با پراکسیهای چرخشی، تأخیر درخواستها و اسکرپینگ توزیعشده قابل دور زدن است.
- مسدودسازی IP
- IPهای شناختهشده مراکز داده و آدرسهای علامتگذاریشده را مسدود میکند. نیاز به پراکسیهای مسکونی یا موبایل برای دور زدن مؤثر دارد.
- Session-based URLs
- Google reCAPTCHA
- سیستم CAPTCHA گوگل. نسخه 2 نیاز به تعامل کاربر دارد، نسخه 3 بیصدا با امتیازدهی ریسک اجرا میشود. با خدمات CAPTCHA قابل حل است.
درباره USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده)
کشف کنید USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده) چه چیزی ارائه میدهد و چه دادههای ارزشمندی میتوان استخراج کرد.
اداره ثبت اختراعات و علائم تجاری ایالات متحده (USPTO) آژانس فدرال مسئول اعطای پتنتهای ایالات متحده و ثبت علائم تجاری است. این سازمان یک دیتابیس عمومی عظیم از سوابق مالکیت معنوی (IP) را نگهداری میکند که نوآوری و مالکیت برند را از سال 1790 مستند کرده است. این وبسایت دارای پرتالهای جستجوی پیچیدهای مانند TSDR (بازیابی وضعیت و اسناد علامت تجاری) و ابزار جستجوی عمومی پتنت است.
دادههای USPTO استاندارد طلایی برای تحقیقات مالکیت معنوی محسوب میشوند. این دادهها شامل جزئیات دقیق در مورد اختراعات، technical claims، واگذاریهای قانونی و شناسههای برند هستند. برای کسبوکارها و متخصصان حقوقی، این دادهها برای تایید اعتبار IP، انجام due diligence در طول خرید و ادغام شرکتها و شناسایی روندهای فناوری نوظهور پیش از ورود به بازار اصلی، حیاتی هستند.
اسکرپ کردن USPTO برای شرکتهای legal tech، بخشهای R&D و تحلیلگران بازار بسیار ارزشمند است. این کار امکان خودکارسازی نظارت بر رقبا، ردیابی چرخه حیات درخواستهای علامت تجاری و ایجاد مجموعهدادههای جامع برای تجزیه و تحلیل چشمانداز پتنت را فراهم میکند.

چرا USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده) را اسکرپ کنیم؟
ارزش تجاری و موارد استفاده برای استخراج داده از USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده) را کشف کنید.
نظارت بر پروندههای پتنت رقبا برای استراتژی R&D
ردیابی درخواستهای جدید علامت تجاری برای محافظت از برند
انجام جستجوهای freedom-to-operate (FTO)
تجزیه و تحلیل چشمانداز پتنت برای شناسایی شکافهای بازار
جمعآوری دادهها برای due diligence حقوقی و ارزشگذاری
ساخت مجموعهدادههای آکادمیک برای تحقیقات نوآوری
چالشهای اسکرپینگ
چالشهای فنی که ممکن است هنگام اسکرپ USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده) با آنها مواجه شوید.
رابطهای جستجوی بسیار پویا که نیاز به اجرای JS دارند
محدودیت نرخ (rate limiting) تهاجمی در کوئریهای جستجو
URLهای وابسته به session که به سرعت منقضی میشوند
جدولهای HTML پیچیده با تو در تویی زیاد
بهروزرسانیهای مکرر ساختار در سیستمهای دولتی قدیمی
استخراج داده از USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده) با هوش مصنوعی
بدون نیاز به کدنویسی. با اتوماسیون مبتنی بر هوش مصنوعی در چند دقیقه داده استخراج کنید.
نحوه عملکرد
نیاز خود را توصیف کنید
به هوش مصنوعی بگویید چه دادههایی را میخواهید از USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده) استخراج کنید. فقط به زبان طبیعی بنویسید — بدون نیاز به کد یا سلکتور.
هوش مصنوعی دادهها را استخراج میکند
هوش مصنوعی ما USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده) را مرور میکند، محتوای پویا را مدیریت میکند و دقیقاً آنچه درخواست کردهاید را استخراج میکند.
دادههای خود را دریافت کنید
دادههای تمیز و ساختاریافته آماده برای صادرات به CSV، JSON یا ارسال مستقیم به برنامههای شما دریافت کنید.
چرا از هوش مصنوعی برای استخراج داده استفاده کنید
هوش مصنوعی استخراج داده از USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده) را بدون نوشتن کد آسان میکند. پلتفرم ما با هوش مصنوعی میفهمد چه دادههایی میخواهید — فقط به زبان طبیعی توصیف کنید و هوش مصنوعی به طور خودکار استخراج میکند.
How to scrape with AI:
- نیاز خود را توصیف کنید: به هوش مصنوعی بگویید چه دادههایی را میخواهید از USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده) استخراج کنید. فقط به زبان طبیعی بنویسید — بدون نیاز به کد یا سلکتور.
- هوش مصنوعی دادهها را استخراج میکند: هوش مصنوعی ما USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده) را مرور میکند، محتوای پویا را مدیریت میکند و دقیقاً آنچه درخواست کردهاید را استخراج میکند.
- دادههای خود را دریافت کنید: دادههای تمیز و ساختاریافته آماده برای صادرات به CSV، JSON یا ارسال مستقیم به برنامههای شما دریافت کنید.
Why use AI for scraping:
- مدیریت پرتالهای جستجوی پیچیده JavaScript بدون نیاز به کدنویسی
- مدیریت خودکار کوکیهای session و timeoutهای پویا
- اجرای برنامهریزی شده برای شناسایی خودکار پروندههای جدید
- استخراج آسان نقشههای پتنت و لوگوهای علامت تجاری
- تبدیل جدولهای نامنظم دولتی به فایلهای تمیز CSV یا JSON
اسکرپرهای وب بدون کد برای USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده)
جایگزینهای کلیک و انتخاب برای اسکرپینگ مبتنی بر AI
چندین ابزار بدون کد مانند Browse.ai، Octoparse، Axiom و ParseHub میتوانند به شما در اسکرپ USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده) بدون نوشتن کد کمک کنند. این ابزارها معمولاً از رابطهای بصری برای انتخاب داده استفاده میکنند، اگرچه ممکن است با محتوای پویای پیچیده یا اقدامات ضد ربات مشکل داشته باشند.
گردش کار معمول با ابزارهای بدون کد
چالشهای رایج
منحنی یادگیری
درک انتخابگرها و منطق استخراج زمان میبرد
انتخابگرها خراب میشوند
تغییرات وبسایت میتواند کل جریان کار را خراب کند
مشکلات محتوای پویا
سایتهای پر از JavaScript نیاز به راهحلهای پیچیده دارند
محدودیتهای CAPTCHA
اکثر ابزارها نیاز به مداخله دستی برای CAPTCHA دارند
مسدود شدن IP
استخراج تهاجمی میتواند منجر به مسدود شدن IP شما شود
اسکرپرهای وب بدون کد برای USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده)
چندین ابزار بدون کد مانند Browse.ai، Octoparse، Axiom و ParseHub میتوانند به شما در اسکرپ USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده) بدون نوشتن کد کمک کنند. این ابزارها معمولاً از رابطهای بصری برای انتخاب داده استفاده میکنند، اگرچه ممکن است با محتوای پویای پیچیده یا اقدامات ضد ربات مشکل داشته باشند.
گردش کار معمول با ابزارهای بدون کد
- افزونه مرورگر را نصب کنید یا در پلتفرم ثبتنام کنید
- به وبسایت هدف بروید و ابزار را باز کنید
- عناصر دادهای مورد نظر را با کلیک انتخاب کنید
- انتخابگرهای CSS را برای هر فیلد داده پیکربندی کنید
- قوانین صفحهبندی را برای استخراج چندین صفحه تنظیم کنید
- CAPTCHA را مدیریت کنید (اغلب نیاز به حل دستی دارد)
- زمانبندی اجرای خودکار را پیکربندی کنید
- دادهها را به CSV، JSON صادر کنید یا از طریق API متصل شوید
چالشهای رایج
- منحنی یادگیری: درک انتخابگرها و منطق استخراج زمان میبرد
- انتخابگرها خراب میشوند: تغییرات وبسایت میتواند کل جریان کار را خراب کند
- مشکلات محتوای پویا: سایتهای پر از JavaScript نیاز به راهحلهای پیچیده دارند
- محدودیتهای CAPTCHA: اکثر ابزارها نیاز به مداخله دستی برای CAPTCHA دارند
- مسدود شدن IP: استخراج تهاجمی میتواند منجر به مسدود شدن IP شما شود
نمونه کدها
import requests
from bs4 import BeautifulSoup
# Note: Bulk data is easier for high volumes
url = 'https://bulkdata.uspto.gov/'
headers = {'User-Agent': 'Mozilla/5.0'}
try:
response = requests.get(url, headers=headers)
response.raise_for_status()
soup = BeautifulSoup(response.text, 'html.parser')
# Finding links to weekly patent zip files
links = [a['href'] for a in soup.find_all('a', href=True) if '.zip' in a['href']]
print(f'Found {len(links)} datasets available for download')
except Exception as e:
print(f'Error: {e}')زمان استفاده
بهترین گزینه برای صفحات HTML ایستا که محتوا در سمت سرور بارگذاری میشود. سریعترین و سادهترین روش وقتی رندر JavaScript لازم نیست.
مزایا
- ●سریعترین اجرا (بدون سربار مرورگر)
- ●کمترین مصرف منابع
- ●به راحتی با asyncio قابل موازیسازی
- ●عالی برای API و صفحات ایستا
محدودیتها
- ●قادر به اجرای JavaScript نیست
- ●در SPA و محتوای پویا ناموفق است
- ●ممکن است با سیستمهای ضد ربات پیچیده مشکل داشته باشد
How to Scrape USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده) with Code
Python + Requests
import requests
from bs4 import BeautifulSoup
# Note: Bulk data is easier for high volumes
url = 'https://bulkdata.uspto.gov/'
headers = {'User-Agent': 'Mozilla/5.0'}
try:
response = requests.get(url, headers=headers)
response.raise_for_status()
soup = BeautifulSoup(response.text, 'html.parser')
# Finding links to weekly patent zip files
links = [a['href'] for a in soup.find_all('a', href=True) if '.zip' in a['href']]
print(f'Found {len(links)} datasets available for download')
except Exception as e:
print(f'Error: {e}')Python + Playwright
from playwright.sync_api import sync_playwright
def scrape_uspto_trademark():
with sync_playwright() as p:
# USPTO requires a real browser fingerprint to avoid Cloudflare triggers
browser = p.chromium.launch(headless=True)
page = browser.new_page()
# Navigating to TSDR status page
page.goto('https://tsdr.uspto.gov/')
# Fill in a serial number (Example: 98021018)
page.fill('#caseNumber', '98021018')
page.click('#statusSearch')
# Wait for the status section to render via JS
page.wait_for_selector('.status-info')
# Extract data from the page
mark_name = page.inner_text('.mark-name')
print(f'Trademark Name: {mark_name}')
browser.close()
scrape_uspto_trademark()Python + Scrapy
import scrapy
class UsptoSpider(scrapy.Spider):
name = 'uspto_spider'
# Targeting the Patent Grant Red Book directory
start_urls = ['https://bulkdata.uspto.gov/data/patent/grant/redbook/2024/']
def parse(self, response):
# Scrape all zip file links for the year 2024
for file_link in response.css('a::attr(href)').getall():
if file_link.endswith('.zip'):
yield {
'file_url': response.urljoin(file_link),
'year': 2024
}
# Logic for traversing directories can be added hereNode.js + Puppeteer
const puppeteer = require('puppeteer');
(async () => {
const browser = await puppeteer.launch();
const page = await browser.newPage();
// Accessing the Patent Public Search landing page
await page.goto('https://ppubs.uspto.gov/pubwebapp/static/pages/landing.html');
// Wait for the 'Basic Search' button to appear
await page.waitForSelector('#basic-search-button');
await page.click('#basic-search-button');
// Additional logic to input search queries and wait for dynamic tables
await page.waitForSelector('.result-item');
const results = await page.evaluate(() => {
return Array.from(document.querySelectorAll('.patent-title')).map(el => el.innerText);
});
console.log('Scraped Titles:', results);
await browser.close();
})();با دادههای USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده) چه کارهایی میتوانید انجام دهید
کاربردهای عملی و بینشها از دادههای USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده) را بررسی کنید.
نظارت رقابتی بر برند
خردهفروشان و صاحبان برند میتوانند پروندههای جدید علامت تجاری را برای محافظت در برابر نقض حقوق و ورود به بازار نظارت کنند.
نحوه پیادهسازی:
- 1اسکرپ هفتگی پروندههای علامت تجاری برای کلمات کلیدی خاص مرتبط با برند شما.
- 2مقایسه پروندههای جدید با علائم تجاری و طرحهای موجود برند.
- 3هشدار به تیمهای حقوقی هنگام ثبت علائم مشابه در کلاسهای IC مرتبط.
از Automatio برای استخراج داده از USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده) و ساخت این برنامهها بدون نوشتن کد استفاده کنید.
با دادههای USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده) چه کارهایی میتوانید انجام دهید
- نظارت رقابتی بر برند
خردهفروشان و صاحبان برند میتوانند پروندههای جدید علامت تجاری را برای محافظت در برابر نقض حقوق و ورود به بازار نظارت کنند.
- اسکرپ هفتگی پروندههای علامت تجاری برای کلمات کلیدی خاص مرتبط با برند شما.
- مقایسه پروندههای جدید با علائم تجاری و طرحهای موجود برند.
- هشدار به تیمهای حقوقی هنگام ثبت علائم مشابه در کلاسهای IC مرتبط.
- نقشهبرداری از روند نوآوری
آزمایشگاههای R&D میتوانند پتنتهای اعطا شده را تجزیه و تحلیل کنند تا ببینند کدام فناوریها سرمایهگذاری سنگینی از سوی شرکتهای جهانی دریافت میکنند.
- اسکرپ خلاصهها و دستهبندیهای پتنت در یک دوره زمانی 5 ساله.
- استفاده از NLP برای شناسایی کلمات کلیدی فنی پرطرفدار و طبقهبندیهای CPC.
- تجسم رشد بخشهای خاص فناوری مانند AI، بیوتکنولوژی یا انرژیهای پاک.
- Due Diligence در حوزه Legal Tech
شرکتهای حقوقی میتوانند جمعآوری کل پورتفولیوی IP یک نهاد را برای فعالیتهای M&A و ارزشگذاری خودکار کنند.
- وارد کردن لیستی از نام شرکتها یا شناسههای واگذارنده در اسکرپر.
- استخراج تمام سوابق فعال پتنت و علامت تجاری برای آن نهادها، شامل تاریخهای انقضا.
- تولید گزارشی از قدرت، تنوع و مهلتهای تمدید داراییها.
- تولید لید برای خدمات IP
وکلا میتوانند ثبتکنندگان جدیدی را که ممکن است به خدمات تخصصی پیگیری پتنت یا علامت تجاری نیاز داشته باشند، شناسایی کنند.
- فیلتر کردن درخواستهای جدید علامت تجاری که وکیل ثبت شده ندارند.
- استخراج اطلاعات تماس رابط و جزئیات مالک.
- انجام بازاریابی هدفمند برای نمایندگی حقوقی یا خدمات مدیریت تمدید.
گردش کار خود را با اتوماسیون AI
Automatio قدرت عاملهای AI، اتوماسیون وب و ادغامهای هوشمند را ترکیب میکند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.
نکات حرفهای برای اسکرپ USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده)
توصیههای تخصصی برای استخراج موفق داده از USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده).
برای نیازهای دادهای در مقیاس بالا، سیستم ذخیرهسازی دادههای حجیم (BDSS) را در اولویت قرار دهید تا از مسدود شدن در پرتال جستجو جلوگیری کنید.
از یک headless browser مانند Playwright برای مدیریت فایلهای سنگین JavaScript و وضعیتهای session که پرتالهای مدرن به آنها نیاز دارند، استفاده کنید.
جدول زمانی نگهداری USPTO را بررسی کنید، زیرا دیتابیسها اغلب در آخر هفتهها برای بهروزرسانی آفلاین میشوند.
از residential proxies چرخشی استفاده کنید تا محدودیتهای نرخ درخواست (rate limits) سختگیرانه در کوئریهای جستجو و چالشهای Cloudflare را دور بزنید.
URLهای تصاویر اسناد را استخراج کنید تا به فایلهای اصلی TIFF یا PDF با وضوح بالا از پروندههای رسمی دسترسی پیدا کنید.
اگر به technical claims نیاز دارید، فایلهای XML را از پرتال دادههای حجیم پارس کنید، زیرا رابط کاربری وب اغلب متنها را کوتاه میکند.
نظرات
کاربران ما چه میگویند
به هزاران کاربر راضی که گردش کار خود را متحول کردهاند بپیوندید
Jonathan Kogan
Co-Founder/CEO, rpatools.io
Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.
Mohammed Ibrahim
CEO, qannas.pro
I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!
Ben Bressington
CTO, AiChatSolutions
Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!
Sarah Chen
Head of Growth, ScaleUp Labs
We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.
David Park
Founder, DataDriven.io
The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!
Emily Rodriguez
Marketing Director, GrowthMetrics
Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.
Jonathan Kogan
Co-Founder/CEO, rpatools.io
Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.
Mohammed Ibrahim
CEO, qannas.pro
I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!
Ben Bressington
CTO, AiChatSolutions
Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!
Sarah Chen
Head of Growth, ScaleUp Labs
We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.
David Park
Founder, DataDriven.io
The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!
Emily Rodriguez
Marketing Director, GrowthMetrics
Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.
مرتبط Web Scraping
سوالات متداول درباره USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده)
پاسخ سوالات رایج درباره USPTO (اداره ثبت اختراعات و علائم تجاری ایالات متحده) را بیابید


