نحوه اسکرپ کردن OnTheMarket | وب اسکرپر OnTheMarket
بیاموزید چگونه OnTheMarket را برای استخراج آگهیهای املاک بریتانیا، قیمتها و دادههای مشاورین املاک اسکرپ کنید. راهنمایی ضروری برای سرمایهگذاران املاک و...
حفاظت ضد ربات شناسایی شد
- Cloudflare
- WAF و مدیریت ربات در سطح سازمانی. از چالشهای JavaScript، CAPTCHA و تحلیل رفتاری استفاده میکند. نیاز به اتوماسیون مرورگر با تنظیمات مخفی دارد.
- CloudFront
- محدودیت نرخ
- درخواستها را بر اساس IP/جلسه در طول زمان محدود میکند. با پراکسیهای چرخشی، تأخیر درخواستها و اسکرپینگ توزیعشده قابل دور زدن است.
- مسدودسازی IP
- IPهای شناختهشده مراکز داده و آدرسهای علامتگذاریشده را مسدود میکند. نیاز به پراکسیهای مسکونی یا موبایل برای دور زدن مؤثر دارد.
- Google reCAPTCHA
- سیستم CAPTCHA گوگل. نسخه 2 نیاز به تعامل کاربر دارد، نسخه 3 بیصدا با امتیازدهی ریسک اجرا میشود. با خدمات CAPTCHA قابل حل است.
درباره OnTheMarket
کشف کنید OnTheMarket چه چیزی ارائه میدهد و چه دادههای ارزشمندی میتوان استخراج کرد.
نمای کلی بازار
OnTheMarket یکی از پورتالهای پیشرو املاک در بریتانیا است که در سال ۲۰۱۵ راهاندازی شد و در حال حاضر بخش عمده سهام آن متعلق به CoStar Group است. این سایت به عنوان یک پلتفرم حیاتی برای آژانسهای املاک جهت لیست کردن املاک مسکونی و تجاری برای فروش و اجاره در سراسر بریتانیا عمل میکند. این وبسایت رقیب اصلی Rightmove و Zoopla محسوب میشود و با شرایط لیستینگ منحصربهفرد خود متمایز میگردد.
در دسترس بودن دادهها
این پلتفرم میزبان مخزن عظیمی از اطلاعات ساختاریافته املاک است، شامل asking prices، مشخصات دقیق ملک، تصاویر با وضوح بالا و نقشههای طبقات. یک ویژگی مهم، برچسب "Only With Us" است که در آن املاک ۲۴ ساعت یا بیشتر قبل از لیست شدن در سایر پورتالهای بزرگ، در OnTheMarket ظاهر میشوند و مزیت زمانی متمایزی برای جمعآوری دادهها ایجاد میکنند.
پتانسیل اسکرپینگ
برای متخصصان املاک و سرمایهگذاران، اسکرپ کردن این پلتفرم برای market analysis و ردیابی روندها بسیار ارزشمند است. دسترسی به این دادهها در مقیاس وسیع، امکان ایجاد مدلهای ارزشگذاری خودکار (AVMs)، نظارت بر موجودی رقابتی و شناسایی فروشندگان با انگیزه از طریق تشخیص کاهش قیمت را بدون تلاش دستی فراهم میکند.

چرا OnTheMarket را اسکرپ کنیم؟
ارزش تجاری و موارد استفاده برای استخراج داده از OnTheMarket را کشف کنید.
مانیتورینگ لحظهای آگهیهای زودهنگام 'Only With Us' در بریتانیا
ارزشگذاری دقیق ملک و جستجوی فرصتهای سرمایهگذاری
هوش رقابتی برای تحلیل سهم بازار آژانسهای املاک
Lead generation برای خدمات جابجایی و بازسازی خانه
ردیابی تاریخچه قیمت برای شناسایی فروشندگان با انگیزه
تجمیع ویژگیهای ملک برای مدلهای machine learning
چالشهای اسکرپینگ
چالشهای فنی که ممکن است هنگام اسکرپ OnTheMarket با آنها مواجه شوید.
محافظت آنتی-بات تهاجمی از طریق CloudFront و Cloudflare
اتکای زیاد به رندرینگ JavaScript (React/Next.js)
تغییرات مکرر در نام کلاسهای داینامیک CSS و ساختار DOM
محدودیت نرخ درخواست (rate limiting) شدید و ردیابی نشست مبتنی بر IP
منطق پیچیده صفحهبندی شامل پارامترهای داینامیک URL
استخراج داده از OnTheMarket با هوش مصنوعی
بدون نیاز به کدنویسی. با اتوماسیون مبتنی بر هوش مصنوعی در چند دقیقه داده استخراج کنید.
نحوه عملکرد
نیاز خود را توصیف کنید
به هوش مصنوعی بگویید چه دادههایی را میخواهید از OnTheMarket استخراج کنید. فقط به زبان طبیعی بنویسید — بدون نیاز به کد یا سلکتور.
هوش مصنوعی دادهها را استخراج میکند
هوش مصنوعی ما OnTheMarket را مرور میکند، محتوای پویا را مدیریت میکند و دقیقاً آنچه درخواست کردهاید را استخراج میکند.
دادههای خود را دریافت کنید
دادههای تمیز و ساختاریافته آماده برای صادرات به CSV، JSON یا ارسال مستقیم به برنامههای شما دریافت کنید.
چرا از هوش مصنوعی برای استخراج داده استفاده کنید
هوش مصنوعی استخراج داده از OnTheMarket را بدون نوشتن کد آسان میکند. پلتفرم ما با هوش مصنوعی میفهمد چه دادههایی میخواهید — فقط به زبان طبیعی توصیف کنید و هوش مصنوعی به طور خودکار استخراج میکند.
How to scrape with AI:
- نیاز خود را توصیف کنید: به هوش مصنوعی بگویید چه دادههایی را میخواهید از OnTheMarket استخراج کنید. فقط به زبان طبیعی بنویسید — بدون نیاز به کد یا سلکتور.
- هوش مصنوعی دادهها را استخراج میکند: هوش مصنوعی ما OnTheMarket را مرور میکند، محتوای پویا را مدیریت میکند و دقیقاً آنچه درخواست کردهاید را استخراج میکند.
- دادههای خود را دریافت کنید: دادههای تمیز و ساختاریافته آماده برای صادرات به CSV، JSON یا ارسال مستقیم به برنامههای شما دریافت کنید.
Why use AI for scraping:
- دور زدن خودکار پیچیدگیهای JavaScript و مسائل hydration
- استفاده از residential proxies ابری برای جلوگیری از مسدود شدن IP
- اسکرپینگ زمانبندی شده برای مشاهده فوری آگهیهای ۲۴ ساعت زودتر
- راهاندازی بدون کدنویسی (zero-code) برای استخراج نتایج چندصفحهای املاک
- اتصال مستقیم به Google Sheets برای تحلیلهای لحظهای
اسکرپرهای وب بدون کد برای OnTheMarket
جایگزینهای کلیک و انتخاب برای اسکرپینگ مبتنی بر AI
چندین ابزار بدون کد مانند Browse.ai، Octoparse، Axiom و ParseHub میتوانند به شما در اسکرپ OnTheMarket بدون نوشتن کد کمک کنند. این ابزارها معمولاً از رابطهای بصری برای انتخاب داده استفاده میکنند، اگرچه ممکن است با محتوای پویای پیچیده یا اقدامات ضد ربات مشکل داشته باشند.
گردش کار معمول با ابزارهای بدون کد
چالشهای رایج
منحنی یادگیری
درک انتخابگرها و منطق استخراج زمان میبرد
انتخابگرها خراب میشوند
تغییرات وبسایت میتواند کل جریان کار را خراب کند
مشکلات محتوای پویا
سایتهای پر از JavaScript نیاز به راهحلهای پیچیده دارند
محدودیتهای CAPTCHA
اکثر ابزارها نیاز به مداخله دستی برای CAPTCHA دارند
مسدود شدن IP
استخراج تهاجمی میتواند منجر به مسدود شدن IP شما شود
اسکرپرهای وب بدون کد برای OnTheMarket
چندین ابزار بدون کد مانند Browse.ai، Octoparse، Axiom و ParseHub میتوانند به شما در اسکرپ OnTheMarket بدون نوشتن کد کمک کنند. این ابزارها معمولاً از رابطهای بصری برای انتخاب داده استفاده میکنند، اگرچه ممکن است با محتوای پویای پیچیده یا اقدامات ضد ربات مشکل داشته باشند.
گردش کار معمول با ابزارهای بدون کد
- افزونه مرورگر را نصب کنید یا در پلتفرم ثبتنام کنید
- به وبسایت هدف بروید و ابزار را باز کنید
- عناصر دادهای مورد نظر را با کلیک انتخاب کنید
- انتخابگرهای CSS را برای هر فیلد داده پیکربندی کنید
- قوانین صفحهبندی را برای استخراج چندین صفحه تنظیم کنید
- CAPTCHA را مدیریت کنید (اغلب نیاز به حل دستی دارد)
- زمانبندی اجرای خودکار را پیکربندی کنید
- دادهها را به CSV، JSON صادر کنید یا از طریق API متصل شوید
چالشهای رایج
- منحنی یادگیری: درک انتخابگرها و منطق استخراج زمان میبرد
- انتخابگرها خراب میشوند: تغییرات وبسایت میتواند کل جریان کار را خراب کند
- مشکلات محتوای پویا: سایتهای پر از JavaScript نیاز به راهحلهای پیچیده دارند
- محدودیتهای CAPTCHA: اکثر ابزارها نیاز به مداخله دستی برای CAPTCHA دارند
- مسدود شدن IP: استخراج تهاجمی میتواند منجر به مسدود شدن IP شما شود
نمونه کدها
import requests
from bs4 import BeautifulSoup
# پلتفرم OnTheMarket از Cloudflare استفاده میکند؛ درخواستهای استاندارد اغلب با خطای 403 مواجه میشوند
url = 'https://www.onthemarket.com/for-sale/property/london/'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36'
}
try:
response = requests.get(url, headers=headers)
response.raise_for_status()
soup = BeautifulSoup(response.text, 'html.parser')
# سلکتورها ممکن است تغییر کنند؛ به دنبال آیتمهای لیستی حاوی نتایج باشید
listings = soup.select('li[id^="result-"]')
for item in listings:
price = item.select_one('a.text-xl').text.strip() if item.select_one('a.text-xl') else 'N/A'
address = item.select_one('address').text.strip() if item.select_one('address') else 'N/A'
print(f'Price: {price} | Address: {address}')
except Exception as e:
print(f'Scraping failed: {e}')زمان استفاده
بهترین گزینه برای صفحات HTML ایستا که محتوا در سمت سرور بارگذاری میشود. سریعترین و سادهترین روش وقتی رندر JavaScript لازم نیست.
مزایا
- ●سریعترین اجرا (بدون سربار مرورگر)
- ●کمترین مصرف منابع
- ●به راحتی با asyncio قابل موازیسازی
- ●عالی برای API و صفحات ایستا
محدودیتها
- ●قادر به اجرای JavaScript نیست
- ●در SPA و محتوای پویا ناموفق است
- ●ممکن است با سیستمهای ضد ربات پیچیده مشکل داشته باشد
How to Scrape OnTheMarket with Code
Python + Requests
import requests
from bs4 import BeautifulSoup
# پلتفرم OnTheMarket از Cloudflare استفاده میکند؛ درخواستهای استاندارد اغلب با خطای 403 مواجه میشوند
url = 'https://www.onthemarket.com/for-sale/property/london/'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36'
}
try:
response = requests.get(url, headers=headers)
response.raise_for_status()
soup = BeautifulSoup(response.text, 'html.parser')
# سلکتورها ممکن است تغییر کنند؛ به دنبال آیتمهای لیستی حاوی نتایج باشید
listings = soup.select('li[id^="result-"]')
for item in listings:
price = item.select_one('a.text-xl').text.strip() if item.select_one('a.text-xl') else 'N/A'
address = item.select_one('address').text.strip() if item.select_one('address') else 'N/A'
print(f'Price: {price} | Address: {address}')
except Exception as e:
print(f'Scraping failed: {e}')Python + Playwright
from playwright.sync_api import sync_playwright
def scrape_otm():
with sync_playwright() as p:
browser = p.chromium.launch(headless=True)
# استفاده از یک کانتکست شبیه به مرورگر معمولی
context = browser.new_context(user_agent='Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36')
page = context.new_page()
page.goto('https://www.onthemarket.com/for-sale/property/london/', wait_until='networkidle')
# منتظر ماندن برای هیدراته شدن نتایج
page.wait_for_selector('li[id^="result-"]')
listings = page.query_selector_all('li[id^="result-"]')
for prop in listings:
title = prop.query_selector('.text-sm.text-denim').inner_text()
price = prop.query_selector('.text-xl.font-bold').inner_text()
print({'title': title, 'price': price})
browser.close()
scrape_otm()Python + Scrapy
import scrapy
class OnTheMarketSpider(scrapy.Spider):
name = 'otm'
start_urls = ['https://www.onthemarket.com/for-sale/property/london/']
def parse(self, response):
# آیتمهای لیست کانتینر اصلی آگهیها را هدف قرار میدهد
for item in response.css('li[id^="result-"]'):
yield {
'price': item.css('.text-xl.font-bold::text').get(),
'address': item.css('address span::text').get(),
'agency': item.css('img::attr(alt)').get(),
'link': response.urljoin(item.css('a::attr(href)').get())
}
next_page = response.css('link[rel="next"]::attr(href)').get()
if next_page:
yield response.follow(next_page, self.parse)Node.js + Puppeteer
const puppeteer = require('puppeteer');
(async () => {
const browser = await puppeteer.launch({ headless: true });
const page = await browser.newPage();
await page.setUserAgent('Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36');
await page.goto('https://www.onthemarket.com/for-sale/property/london/', { waitUntil: 'networkidle2' });
const data = await page.evaluate(() => {
return Array.from(document.querySelectorAll('li[id^="result-"]')).map(li => ({
price: li.querySelector('.text-xl')?.innerText.trim(),
address: li.querySelector('address')?.innerText.trim()
}));
});
console.log(data);
await browser.close();
})();با دادههای OnTheMarket چه کارهایی میتوانید انجام دهید
کاربردهای عملی و بینشها از دادههای OnTheMarket را بررسی کنید.
جستجوی املاک اجارهای با بازدهی بالا در بریتانیا
سرمایهگذاران Buy-to-let میتوانند با مقایسه دادههای اجاره و فروش، املاکی با پتانسیل ROI بالا را شناسایی کنند.
نحوه پیادهسازی:
- 1اسکرپ کردن آگهیهای فروش و اجاره برای کدهای پستی یکسان.
- 2تطبیق انواع ملک و تعداد اتاق خواب برای محاسبه بازدهی (yields).
- 3شناسایی مناطقی که نسبت قیمت به اجاره در آنها مطلوبتر است.
- 4فیلتر کردن آگهیهای 'Only With Us' برای نهایی کردن معاملات قبل از بازار گستردهتر.
از Automatio برای استخراج داده از OnTheMarket و ساخت این برنامهها بدون نوشتن کد استفاده کنید.
با دادههای OnTheMarket چه کارهایی میتوانید انجام دهید
- جستجوی املاک اجارهای با بازدهی بالا در بریتانیا
سرمایهگذاران Buy-to-let میتوانند با مقایسه دادههای اجاره و فروش، املاکی با پتانسیل ROI بالا را شناسایی کنند.
- اسکرپ کردن آگهیهای فروش و اجاره برای کدهای پستی یکسان.
- تطبیق انواع ملک و تعداد اتاق خواب برای محاسبه بازدهی (yields).
- شناسایی مناطقی که نسبت قیمت به اجاره در آنها مطلوبتر است.
- فیلتر کردن آگهیهای 'Only With Us' برای نهایی کردن معاملات قبل از بازار گستردهتر.
- گزارشهای خودکار موجودی بازار
تحلیلگران میتوانند تعداد آگهیهای جدید را در مقابل املاک فروخته شده ردیابی کنند تا میزان داغ بودن بازار را تعیین کنند.
- اجرای اسکرپ روزانه از لیستها در شهرهای بزرگ بریتانیا.
- شمارش برچسبهای 'New' در مقابل 'Sold STC' یا 'Under Offer'.
- محاسبه میانگین روزهای حضور در بازار برای بازههای قیمتی مختلف.
- تجسم روندهای موجودی در طول زمان در یک داشبورد.
- تحلیل سهم بازار آژانسها
آژانسهای املاک میتوانند حجم آگهیهای رقبا را ردیابی کنند تا استراتژیهای بازاریابی محلی خود را تنظیم نمایند.
- استخراج 'نام آژانس' از تمام آگهیهای یک منطقه محلی خاص.
- تجمیع دادهها برای مشاهده اینکه کدام آژانس بیشترین آگهیها را در اختیار دارد.
- نظارت بر استراتژیهای قیمتگذاری آژانسها و کاهش قیمتهای مبتنی بر کمیسیون.
- تنظیم استراتژیهای بازاریابی بر اساس عملکرد رقبا.
- API ارزشگذاری Proptech
استارتاپها میتوانند با استفاده از دادههای زنده بازار به عنوان منبع آموزشی اصلی، ابزارهای ارزشگذاری بسازند.
- اسکرپ کردن دادههای تاریخی و فعلی آگهیها شامل متراژ.
- پاکسازی دادهها و مدیریت مقادیر پرت (outliers) در قیمت یا اندازه.
- آموزش یک مدل regression برای پیشبینی ارزش ملک بر اساس ویژگیهای محلی.
- ارائه تخمینهای لحظهای به کاربران از طریق یک API خارجی.
گردش کار خود را با اتوماسیون AI
Automatio قدرت عاملهای AI، اتوماسیون وب و ادغامهای هوشمند را ترکیب میکند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.
نکات حرفهای برای اسکرپ OnTheMarket
توصیههای تخصصی برای استخراج موفق داده از OnTheMarket.
تگ اسکریپت __OTM_DATA__ را در سورس HTML هدف قرار دهید تا دادههای JSON تمیز را بدون نیاز به پارس کردن کلاسهای پیچیده CSS پیدا کنید.
منحصراً از residential proxies استفاده کنید؛ IPهای دیتاسنتر تقریباً بلافاصله توسط CloudFront شناسایی و مسدود میشوند.
همیشه در مرورگرهای headless یک شرط 'wait_until' تنظیم کنید تا به کامپوننتهای React اجازه دهید به طور کامل hydration را انجام دهند.
املاکی که با برچسب 'Only With Us' مشخص شدهاند را اوایل صبح اسکرپ کنید تا ۲۴ ساعت زودتر از سایر پورتالها به دادهها دسترسی پیدا کنید.
یک بازه استراحت (sleep) تصادفی بین ۳ تا ۱۰ ثانیه ایجاد کنید تا رفتار در حال گشتوگذار یک کاربر انسانی را شبیهسازی کنید.
فیلد 'Date Added' را بررسی کنید تا از پردازش تکراری در دیتابیس خود جلوگیری کرده و در پهنای باند صرفهجویی کنید.
نظرات
کاربران ما چه میگویند
به هزاران کاربر راضی که گردش کار خود را متحول کردهاند بپیوندید
Jonathan Kogan
Co-Founder/CEO, rpatools.io
Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.
Mohammed Ibrahim
CEO, qannas.pro
I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!
Ben Bressington
CTO, AiChatSolutions
Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!
Sarah Chen
Head of Growth, ScaleUp Labs
We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.
David Park
Founder, DataDriven.io
The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!
Emily Rodriguez
Marketing Director, GrowthMetrics
Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.
Jonathan Kogan
Co-Founder/CEO, rpatools.io
Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.
Mohammed Ibrahim
CEO, qannas.pro
I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!
Ben Bressington
CTO, AiChatSolutions
Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!
Sarah Chen
Head of Growth, ScaleUp Labs
We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.
David Park
Founder, DataDriven.io
The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!
Emily Rodriguez
Marketing Director, GrowthMetrics
Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.
مرتبط Web Scraping

How to Scrape Brown Real Estate NC | Fayetteville Property Scraper

How to Scrape LivePiazza: Philadelphia Real Estate Scraper

How to Scrape Century 21: A Technical Real Estate Guide

How to Scrape HotPads: A Complete Guide to Extracting Rental Data

How to Scrape Progress Residential Website

How to Scrape Geolocaux | Geolocaux Web Scraper Guide

How to Scrape Sacramento Delta Property Management

How to Scrape Dorman Real Estate Management Listings
سوالات متداول درباره OnTheMarket
پاسخ سوالات رایج درباره OnTheMarket را بیابید